69
Apostila de Estatística Volume 1 – Edição 2007 Curso: Matemática e Psicologia Amostragem, Séries Estatísticas, Distribuição de Freqüência, Média, Mediana, Quartil, Percentil e Desvio Padrão Prof. Dr. Celso Eduardo Tuna Prof. Ms. Wiliam Gonzaga Pereira

Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Embed Size (px)

Citation preview

Page 1: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Apostila de Estatística

Volume 1 – Edição 2007

Curso: Matemática e Psicologia

Amostragem, Séries Estatísticas, Distribuição de Freqüência, Média, Mediana,

Quartil, Percentil e Desvio Padrão

Prof. Dr. Celso Eduardo Tuna Prof. Ms. Wiliam Gonzaga Pereira

Page 2: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Estatística Capítulo 1 - Introdução 1.1 Histórico A estatística é um ramo da matemática aplicada. A partir do século XVI começaram a surgir as primeiras análises sistemáticas de registros diversos como os de nascimento, óbitos, riquezas, casamentos. Esses registros eram utilizados para principalmente cobrar impostos. No século XVIII , Godofredo Achenwall batizou esses estudos como uma nova ciência com o nome de Estatística. Surgiram tabelas mais complexas, representações gráficas e cálculo de probabilidade. Formou-se a ferramenta que através da observação de partes (amostras) chega-se a conclusões sobre um todo (população). 1.2 Método Estatístico Método é o conjunto de procedimentos dispostos ordenadamente para se chegar a um desejado fim. Dos métodos científicos pode-se destacar: Método Experimental: consiste em manter constantes todas as causas (fatores, componentes, variáveis), menos uma, e variar essa última para descobrir seus efeitos, caso existam. Método Estatístico: diante da impossibilidade de manter as causas constantes, registram-se os resultados dessas variações procurando determinar a influência (os efeitos) de cada uma delas. 1.3 Estatística A Estatística é parte da Matemática Aplicada que fornece métodos de coleta, organização, descrição, análise e interpretação de dados, úteis nas tomadas de decisão. Estatística Descritiva: coleta, organização e descrição dos dados. Estatística Indutiva ou Inferencial: análise e interpretação dos dados. Permite obter conclusões que transcendam os dados obtidos inicialmente, objetivo essencial da Estatística. Probabilidade: útil para analisar situações que envolvem o acaso. Ex: a decisão de parar de imunizar pessoas com mais de vinte anos contra determinada doença. 1.4 Método Estatístico (Pesquisa) Exemplos: - Indústrias realizam pesquisa entre os consumidores para o lançamento de um novo produto

Page 3: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

- As pesquisas eleitorais fornecem elementos para que os candidatos direcionem a campanha - Emissoras de tevê utilizam pesquisas que mostram a preferência dos espectadores para organizar sua programação - A pesquisa do desempenho dos atletas ou das equipes em uma partida ou em um campeonato interfere no planejamento dos treinamentos A pesquisa é composta basicamente de 5 fases 1a Coleta de Dados Após planejamento e determinação das características mensuráveis do objeto em estudo, inicia-se a coleta de dados. Esta pode ser direta ou indireta. A coleta direta é feita sobre registros diversos: nascimento, casamento, óbitos, importação, registros escolares; ou ainda quando os dados são coletados diretamente pelo pesquisador através de questionários (ex: censo). A coleta direta pode ser: contínua; periódica (censos); ocasional A coleta indireta é uma coleta feita sobre dados colhidos de uma coleta direta (ex: mortalidade infantil) 2a Crítica dos Dados Os dados coletados devem ser observados, à procura de falhas e imperfeições, a fim de não causarem erro nos resultados. Exemplo 1 : Perguntas tendenciosas. Foi realizada a seguinte pesquisa: O tráfego contribui em maior ou menor grau do que a indústria para a poluição atmosférica ? Resposta: 45 % para o tráfego e 32 % para a indústria. A indústria contribui em maior ou menor grau do que o tráfego para a poluição atmosférica ? Resposta: 24 % para o tráfego e 57 % para a indústria. Exemplo 2: Preservação da auto-imagem. Em uma pesquisa telefônica 94 % dos entrevistados disseram que lavam as suas mãos após usar o banheiro, mas a observação em banheiros públicos esse percentual cai para 68 %. Exemplo 3: Más Amostras. As pessoas devem ser escolhidas aleatoriamente para a pesquisa, como por exemplo, numa pesquisa de opinião na rua, deve-se entrevistar somente quem pisou em uma determinada marca pré-determinada na calçada. Exemplo 4. Más perguntas. A pergunta deve conter o linguajar próprio do entrevistado. Geralmente, se o entrevistado não entender a pergunta, ele responderá qualquer coisa, pois tem vergonha de perguntar. 3a Apuração dos Dados

Page 4: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

É o processamento dos dados obtidos 4a Exposição dos Dados Através de tabelas ou gráficos, tornando mais fácil seu exame e aplicação de um cálculo estatístico 5a Análise dos Resultados Através de métodos de estatística indutiva ou inferencial obtêm-se conclusões e previsões de um todo através do exame de apenas uma parte desse todo.

Page 5: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Capítulo 2 - População e Amostra 2.1 Variável Variável é o conjunto de resultados possíveis de um fenômeno. A variável pode ser qualitativa, quando seus valores são expressos por atributos (ex: sexo, cor), ou pode ser quantitativa, quando seus valores são expressos em números. A variável quantitativa pode ser contínua, quando assume qualquer valor entre dois limites (ex: peso, altura, medições), ou pode ser discreta, quando só pode assumir valores pertencentes a um conjunto enumerável (ex: número de filhos, contagens em geral, números inteiros).

2.2 Precisão A precisão da medida será automaticamente indicada pelo número de decimais com que se escrevem os valores da variável. Ex: 1,80 m indica uma medição com precisão de centésimos. 2.3 Arredondamento De acordo com resolução do IBGE Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3, ou 4, fica inalterado o último algarismo a permanecer. Ex: 53,24 passa a 53,2 ; 17,3452 passa a 17,3 Quando o primeiro algarismo a ser abandonado é 6, 7, 8, ou 9, aumenta-se de uma unidade o último algarismo a permanecer. Ex: 42,87 passa a 42,9 ; 25,08 passa a 25,1; 53,99 passa a 54,0 Quando o primeiro algarismo a ser abandonado é 5, há duas soluções: a) Se ao 5 seguir em qualquer casa um algarismo diferente de 0, aumenta-se de uma unidade o último algarismo a permanecer. Ex: 2,352 passa a 2,4 ; 25,6501 passa a 25,7. b) Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último algarismo a ser conservado só será aumentado de uma unidade se for ímpar. Ex: 24,75 passa a 24,8 ; 24,65 passa a 24,6 ; 24,7500 passa a 24,8 ; 24,6500 passa a 24,6 Exercícios. Arredonde deixando número inteiro: 2,38 = 24,65 = 0,351 = 4,24 = 328,35 = 2,97 = 6,829 = 5,55 = 89,99 = Exercícios. Arredonde deixando uma casa decimal:

Page 6: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

2,38 = 24,65 = 0,351 = 4,24 = 328,35 = 2,97 = 6,829 = 5,55 = 89,99 = 2.4 População e Amostra População é o conjunto de portadores de, pelo menos, uma característica comum. Amostra é um subconjunto finito de uma população. A amostra é escolhida através de processos adequados que garantam o acaso na escolha 2.5 Amostragem É o processo de colher amostras. Nesse processo, cada elemento da população passa a ter a mesma chance de ser escolhido. Dentre os processos de amostragem pode-se destacar três: amostragem casual ou aleatória simples, amostragem proporcional estratificada e amostragem sistemática. a) Amostragem casual ou aleatória simples: É um sorteio, por exemplo, para retirar uma amostra de 9 alunos de uma sala de 90 alunos, utiliza-se um sorteio com todos os números dos alunos escritos em papéis dentro de um saco. Para amostras grandes utiliza-se a Tabela de Números Aleatórios (Página 40). Assim para o exemplo da sala de aula, utilizando dois algarismos, através da leitura

a primeira linha (escolhida através de sorteio), obtém-se: d C omo a população vai de 1 a 90 escolhe-se os 9 primeiros números dentro dessa faixa:

b) Amostragem proporcional estratificada: É comum termos populações que se dividam em subpopulações (estratos) e como cada estrato pode ter um comportamento diferente do outro, a amostra deve considerar a existência desses estratos e a sua proporção em relação à população. Exemplo: supondo que uma sala de aula seja composta de 54 meninos e 36 meninas. Determine uma amostra de 9 pessoas:

Sexo População Cálculo Proporcional Regra de três simples

Amostra

Masculino 54 54 x 9 / 90 = 5,4 5 Feminino 36 36 x 9 / 90 = 3,6 4

Total 90 9 9

Page 7: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Posteriormente, utiliza-se a tabela de números aleatórios para escolher 5 meninos e 4 meninas. Verifica-se que foi realizado um arredondamento dos números 5,4 e 3,6. Esse arredondamento é efetuado utilizando as regras de arredondamento. Exercício: Em uma escola existem 250 alunos, distribuídos em séries conforme a tabela. Obtenha uma amostra de 40 alunos e preencha a tabela.

Séries População Cálculo Proporcional Amostra 1a 35 2a 32 3a 30 4a 28 5a 35 6a 32 7a 31 8a 27

Total 250 40 c) Amostragem sistemática É quando a amostragem é feita através de um sistema possível de ser aplicado pois a população já se encontra ordenada. Exemplo 1: em uma linha de produção, a cada 10 itens fabricados, retira-se 1 para inspeção, tem-se uma amostra de 10 % da população. Exemplo 2: em uma rua com 900 prédios, deseja-se uma amostra de 50. 900/50 =18 (50 grupos de 18 prédios cada). Faz-se um sorteio entre 1 e 18, por exemplo 4, então pesquisaríamos o 4o prédio da rua, o 22o , o 40o , 58o , assim por diante. Exercícios de População e Amostra 1) Uma universidade apresenta o seguinte quadro relativo aos seus alunos do curso de Matemática. Obtenha uma amostra proporcional estartificada de 100 alunos.

Série Qtde Amostra 1a 85

2a 70

3a 80

4a 75

Page 8: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Total 100

Page 9: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

2) Uma cidade X apresenta o seguinte quadro relativo às suas escolas de 1o grau:

Amostra Escola Homens Mulheres Total Homens Mulheres Total

A 80 95 B 102 120 C 110 92 D 134 228 E 150 130 F 300 290

Total 120 Obtenha uma amostra proporcional estratificada de 120 estudantes

Page 10: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

3) Utilizando a tabela de números aleatórios, obtenha uma amostra de 10 pessoas de uma sala de aula com 85 alunos, utilize a 10a e a 11a coluna para começar o sorteio. 4) Ordene uma amostra de 15 elementos de uma população ordenada formada por 210 elementos, sabendo que o elemento de ordem 149 a ela pertence ?

Page 11: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Capítulo 3 - Séries Estatísticas 3.1 Séries Estatísticas Série estatística é toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local, ou da espécie. Pode-se classificar em: histórica, geográfica, específica a) Séries históricas (cronológicas, temporais) - descrevem os valores da variável, em determinado local, em função do tempo Exemplo: Tabela – Analfabetismo na faixa de 15 anos ou mais - Brasil - 1900/2000 População de 15 anos ou mais Ano Total(1) Analfabeta(1) Taxa de Analfabetismo 1900 9.728 6.348 65,3 1920 17.564 11.409 65,0 1940 23.648 13.269 56,1 1950 30.188 15.272 50,6 1960 40.233 15.964 39,7 1970 53.633 18.100 33,7 1980 74.600 19.356 25,9 1991 94.891 18.682 19,7 2000 119.533 16.295 13,6 Fonte: IBGE, Censo Demográfico. Nota: (1) Em milhares b) Séries geográficas (espaciais, territoriais ou de localização) - descrevem os valores da variável, em um determinado instante, em função da região Exemplo:

População Mundial Em milhões de pessoas - 1998

Canadá 30,5 Argentina 36,1

Japão 126,2 Rússia 147,4 Brasil 165,8

Indonésia 206,3 EUA 274 Índia 982,2 China 1255,6

Fonte: O Estado de São Paulo, 01/01/2000

Page 12: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

População Mundial em 1998

30,5 36,1126,2 147,4 165,8 206,3

274

982,2

1255,6

0

200

400

600

800

1000

1200

1400

Argenti

naBras

ilEUA

China

em m

ilhõe

s

c) Séries Específicas (categóricas) - descrevem os valores da variável, em um determinado instante e local, segundo especificações.

Custo médio das campanhas eleitorais em 1998, segundo estimativa dos candidatos em milhões de

reais. Fonte: TSE Presidente 25

Governador 6 Senador 3,5

Deputado Federal 1,5 Deputado Estadual 0,5

Page 13: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Custo médio das campanhas eleitorais em 1998, segundo estimativa dos candidatos em milhões de reais. Fonte: TSE

25

63,5

1,5 0,50

5

10

15

20

25

30

Presidente Governador Senador DeputadoFederal

DeputadoEstadual

Milh

ões

de R

eais

d) Séries Conjugadas - Tabela de Dupla Entrada É a união de duas séries em uma só tabela Exemplo:

População Mundial - em milhões de pessoas País 1998 2050

Canadá 30,5 42,3 Argentina 36,1 54,5

Japão 126,2 104,9 Rússia 147,4 121,2 Brasil 165,8 244,2

Indonésia 206,3 311,8 EUA 274 349,3 Índia 982,2 1528,8 China 1255,6 1477,7

Fonte: O Estado de São Paulo, 01/01/2000 O exemplo acima é uma série geográfica-histórica Podem também existir séries conjugadas de três ou mais entradas, fato mais raro, pois dificulta a interpretação dos dados.

Page 14: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

População Mundial - em milhões de pessoas

0

200

400

600

800

1000

1200

1400

1600

1800

Argenti

naBras

ilEUA

China

Milh

ões

de p

esso

as

19982050

3.2 - Distribuição de freqüência Será tratado em capítulo a parte devido a sua importância. Exemplo:

Idade na morte causada por arma de fogo Idade na Morte Freqüência

15 |- 25 22 25 |- 35 10 35 |- 45 6 45 |- 55 2 55 |- 65 4 65 |- 75 5 75 |- 85 1

3.3 Dados Absolutos e Dados Relativos Dados Absolutos: são resultantes de uma coleta direta, sem outra manipulação senão a contagem Dados Relativos: são resultantes de comparações, há um tratamento matemático dos dados para uma melhor interpretação.

Page 15: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

3.3.1 - As percentagens a) Considere a série:

Idade na morte causada por arma de fogo Idade na Morte Freqüência

15 |- 25 22 25 |- 35 10 35 |- 45 6 45 |- 55 2 55 |- 65 4 65 |- 75 5 75 |- 85 1

Calculando a percentagem das pessoas em cada faixa etária, pode-se preencher uma nova coluna

Idade na Morte Freqüência % 15 |- 25 22 44 25 |- 35 10 20 35 |- 45 6 12 45 |- 55 2 4 55 |- 65 4 8 65 |- 75 5 10 75 |- 85 1 2 Total 50 100

Pode-se agora tirar uma melhor conclusão e também construir um gráfico de setores (pizza).

Page 16: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Idade da Morte causada por arma de fogo

15 |- 2544%

25 |- 3520%

35 |- 4512%

45 |- 554%

55 |- 658%

65 |- 7510%

75 |- 852%

Page 17: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

3.3.2 - Os índices Os índices são razões entre duas grandezas independentes. Ex: Relação candidato vaga = Qtde de candidatos / Qtde de vagas Densidade demográfica = população / área de uma superfície Renda per capita = renda total de uma população / população 3.3.3 - Os Coeficientes Os coeficientes são razões entre o número de ocorrências e o número total. É a porcentagem expressa na forma unitária. Ex: Coeficiente de evasão escolar = no de alunos evadidos / no inicial de alunos Coeficiente de aproveitamento escolar = no de alunos aprovados/ no final de alunos 3.3.4 - As Taxas As taxas são os coeficientes multiplicados por uma potência de 10, 100, 1000, etc para tornar o resultado mais inteligível (claro) Ex: Taxas de mortalidade = coeficiente de mortalidade x 1000 ( lê-se mortes a cada 1000 habitantes) Taxa de evasão escolar = coeficiente de evasão escolar x 100 Exercícios: Exercício 1 - Considere a tabela abaixo: Ano Qtde de Analfabetos no Brasil acima

de 15 anos em milhares de hab. % de aumento

1960 40233 ____

1970 53633

1980 74600

1991 94891

2000 119533

Complete a tabela com uma coluna de percentagem de aumento de um período para o outro. Não utilize casas decimais, apenas números inteiros.

Page 18: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Exercício 2 - Considerando que o Brasil, em 2000, apresentou: População: 164 milhões de habitantes Superfície: 8 511 996 km2

Nascimentos: 6,2 milhões Óbitos: 3,8 milhões Calcule: a) o índice de densidade demográfica b) a taxa de natalidade c) a taxa de mortalidade Exercício 3 - Em certa eleição municipal foram obtidos os seguintes resultados

Candidato % do total de votos Número de votos A 26 B 24 C 22

Brancos e nulos 196 Determine o número de votos obtido pelo candidato vencedor. Exercício 4 : A tabela abaixo apresenta a variação percentual das vendas industriais de aparelhos domésticos, comparando o período de julho e agosto de 2003 com o período de julho e agosto de 2004. Vendas industriais de aparelhos domésticos Variação percentual jul/ago 2003 e jul/ago 2004 Refrigeradores 15,06 Freezers verticais 4,97 Freezers horizontais 42,61 Lavadoras automáticas - 18,18 Fogões - 0,17 Condicionadores de ar 83,45 Supondo que no período de jul/ago de 2003 tenham sido vendidas 200.000 lavadoras automáticas, determine o número de unidades vendidas no mesmo período de 2004.

Page 19: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Capítulo 4 - Distribuição de Freqüência 4.1 Tabela Primitiva e Rol Tabela primitiva - elementos da variável ainda não foram numericamente organizados Ex:

Total de pontos (acertos) obtidos por 40 alunos em um teste de 175 questões 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Rol - é a tabela primitiva ordenada (crescente ou decrescente). Ex: 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 4.2 Distribuição de freqüência Com isso pode-se construir uma tabela denominada Distribuição de Freqüência, sendo a freqüência o numero de elementos relacionados a um determinado valor da variável. Ex:

Pontos Freqüência Pontos Freqüência Pontos Freqüência 150 1 158 2 167 1 151 1 160 5 168 2 152 1 161 4 169 1 153 1 162 2 170 1 154 1 163 2 172 1 155 4 164 3 173 1 156 3 165 1 157 1 166 1 total 40

Para uma melhor visualização e economia de espaço, agrupam-se os valores em intervalos de classe. Ex:

Total de pontos (acertos) obtidos em um teste de 175 questões por 40 alunos

Total de pontos Freqüência 150 |- 154 4 154 |- 158 9 158 |- 162 11 162 |- 166 8 166 |- 170 5 170 |- 174 3

Total 40

Page 20: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Para a confecção dessa tabela pode-se pular o passo anterior, ou seja, do rol já partir para a tabela de distribuição de freqüências com intervalos de classe. 4.3 Elementos de uma distribuição de freqüência a) Classes de freqüência: são os intervalos de variação da variável, representados por

i, sendo i = 1,2,3,4,...,k, onde k é o número total de classes. Em nosso exemplo k = 6 b) Limites da classe: são os extremos de cada classe. Limite superior Li Limite inferior li O símbolo li |- Li significa inclusão de li e exclusão de Li l2 = 154 e L2 = 158 c) Amplitude de um intervalo de classe (h) é a medida do intervalo que define a

classe h = Li - li h2 = 154-158 = 4 d) Amplitude total da distribuição (AT) é a diferença entre o limite superior da

ultima classe (limite superior máximo) e o limite inferior da primeira (limite inferior mínimo).

AT = L(max) - l (min) AT = 174 - 150 = 24 Deve-se notar que AT/h = k 24/4 = 6 e) Amplitude amostral (AA) : é a diferença entre o valor máximo e o valor mínimo

da amostra AA = x(máx) - x(mín) AA = 173-150 = 23 f) Ponto médio de uma classe (xi) : é o ponto que divide o intervalo de classe em duas partes iguais xi = (li+Li)/2 x2 = (154+158)/2 = 156 f) Freqüência simples ou absoluta: é o número de observações correspondentes a essa classe ou a esse valor f1 = 4 f2 = 9 f3 = 11 f4 = 8 f5 = 5 f6 = 3

Page 21: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

nfk

1ii =∑

= 40f

6

1ii =∑

= 4.4 Número de Classes, Intervalos de Classe Determinação do número de classes: utiliza-se a regra de Sturges (obs: não é obrigatório, é apenas uma orientação)

nlog3,31k ⋅+= onde, k é o número de classes e n é o numero total de dados. Esta fórmula nos permite obter a seguinte tabela

n k 3 |-| 5 3 6 |-| 11 4 12 |-| 22 5 23 |-| 46 6 47 |-| 90 7 91 |-| 181 8 182 |-| 362 9

Para determinação do intervalo de classe h aplica-se

kAAh = Quando o resultado não é exato, deve-se arredondá-lo para mais.

No caso 48,36

150173h ==−

= , ou seja, 6 classes de intervalo 4.

Exercício: .As notas obtidas por 50 alunos de uma classe foram:

1 2 3 4 5 6 6 7 7 8 2 3 3 4 5 6 6 7 8 8 2 3 4 4 5 6 6 7 8 9 2 3 4 5 5 6 6 7 8 9 2 3 4 5 5 6 7 7 8 9

Complete a distribuição de freqüência abaixo

i Notas xi fi

0 |- 2

2 |- 4

4 |- 6

6 |- 8

8 |- 10

Page 22: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Total 50 4.5 Tipos de freqüências a) Freqüência Simples ou Absoluta (fi) : é o valor que representa o número de dados de

uma classe, onde :

nfk

1ii =∑

=

b) Freqüência Relativa (fri): é a porcentagem entre a freqüência simples e a freqüência total:

[ ]%100f

ffr k

1ii

ii ⋅=∑=

No exemplo: fr3 = 11/40 = 0,275 x 100 = 27,5 %

É obvio que: %100fr

k

1ii =∑

= O propósito das freqüências relativas é o de permitir a análise e facilitar comparações. c) Freqüência Acumulada (Fi): é o total das freqüências de todos os valores inferiores

ao limite superior do intervalo de uma dada classe.

k321k ffffF ++++= L ou ∑=

=k

1iik fF

No exemplo F3 = f1 + f2 + f3 = 4+9+11=24, o que significa que existem 24 alunos com estatura inferior a 162 cm (limite superior do intervalo da terceira classe) d) Freqüência Acumulada relativa (Fri): é a porcentagem entre a freqüência relativa

acumulada da classe e a freqüência total da distribuição.

[ ]%100f

FFr k

1ii

ii ⋅=∑=

No exemplo temos Fr3 = 24/40 = 0,6 = 60 %, o que significa que 60 % dos alunos acertaram menos de 162 questões

Page 23: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Pode-se então montar a seguinte tabela:

i Total de Pontos xi fi fri (%) Fi Fri (%) 1 150 |- 154 152 4 10,00 4 10,00 2 154 |- 158 156 9 22,50 13 32,50 3 158 |- 162 160 11 27,50 24 60,00 4 162 |- 166 164 8 20,00 32 80,00 5 166 |- 170 168 5 12,50 37 92,50 6 170 |- 174 172 3 7,50 40 100,00 Total 40 1,000

Que nos ajuda a responder: 1) Quantos alunos acertaram entre 154, inclusive, e 158 questões ? Resp. 9 alunos 2) Qual a percentagem de alunos com total de pontos inferior a 154? Resp. 10% 3) Quantos alunos acertaram menos que 162 questões ? Resp. 24 alunos 4) Quantos alunos obtiveram um total de pontos não inferior a 158? Resp. 40-13 = 27

alunos 4.6 Distribuição de Freqüência sem Intervalo de Classe Quando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe, tomando a seguinte forma: Os resultados de um lançamento de um dado 50 vezes foram os seguintes:

6 5 2 6 4 3 6 2 6 5 1 6 3 3 5 1 3 6 3 4 5 4 3 1 3 5 4 4 2 6 2 2 5 2 5 1 3 6 5 1 5 6 2 4 6 1 5 2 4 3

i resultados fi fri Fi Fri

1 1

2 2

3 3

4 4

5 5

6 6

Total 50 1,000 Exercício: Complete a tabela abaixo e responda:

i Horas de estudo por xi fi fri Fi Fri

Page 24: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

semana

1 0 |- 5 5

2 5 |- 10 96

3 10 |- 15 57

4 15 |- 20 25

5 20 |- 25 11

6 25 |- 30 6

Total 1,000 Qual a porcentagem de pessoas que estudam menos de 15 horas ? Qual a porcentagem de pessoas que estudam 20 ou mais horas ?

Page 25: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

4.7 Representação Gráfica de uma Distribuição de Freqüência Pode-se ser representado basicamente por um histograma, por um polígono de freqüência ou por um polígono de freqüência acumulada. a) Histograma: O histograma é formado por um conjunto de retângulos justapostos,

cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. Seja o exemplo:

i Total de

Pontos xi fi Fi

1 150 |- 154 152 4 4 2 154 |- 158 156 9 13 3 158 |- 162 160 11 24 4 162 |- 166 164 8 32 5 166 |- 170 168 5 37 6 170 |- 174 172 3 40 Total 40

Histograma

0

2

4

6

8

10

12

Freq

uênc

ias

fi

150 154 158 162 166 170 174 Total de Pontos

b) Polígono de freqüência: É um gráfico em linha, sendo as freqüências marcadas

sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe.

Page 26: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

0

2

4

6

8

10

12

148 152 156 160 164 168 172 176

f

Total de Pontos

c) Polígono de freqüência acumulada: É traçado marcando-se as freqüências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe.

0

5

10

15

20

25

30

35

40

45

150 154 158 162 166 170 174

F

Total de pontos

0

2

4

6

8

10

12

148 152 156 160 164 168 172 176

fi

Total de Pontos

Page 27: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Polígono de freqüência com o histograma

4.8 - A Curva de Freqüência. Curva Polida O polígono de freqüência nos fornece uma imagem real e a curva uma imagem tendencial. A curva polida de uma amostra limitada se assemelha mais a curva resultante de um grande número de dados, do que o polígono de freqüência obtido da mesma amostra limitada. Utiliza-se uma nova freqüência, denominada calculada (fc).

4ff2f

fc )1i(i)1i(i

+− +⋅+=

No exemplo anterior tem-se:

i Total de Pontos xi fi Fi fc 0 146 |- 150 148 0 0 (0+2*0+4)/4 = 1 1 150 |- 154 152 4 4 (0+2*4+9)/4 = 4,25 2 154 |- 158 156 9 13 (4+2*9+11)/4 = 8,25 3 158 |- 162 160 11 24 (9+2*11+8)/4 = 9,75 4 162 |- 166 164 8 32 (11+2*8+5)/4 = 8 5 166 |- 170 168 5 37 (8+2*5+3)/4 = 5,25 6 170 |- 174 172 3 40 (5+2*3+0)/4 = 2,75 7 174 |- 178 176 0 40 (3+2*0+0)/4 = 0,75 Total 40

1

4,25

8,25

9,75

8

5,25

2,75

0,750

2

4

6

8

10

12

148 152 156 160 164 168 172 176

fc

Total de Pontos

Exercício - Construa o histograma, o polígono de freqüência, o polígono de freqüência acumulada e a curva polida da seguinte distribuição.

Page 28: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

i Total de Faltas de uma sala com 60

alunos

xi fi fci Fi

0

1 0 |- 2 5

2 2 |- 4 15

3 4 |- 6 25

4 6 |- 8 10

5 8 |- 10 5

6

Capítulo 5 - Medidas de Posição 5.1 Introdução Até agora os estudos de distribuição de freqüência efetuados nos permite localizar a maior e menor concentração dos valores de uma dada distribuição. No entanto, para destacar as tendências características necessita-se de elementos típicos da distribuição que são as: Medidas de posição Medidas de variabilidade ou dispersão Medidas de assimetria Medidas de curtose

As medidas de posição nos orienta quanto a posição da distribuição em relação ao eixo horizontal. As medidas mais importantes são as medidas de tendência central (os dados tendem a se agrupar em torno de valores centrais). Dentre elas destacam-se: A média aritmética A mediana A moda

Outras medidas de posição são as separatrizes que são: A mediana Os quartis Os percentis 5.2 Media Aritmética ( x )

Page 29: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

n

xx

n

1ii∑

==

onde xi são os valores da variável e n o número de valores.

a) Desvio em relação a média (di) xxd ii −=

b) Propriedades: 0dn

1ii =∑

=A soma algébrica dos desvio em relação a média é nula Somando-se (ou subtraindo-se) uma constante (c) de todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante. Multiplicando-se (ou dividindo-se) uma constante (c) de todos os valores de uma variável, a média do conjunto fica multiplicada (ou dividida) por essa constante. Exemplo: Seja a nota de 10 alunos: 8, 9, 7, 6, 10, 5,5, 5, 6,5, 7,5, 8,5

A média é 3,710

5,85,75,655,5106798x =+++++++++

=

Desvios:

8 - 7,3 0,7 9 - 7,3 1,7 7 - 7,3 -0,3 6 - 7,3 -1,3 10 - 7,3 2,7 5,5 - 7,3 -1,8 5 - 7,3 -2,3

6,5 - 7,3 -0,8 7,5 - 7,3 0,2 8,5 - 7,3 1,2

Total 0,0 c) para dados agrupados (distribuição de freqüência sem intervalos de classe) Seja a seguinte distribuição:

no de filhos (xi) que se deseja ter

fi fi . xi

0 2 0 1 6 6 2 10 20 3 12 36 4 4 16

Page 30: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Total 34 78

=

=

⋅=

n

1ii

n

1iii

f

)xf(x

tem-se então: 3,2~294,23478x ===

d) para dados agrupados (distribuição de freqüência com intervalos de classe). Adota-se o seguinte: todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio. Seja a seguinte distribuição:

i Total de pontos

xi fi fi . xi

1 150 |- 154 152 4 608 2 154 |- 158 156 9 14043 158 |- 162 160 11 17604 162 |- 166 164 8 13125 166 |- 170 168 5 840 6 170 |- 174 172 3 516 Total 40 6440

tem-se então: 16140

6440x == pontos

Exercício 1 - Complete a tabela e calcule a média aritmética da distribuição.

Qtde de cursos de extensão realizados por ano (xi) pelos alunos do 3o Mat

fi fi . xi

1 2

2 4

3 6

4 8

5 3

6 1

Exercício 2 - Complete a tabela e calcule a média aritmética da distribuição.

Page 31: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

i Salário Mensal dos alunos do 3o Mat [R$]

xi fi fi . xi

1 450 |- 550 8

2 550 |- 650 10

3 650 |- 750 11

4 750 |- 850 16

5 850 |- 950 13

6 950 |- 1050 5

7 1050 |- 1150 1

Total

e) Processo breve Há uma mudança de variável x por outra y, tal que:

hxxy 0i

i−

=

x0 é uma constante escolhida convenientemente entre os pontos médios da distribuição, de preferência o de maior valor de freqüência, e h é o intervalo de classe. A média então é calculada por:

( )

=

=

⋅⎟⎠

⎞⎜⎝

⎛⋅

+= n

1ii

n

1iii

0

f

hyfxx

Exemplo: Escolhendo x0 = 160 e como h = 4

i Total de Pontos xi fi yi fi . yi1 150 |- 154 152 4 -2 -8 2 154 |- 158 156 9 -1 -9 3 158 |- 162 160 11 0 0 4 162 |- 166 164 8 1 8 5 166 |- 170 168 5 2 10 6 170 |- 174 172 3 3 9 Total 40 10

Então: 16140

410160x =⋅

+= pontos

Page 32: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Exercício 3: Pelo processo breve, calcule a média aritmética da distribuição.

i Salário Mensal dos alunos do 3o Mat [R$]

xi fi yi fi . yi

1 450 |- 550 8

2 550 |- 650 10

3 650 |- 750 11

4 750 |- 850 16

5 850 |- 950 13

6 950 |- 1050 5

7 1050 |- 1150 1

Total

Page 33: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Exercício 4: Pelo processo breve, calcule a média aritmética da distribuição.

i Valor da hora aula de profissionais da educação [R$]

xi fi yi fi . yi

1 30 |- 50 2

2 50 |- 70 8

3 70 |- 90 12

4 90 |- 110 10

5 110 |- 130 5

Total

5.3 A Moda (Mo) Denomina-se moda o valor que ocorre com maior freqüência em uma série de valores. Caso 1) Dados não agrupados. Basta procurar o valor que mais se repete. Ex: 3,4,5,6,6,6,6,7,7,8,9 A série tem moda igual a 6 (valor modal 6) Pode acontecer também uma série sem valor modal. Ex: 1,2,3,4,5,6,7,8,9 série amodal Pode acontecer também uma série com mais de uma moda. Ex: 1,2,2,2,3,4,5,6,6,6,7,8,9 a série tem duas modas (2 e 6) - série bimodal Caso 2) Dados agrupados. a) sem intervalos de classe. Basta identificar o valor da variável que possui maior

freqüência. Ex: Seja a seguinte distribuição: Mo = 3 no de filhos (xi) que se deseja ter

fi

0 2 1 6 2 10 3 12 4 4

Total 34 b) com intervalos de classe. A classe com maior freqüência é denominada classe

modal, o cálculo da moda bruta é semelhante ao do ponto médio do intervalo de classe.

Page 34: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

2LxMo i

+==l

Ex: Seja a distribuição:

i Total de pontos xi fi1 150 |- 154 152 4 2 154 |- 158 156 9 3 158 |- 162 160 11 4 162 |- 166 164 8 5 166 |- 170 168 5 6 170 |- 174 172 3 Total 40

Então: a classe modal é i = 3, logo Mo = 160 pontos Exercício: Calcule a moda da seguinte distribuição: i Salário Mensal dos

alunos do 3o Mat [R$]

fi

1 450 |- 550 8 2 550 |- 650 10 3 650 |- 750 11 4 750 |- 850 16 5 850 |- 950 13 6 950 |- 1050 5 7 1050 |- 1150 1 Total 64

5.4 Mediana (Md) A mediana é o número que se encontra no centro de uma série de números, ou seja, separa os valores em dois subconjuntos de mesmo número de elementos. Caso 1 ) Dados não agrupados Dada uma série de valores: 5,13,10,2,18,15,6,16,9 Deve-se então ordená-los: 2,5,6,9,10,13,15,16,18 Determina-se então o valor central que é 10 (4 valores para cada lado) Md = 10

Page 35: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Se a série tiver número par de valores, a mediana é a média dos dois valores centrais: 2,5,6,9,10,15,16,18 Md = (9+10)/2 = 9,5 Caso 2 ) Dados agrupados No caso de distribuição de freqüência deve-se primeiramente determinar a freqüência acumulada. Determina-se então, o valor que divide a distribuição em duas partes iguais. Aplica-se então:

2fi∑

a) sem intervalos de classe. Dada a série:

no de filhos (xi) que se deseja ter

fi Fi

0 2 2 1 6 8 2 10 18 3 12 30 4 4 34

Total 34

Então: 172

342fi ==∑

A menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável.

Md = 2

No caso de ii F

2f=∑

acontecer, a mediana será dada por: 2xxMd 1ii ++

= . Exemplo:

i no de filhos (xi)

que se deseja terfi Fi

1 0 2 2 2 1 6 8 3 2 10 18 4 3 12 30 5 4 6 36 Total 36

3i F18

2f

==∑, então: 5,2

232Md =

+=

Exercícios:

Page 36: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

1) Calcule a mediana das seguintes distribuições: i Qtde de anos de

estudo (xi) fi Fi

1 13 6 2 14 14 3 15 24 4 16 16 5 17 8 Total

i Qtde de disciplinas em dependência

fi Fi

1 0 2 2 1 5 3 2 9 4 3 7 5 4 6 6 5 3 Total

b) com intervalos de classe: segue-se os seguintes passos: 1o - Determina-se as freqüências acumuladas

2o - Calcula-se 2fi∑

3o - Marca-se a classe correspondente a freqüência acumulada imediatamente superior a

2fi∑

(classe mediana) e emprega-se a fórmula:

( )

i

i

i f

hantF2f

Md

⋅⎥⎥⎦

⎢⎢⎣

⎡−

+=

∑l

onde: é o limite inferior da classe mediana lF(ant) é a freqüência acumulada da classe anterior a classe mediana h é a amplitude do intervalo da classe mediana fi é a freqüência do intervalo da classe mediana Exemplo:

i Total de pontos fi Fi1 150 |- 154 4 4 2 154 |- 158 9 13 3 158 |- 162 11 24 4 162 |- 166 8 32 5 166 |- 170 5 37

Page 37: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

6 170 |- 174 3 40 Total 40

20240

2fi ==∑

, logo classe mediana é i = 3 = 158 F(ant) = 13 h = 4

f

l

3 = 11

[ ] 5,1605,215811

41320158Md =+=⋅−

+=

No caso de ii F

2f=∑

acontecer, a mediana será o limite superior da classe

correspondente. Exercício: Calcule a mediana das seguintes distribuições: i Salário Mensal dos

alunos do 3o Mat [R$]

fi Fi

1 450 |- 550 8 2 550 |- 650 10 3 650 |- 750 11 4 750 |- 850 16 5 850 |- 950 13 6 950 |- 1050 5 7 1050 |- 1150 1 Total 64

i Valor da hora aula de profissionais da educação [R$]

fi Fi

1 30 |- 50 2

2 50 |- 70 8

3 70 |- 90 12

4 90 |- 110 10

5 110 |- 130 5

Total

5.5 Os Quartis

Page 38: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Denomina-se quartis os valores de uma série que a dividem em quatro partes iguais. Portanto, há três quartis. São mais aplicados em distribuição de freqüência com intervalos de classe. Primeiro Quartil (Q1) - 25 % dos dados são menores que ele e os 75 % restantes são maiores. Segundo Quartil (Q2) - coincide com a mediana, 50 % para cada lado. Terceiro Quartil (Q3) - 75 % dos dados são menores que ele e os 25 % restantes são maiores.

Para o caso de dados agrupados, basta aplicar: 4

fk i∑, sendo k o número de ordem do

quartil. Então:

( )

i

i

i1 f

hantF4f

Q

⋅⎥⎥⎦

⎢⎢⎣

⎡−

+=

∑l

( )

i

i

i2 f

hantF4

f2

Q⋅⎥

⎤⎢⎣

⎡−

+=

∑l

( )

i

i

i3 f

hantF4

f3

Q⋅⎥

⎤⎢⎣

⎡−

+=

∑l

Exemplo:

i Total de Pontos fi Fi1 150 |- 154 4 4 2 154 |- 158 9 13 3 158 |- 162 11 24 4 162 |- 166 8 32 5 166 |- 170 5 37 6 170 |- 174 3 40 Total 40

Primeiro Quartil

10440

4fi ==∑

, logo classe do 1o Quartil é i = 2 = 154 F(ant) = 4 l

h = 4 f2 = 9

[ ] 7,15666,15666,21549

4410154Q1 ==+=⋅−

+=

Segundo Quartil = Mediana

20240

4f2 i ==∑

, logo classe do 2o Quartil é i = 3 = 158 F(ant)

= 13

l

h = 4 f3 = 11

Page 39: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

[ ] 5,1605,215811

41320158MdQ2 =+=⋅−

+==

Terceiro Quartil

304403

4f3 i =

⋅=∑

, logo classe do 3o Quartil é i = 4 = 162 F(ant)

= 24

l

h = 4 f4 = 8

[ ] 16531628

42430162Q3 =+=⋅−

+=

Exercício: Calcule os quartis da seguinte distribuição: i Salário Mensal dos alunos

do 3o Mat [R$]

fi Fi

1 450 |- 550 8 2 550 |- 650 10 3 650 |- 750 11 4 750 |- 850 16 5 850 |- 950 13 6 950 |- 1050 5 7 1050 |- 1150 1 Total 64

5.6 Os Percentis Denomina-se percentis os noventa e nove valores que separam uma série em 100 partes iguais. Indica-se da seguinte forma: P1,P2,P3,...P99Note-se que: P50 = Md, P25 = Q1 e P75 = Q3Calcula-se da mesma forma que os quartis, só que aplicando:

100fk i∑

, sendo k o número de ordem do percentil.

( )

i

i

iK f

hantF100

fk

P

⋅⎥⎥⎦

⎢⎢⎣

⎡−

+=

∑l

Exemplo: i Total de Pontos fi Fi1 150 |- 154 4 4 2 154 |- 158 9 13 3 158 |- 162 11 24 4 162 |- 166 8 32 5 166 |- 170 5 37 6 170 |- 174 3 40

Page 40: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Total 40 Tem-se para o oitavo percentil:

2,3100

408100

f88k i =

⋅==>= ∑

, logo classe do 8o Percentil é i = 1

l = 150 F(ant) = 0 h = 4 f1 = 4

[ ] 2,1532,31504

402,3150P8 =+=⋅−

+=

Exercício: Calcule o percentil de ordem 20 da seguinte distribuição:

i Salário Mensal dos alunos do 3o Mat [R$]

fi Fi

1 450 |- 550 8 2 550 |- 650 10 3 650 |- 750 11 4 750 |- 850 16 5 850 |- 950 13 6 950 |- 1050 5 7 1050 |- 1150 1 Total 64

Page 41: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Capítulo 6 - Medidas de Dispersão ou de Variabilidade 6.1 Amplitude total (AT) a) a amplitude total é a diferença entre o maior valor e o menor valor observado:

MÍNMÁX xxAT −= Exemplo: 40, 45, 48, 52, 54, 62, e 70 AT = 70 - 40 = 30 Quanto maior a amplitude total , maior será a dispersão dos valores da variável em torno da média. 6.2 Variância (s2) e Desvio Padrão (s)

São mais estáveis que a amplitude total, não sofrem tanto a interferência de valores extremos.

a) para dados não agrupados

A variância é a média aritmética dos quadrados dos desvios:

( ) ( )n

xxf

xxs

2i

i

2i2 ∑∑

∑ −=

−=

A variância é um número em unidade quadrada em relação a média, por isso, definiu-se o desvio padrão como a raiz quadrada da variância. O desvio padrão é a raiz quadrada da média aritmética dos quadrados dos desvios. Para evitar o acúmulo de erro por arredondamento, simplifica-se o cálculo do desvio padrão com a seguinte:

( ) ( )nx

xxx2

i2i

2i

∑∑∑ −=−

que resulta em: 2

i2i

nx

nx

s ⎟⎟⎠

⎞⎜⎜⎝

⎛−= ∑∑

Obs: Quando calcula-se a variância ou o desvio padrão de uma população através de uma amostra dessa, deve-se substituir o denominador n por n-1.

Propriedades: 1a: Somando-se (ou subtraindo-se) uma constante a (de) todos os valores de uma variável, o desvio padrão não se altera. 2a.: Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante.

Page 42: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Exemplo: Calcule o desvio padrão da seguinte série:

i xi xi

2

1 8 64 2 10 100 3 11 121 4 15 225 5 16 256 6 18 324 Total 78 1090

56,316967,181678

61090

nx

nx

s22

i2i =−=⎟

⎠⎞

⎜⎝⎛−=⎟

⎟⎠

⎞⎜⎜⎝

⎛−= ∑∑

b) para dados agrupados sem intervalos de classe: deve-se levar em conta as freqüências.

2

ii2ii

n)xf(

n)xf(

s ⎟⎟⎠

⎞⎜⎜⎝

⎛ ⋅−

⋅= ∑∑

Exemplo: i Qtde de filhos que se

deseja ter (xi) fi fi . xi fi . xi

2

1 0 2 0 0 2 1 6 6 6 3 2 12 24 48 4 3 7 21 63 5 4 3 12 48

Total 30 63 165

04,141,45,53063

30165

n)xf(

n)xf(

s22

ii2ii =−=⎟

⎠⎞

⎜⎝⎛−=⎟

⎟⎠

⎞⎜⎜⎝

⎛ ⋅−

⋅= ∑∑

Exercício: Determine o desvio padrão.

i Qtde de cursos de extensão realizados por ano (xi) pelos alunos do 3o Mat

fi fi . xi fi . xi2

1 1 2

2 2 5

3 3 8

Page 43: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

4 4 6

5 5 3

6 6 1

Total 25

c) para dados agrupados com intervalos de classe: também leva-se em conta as freqüências e xi é o ponto médio do intervalo de classe. Exemplo:

i Total de Pontos xi fi fixi fixi2

1 150 |- 154 152 4 608 92416 2 154 |- 158 156 9 1404 219024 3 158 |- 162 160 11 1760 281600 4 162 |- 166 164 8 1312 215168 5 166 |- 170 168 5 840 141120 6 170 |- 174 172 3 516 88752 Total 40 6440 1038080

57,531259212595240

644040

1038080n

)xf(n

)xf(s

22ii

2ii ==−=⎟

⎠⎞

⎜⎝⎛−=⎟

⎞⎜⎝

⎛ ⋅−

⋅= ∑∑

Processo breve: Da mesma maneira que o cálculo da média, muda-se a variável X por outra Y, tal que:

hxxy 0i

i−

= e

2ii

2ii

n)yf(

n)yf(

hs ⎟⎟⎠

⎞⎜⎜⎝

⎛ ⋅−

⋅⋅= ∑∑

Exemplo: i Total de Pontos xi fi yi fiyi fiyi

2

1 150 |- 154 152 4 -2 -8 16 2 154 |- 158 156 9 -1 -9 9 3 158 |- 162 160 11 0 0 0 4 162 |- 166 164 8 1 8 8 5 166 |- 170 168 5 2 10 20 6 170 |- 174 172 3 3 9 27 Total 40 10 80

57,5391941,149375,140625,0244010

40804s

2

=⋅=⋅=−⋅=⎟⎠⎞

⎜⎝⎛−⋅=

Resolva: Calcule o desvio padrão pelo processo breve. i Salário Mensal dos

alunos do 3o Mat [R$]

xi fi yi fiyi fiyi2

1 450 |- 550 8

Page 44: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

2 550 |- 650 10

3 650 |- 750 11

4 750 |- 850 16

5 850 |- 950 13

6 950 |- 1050 5

7 1050 |- 1150 1

Total 64

i Peso kg xi fi yi fiyi fiyi2

1 30 |- 50 2

2 50 |- 70 8

3 70 |- 90 12

4 90 |- 110 10

5 110 |- 130 5

Total 37

6.3- Coeficiente de Variação (CV)

É a porcentagem do desvio padrão em relação a sua média.

100xsCV ⋅=

Exemplo: Para o exemplo anterior, das estaturas, tem-se média de 161 cm e desvio padrão de 5,57 cm

%5,3459,3100161

57,5CV ==⋅=

Resolva: Calcule o CV dos dois últimos exercícios de cálculo de desvio padrão pelo processo breve.

a) 154s755x

==

Page 45: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

b) 88,21s3,84x

==

Conclusão: Quanto maior o CV maior será a dispersão

Quanto menor o CV menor será a dispersão

Page 46: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Exercícios de Revisão: Os dados abaixo referem-se a idade das pessoas que compraram um determinado produto novo durante um dia. Determine:

i Idade xi fi Fi yi fiyi fiyi2 fixi fixi

2

1 0 |- 10 10

2 10 |- 20 26

3 20 |- 30 15

4 30 |- 40 8

5 40 |- 50 4

6 50 |- 60 3

7 60 |- 70 2

Total

a) Média; b) Desvio Padrão; c) Mediana d) Primeiro Quartil e) Terceiro Quartil f) P40

Page 47: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

TABELA DE NÚMEROS ALEATÓRIOS:

4 0 8 9 3 2 1 5 0 9 7 2 3 1 1 2 2 9 9 1 6 3 2 2 0 7 3 3 4 2 7 5 7 9 3 59 4 2 9 8 8 3 9 5 6 5 6 0 3 5 4 2 1 5 6 0 8 7 6 7 4 7 5 8 4 4 7 4 5 7 49 1 6 2 3 4 9 3 5 1 3 1 7 4 6 7 5 9 1 2 3 1 0 9 3 3 7 2 1 7 4 5 0 3 0 71 8 9 3 3 5 4 0 7 7 8 0 6 0 0 2 8 8 8 2 0 7 0 6 3 7 2 0 8 6 8 3 4 6 6 75 4 6 3 4 6 8 1 0 6 9 1 3 2 0 3 4 5 8 5 1 1 0 4 0 8 4 1 6 6 3 6 5 8 2 28 9 7 1 4 1 9 7 8 6 9 5 9 4 1 0 4 3 8 6 8 6 3 7 7 8 0 4 7 7 9 7 7 1 9 33 3 3 4 4 8 5 8 0 1 4 1 7 8 0 9 4 9 7 5 9 8 7 7 6 8 6 8 7 9 9 6 6 0 3 74 5 4 1 4 2 7 4 5 4 5 3 7 9 6 3 0 7 0 7 8 4 3 7 5 1 0 5 0 0 3 7 8 5 8 30 9 3 7 3 7 5 9 0 2 2 6 2 8 6 5 4 3 8 3 6 8 7 6 8 0 0 5 7 6 7 3 0 8 2 30 0 3 1 2 5 7 2 2 7 0 0 5 3 8 3 0 1 6 8 9 9 2 0 3 2 6 7 5 0 6 8 9 5 9 74 0 5 8 6 0 2 8 6 8 1 9 6 0 1 1 2 4 1 1 2 0 4 9 5 2 8 1 3 8 2 8 3 9 8 04 8 5 1 7 7 0 8 2 9 6 1 6 1 5 1 5 1 9 8 3 9 5 2 9 3 6 1 7 7 5 3 4 2 1 38 3 7 7 3 8 8 0 7 7 6 8 1 1 0 4 2 1 3 9 2 1 6 8 0 9 1 6 7 5 5 4 5 3 4 49 4 7 8 1 3 9 9 9 4 5 8 0 9 3 0 1 4 7 1 2 6 1 1 3 1 3 2 5 3 0 0 1 9 3 77 2 5 5 0 1 7 6 5 1 3 7 4 6 7 5 3 8 9 7 0 1 1 2 1 1 1 0 5 2 5 2 3 3 8 07 5 0 2 3 0 9 7 0 3 3 6 8 9 7 5 1 7 7 2 7 8 3 8 5 9 5 8 9 2 5 5 8 0 2 20 5 4 8 6 6 0 5 9 8 7 6 8 7 8 3 1 6 8 7 4 6 6 8 9 6 3 6 5 4 0 2 2 1 0 17 7 3 3 6 5 7 7 5 2 5 9 4 2 7 4 3 6 6 2 1 2 2 4 9 0 6 4 8 9 9 7 0 7 9 88 7 1 2 0 7 3 1 5 0 9 1 9 0 1 8 2 9 8 3 1 3 6 4 8 9 6 1 1 5 1 8 1 6 8 89 1 4 1 8 8 4 0 5 1 7 4 1 2 9 3 2 5 3 3 9 8 7 6 6 9 3 6 4 7 4 8 4 2 3 51 3 3 3 9 9 4 1 5 8 1 8 8 1 2 0 9 7 2 6 1 5 7 5 2 5 2 0 7 5 1 5 8 9 4 56 4 0 9 5 0 9 5 0 4 3 3 2 3 6 5 5 6 7 6 0 2 2 9 5 7 8 4 8 6 0 9 0 4 1 56 6 1 2 3 5 2 3 3 4 5 3 9 0 2 9 5 4 3 6 5 9 5 0 6 5 6 4 4 7 1 6 7 2 0 63 6 8 4 3 8 5 3 1 7 3 3 9 9 3 3 8 5 9 8 1 1 7 1 3 7 6 9 3 2 3 4 4 5 7 96 0 9 7 0 3 9 6 6 1 9 5 8 7 2 2 4 8 1 2 4 3 4 4 7 8 7 1 3 8 1 5 8 2 6 92 9 5 9 4 1 2 2 8 6 4 5 0 3 4 3 2 8 2 6 7 0 9 0 9 3 9 2 1 4 7 0 4 6 8 69 4 9 5 5 5 9 2 5 3 8 8 2 4 9 3 6 4 7 0 3 9 6 7 6 0 7 0 6 8 6 5 6 3 9 26 6 7 9 3 5 6 9 3 0 0 3 0 1 3 3 1 7 8 5 1 7 0 7 7 6 5 8 7 0 5 5 9 0 6 56 6 5 0 6 2 3 2 2 8 9 5 2 9 0 5 1 5 1 5 4 0 7 5 0 4 9 4 4 2 2 1 2 7 4 16 2 6 1 2 2 0 6 0 5 2 5 2 6 3 9 2 8 3 6 2 6 5 9 1 3 5 0 8 2 1 9 6 5 0 32 6 6 6 3 1 7 2 8 4 3 5 1 2 8 1 2 6 0 4 9 8 0 1 6 6 0 7 2 2 9 7 6 8 1 46 3 1 4 6 0 4 4 7 5 2 9 5 1 7 4 3 7 3 7 7 1 1 5 2 0 8 6 7 8 6 0 5 2 2 42 3 1 5 5 0 4 6 7 3 2 9 1 0 3 8 3 7 8 2 3 0 7 8 1 4 3 4 3 6 8 8 8 1 9 19 2 8 1 4 2 3 1 5 8 2 0 8 4 0 1 6 9 1 2 5 2 4 0 2 6 5 2 9 4 2 0 0 6 7 19 4 8 6 1 3 9 1 3 1 5 8 1 1 7 0 3 6 4 6 3 8 9 1 4 1 7 2 6 0 4 5 1 2 3 99 3 1 8 4 1 6 1 2 8 4 8 0 9 0 4 7 5 6 0 0 4 5 8 5 0 4 1 8 0 1 2 7 1 8 04 5 8 4 2 0 2 4 6 0 6 4 9 8 2 5 0 7 5 1 8 3 4 8 9 5 9 9 2 6 0 0 6 1 6 88 7 5 2 6 5 0 7 2 0 2 2 0 7 2 0 0 6 2 1 5 0 9 2 0 8 2 2 9 9 4 6 8 5 9 37 6 6 1 7 5 1 3 7 8 6 5 6 8 9 1 3 1 3 6 4 8 7 8 9 0 7 1 3 6 2 9 8 8 7 33 1 7 8 9 0 4 7 7 2 9 4 4 1 4 5 1 1 5 9 4 4 7 1 6 5 7 6 9 5 6 0 2 1 0 09 0 5 2 8 9 1 6 6 9 2 2 4 0 4 7 2 1 9 9 2 7 7 5 7 7 4 5 4 9 2 7 6 5 4 39 3 3 7 7 4 8 0 4 7 3 2 8 0 6 3 6 5 9 5 8 6 8 2 2 5 6 3 3 8 9 8 7 2 9 49 8 4 3 7 1 9 9 8 0 0 2 4 4 5 0 7 3 1 1 8 5 8 1 8 5 8 6 8 6 7 7 0 0 7 32 2 9 9 6 4 8 9 2 9 5 4 1 8 1 4 3 1 0 4 6 9 3 6 9 5 0 0 8 6 6 9 2 0 5 37 9 9 9 4 7 9 2 9 0 9 4 3 0 1 2 2 4 7 3 6 0 2 4 1 0 2 8 9 5 3 5 5 0 0 98 1 6 2 9 6 3 1 5 6 3 1 0 8 5 8 8 5 5 9 2 0 9 1 9 4 4 8 2 1 6 3 5 6 9 34 5 7 2 1 6 5 0 1 2 9 9 8 9 2 9 1 1 5 8 3 6 9 5 1 6 6 7 5 3 2 7 1 6 8 27 4 0 2 0 7 8 8 9 1 4 0 1 8 7 8 9 1 1 1 1 8 5 3 5 9 8 5 3 8 5 4 2 9 2 99 0 2 1 4 0 9 2 5 0 6 3 0 9 9 0 1 1 2 4 9 7 1 5 2 2 4 6 8 3 9 9 9 2 1 58 7 4 1 4 7 9 7 4 8 7 0 8 6 2 7 4 5 1 7 0 4 5 1 5 0 3 9 4 4 4 8 3 6 9 03 3 5 3 8 3 6 1 0 6 8 9 0 0 7 1 5 2 0 1 8 0 7 4 2 8 2 7 2 8 2 1 8 7 3 56 1 8 0 4 8 5 7 8 4 0 3 4 9 2 9 4 4 1 2 7 5 4 9 8 3 5 2 8 0 5 6 0 2 8 26 6 5 6 6 0 8 3 9 5 1 6 7 3 7 9 1 7 4 2 5 5 4 2 9 8 6 0 5 5 7 3 8 3 0 49 1 3 6 3 8 0 0 4 3 5 2 6 8 2 2 5 4 1 0 3 5 3 7 0 9 9 7 8 0 7 0 8 6 3 13 2 3 9 0 5 8 7 8 4 4 0 0 9 6 1 2 2 6 1 4 1 2 3 3 1 5 2 9 3 2 7 3 3 1 46 3 8 1 2 7 1 9 8 8 3 7 1 9 7 3 2 7 4 0 0 5 9 5 9 2 3 1 3 2 5 6 3 2 9 4

Page 48: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Tamanho da Amostra para populações finitas

( ) ( )[ ]( ) ( ) ([ ])n/x1n/xze1N

Nn/x1n/xzn 22

2

−⋅⋅+⋅−⋅−⋅⋅

=

n = tamanho da amostra N = tamanho da população e = % de erro na forma unitária z = intervalo de confiança, 1,96 para 95% de confiança (valor usual) 2,58 para 99% de confiança. x/n = proporção esperada. O valor de n é máximo para x/n = 0,50 Resultando em:

[ ]( ) [ ]

( ) 9604,0e1NN9604,0n

50,0150,096,1e1NN50,0150,096,1n

2

22

2

+⋅−⋅

=

=−⋅⋅+⋅−⋅−⋅⋅

=

Exemplo: erro 2% 0,02z= 1,96x/n = 0,5

Page 49: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

População Amostra100 96200 185300 267400 343500 414600 480700 542800 600900 655

1000 7061100 7551200 8001300 8441400 8851500 9231600 9601700 9961800 10291900 10612000 1091

População Amostra10000 193620000 214430000 222340000 226550000 229160000 230970000 232180000 233190000 2339

100000 2345

População Amostra100000 2345200000 2373300000 2382400000 2387500000 2390600000 2391700000 2393800000 2394900000 2395

1000000 2395 População Amostra

1000000 23952000000 23983000000 23994000000 24005000000 24006000000 24007000000 24008000000 24009000000 2400

10000000 2400115000000 2401

Cálculo do erro

( ) ( )[ ]n

n/x1n/xze −⋅⋅= para população desconhecida

( ) ( )[ ]1NnN

nn/x1n/xze

−−

⋅−⋅

⋅= para população conhecida

para z = 1,96 e x/n = 0,50 tem-se:

n198,0e ⋅= para população desconhecida

Page 50: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

)1N(nnN98,0e−⋅

−⋅= para população conhecida

População = 100Amostra Erro

10 0,3020 0,2030 0,1540 0,1250 0,1060 0,0870 0,0680 0,0590 0,03

100 0,00 Bibliografia STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo: Editora HARBRA Ltda, 1981

Page 51: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

BIBLIOGRAFIA: COSTA NETO, P. L. de O. Probabilidades. São Paulo: Editora Edgard Blucher Ltda, 1985. COSTA NETO, P. L. de O. Estatística. São Paulo: Editora Edgard Blucher Ltda, 17o ed. 1999. CRESPO, A. A. Estatística Fácil. São Paulo: Editora Saraiva, 17o ed. 1999. DANTE, L. R. Matemática: Contexto de Aplicações. São Paulo: Editora Ática, 1999. DOWNING, D. , CLARK, J. Estatística Aplicada. São Paulo: Editora Saraiva, 2000. KAZMIER, L. J. Estatística Aplicada à Economia e Administração. São Paulo: Editora Makron books Ltda., 1982. LAPPONI, J. C. Estatística Usando Excel. São Paulo: Editora Lapponi, 2000. LEVIN, J. Estatística Aplicada a Ciências Humanas, 2a edição. São Paulo: Editora Harper & Row do Brasil Ltda, 1978. NICK, E. , KELLNER, S. R. O. Fundamentos de Estatística para as Ciências do Comportamento. Rio de Janeiro: Editora Renes, 1971. SIEGEL, S. Estatística Não Paramétrica. São Paulo: Editora McGraw-Hill do Brasil Ltda, 1975. STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo: Editora Harper & Row do Brasil Ltda, 1981. TRIOLA, M. F. Introdução à Estatística. Rio de Janeiro: Livros Técnicos e Científicos Editora S.A., 7a ed. 1999.

Page 52: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Apêndice 01

1. Calcule em cada caso, a média aritmética dos valores:

a) 18 – 21 – 25 – 19 – 20 – 23 – 21 b) 35 – 36 – 37 – 38 – 39 – 40 c) 7 – 7 – 7 – 8 – 8 – 8 – 9 – 9 – 10 – 10 – 10 – 10 d) 0,5 – 0,5 – 0,5 – 0,5 – 0,25 – 0,25 e) A – a – a – a – a – b – b – b – b – c – c f) 43 – 49 – 52 – 41 – 47 – 50 – 53 – 44

2. Um ônibus de excursão partiu com 40 turistas a bordo dos quais 8 reservaram a

viagem com antecedência e pagaram cada um R$ 300,00. Os demais pagaram cada um R$ 340,00 pela viagem, Qual foi o preço médio que cada turista pagou nessa excursão?

3. Sejam A = (x, 6, 3, 4, 5) e B = (9, 4, 8, x, 6, 11, 3).

a) Determine x para que as médias aritméticas dos dois conjuntos sejam iguais. b) Determine os possíveis valores inteiros de x de modo que Ax não ultrapasse 4 e

Bx seja, no mínimo, igual a 5.

4. Para que os valores de a as médias aritméticas de (- 3, a, 10, 9) e (- 2, 3, a2, - 5) coincidem?

5. x é uma variável que assume os valores, 11 – 8 – 7 – a – 16 – 10.

Determine a de modo que: a) 11=x b) 1312 <≤ x c) 0<x

6. Os dados na tabela ao lado referem-se ao número de umidades de um livro

didático vendidas, mês a mês, nos dois primeiros anos após seu lançamento.

Mês 1a ano 2a ano Janeiro 2460 3152

Fevereiro 2388 2963 Março 2126 2049 Abril 1437 1614 Maio 931 1024 Junho 605 898 Julho 619 910

Agosto 421 648 Setembro 742 937

Page 53: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Outubro 687 702 Novembro 1043 1051 Dezembro 1769 2016

a) Do primeiro para o segundo ano de vendas, a média mensal de livros

vendidos aumentou em x unidades. Qual é o valor de x? b) Do primeiro para o segundo ano de vendas, a média mensal de livros

vendidos aumentou em y%. Qual é o valor de y?

7. Os dados seguintes referem - se às quantidades mensais de CDs do cantor x vendidos durante um ano.

3000 – 4000 – 3500 – 5200 – 6700 – 5000 8500 – 7600 – 6500 – 6400 – 7000 – 5400

a) Em quantos meses as vendas mensais superaram a média de CDs vendidos?

8. A média aritmética de 80 números é igual a 40,5. Adicionando-se a esse

conjunto de valores o número 243, qual será a média aritmética?

9. A média aritmética de uma lista formada por 55 números é igual a 28. Adicionando – se dois números a essa relação, a média aumenta em 2 unidades. Determine-os, sabendo que um deles é o triplo do outro.

10. A média aritmética de 45 números é igual a 6. Ao acrescentarmos o número x a

esses valores, a média aumenta em 50%.

a) Qual é o valor de x?

b) Qual é a média aritmética dos números ?12

;8

;6

;4

;2

xxxxx

11. Uma prova de Conhecimentos Gerais foi aplicada em duas turmas, A e B, com n

e m alunos, respectivamente. A média das notas da turma A foi 6,8 e a da turma B foram 5,2. Juntando as notas das duas turmas, a média geral foi 5,8.

a) Intuitivamente, responda O que é maior n ou m? b) Determine n e m, sabendo que a diferença entre eles é igual a 14.

12. A média de “pesos” de 25 clientes hospedadas em um SPA era de 84 Kg. A elas juntou-se um grupo de n amigas. Curiosamente, cada amiga desse grupo pesava 90 Kg. Determine o valor de n, sabendo que a média de ¨pesos¨ de todas as clientes hospedadas no SPA aumentou em 1 quilograma.

13. A média aritmética de 15 números é 26. Retirando - se um deles, a média dos

demais passa a ser 25. Qual foi o número retirado?

Page 54: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

14. A média aritmética de n números é 29. Retirando-se o número 24, a média aumenta para 30. Qual é o valor de n?

15. Determine n a fim de que a média aritmética dos números 2 n, 2n + 1,2n + 2 e 2 n + 3

seja igual a 60. 16. A média aritmética de 7 números inteiros é 4. Determine-os, sabendo que eles

formam uma P. A crescente de razão 6.

17. Calcule a média aritmética entre os números reais log 3, log 4 e log 5, sabendo que log 1,2 08,0≅ .

18. A média aritmética de 10 números, x1, x2,... , x10, é 4. Qual será a nova média se

: a) x1 for aumentado de 4 unidades e x2 aumentado de 8 unidades? b) x1 for subtraído de 10 unidades e x2 aumentado de 6 unidades?

19. A tabela seguinte mostra o salário médio dos trabalhadores de três cidades, A, B

e C, que compõem uma região metropolitana.

Cidade Salário médio (em reais) A 530,00 B 600,00 C 700,00

Determine o salário médio na região metropolitana se:

a) A B e C têm o mesmo número de trabalhadores; b) A têm 200 000 trabalhadores, B tem 300 000 e C tem 500 000; c) A tem o dobro de trabalhadores de B, que tem o triplo de trabalhadores de C.

20. Na situação do exercício anterior, suponha que A concentre 70% dos

trabalhadores da região metropolitana. Determine o percentual de trabalhadores que vivem em B e C, respectivamente, a fim de que o salário médio dos trabalhadores da região seja R$ 560,00.

21. O gráfico seguinte informa a distribuição do tempo de serviço (em anos) dos

funcionários de uma pequena empresa.

Page 55: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Tempo de serviço

8%

26%

45%

11% 10%

0%

10%

20%

30%

40%

50%

1 2 3 4 5

anos

porc

enta

gem

Qual é o tempo médio de trabalho dos funcionários dessa empresa?

22. Sejam x1, x2, ..., xn os n valores assumidos por uma variável quantitativa e x a média aritmética correspondentes a tais valores. Estabeleça uma relação entre a nova média ( ) xex′ em cada caso a seguir.

a) Cada xi (i = 1,2,3...,n) é aumentado de duas unidades; b) Cada xi (i = 1,2,3...,n) é multiplicado por três; c) Cada xi (i = 1,2,3...,n) é diminuído de cinco unidades; d) Cada xi (i = 1,2,3...,n) é multiplicado por – 2 e ao resultado são acrescentadas

três unidades; e) Cada xi (i = 1,2,3...,n) é subtraído de x unidades.

23. A tabela seguinte mostra o número de gols por partida registrada nas duas

primeiras rodadas de um campeonato brasileiro.

No de gols Freqüência Absoluta 0 5 jogos 1 6 jogos 2 8 jogos 3 4 jogos 4 5 jogos 5 3 jogos 6 1 jogo

a) Qual foi a média de gols por partida registrada nas duas primeiras rodadas?

Page 56: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

b) A rodada seguinte previa a realização de n jogos sábado e a dos demais no domingo. Em cada um dos jogos desabado foram marcados 3 gols. Com isso, a média de gols do campeonato (comparadas às duas primeiras rodadas e os jogos de sábado) elevou-se para 2,5 gols por partida. Qual é o valor de n?

24. A média dos salários dos funcionários de uma loja é de R$ 620,00. Qual será a

nova média salarial se:

a) Cada funcionário receber um aumento de R$50,00? b) Cada funcionário receber um aumento de 20%?

25. Uma prova foi aplicada em duas turmas, A e B ,e as médias obtidas foram 7.2 e

6.3, respectivamente. Se cada aluno da turma A tivesse obtido n pontos a menos e cada aluno da turma B tivesse obtido n pontos a mais, as médias das duas turmas seriam iguais. Qual o valor de n?

26. Em uma empresa, a média salarial é R$540,00. Pretende-se dar a cada

funcionário um aumento de 5% e um abono de R$80,00. Qual será a nova média de salários na empresa se:

a) O aumento for dado antes do abono? b) O aumento for dado após a incorporação do abono ao salário? 27. É comum encontrarmos produtos com conteúdo líquido menor que o declarado

nas embalagens. Em uma pequena cidade, doces de leite são vendidos em copos de vidro em cujos rótulos constam à informação relativa ao peso de 200g. Dois fabricantes, A e B, fornecem doces com conteúdo real médio de 190 g e 195 g., respectivamente. Um supermercado comprou um total de n copos (somadas as duas marcas) de doce de leite, e verificou-se que o conteúdo médio líquido do lote era 193,5 g.

28. Cada um dos 60 alunos da turma A obteve, na avaliação de um trabalho, nota 5

ou nota 10. A média aritmética dessas notas foi 6. Determine quantos alunos obtiveram nota 5 e quantos obtiveram nota 10?

29. O gráfico ao lado, em forma de pizza, representa as notas obtidas em uma

questão pelos 32 000 candidatos presentes à primeira fase de uma prova de vestibular. Ele mostra, por exemplo, que 32% desses candidatos tiveram nota 2 nessa questão. Pergunta-se:

Notas de uma questão do vestibular

1 20%

2 32%3 16%

4 12%

5 10%

6 10%

Page 57: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

a) Quantos candidatos tiveram nota 3? b) É possível afirmar que a nota média, nessa questão, foi menor ou igual a 2? Justifique sua

resposta. 30. Em uma fábrica, a média salarial de determinado setor, que emprega 20 funcionários, é 520

reais. Um deles, que ganhava 550 reais, foi afastado, e foram contratados 2 novos funcionários, um com salário de 480 reais e o outro com salário de 630 reais. Qual é o número inteiro mais próximo da nova média de salários nesse setor?

31. Em uma classe de educação infantil, a média de idade das 25 crianças é 4 anos e 3 meses.

Qual é o número de crianças com 4 anos e 9 meses que devem ingressar nessa classe a fim de elevar essa média para 4 anos e 4 meses?

32. Um programa beneficente veiculado em um canal de TV tinha como objetivo arrecadar

fundos para crianças carentes. O telespectador poderia escolher entre 10, 20 ou 50 reais e ligar para o número correspondente ao valor escolhido a fim de fazer a doação. Na primeira hora, 50 000 pessoas fizeram doações, das quais 48% contribuíram com o valor mínimo, 37% com o valor intermediário e cada uma das demais com o valor maior.

a) Qual foi a média de doações na primeira hora?

b) Na hora seguinte, 30.000 pessoas contribuíram para a campanha, das quais 31 colaborou

com o valor mínimo. Determine o valor doado pelas demais pessoas, sabendo que a doação média das duas primeiras horas foi R$ 22,80.

33. Um grupo de 20 nadadores, cuja média de altura é 1,88 m, está treinando para uma

competição. Se um grupo de 7 atletas cuja média de altura é 1,92 m se juntar ao primeiro grupo, qual será a média de altura dos 27 atletas?

34. A média aritmética dos números a1, a2, a3,..., a14, a15 é 24. Qual é a média aritmética dos

números a1 + 1, a2 + 2,..., a14 + 14, a15 + 15?

35. Numa classe com vinte alunos as notas do exame final podiam variar de 0 a 100 e a nota mínima para aprovação era 70. Realizando o exame, verificou-se que oito alunos foram reprovados. A média aritmética das notas desses oito alunos foi 65, enquanto a média dos aprovados foi 77. Após a divulgação dos resultados, o professor verificou que uma questão havia sido mal formulada e decidiu atribuir 5 pontos a mais para todos os alunos. Com essa decisão, a média dos aprovados passou a ser 80 e dos reprovados 68,8.

a) Calcule a média das notas da classe toda antes da atribuição dos 5 pontos extras? b) Com a atribuição dos 5 pontos extras, quantos alunos, inicialmente reprovados,

atingiram nota para aprovação?

36. A média aritmética dos números x1, x2,..., xn é p. Determine a média aritmética dos números x1 – 1 x2 + 1, x4 +1,..., xn + (-1)n, considerando que:

a) n é par; b) n é impar. 37. Em um time de futebol, o jogador mais velho entre os onze titulares foi substituído por um

jogador de 16 anos. Isso fez com que a média de idade dos 11 jogadores diminuísse 2 anos.

1

Page 58: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Calcule a idade do jogador mais velho que foi substituído. 38. Cresce o percentual de mulheres na população (em milhões de habitante) Calcule o percentual da população feminina e da população masculina relativo a cada ano constante no gráfico .A seguir, utilizando apenas uma casa após a vírgula, determine, relativamente a cada sexo: a) a média desses percentuais no período considerado; b) a média desses percentuais de 1940 a 2000. 39. O gráfico abaixo representa as temperaturas médias mensais nas cidades de Goiânia e

Aragarças (consideradas a cidades mais quentes do Estado de Goiás), no período de janeiro a agosto de 2001.

Com base nesse gráfico, julgue como verdadeira (V) ou falsa (F) cada uma das afirmações a seguir:

a) Em Goiânia, a temperatura média no mês de agosto é 4% superior à temperatura média no mês

de abril. b) Em Goiânia, a média das temperaturas médias mensais no período de janeiro a agosto é igual à

temperatura média do mês de junho. c) No período de janeiro a agosto, a amplitude (diferença entre o maior e o menor valor) da

temperatura média mensal, em Goiânia, é maior do que em Aragarças. d) No período de janeiro a agosto, a diferença das temperaturas médias mensais entre Aragarças e

Goiânia é máxima no mês de maio.

40. Suprimindo-se um dos elementos do conjunto { }201,...,3,2,1 , a média aritmética dos elementos restantes é 101,45. Sendo m o elemento suprimido, calcule o valor de: m+ 201.

41. Considere um conjunto de dados formado por n valores. Adicionando-se a esse conjunto o

número 119, a média aumenta 4 unidades em relação à média inicial; retirando-se do conjunto original o número 54, a média diminuiu 1 unidade em relação à média inicial.

a) Qual é o valor de n? b) Qual é a média aritmética inicial do conjunto de dados?

2

Page 59: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Apêndice 2

1. Calcule a moda e a mediana de cada um dos seguintes conjuntos de valores:

a) 9 – 8 – 8 – 7 – 10 – 12 – 11 – 8 – 8 – 7 – 6 – 14 – 10 b) 0 – 0 – 0 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 2 – 2 – 3 – 3 – 3 – 3 – 3 – 3 c) 40 – 44 – 42 – 23 – 36 – 40 d) 0,6 – 0,7 – 0,7 – 0,5 – 0,8 – 0,6 – 0,4 – 0,9

2. Determine as medidas de centralidade (média, mediana e moda) correspondentes aos

percentuais relacionados na tabela a seguir:

Os 20 municípios com menor taxa de analfabetismo no Brasil ( % )

Município Taxa de analfabetismo

1o São João do Oeste (SC) 0,9 2o Morro Reuter (RS) 1,6 3o Harmonia (RS) 1,8 4o Pomerode (SC) 1,9 5o Bom Princípio (RS) 1,9 6o São Vendelino (RS) 1,9 7o Feliz (RS) 1,9 8o Lagoa dos Três Cantos (RS) 2,0 9o Salvador das Missões (RS) 2,2 10o Ivotí (RS) 2,3 11o Quatro Pontes (PR) 2,4 12o Vale Real (RS) 2,5 13o Timbó (SC) 2,6 14o Dois Irmãos (RS) 2,6 15o Jaraguá do Sul (SC) 2,6 16o São José do Hortêncio (RS) 2,7 17o Teutônia (RS) 2,7 18o Blumenau (SC) 2,8 19o Linha Nova (RS) 2,8 20o Nova Petrópolis (RS) 2,8

3

Page 60: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

3. As tabelas seguintes relacionam os países com consumo anual de peixe.

Os maiores consumidores

País

Quantidade de peixe consumido (milhões de tonelada )

1o China 30 2o Japão 8 3o Estados Unidos 6 4o Índia 4 5o Indonésia 4 6o Rússia 3 7o Coréia do Sul 2 8o Filipinas 2 9o França 2 10o Espanha 2

a) Calcule a média, a mediana e a moda dos dados apresentados. Por que a média é bem maior

que as outras duas medidas? b) Sabendo que a população da China é 1,285 bilhões de habitante e a da Espanha é 39,9

milhões de habitante, mostre que o consumo per capita anual na Espanha é maior que o dobro do consumo per capita na China.

(dados extraídos de: Almanaque Abril, 2002.).

4. As tabelas seguintes informam o número de jornais diários em circulação na região metropolitana das capitais brasileiras.

Cidade Jornais em

circulação Cidade Jornais em

circulação Cidade Jornais em

circulação Aracaju 3 Aracaju 3 Porto

Velho 3

Belém 3 Belém 3 Recife 4 Belo

Horizonte 6 Belo

Horizonte 6 Rio

Branco 4

Boa Vista 3 Boa Vista 3 Rio de Janeiro

11

Brasília 2 Brasília 2 Salvador 4 Campo Grande

2 Campo Grande

2 São Luís 2

Cuiabá 3 Cuiabá 3 São Paulo 16 Curitiba 8 Curitiba 8 Teresina 5

4

Page 61: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Florianópolis 3 Florianópolis 3 Vitória 2

a) Intuitivamente, responda: Qual medida de centralidade – a média ou a mediana – é mais adequada para representar esses valores?

b) Calcule a média, a moda e a mediana. c) Elimine os dois Estados com maior número de jornais e recalcule a média. 5. Um instituto de pesquisa fez um levantamento dos preços por quilo de vários produtos em

um sacolão. Os resultados estão na tabela abaixo.

Preço (em reais ) Freqüência (%) 2,00 30 3,00 40 4,00 20 6,00 10

Responda:

Qual é a média, a moda e a mediana do preço por quilo dos produtos á venda nesse sacolão?

6. O gráfico ao lado informa a distribuição do número de filhos de 800 funcionários de uma empresa.

a) Quantos funcionários têm exatamente 2 filhos? b) Qual é a mediana do número de filhos? c) Qual é a moda do número de filhos?

7. A tabela seguinte informa o número de defeitos, por peça, encontrados durante uma inspeção feita em um lote de 80 peças que chegou a um porto.

Número de defeitos por peça 0 1 2 3 4 Número de peças 12 20 24 16 8

a) Considerando o número de defeitos por peça, qual é a mediana dos valores encontrados? b) Qual será a nova mediana se forem acrescentadas a esse lote 18 peças, cada uma com

exatamente 1 defeito? c) Adicionando-se ao lote inicial n peças, cada uma com 3 defeitos, o valor da mediana passa a

ser 3. Qual é o menor valor possível de n? 8. Os valores ordenados abaixo referem-se ao número de desistências mensais de reservas

solicitadas a uma companhia aérea.

48 – 52 – 58 – 63 – 68 – x – 76 – 82 – y – 96 – 98 – 102

a) Sabendo que a mediana desses valores é 73 e que a média é 75 quais são os valores de x e de y?

5

Page 62: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

b) Supondo que em cada um dos 5 meses seguintes o número de desistências variou entre 50 e 60, qual será o valor da mediana relativa a esses 17 meses?

9. Considere a seqüência decrescente:

2n , 2n – 1 , ..., 2n – 5 (em que n é um número natural)

Sabendo que a mediana dos elementos dessa seqüência é 6, determine:

a) O valor de n; b) A média aritmética dos elementos dessa seqüência. 10. A tabela adiante apresenta o levantamento das quantidades de peças defeituosas para cada

lote de 100 unidades fabricadas em uma linha de produção de autopeças durante um período de 30 dias úteis.

Dia No de peças

defeituosas Dia No de peças

defeituosas Dia No de peças

defeituosas 1 6 11 1 21 2 2 4 12 5 22 6 3 3 13 4 23 3 4 4 14 1 24 5 5 2 15 3 25 2 6 4 16 7 26 1 7 3 17 5 27 3 8 5 18 6 28 2 9 1 19 4 29 5 10 2 20 3 30 7

Considerando S a série numérica de distribuição de freqüências de peças defeituosas por lote de 100 unidades, julgue os itens abaixo:

a) A moda da série S é 5. b) Durante o período de levantamento desses dados, o percentual de peças defeituosas ficou,

em média, abaixo de 3,7%. c) Os dados obtidos nos 10 primeiros dias do levantamento geram uma série numérica de

distribuição de freqüências com a mesma mediana da sérieS. 11. Uma pesquisa realizada com 280 pessoas fez o levantamento da freqüência anual de visitas

ao dentista. Os resultados aparecem na tabela abaixo.

Número de visitas ao dentista por ano Número de pessoas 0 63 1 105 2 39 3 47

6

Page 63: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

4 16 5 ou mais 10

total 280 a) Qual é o número mediano de visitas? b) Quantas pessoas dessa amostra que visitam o dentista uma única vez por ano deveriam

passar a visitá-lo duas vezes por ano a fim de que a mediana passasse a ser 1,5 visitas?

7

Page 64: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

Apêndice 3

1. Calcule o desvio padrão dos seguintes conjuntos de valores: a) 2 – 3 – 4 – 5 – 6 b) 2 – 2 – 3 – 4 – 4 c) (-2 ) – ( - 1 ) – ( - 1) – 0 – 1 – 3

d) 21 -

81 -

41 -

51 -

101

e) 70 – 65 – 60 – 60 – 65 – 68 – 72 – 60

2. A tabela seguinte informa a participação percentual dos Estados da região Nordeste no

produto interno bruto (PIB) nacional.

Alagoas 0,9% Bahia 4,4% Ceará 1,8%

Maranhão 1,0% Paraíba 0,7%

Pernambuco 2,3% Piauí 0,5%

Rio Grande do Norte 0,9% Sergipe 0,5%

a) Calcule a média ( x ) e o desvio padrão() dos percentuais acima.

b) Quantos Estados têm participação pertencente ao intervalo [ x - 21 σ, x +

21 σ]?

3. O gráfico seguinte mostra os números relativos aos turistas estrangeiros que estiveram no Brasil no período de 1998 a 2002.

Números de turistas ( em milhões )

a) Qual é o desvio padrão dos dados apresentados?

8

Page 65: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

4. Os dados seguintes referem-se às porcentagens da população de países sul americano que vive em áreas urbanas.

Argentina 90% Bolívia 63% Brasil 81% Chile 86%

Colômbia 74% Equador 65% Paraguai 56%

Peru 73% Uruguai 91%

Venezuela 87%

a) Calcule a média e o desvio padrão dos percentuais acima. b) Elimine os dois países com menores percentuais. O que ocorrerá com o desvio padrão? Faça

os cálculos para confirmar sua resposta. 5. Um conjunto é formado por três elementos: 8, 10 e x. Determine os possíveis valores de x

para os quais a variância desses elementos é igual a 3

26 .

6. Sejam x1, x2,... xk os valores distintos assumidos por uma variável x, com freqüências

absolutas iguais a n1, n2, ..., nk, respectivamente. Encontre uma expressão para a variância desses valores.

7. A tabela seguinte informa a distribuição do número de cartões amarelos recebidos por um time durante os 35 jogos de um torneio:

Número de cartões Número de jogos

0 5 1 19 2 10 3 7 4 4

a) Calcule o desvio padrão referente ao número de cartões recebidos. 8. Um professor aplicou um exercício em sua turma de 60 alunos e as notas possíveis eram

zero, 0,5 ponto. Sabendo que 40% dos alunos não obtiveram pontuação, 35% conseguiram 0,5 pontos e o restante atingiram a pontuação máxima, determine:

a) A mediana dos pontos obtidos pelos alunos nessa atividade; b) A variância correspondente aos pontos obtidos pelos alunos.

9

Page 66: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

9. A secretaria de saúde de uma cidade está interessada em saber com que freqüência semanal seus habitantes praticam atividades físicas. Para isso, uma equipe entrevistou n pessoas e os resultados encontram-se no gráfico seguinte:

a) Determine o valor de n. b) Qual é a média das freqüências de atividades físicas? c) Qual é a moda e a mediana dos dados obtidos? d) Qual é o desvio padrão dos dados obtidos?

10. Um conjunto de dados possui n valores (n > 3 ), dos quais três são iguais a 2 e os demais iguais a 5.

a) Determine, em função de n, a média aritmética desses elementos. b) Determine o maior valor inteiro de n para qual a variância desse conjunto de valores seja maior que 2.

11. Para um conjunto X = ( x1, x2, x3, x4), a média aritmética de X é definida por

x =4

xxxxx ++++ e a variância e x é definida por:

v =41 [( x1 - x )2 + ... + (x4 - x )2].

Dado o conjunto X= (2, 5, 8, 9 ), pede-se.

a) Calcular a média aritmética de x. b) Calcular a variância de x. c) Quais elementos de x pertencem ao intervalo [ x - v , x + v ]?

12. Dados n valores x1, x2, x3,..., xn, seja M sua média aritmética. Chama-se variância desses

valores ao número σ2 dado por:

n

Mxn

ii∑

=

−= 1

2

2)(

σ

A raiz quadrada não negativa da variância chama-se desvio padrão.

a) Se em cada um de 10 meses consecutivos um fundo de investimentos renderem 1% ao mês, qual o desvio padrão dessa taxa de rendimento?

b) Se em cada um de 6 meses consecutivos o fundo render 1% ao mês 3% ao mês em cada um dos quatro meses seguintes, qual o desvio padrão dessas taxas de rendimento?

13. Observe os dados apresentados pelo gráfico:

a) Encontre o desvio padrão correspondente ao número anual de ações registradas no período

de 1988 a 2001. b) Considere os períodos de 1988 a 1993 e de 1996 a 2000. Calcule o desvio padrão

correspondente a cada período. Por que se observa uma queda em relação ao desvio encontrado no item a?

10

Page 67: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

14. O departamento de Aviação Civil registrou durante cinco dias o percentual diário de vôos de duas companhias aéreas, A e B, que decolaram sem atraso.

Os dados estão relacionados a seguir: Companhia A: 90% - 92% - 95% - 88% - 91%

Companhia B: 97 % - 88% - 98% - 86% - 90%

a) Qual companhia apresentou percentual médio mais alto? b) Qual companhia apresentou desempenho mais regular?

15. Seja um conjunto de valores 4, 1, 8, 7 e n. Qual é o valor de n que minimiza a variância

desses valores? Qual é, nesses casos, o valor da variância?

16. Considere os seguintes conjuntos de valores:

A={3, 3, 3, 3, 4, 4, } e B= {2, 2, 3, 3, 4, 4, }

Compare σ2a com σ2

b.

17. A tabela de freqüências ao lado informa o número de filhos dos 80 funcionários de uma escola.

Números de filhos Freqüência

absoluta 0 20 1 36 2 14 3 8 4 2

a) Qual o desvio padrão correspondente ao número de filhos? b) Suponha que cada funcionário dessa escola tenha um novo filho. Qual será o novo desvio

padrão?

18. Sejam x1, x2..., xn, os valores assumidos por uma variável x, e σ2 a variância correspondente a tais valores. Determine a relação existente entre a nova variância (σ2) e a variância original (σ ) quando:

a) Cada x1 (i =1, 2,..., n) é multiplicado por 2; b) A cada xi ( i = 1, 2,..., n ) são adicionadas 3 unidades; c) Cada xi ( i = 1, 2,..., n ) é dividido por 5; d) Cada x é multiplicado por 4 e ao valor obtido são adicionadas 3 unidades; e) De cada xi subtraem-se 10 unidades.

19. Os saldos (xi) em cadernetas de poupança de 1000 clientes de um banco em uma pequena

cidade são tais que:

000.309.119000.322 2 == ∑∑i

ii

i xex , para i є {1,2,...,1.000}.

11

Page 68: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

12

a) Determine o saldo médio das cadernetas. b) Qual é o desvio padrão correspondente aos saldos das cadernetas?

20. Uma pastelaria situada no centro de uma cidade funciona os sete dias da semana. Em certa

semana, a receita média diária era R$ 1200,00 e a soma dos quadrados das receitas diárias totalizava R$ 10086300,00. Qual foi o desvio padrão da receita diária registrada nessa semana?

21. Que número deve ser acrescentado ao conjunto de valores 2, 6,5 e 7 a fim de que a variância

aumente 3,3 unidades?

22. Sejam x1, x2,..., xn valores assumidos por uma variável x a média aritmética e o desvio padrão. Suponha que de cada x1 ( i = 1, 2,..., n ) subtraímos a média e dividimos a diferença obtida pelo desvio padrão. Qual será a nova média e o novo desvio padrão desse conjunto?

23. Dados os números a1, a2, ...,an e considerando a média aritmética M(x) dos n números ( a1- x )2 , (a2-x) 2, ...,(an – x)2, em que x é um número real qualquer:

a) Determine x de modo que a média M(x) seja mínima; b) Determine o valor mínimo da média M(x), que é chamado de variância de a1, a2,...,an.

Page 69: Apostila_Estat%edstica_Matem%e1tica_Vol_1_2007 vers%e3o 2

13