Upload
deangelis
View
2.204
Download
1
Embed Size (px)
Citation preview
UNIVERSIDADE DO CONTESTADO – UnC CURSO DE SISTEMAS DE INFORMAÇÃO
PROBABILIDADE E ESTATÍSTICA2a PARTE
PROFa ARLENE GUAREZI P. DE OLIVEIRA
CONCÒRDIAABRIL /2007
1 GRÁFICOS
1.1 INTRODUÇÃO
A organização e descrição de dados podem ser feitas por meio da construção de gráficos e tabelas. Os gráficos assumem papel fundamental em qualquer campo da ciência.
O gráfico pode retratar fases históricas nas análises de situações atuais e até mesmo nas previsões futuras.
Sua utilização na estatística é de suma importância, visto que, praticamente, todo e qualquer relatório analítico vem acompanhado de gráficos ilustrativos. Isto facilita a interpretação rápida do fenômeno que ora se analisa.
Mas, para esta afirmação se torne válida, é necessário seguir certas normas para elaboração correta e precisa deles. Se assim não se fizer, poder-se-á ter uma visão distorcida, ou mesmo errônea, do fenômeno estudado. Basicamente, devemos levar em consideração três características para a construção de um gráfico: simplicidade, clareza e veracidade.
1.2 DESCRIÇÃO GRÁFICA DE VARIÁVEIS QUALITATIVAS
Os gráficos de colunas e barras (horizontais e verticais) e também os em forma de pizza são os gráficos mais comuns para a descrição de dados oriundos de variáveis qualitativas. Basicamente eles mostram as freqüências de observações para cada nível, ou categoria, da variável que se deseja escrever.
Exemplo 1:Vamos construir os gráficos de colunas, barras e de pizza para os dados da seguinte tabela. Tabela 1.1 Automóveis nacionais mais vendidos: janeiro/agosto de 2004
Veículos Quantidades Vendidas
GolUnoPalioAstraCorsaVectra
Palio WeekendFiesta
Corsa SedanParati
166.15858.55686.77622.00666.06523.16218.99724.58655.33418.765
Fonte: Jornauto, São Paulo, agosto 2004
2
Quantidades Vendidas
0
20.000
40.000
60.000
80.000
100.000
120.000
140.000
160.000
180.000
Gol Uno Palio Astra Corsa Vectra PalioWeekend
Fiesta Corsa Sedan Parati
Tipos de carros
Qu
anti
dad
es V
end
idas
Quantidades Vendidas
Quantidades Vendidas
0 20.000 40.000 60.000 80.000 100.000 120.000 140.000 160.000 180.000
Gol
Uno
Palio
Astra
Corsa
Vectra
Palio Weekend
Fiesta
Corsa Sedan
Parati
Vei
culo
s
Quantidade Vendida
Quantidades Vendidas
Quantidades Vendidas
31%
11%
16%
4%
12%
4%
4%
5%
10%
3%
Gol
Uno
Palio
Astra
Corsa
Vectra
Palio Weekend
Fiesta
Corsa Sedan
Parati
3
1.3 DESCRIÇAÕ GRÁFICA DE VARIÁVEIS QUANTITATIVAS
Os histogramas são os gráficos mais adequados para a descrição de dados oriundos de variáveis quantitativas. Basicamente, eles mostram as freqüências de observações para cada valor ou conjunto de valores da variável que se deseja descrever. Com base em uma tabela de distribuição de freqüências é construído o histograma – trata-se de uma representação gráfica adequada para o tratamento de conjuntos de dados quantitativos com elevada quantidade de elementos.
Tabela 1.2 Idades de 50 funcionários da empresa XPTO
ClassesIntervalos das
Classes fi fri Fi Fri xi1 [18 ; 25 [ 6 0,12 6 0,12 21,52 [25 ; 32[ 10 0,20 16 0,32 28,53 [32 ; 39[ 13 0,26 29 0,58 35,54 [39 ; 46[ 8 0,16 37 0,74 42,55 [46 ; 53[ 6 0,12 43 0,86 49,56 [53 ; 60[ 5 0,10 48 0,96 56,57 [60 ; 66[ 2 0,04 50 1,00 63,5
50 1
Frequências Absolutas
0
2
4
6
8
10
12
14
[18 ; 25[ [25 ; 32[ [32 ; 39[ [39 ; 46[ [46 ; 53[ [53 ; 60[ [60 ; 66[
Intervalos de classes
Fre
qu
ênci
a R
elat
iva
fi
4
Frequências Relativas
0,12
0,20
0,26
0,16
0,12
0,10
0,04
0
0,05
0,1
0,15
0,2
0,25
0,3
[18 ; 25[ [25 ; 32[ [32 ; 39[ [39 ; 46[ [46 ; 53[ [53 ; 60[ [60 ; 66[
intervalos de classes
fri
fri
1.3.1 DESCRIÇAÕ GRÁFICA DE VARIÁVEIS QUANTITATIVAS CONTÍNUAS
Os gráficos lineares é um dos gráficos mais adequados para a descrição de dados oriundos de variáveis quantitativas contínuas.Tabela 3 Produção de Pneumáticos – 1997/2002 – Brasil
Anos Pneumáticos (1000 peças)199719981999200020012002
9.39310.71013.46616.23816.70419.149
Produção de Pneumáticos - 1997/2002 - Brasil
0
5.000
10.000
15.000
20.000
25.000
a1997 a1998 a1999 a2000 a2001 a2002
Ano
Pn
eum
átic
os
(100
0 p
eças
)
Pneumáticos (1000 peça)
5
2 MEDIDAS DE POSIÇÃO OU TENDÊNCIA CENTRAL
2.1 INTRODUÇÃO
De um modo geral, qualquer conjunto de dados estatísticos – agrupados ou não -, dependendo do estudo a que se propõe, ocupa uma posição específica dentro de uma distribuição. As medidas de tendência central dão valor do ponto em torno do qual os dados se distribuem.
Vejamos a seguir o cálculo das medidas de posição ou de tendência central. Elas representam os conjuntos de dados pelos seus valores médios, em torno dos quais esses dados tendem a concentrar-se.
Essas medidas são:a) Medidas de tendência central.b) Medidas de dispersão.As primeiras mostram a magnitude (por um valor central e um valor médio) e as
segundas mostram variações ou concentrações dos dados em torno daquele valor.Primeiramente, vamos estudar as principais medidas de tendência central, assim
subdivididas:1. Média (aritmética, ponderada).2. Mediana.3. Moda
2.2 MÉDIA ARITMÉTICA ( )
É uma das principais medidas de posição, cuja aplicação é seguramente a mais usada, sendo que podem ser simples (dados não agrupados em classe) e ponderadas (dados agrupados em classe)2.2.1 Média Aritmética simples ( )
A média aritmética simples de um conjunto de números é igual ao quociente entre a soma dos valores do conjunto e o número total de valores.
Genericamente podemos escrever:
= xi , onde x1 = valor genérico da observação
n n = nº de observaçãoExemplo:
a) Durante um determinado mês de verão, os nove vendedores de uma firma de calefação central e ar-condicionado venderam os seguintes números de unidades de ar-condicionado centra: 8, 11, 5, 14, 8, 11, 16, 11, 16 considerando este mês como uma população estatística de interesse, o nº médio de unidades vendidas é:
= = 8 + 11 + 5 + 14 + 8 + 11 + 16 + 11 + 16 = 100
n 9 9= 11 unidades
2.2. 2 Média Aritmética Ponderada
A média aritmética é considerada ponderada quando os valores do conjunto tiverem pesos diferentes. Tratando-se de média simples, todos os valores apresentam
6
igual peso. Obtém-se uma média aritmética ponderada através do quociente entre o produto dos valores da variável pelos respectivos pesos e a soma dos pesos.
Assim, por exemplo, um professor pode realizar quatro provas por ano em sua matéria, atribuindo a cada uma delas os seguintes pesos: 1, 2, 3, 4. Se um aluno tiver recebido as notas 8, 7; 9 e 9, nessa ordem, sua nota final será a média aritmética ponderada 8,5, obtida da seguinte maneira:Média Final = (8 x 1) + (7 x 2) + (9 x 3) + (9 x 4) = 8 + 14 + 27 + 36 = 85 = 8,5
1 + 2 + 3 + 4 10 10
Para o cálculo da média aritmética ponderada utilizaram uma tabela que facilita em muito a visualização dos valores.Tabela 4
xi fi xi fi
1 2 1 x 2 = 2
2 2 2 x 2 = 4
3 3 3 x 3 = 9
5 3 5 x 3 = 15
fi = 10 xi fi = 30
xi fi
fi
2.2.2.1 Média aritmética para dados contínuos (ponderada)
É definido como sendo o quociente entre a soma dos produtos das freqüências, pelos pontos médios de cada classe, e a soma de todas as freqüências. Assim,
fi Pmi
fi
Ex: Tomemos a tabela abaixo, relativa as estaturas dos alunos da UnC – Ano 2001:
Estaturas (cm) Nº de alunos (fi) FiPmi = xi fiPmi
150 |---- 156 5 153 765
156 |---- 162 4 159 636
162 |---- 168 19 165 3.135
168 |---- 174 18 171 3.078
174 |---- 180 14 177 2.478
180 |---- 186 12 183 2.196
186 |---- 192 4 189 756
fi = 76 fi Pmi = 13.044
7
= 30 = 3,0 10
=
=
= fi Pmi
= 13.044 171,63 cm 76
Exercícios propostos
1) Calcule a média aritmética da série:(a) X: 1, 2, 8, 10, 12, 16, 21, 30.(b) Y: 5, 6, 6, 10, 11, 11, 20.
A seguir é dada a distribuição da quantidade de defeitos por microcomputador para uma amostra de 100 aparelhos.
Quantidade de defeitos por micro 0 1 2 3 4 5 6Números de aparelhos 15 28 20 14 10 7 6
2) Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só é aprovado se apresentar um peso superior a 40 quilos.Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5,0; 3,5; 4; 5; 5,5; 4;5, este lote será aprovado? Qual o peso médio do produto?
3) Uma loja vende cinco produtos básicos A, B, C, D, E. O lucro por unidade comercializada destes produtos vale respectivamente R$ 200,00; R$ 300,00; R$ 500,00; R$ 1.000,00; R$ 5.000,00. a loja vendeu em determinado mês 10; 30; 20; 10; 5 unidades respectivamente. Qual foi o lucro médio por unidade comercializada por esta loja?
4) Um caminhão cujo peso vazio é 3.000Kg será carregado com 480 caixas de 10 kg cada, 350 caixas de 8kg cada, 500 caixas de 4 kg cada e 800 caixas de 5kg cada. O motorista do caminhão pesa 80 kg e a lona de cobertura da carga pesa 50 kg. (a) Se este caminhão tem que passar por uma balança que só permite passagens a caminhões com peso máximo de 15 toneladas, este caminhão passará pela balança? (b) Qual o peso médio das caixas carregadas no caminhão?
5) Calcule o número médio de acidentes por dia em uma determinada esquina.Nº de acidentes
por dia: xi
Nº de diasfi
0 301 52 33 14 1
6) O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule o salário médio destes funcionários.
8
fi
=
Classes Salários $ Nº de funcionáriosfi
1 400,00 |---- 500,00 122 500,00 |---- 600,00 153 600,00 |---- 700,00 84 700,00 |---- 800,00 35 800,00 |---- 900,00 16 900,00 |---- 1.000,00 1
7) Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo:
Classes Aluguel $ Nº de casasfi
1 0 |---- 200,00 302 200,00 |---- 400,00 523 400,00 |---- 600,00 284 600,00 |---- 800,00 75 800,00 |---- 1.000,00 3
Calcule o aluguel médio para essas residências.
2. 3 MEDIANA (Md)
Mediana é um valor central de um rol, ou seja, a mediana de um conjunto de valores ordenados (crescente ou decrescente) é a medida que divide este conjunto em duas partes iguais, cuja valor está sucedido de 50% e antecedido 50% desse conjunto de observações.
2.3.1 Cálculo da mediana – variável discreta
Dado um conjunto qualquer de valores, o primeiro passo é ordenar estes valores. Isto poderá ser feito tanto em ordem crescente quanto decrescente. E, como segundo passo, verificar se o número de elementos que compõe este conjunto é par ou ímpar.Se o número de elementos for ímpar, o elemento mediano será dado pela seguinte expressão: Em = N + 1 , 2
onde, Em = elementos mediano, e N = número de elementos do conjunto. Caso o número de elementos for par, a medida será dada pela média aritmética, expressa por N + N + 2 2 2
Exemplo 1: X = { 2, 5, 7, 9, 13, 15, 22 }
Em = 7 + 1 = 4. 2Md = 9
Exemplo 2: X = {2, 5, 7, 9, 10, 16}
9
Cálculos do elemento mediano
N + N + 2 6 + 6 + 2 2 2 = 2 2 = 3,5 2 2 O valor “3,5” corresponde à posição do elemento mediano dentro deste rol. Portanto, a mediana corresponde à média aritmética entre os valores centrais 7 e 9,ou seja ,
7 + 9 = 8 (Mediana) 2
Exemplo 3: Xi fi Fi
24578
25864
27152125
5∑ fi = 25
i = 1
Em = N +1 = 25 + 1 = 132 2
Md = 5 Exemplo 4:
Xi Fi Fi24578
54683
59152326
5 ∑ fi = 26i =1
N + N + 2 26 + 26 + 2 Em = 2 2 = 2 2 = 13,5
2 2 Md = 6 2. 3. 2 Cálculo da mediana – variável contínua
10
Em se tratando de cálculo da mediana para variável contínua, independente se n é par ou impar, devemos: 1o Passo: Calcula-se a ordem n . 22o Passo : Pela Fi (frequência acumulada) identifica-se a classe que contém a mediana (classe Md).
3o Passo Md = li + Em - F(ant) x h fi classe Em que:
li = limite inferior da classe mediana Em = elemento mediano F(ant) = freqüência acumulada até a classe anterior á classe mediana. fi classe = freqüência simples ou absoluta da classe mediana. h = amplitude do intervalo da classe mediana. Exemplo 1: Dada a distribuição amostral, calcular a mediana: Notas da Classe fi Fi
0 |---- 22 |---- 44 |---- 66 |---- 88 |---- 10
27 16 34 17 16
27 43 77 94 110
5 ∑ fi = 110 i =1
Exemplo 2: Com os dados da distribuição amostral, calcular a mediana. Intervalo das classes Fi Fi
35 |----45 5 545 |----55 12 1755 |----65 18 3565 |----75 14 4975 |----85 6 5585 |----95 3 58
∑ 58 Exercícios : 1) Calcule a mediana da seqüência :a) X: 2 ,5, 8, 10, 12, 15, 8, 5, 1b) Y: 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8 c) Interprete os valores obtidos.
2) Calcule a mediana da distribuição.
11
3) Calcule a mediana da distribuição do número de acidentes por dia, observando em determinado cruzamento , durante 40 dias.
No de acidentes por dia Número de dias
0 1 2 3 4
30 5 3 1 1
4) O consumo de energia elétrica verificada em 250 residências de família da classe média, com dois filhos, revelou a distribuição.
Classes Consumo Kwh No de famílias1234567
0 │------ 50 50 │------- 100100 │-------150 150 │------- 200200 │------- 250250 │------- 300300 │------- 350
2153247508024
a) Calcule a mediana da distribuiçãob) Interprete o valor obtido.
2.4 QUARTIS
Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:
0% 25% 50% 75% 100%│----------------------│---------------------│----------------------│----------------------│
Q1 Q2 = Md Q3
Q1 = 1o quartil, deixa 25% dos elementos. Q2 = 2o quartil, coincide com a mediana, deixa 50% dos elementos. Q3 = 3o quartil, deixa 75% dos elementos.
2.4.1 Cálculos para os quartis – variável discreta
2.4.1.1 Quando o número de observações for par
xi fi
2 4 5 6 8
5 20 32 40 2
12
A posição do elemento quartil o conjunto ordenado é identificado pela seguinte expressão: Eqi = i( N +1) , onde, 4
Eqi = posição do elemento desejado, i = { 1,2,3 } e N = número de observações
Exemplo1: Dado o conjunto X = { 10, 12, 12, 16, 20, 23, 25, 28 }, calcular o primeiro quartil ( Q1 ) e o terceiro ( Q3 ). Eqi = 1. (8 +1) = 9 = 2,25 ( posição do 1o elemento quartil no conjunto )
4 4
Q1 = 12
Eq3 = 3( 8 +1 ) = 27 = 6,75 ( posição do 3o elemento quartil no conjunto) 4 4
O 3o quartil Q3 = 24,5 Ou seja, o conjunto X, a 6o posição corresponde ao valor 1o ao 3o posição
corresponde ao valor 25. Portando, a posição 6,75 corresponde a 75% da diferença entre os valores 25 e 23, cujo resultado é adicionado ao valor que ocupa a 6 a posição, assim, 25 – 23 = 2 x 0,75 = 1,5 ; Logo, Q3 = 23 + 1,5 = 24,5
Exemplo 2: Determinar a faixa salarial (distância que vai do 1o ao 3o quartil) de 6 funcionários de certa Empresa, que ocupam o mesmo cargo. Salários: R$ 5.500,00; R$ 5.780,00; R$ 6.120,00; R$ 6.150,00; R$ 6.620,00; R$ 7.120,00.
Exemplo3: Sendo:
Salário (R$) N o de funcionários (fi)
2.300,003.200,004.600,005.785,006.890,00
35431
5
∑ fi = 16 i = 1
Calcular a fixa salarial .
2.4.1.2 Quando o N º de observações for impar.
Exemplo1: Dados X = { 185, 196, 207, 305, 574, 597, 612 . Calcular o primeiro quartil (Q1) e o terceiro quartil (Q3). Eqi = i( N +1) 4
13
Exemplo2: Dado:
Idades (anos) N º de observações (fi)20232529323536
102684331
7
∑ fi = 55 i = 1
Calcular a faixa de idade (Q1 a Q3)
2.4.1.3 Cálculos para os quartis – variável contínua
Determinação do 1o quartil: 1o passo: Calcular-se a ordem n 42o passo: Identifica-se a classe Q1 pela fi.
3o passo: Aplica-se a fórmula:
n - F(ant) x h 4Q1 = lQ1 + -------------------------------------------
fQ1
Determinação do 3o quartil: 1o passo: calcula-se a ordem 3n 42o passo: Identificar-se a classe Q3 pela fi.
3o passo: Aplica-se a fórmula
3n - F(ant) x h 4Q3 = lQ3 + -------------------------------------------
fQ3
Exemplo 1: Dada a distribuição, determinar os quartis ( Q1 e Q3 ) e mediana. Classes fi Fi
7 │------- 17 6 617 │------- 27 15 2127 │------- 37 20 4137 │------- 47 10 5147 │------- 57 5 56
∑ 56
14
Exercícios1) Calcule o primeiro e o terceiro quartis da distribuição de freqüência abaixo:
Custos 450│----- 550 │-----650 │----- 750 │-----850 │-----950│-----1050│----- 1150
fi 8 10 11 16 13 5 1
2) Dada a série X: 3, 15, 6, 9, 10, 4, 12,15, 17, 20, 29, calcule: a) Q1 b) Q2 c) Q3
3)A distribuição de freqüência abaixo representa idade de 50 alunos de uma classe de primeiro ano de faculdade.
Idade No de alunos1718192021
3181784
Calcule: a) Q1 b) Q3
4 . 5 Moda (Mo)
Dentre as principais medidas de posição, destaca-se a Moda. É o valor mais freqüente da distribuição. Para distribuição simples (sem agrupamento em classes), a identificação da Moda é facilitada pela simples observação de elementos que apresenta maior freqüência. Assim, para a distribuição:
xi 243 245 248 251 307
fi 7 17 23 20 8
A moda será 248. Indica-se: Mo = 248
Para dados agrupados em classes (variáveis contínuas), há diversas fórmulas para o cálculo da Moda. Destacamos o cálculo da moda por meio da fórmula de Czuber.
1o Passo: Identifica-se a classe modal (classe com maior freqüência).
2o Passo: Aplica-se a fórmula: Mo = lM o + ∆ 1 . h ∆ 1 + ∆ 2
em que: lM o = limite inferior da classe modal ∆ 1 = diferença entre a freqüência da classe modal e a frequência
imediatamente anterior ∆ 2 = diferença entre a freqüência da classe modal e a frequência
imediatamente posterior h = amplitude da classe modal
15
Exemplo 1: Determinar a moda para a distribuição:
Classes 0 │----- 1 1 │----- 2 2 │----- 3 3 │----- 4 4│----- 5 ∑
fi 3 10 17 8 5 43
1o Passo: Identifica-se a classe modal. No caso, trata-se da 3a classe: 2 │----- 3.
2o Passo: Aplica-se a fórmula, onde:Mo = lM o + ∆ 1 . h ∆ 1 + ∆ 2
Exemplo 2: Calcular a moda para a distribuição:
Salários (US$) 80 │----- 180 180 │----- 250 250 │----- 300 300 │----- 500
No de empregados 70 140 140 60
Observe que as amplitudes das classes não são iguais. Nesse caso, é preciso calcular as densidades das classes: fi ÷ h, para identificar qual classe modal (aquela com maior densidade). Assim:
Salários (US$) fi fi / h
80 │----- 180 70 70 / 100 = 0,7
180 │----- 250 140 140 / 70 = 2,0
250 │----- 300 140 140 / 50 = 2,8
250 │----- 300 60 60 / 200 = 0,3
1o Passo: Identifica-se a classe modal. No caso, trata-se da 3a classe: 250│----- 300.
2o Passo: Aplica-se a fórmula, onde:
Exercícios
1) Desejando lançar uma nova pasta dental, uma indústria pesquisou sobre os valores cobrados por nove marcas concorrentes e obteve os seguintes valores, em reais: 1,12; 1,00 ;1,07; 1,18; 1,60;1,90;0,92;2,02;1,70;1,12. Calcule a média aritmética, a moda e a mediana.
2) Para uma amostra de clientes de um pequeno mercado, foram observados os seguintes montantes de vendas, ordenados em ordem crescente:$ 0,10; 0,10; 0,25; 0,25; 0,25; 0,35; 0,40; 0,53; 0,90; 1,25; 1,35; 2,45; 2,71; 3,09; 4,10.
16
Determinar: a) a médiab) a medianac) a moda para esses valores de venda
3) A seguir, temos a distribuição do número de acidentes diários, durante 53 dias, em certa rodovia:
No de acidentes 0 1 2 3 4No de dias 20 15 10 5 3
Pede-se:a) Determinar a média.b) Determinar a mediana.c) Calcular a moda.d) Qual a porcentagem de dias em que tivemos dois ou mais acidentes por dia?
4) Sendo: Idade(anos)
10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14
No de pessoas
15 28 40 30 20 15 10 5
3 MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
3.1 INTRODUÇÃO
São mediadas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média. Servem para medir a representatividade da media. Dispersão _______________________________________________ Sejam as séries: (a ) 20, 20, 20 (b) 15, 10, 20, 25, 30 Tem –se: a = 20 e b = 20 Observe: apesar de as séries terem médias iguais, a série a não apresenta dispersão em torno da média: a = 20, enquanto os valores da série b apresentam dispersão em torno da média: b = 20. Nesta seção são apresentadas medidas estatísticas que avaliam o grau de dispersão, ou variabilidade, de uma variável.
3.2 AMPLITUDE TOTAL
É uma medida de dispersão dada pela diferença entre o maior e o menor valor da série.
17
R = xmáx – x mín Exemplo: Para a série: 10, 12, 20, 22, 25, 33, 38 R = 38 – 10 = 28
A utilização da amplitude total como mediada de dispersão é limitada, pois, sendo uma medida que depende apenas dos valores externos, não capta possíveis variações entre esses limites. ]
3.3 DESVIO MÉDIO: (dm)Considerando que num conjunto de dados cada valor apresenta em relação à
média aritmética um afastamento, o desvio médio será a média aritmética destes afastamentos, levando-se em conta os valores absolutos desses desvios. Fórmula: dm = ∑ |x – | nExemplo 1: Para o conjunto de observações, calcular o desvio médio.
{2, 5, 11, 14, 25}
Exemplo 2: A tabela mostra o total de pontos obtidos por dois times de futebol no período de 1996 a 2000.
1996 1997 1998 1999 2000TIME A 7 12 20 16 10TIME B 18 16 15 9 12
a) Qual o desvio médio de cada um desses times?b) Qual o time mais regular nesse período?
3.4 VARIÂNCIA AMOSTRAL
Como se deseja medir a dispersão dos dados em relação à média, é interessante analisar os desvios de cada (xi) em relação à média isto é di = (xi - ). Se os di forem baixos, teremos pouca dispersão, ao contrário, se os desvios forem altos, teremos elevada dispersão. É fácil constatar que a soma dos desvios em torno da média é zero. Isto é: ∑di = 0. Para o cálculo da variância consideram-se os quadrados dos desvios: di
2.
A variância, S2, de uma amostra de n medidas é igual à soma dos quadrados dos desvios: ∑d2
i , dividida por (n - 1), assim:
S2 = ∑ d 2 = ∑ ( x i – ) 2 n – 1 n – 1 para dados agrupados , tem-se:
S2 = ∑ di 2 F i = ∑ ( x i – ) 2 . F i
n – 1 n – 1
Desenvolvendo-se o quadrado das diferenças: (xi - )2, somando-se os termos comuns, encontram-se as seguintes fórmulas práticas para o cálculo da variância amostral:
18
S2 = 1 ∑x2i – ( ∑ x i ) 2
n – 1 n Quando maior o valor de S2, maior a dispersão dos dados amostrais.
Exemplo 1: Calcular a variância para as medidas amostrais: 3, 7, 2, 1, 8.
Solução: Vamos determinar S2 pela fórmula básica. Para tanto, é interessante a construção da seguinte tabela:
xi di = (xi - ) di2 = (xi - )2
3 (3 - 4,2) = -1,2 1,447 2,8 7,842 -2,2 4,841 -3,2 10,248 3,8 14,44
∑ 21 0 38,80
A média amostral será: = ∑ x i = 21 = 4,2 n 5 Logo, a variância amostral será:
S2 = ∑ ( xi – ) 2 = 38,80 = 9,7 n -1 4
Agora, vamos determinar S2 pela aplicação da fórmula prática. Para tanto, é interessante a construção da seguinte tabela:
xi x2i
3 97 492 41 18 64
∑21 127
Então, a variância amostral será:
S2 = 1 ∑x2i – ( ∑ x i ) 2 = = 1 [ 127 – ( 21 ) 2 ] = 9,7
n – 1 n 4 5
3.5 DESVIO PADRÃO AMOSTRAL
Como explicado no item acima, o cálculo da variância é obtido pela soma dos quadrados dos desvios em relação à media. Assim é que, se a variável sob análise for medida em metros, a variância deverá ser expressa em m2 ( metros ao quadrado). Ou seja, a variância é expressa pelo quadrado da unidade de medida da variável que está sendo estudada. Para melhor interpretar a dispersão de uma variável, calcula-se a raiz
19
quadrada da variância, obtendo-se o desvio padrão que será expresso na unidade da mediada original. Assim:
S = √ S2
O desvio padrão das cincos medidas amostrais do exemplo 1 acima é dado por:
S = √S2 = √9.7 = 3,1
Exemplo 2: As velocidades máximas das cinco voltas dadas em um teste de fórmula 1, em Km/h foram: 190; 196; 204 e 202. Nessas condições, determine:a) a média das velocidades;b) a variância c) o desvio padrão.
Exercícios:1) Calcular a variância e o desvio padrão da seguinte distribuição amostral:
xi 5 7 8 9 11fi 2 3 5 4 2
2) A tabela a seguir mostra o número de votos por classe de dois candidatos que estão concorrendo a uma vaga para o centro acadêmico do curso.
Fases/ Candidatos
1a fase 3a fase 5a fase 7a fase 8a fase 9a fase
Vítor 12 15 12 16 14 15Rafael 12 11 18 9 19 15
a) Calcular o desvio padrão de cada um desses candidatos. b) Qual dos dois candidatos é o mais regular?
3. 6 COEFICIENTE DE VARIAÇÃO (C.V)
Em trabalhos experimentais, através deste parâmetro, comprovamos a precisão alcançada, embora não seja apenas esta a sua finalidade. Este coeficiente é expresso em percentagem, sendo utilizado em trabalhos científicos. É calculado utilizando–se a fórmula:
C.V = s. 100 s - desvio padrão - média aritmética
Verificamos, portanto, o que é a relação existente entre o desvio padrão e a média aritmética. Quanto maior a for a dispersão no conjunto de observações, maior será o seu valor. Até 10%-- ótimo; de 11% a 20%-- bom; de e 21% a 30% -- regular.
Exemplo: considerando-se a amostra abaixo, conclui-se que, neste caso o nível de dispersão --20%--é bom. = 40 e s = 8
20
C.V = 8 .100 C.V = 8 . 100 = 20% 40
Exercícios: 1) Determine a média aritmética e o desvio padrão e o coeficiente de variação dos
valores apresentados na tabela seguinte:
xi 2 3 4 5 6 7fi 5 10 15 12 5 3
2) O quadro mostra a distribuição das idades de 400 funcionários de uma empresa.Classes f ;
20 │--- 2525 │--- 3030 │--- 3535 │--- 4040 │--- 4545 │--- 5050 │--- 55
148046120100328
Nessas condições, calcule:a) a média das idadesb) o desvio padrãoc) o coeficiente de variação
2) O quadro nos mostra o número de defeitos por carro de uma determinada marca, numa frota de 40 carros
Defeito por carroxi
Freqüênciafi
012345
697495
Nessas condições determine:a) a média aritméticab) o desvio padrãoc) a variânciad) C.V
21
22