29
UNIVERSIDADE DO CONTESTADO – UnC CURSO DE SISTEMAS DE INFORMAÇÃO PROBABILIDADE E ESTATÍSTICA 2 a PARTE PROF a ARLENE GUAREZI P. DE OLIVEIRA

Apostila Probabilidade e a

Embed Size (px)

Citation preview

Page 1: Apostila Probabilidade e a

UNIVERSIDADE DO CONTESTADO – UnC CURSO DE SISTEMAS DE INFORMAÇÃO

PROBABILIDADE E ESTATÍSTICA2a PARTE

PROFa ARLENE GUAREZI P. DE OLIVEIRA

CONCÒRDIAABRIL /2007

Page 2: Apostila Probabilidade e a

1 GRÁFICOS

1.1 INTRODUÇÃO

A organização e descrição de dados podem ser feitas por meio da construção de gráficos e tabelas. Os gráficos assumem papel fundamental em qualquer campo da ciência.

O gráfico pode retratar fases históricas nas análises de situações atuais e até mesmo nas previsões futuras.

Sua utilização na estatística é de suma importância, visto que, praticamente, todo e qualquer relatório analítico vem acompanhado de gráficos ilustrativos. Isto facilita a interpretação rápida do fenômeno que ora se analisa.

Mas, para esta afirmação se torne válida, é necessário seguir certas normas para elaboração correta e precisa deles. Se assim não se fizer, poder-se-á ter uma visão distorcida, ou mesmo errônea, do fenômeno estudado. Basicamente, devemos levar em consideração três características para a construção de um gráfico: simplicidade, clareza e veracidade.

1.2 DESCRIÇÃO GRÁFICA DE VARIÁVEIS QUALITATIVAS

Os gráficos de colunas e barras (horizontais e verticais) e também os em forma de pizza são os gráficos mais comuns para a descrição de dados oriundos de variáveis qualitativas. Basicamente eles mostram as freqüências de observações para cada nível, ou categoria, da variável que se deseja escrever.

Exemplo 1:Vamos construir os gráficos de colunas, barras e de pizza para os dados da seguinte tabela. Tabela 1.1 Automóveis nacionais mais vendidos: janeiro/agosto de 2004

Veículos Quantidades Vendidas

GolUnoPalioAstraCorsaVectra

Palio WeekendFiesta

Corsa SedanParati

166.15858.55686.77622.00666.06523.16218.99724.58655.33418.765

Fonte: Jornauto, São Paulo, agosto 2004

2

Page 3: Apostila Probabilidade e a

Quantidades Vendidas

0

20.000

40.000

60.000

80.000

100.000

120.000

140.000

160.000

180.000

Gol Uno Palio Astra Corsa Vectra PalioWeekend

Fiesta Corsa Sedan Parati

Tipos de carros

Qu

anti

dad

es V

end

idas

Quantidades Vendidas

Quantidades Vendidas

0 20.000 40.000 60.000 80.000 100.000 120.000 140.000 160.000 180.000

Gol

Uno

Palio

Astra

Corsa

Vectra

Palio Weekend

Fiesta

Corsa Sedan

Parati

Vei

culo

s

Quantidade Vendida

Quantidades Vendidas

Quantidades Vendidas

31%

11%

16%

4%

12%

4%

4%

5%

10%

3%

Gol

Uno

Palio

Astra

Corsa

Vectra

Palio Weekend

Fiesta

Corsa Sedan

Parati

3

Page 4: Apostila Probabilidade e a

1.3 DESCRIÇAÕ GRÁFICA DE VARIÁVEIS QUANTITATIVAS

Os histogramas são os gráficos mais adequados para a descrição de dados oriundos de variáveis quantitativas. Basicamente, eles mostram as freqüências de observações para cada valor ou conjunto de valores da variável que se deseja descrever. Com base em uma tabela de distribuição de freqüências é construído o histograma – trata-se de uma representação gráfica adequada para o tratamento de conjuntos de dados quantitativos com elevada quantidade de elementos.

Tabela 1.2 Idades de 50 funcionários da empresa XPTO

ClassesIntervalos das

Classes fi fri Fi Fri xi1 [18 ; 25 [ 6 0,12 6 0,12 21,52 [25 ; 32[ 10 0,20 16 0,32 28,53 [32 ; 39[ 13 0,26 29 0,58 35,54 [39 ; 46[ 8 0,16 37 0,74 42,55 [46 ; 53[ 6 0,12 43 0,86 49,56 [53 ; 60[ 5 0,10 48 0,96 56,57 [60 ; 66[ 2 0,04 50 1,00 63,5

50 1

Frequências Absolutas

0

2

4

6

8

10

12

14

[18 ; 25[ [25 ; 32[ [32 ; 39[ [39 ; 46[ [46 ; 53[ [53 ; 60[ [60 ; 66[

Intervalos de classes

Fre

qu

ênci

a R

elat

iva

fi

4

Page 5: Apostila Probabilidade e a

Frequências Relativas

0,12

0,20

0,26

0,16

0,12

0,10

0,04

0

0,05

0,1

0,15

0,2

0,25

0,3

[18 ; 25[ [25 ; 32[ [32 ; 39[ [39 ; 46[ [46 ; 53[ [53 ; 60[ [60 ; 66[

intervalos de classes

fri

fri

1.3.1 DESCRIÇAÕ GRÁFICA DE VARIÁVEIS QUANTITATIVAS CONTÍNUAS

Os gráficos lineares é um dos gráficos mais adequados para a descrição de dados oriundos de variáveis quantitativas contínuas.Tabela 3 Produção de Pneumáticos – 1997/2002 – Brasil

Anos Pneumáticos (1000 peças)199719981999200020012002

9.39310.71013.46616.23816.70419.149

Produção de Pneumáticos - 1997/2002 - Brasil

0

5.000

10.000

15.000

20.000

25.000

a1997 a1998 a1999 a2000 a2001 a2002

Ano

Pn

eum

átic

os

(100

0 p

eças

)

Pneumáticos (1000 peça)

5

Page 6: Apostila Probabilidade e a

2 MEDIDAS DE POSIÇÃO OU TENDÊNCIA CENTRAL

2.1 INTRODUÇÃO

De um modo geral, qualquer conjunto de dados estatísticos – agrupados ou não -, dependendo do estudo a que se propõe, ocupa uma posição específica dentro de uma distribuição. As medidas de tendência central dão valor do ponto em torno do qual os dados se distribuem.

Vejamos a seguir o cálculo das medidas de posição ou de tendência central. Elas representam os conjuntos de dados pelos seus valores médios, em torno dos quais esses dados tendem a concentrar-se.

Essas medidas são:a) Medidas de tendência central.b) Medidas de dispersão.As primeiras mostram a magnitude (por um valor central e um valor médio) e as

segundas mostram variações ou concentrações dos dados em torno daquele valor.Primeiramente, vamos estudar as principais medidas de tendência central, assim

subdivididas:1. Média (aritmética, ponderada).2. Mediana.3. Moda

2.2 MÉDIA ARITMÉTICA ( )

É uma das principais medidas de posição, cuja aplicação é seguramente a mais usada, sendo que podem ser simples (dados não agrupados em classe) e ponderadas (dados agrupados em classe)2.2.1 Média Aritmética simples ( )

A média aritmética simples de um conjunto de números é igual ao quociente entre a soma dos valores do conjunto e o número total de valores.

Genericamente podemos escrever:

= xi , onde x1 = valor genérico da observação

n n = nº de observaçãoExemplo:

a) Durante um determinado mês de verão, os nove vendedores de uma firma de calefação central e ar-condicionado venderam os seguintes números de unidades de ar-condicionado centra: 8, 11, 5, 14, 8, 11, 16, 11, 16 considerando este mês como uma população estatística de interesse, o nº médio de unidades vendidas é:

= = 8 + 11 + 5 + 14 + 8 + 11 + 16 + 11 + 16 = 100

n 9 9= 11 unidades

2.2. 2 Média Aritmética Ponderada

A média aritmética é considerada ponderada quando os valores do conjunto tiverem pesos diferentes. Tratando-se de média simples, todos os valores apresentam

6

Page 7: Apostila Probabilidade e a

igual peso. Obtém-se uma média aritmética ponderada através do quociente entre o produto dos valores da variável pelos respectivos pesos e a soma dos pesos.

Assim, por exemplo, um professor pode realizar quatro provas por ano em sua matéria, atribuindo a cada uma delas os seguintes pesos: 1, 2, 3, 4. Se um aluno tiver recebido as notas 8, 7; 9 e 9, nessa ordem, sua nota final será a média aritmética ponderada 8,5, obtida da seguinte maneira:Média Final = (8 x 1) + (7 x 2) + (9 x 3) + (9 x 4) = 8 + 14 + 27 + 36 = 85 = 8,5

1 + 2 + 3 + 4 10 10

Para o cálculo da média aritmética ponderada utilizaram uma tabela que facilita em muito a visualização dos valores.Tabela 4

xi fi xi fi

1 2 1 x 2 = 2

2 2 2 x 2 = 4

3 3 3 x 3 = 9

5 3 5 x 3 = 15

fi = 10 xi fi = 30

xi fi

fi

2.2.2.1 Média aritmética para dados contínuos (ponderada)

É definido como sendo o quociente entre a soma dos produtos das freqüências, pelos pontos médios de cada classe, e a soma de todas as freqüências. Assim,

fi Pmi

fi

Ex: Tomemos a tabela abaixo, relativa as estaturas dos alunos da UnC – Ano 2001:

Estaturas (cm) Nº de alunos (fi) FiPmi = xi fiPmi

150 |---- 156 5 153 765

156 |---- 162 4 159 636

162 |---- 168 19 165 3.135

168 |---- 174 18 171 3.078

174 |---- 180 14 177 2.478

180 |---- 186 12 183 2.196

186 |---- 192 4 189 756

fi = 76 fi Pmi = 13.044

7

= 30 = 3,0 10

=

=

Page 8: Apostila Probabilidade e a

= fi Pmi

= 13.044 171,63 cm 76

Exercícios propostos

1) Calcule a média aritmética da série:(a) X: 1, 2, 8, 10, 12, 16, 21, 30.(b) Y: 5, 6, 6, 10, 11, 11, 20.

A seguir é dada a distribuição da quantidade de defeitos por microcomputador para uma amostra de 100 aparelhos.

Quantidade de defeitos por micro 0 1 2 3 4 5 6Números de aparelhos 15 28 20 14 10 7 6

2) Um produto é acondicionado em lotes contendo cada um deles 10 unidades. O lote só é aprovado se apresentar um peso superior a 40 quilos.Se as unidades que compõem determinado lote pesam: 3; 4; 3,5; 5,0; 3,5; 4; 5; 5,5; 4;5, este lote será aprovado? Qual o peso médio do produto?

3) Uma loja vende cinco produtos básicos A, B, C, D, E. O lucro por unidade comercializada destes produtos vale respectivamente R$ 200,00; R$ 300,00; R$ 500,00; R$ 1.000,00; R$ 5.000,00. a loja vendeu em determinado mês 10; 30; 20; 10; 5 unidades respectivamente. Qual foi o lucro médio por unidade comercializada por esta loja?

4) Um caminhão cujo peso vazio é 3.000Kg será carregado com 480 caixas de 10 kg cada, 350 caixas de 8kg cada, 500 caixas de 4 kg cada e 800 caixas de 5kg cada. O motorista do caminhão pesa 80 kg e a lona de cobertura da carga pesa 50 kg. (a) Se este caminhão tem que passar por uma balança que só permite passagens a caminhões com peso máximo de 15 toneladas, este caminhão passará pela balança? (b) Qual o peso médio das caixas carregadas no caminhão?

5) Calcule o número médio de acidentes por dia em uma determinada esquina.Nº de acidentes

por dia: xi

Nº de diasfi

0 301 52 33 14 1

6) O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule o salário médio destes funcionários.

8

fi

=

Page 9: Apostila Probabilidade e a

Classes Salários $ Nº de funcionáriosfi

1 400,00 |---- 500,00 122 500,00 |---- 600,00 153 600,00 |---- 700,00 84 700,00 |---- 800,00 35 800,00 |---- 900,00 16 900,00 |---- 1.000,00 1

7) Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo:

Classes Aluguel $ Nº de casasfi

1 0 |---- 200,00 302 200,00 |---- 400,00 523 400,00 |---- 600,00 284 600,00 |---- 800,00 75 800,00 |---- 1.000,00 3

Calcule o aluguel médio para essas residências.

2. 3 MEDIANA (Md)

Mediana é um valor central de um rol, ou seja, a mediana de um conjunto de valores ordenados (crescente ou decrescente) é a medida que divide este conjunto em duas partes iguais, cuja valor está sucedido de 50% e antecedido 50% desse conjunto de observações.

2.3.1 Cálculo da mediana – variável discreta

Dado um conjunto qualquer de valores, o primeiro passo é ordenar estes valores. Isto poderá ser feito tanto em ordem crescente quanto decrescente. E, como segundo passo, verificar se o número de elementos que compõe este conjunto é par ou ímpar.Se o número de elementos for ímpar, o elemento mediano será dado pela seguinte expressão: Em = N + 1 , 2

onde, Em = elementos mediano, e N = número de elementos do conjunto. Caso o número de elementos for par, a medida será dada pela média aritmética, expressa por N + N + 2 2 2

Exemplo 1: X = { 2, 5, 7, 9, 13, 15, 22 }

Em = 7 + 1 = 4. 2Md = 9

Exemplo 2: X = {2, 5, 7, 9, 10, 16}

9

Page 10: Apostila Probabilidade e a

Cálculos do elemento mediano

N + N + 2 6 + 6 + 2 2 2 = 2 2 = 3,5 2 2 O valor “3,5” corresponde à posição do elemento mediano dentro deste rol. Portanto, a mediana corresponde à média aritmética entre os valores centrais 7 e 9,ou seja ,

7 + 9 = 8 (Mediana) 2

Exemplo 3: Xi fi Fi

24578

25864

27152125

5∑ fi = 25

i = 1

Em = N +1 = 25 + 1 = 132 2

Md = 5 Exemplo 4:

Xi Fi Fi24578

54683

59152326

5 ∑ fi = 26i =1

N + N + 2 26 + 26 + 2 Em = 2 2 = 2 2 = 13,5

2 2 Md = 6 2. 3. 2 Cálculo da mediana – variável contínua

10

Page 11: Apostila Probabilidade e a

Em se tratando de cálculo da mediana para variável contínua, independente se n é par ou impar, devemos: 1o Passo: Calcula-se a ordem n . 22o Passo : Pela Fi (frequência acumulada) identifica-se a classe que contém a mediana (classe Md).

3o Passo Md = li + Em - F(ant) x h fi classe Em que:

li = limite inferior da classe mediana Em = elemento mediano F(ant) = freqüência acumulada até a classe anterior á classe mediana. fi classe = freqüência simples ou absoluta da classe mediana. h = amplitude do intervalo da classe mediana. Exemplo 1: Dada a distribuição amostral, calcular a mediana: Notas da Classe fi Fi

0 |---- 22 |---- 44 |---- 66 |---- 88 |---- 10

27 16 34 17 16

27 43 77 94 110

5 ∑ fi = 110 i =1

Exemplo 2: Com os dados da distribuição amostral, calcular a mediana. Intervalo das classes Fi Fi

35 |----45 5 545 |----55 12 1755 |----65 18 3565 |----75 14 4975 |----85 6 5585 |----95 3 58

∑ 58 Exercícios : 1) Calcule a mediana da seqüência :a) X: 2 ,5, 8, 10, 12, 15, 8, 5, 1b) Y: 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8 c) Interprete os valores obtidos.

2) Calcule a mediana da distribuição.

11

Page 12: Apostila Probabilidade e a

3) Calcule a mediana da distribuição do número de acidentes por dia, observando em determinado cruzamento , durante 40 dias.

No de acidentes por dia Número de dias

0 1 2 3 4

30 5 3 1 1

4) O consumo de energia elétrica verificada em 250 residências de família da classe média, com dois filhos, revelou a distribuição.

Classes Consumo Kwh No de famílias1234567

0 │------ 50 50 │------- 100100 │-------150 150 │------- 200200 │------- 250250 │------- 300300 │------- 350

2153247508024

a) Calcule a mediana da distribuiçãob) Interprete o valor obtido.

2.4 QUARTIS

Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:

0% 25% 50% 75% 100%│----------------------│---------------------│----------------------│----------------------│

Q1 Q2 = Md Q3

Q1 = 1o quartil, deixa 25% dos elementos. Q2 = 2o quartil, coincide com a mediana, deixa 50% dos elementos. Q3 = 3o quartil, deixa 75% dos elementos.

2.4.1 Cálculos para os quartis – variável discreta

2.4.1.1 Quando o número de observações for par

xi fi

2 4 5 6 8

5 20 32 40 2

12

Page 13: Apostila Probabilidade e a

A posição do elemento quartil o conjunto ordenado é identificado pela seguinte expressão: Eqi = i( N +1) , onde, 4

Eqi = posição do elemento desejado, i = { 1,2,3 } e N = número de observações

Exemplo1: Dado o conjunto X = { 10, 12, 12, 16, 20, 23, 25, 28 }, calcular o primeiro quartil ( Q1 ) e o terceiro ( Q3 ). Eqi = 1. (8 +1) = 9 = 2,25 ( posição do 1o elemento quartil no conjunto )

4 4

Q1 = 12

Eq3 = 3( 8 +1 ) = 27 = 6,75 ( posição do 3o elemento quartil no conjunto) 4 4

O 3o quartil Q3 = 24,5 Ou seja, o conjunto X, a 6o posição corresponde ao valor 1o ao 3o posição

corresponde ao valor 25. Portando, a posição 6,75 corresponde a 75% da diferença entre os valores 25 e 23, cujo resultado é adicionado ao valor que ocupa a 6 a posição, assim, 25 – 23 = 2 x 0,75 = 1,5 ; Logo, Q3 = 23 + 1,5 = 24,5

Exemplo 2: Determinar a faixa salarial (distância que vai do 1o ao 3o quartil) de 6 funcionários de certa Empresa, que ocupam o mesmo cargo. Salários: R$ 5.500,00; R$ 5.780,00; R$ 6.120,00; R$ 6.150,00; R$ 6.620,00; R$ 7.120,00.

Exemplo3: Sendo:

Salário (R$) N o de funcionários (fi)

2.300,003.200,004.600,005.785,006.890,00

35431

5

∑ fi = 16 i = 1

Calcular a fixa salarial .

2.4.1.2 Quando o N º de observações for impar.

Exemplo1: Dados X = { 185, 196, 207, 305, 574, 597, 612 . Calcular o primeiro quartil (Q1) e o terceiro quartil (Q3). Eqi = i( N +1) 4

13

Page 14: Apostila Probabilidade e a

Exemplo2: Dado:

Idades (anos) N º de observações (fi)20232529323536

102684331

7

∑ fi = 55 i = 1

Calcular a faixa de idade (Q1 a Q3)

2.4.1.3 Cálculos para os quartis – variável contínua

Determinação do 1o quartil: 1o passo: Calcular-se a ordem n 42o passo: Identifica-se a classe Q1 pela fi.

3o passo: Aplica-se a fórmula:

n - F(ant) x h 4Q1 = lQ1 + -------------------------------------------

fQ1

Determinação do 3o quartil: 1o passo: calcula-se a ordem 3n 42o passo: Identificar-se a classe Q3 pela fi.

3o passo: Aplica-se a fórmula

3n - F(ant) x h 4Q3 = lQ3 + -------------------------------------------

fQ3

Exemplo 1: Dada a distribuição, determinar os quartis ( Q1 e Q3 ) e mediana. Classes fi Fi

7 │------- 17 6 617 │------- 27 15 2127 │------- 37 20 4137 │------- 47 10 5147 │------- 57 5 56

∑ 56

14

Page 15: Apostila Probabilidade e a

Exercícios1) Calcule o primeiro e o terceiro quartis da distribuição de freqüência abaixo:

Custos 450│----- 550 │-----650 │----- 750 │-----850 │-----950│-----1050│----- 1150

fi 8 10 11 16 13 5 1

2) Dada a série X: 3, 15, 6, 9, 10, 4, 12,15, 17, 20, 29, calcule: a) Q1 b) Q2 c) Q3

3)A distribuição de freqüência abaixo representa idade de 50 alunos de uma classe de primeiro ano de faculdade.

Idade No de alunos1718192021

3181784

Calcule: a) Q1 b) Q3

4 . 5 Moda (Mo)

Dentre as principais medidas de posição, destaca-se a Moda. É o valor mais freqüente da distribuição. Para distribuição simples (sem agrupamento em classes), a identificação da Moda é facilitada pela simples observação de elementos que apresenta maior freqüência. Assim, para a distribuição:

xi 243 245 248 251 307

fi 7 17 23 20 8

A moda será 248. Indica-se: Mo = 248

Para dados agrupados em classes (variáveis contínuas), há diversas fórmulas para o cálculo da Moda. Destacamos o cálculo da moda por meio da fórmula de Czuber.

1o Passo: Identifica-se a classe modal (classe com maior freqüência).

2o Passo: Aplica-se a fórmula: Mo = lM o + ∆ 1 . h ∆ 1 + ∆ 2

em que: lM o = limite inferior da classe modal ∆ 1 = diferença entre a freqüência da classe modal e a frequência

imediatamente anterior ∆ 2 = diferença entre a freqüência da classe modal e a frequência

imediatamente posterior h = amplitude da classe modal

15

Page 16: Apostila Probabilidade e a

Exemplo 1: Determinar a moda para a distribuição:

Classes 0 │----- 1 1 │----- 2 2 │----- 3 3 │----- 4 4│----- 5 ∑

fi 3 10 17 8 5 43

1o Passo: Identifica-se a classe modal. No caso, trata-se da 3a classe: 2 │----- 3.

2o Passo: Aplica-se a fórmula, onde:Mo = lM o + ∆ 1 . h ∆ 1 + ∆ 2

Exemplo 2: Calcular a moda para a distribuição:

Salários (US$) 80 │----- 180 180 │----- 250 250 │----- 300 300 │----- 500

No de empregados 70 140 140 60

Observe que as amplitudes das classes não são iguais. Nesse caso, é preciso calcular as densidades das classes: fi ÷ h, para identificar qual classe modal (aquela com maior densidade). Assim:

Salários (US$) fi fi / h

80 │----- 180 70 70 / 100 = 0,7

180 │----- 250 140 140 / 70 = 2,0

250 │----- 300 140 140 / 50 = 2,8

250 │----- 300 60 60 / 200 = 0,3

1o Passo: Identifica-se a classe modal. No caso, trata-se da 3a classe: 250│----- 300.

2o Passo: Aplica-se a fórmula, onde:

Exercícios

1) Desejando lançar uma nova pasta dental, uma indústria pesquisou sobre os valores cobrados por nove marcas concorrentes e obteve os seguintes valores, em reais: 1,12; 1,00 ;1,07; 1,18; 1,60;1,90;0,92;2,02;1,70;1,12. Calcule a média aritmética, a moda e a mediana.

2) Para uma amostra de clientes de um pequeno mercado, foram observados os seguintes montantes de vendas, ordenados em ordem crescente:$ 0,10; 0,10; 0,25; 0,25; 0,25; 0,35; 0,40; 0,53; 0,90; 1,25; 1,35; 2,45; 2,71; 3,09; 4,10.

16

Page 17: Apostila Probabilidade e a

Determinar: a) a médiab) a medianac) a moda para esses valores de venda

3) A seguir, temos a distribuição do número de acidentes diários, durante 53 dias, em certa rodovia:

No de acidentes 0 1 2 3 4No de dias 20 15 10 5 3

Pede-se:a) Determinar a média.b) Determinar a mediana.c) Calcular a moda.d) Qual a porcentagem de dias em que tivemos dois ou mais acidentes por dia?

4) Sendo: Idade(anos)

10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14 10│--- 14

No de pessoas

15 28 40 30 20 15 10 5

3 MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

3.1 INTRODUÇÃO

São mediadas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média. Servem para medir a representatividade da media. Dispersão _______________________________________________ Sejam as séries: (a ) 20, 20, 20 (b) 15, 10, 20, 25, 30 Tem –se: a = 20 e b = 20 Observe: apesar de as séries terem médias iguais, a série a não apresenta dispersão em torno da média: a = 20, enquanto os valores da série b apresentam dispersão em torno da média: b = 20. Nesta seção são apresentadas medidas estatísticas que avaliam o grau de dispersão, ou variabilidade, de uma variável.

3.2 AMPLITUDE TOTAL

É uma medida de dispersão dada pela diferença entre o maior e o menor valor da série.

17

Page 18: Apostila Probabilidade e a

R = xmáx – x mín Exemplo: Para a série: 10, 12, 20, 22, 25, 33, 38 R = 38 – 10 = 28

A utilização da amplitude total como mediada de dispersão é limitada, pois, sendo uma medida que depende apenas dos valores externos, não capta possíveis variações entre esses limites. ]

3.3 DESVIO MÉDIO: (dm)Considerando que num conjunto de dados cada valor apresenta em relação à

média aritmética um afastamento, o desvio médio será a média aritmética destes afastamentos, levando-se em conta os valores absolutos desses desvios. Fórmula: dm = ∑ |x – | nExemplo 1: Para o conjunto de observações, calcular o desvio médio.

{2, 5, 11, 14, 25}

Exemplo 2: A tabela mostra o total de pontos obtidos por dois times de futebol no período de 1996 a 2000.

1996 1997 1998 1999 2000TIME A 7 12 20 16 10TIME B 18 16 15 9 12

a) Qual o desvio médio de cada um desses times?b) Qual o time mais regular nesse período?

3.4 VARIÂNCIA AMOSTRAL

Como se deseja medir a dispersão dos dados em relação à média, é interessante analisar os desvios de cada (xi) em relação à média isto é di = (xi - ). Se os di forem baixos, teremos pouca dispersão, ao contrário, se os desvios forem altos, teremos elevada dispersão. É fácil constatar que a soma dos desvios em torno da média é zero. Isto é: ∑di = 0. Para o cálculo da variância consideram-se os quadrados dos desvios: di

2.

A variância, S2, de uma amostra de n medidas é igual à soma dos quadrados dos desvios: ∑d2

i , dividida por (n - 1), assim:

S2 = ∑ d 2 = ∑ ( x i – ) 2 n – 1 n – 1 para dados agrupados , tem-se:

S2 = ∑ di 2 F i = ∑ ( x i – ) 2 . F i

n – 1 n – 1

Desenvolvendo-se o quadrado das diferenças: (xi - )2, somando-se os termos comuns, encontram-se as seguintes fórmulas práticas para o cálculo da variância amostral:

18

Page 19: Apostila Probabilidade e a

S2 = 1 ∑x2i – ( ∑ x i ) 2

n – 1 n Quando maior o valor de S2, maior a dispersão dos dados amostrais.

Exemplo 1: Calcular a variância para as medidas amostrais: 3, 7, 2, 1, 8.

Solução: Vamos determinar S2 pela fórmula básica. Para tanto, é interessante a construção da seguinte tabela:

xi di = (xi - ) di2 = (xi - )2

3 (3 - 4,2) = -1,2 1,447 2,8 7,842 -2,2 4,841 -3,2 10,248 3,8 14,44

∑ 21 0 38,80

A média amostral será: = ∑ x i = 21 = 4,2 n 5 Logo, a variância amostral será:

S2 = ∑ ( xi – ) 2 = 38,80 = 9,7 n -1 4

Agora, vamos determinar S2 pela aplicação da fórmula prática. Para tanto, é interessante a construção da seguinte tabela:

xi x2i

3 97 492 41 18 64

∑21 127

Então, a variância amostral será:

S2 = 1 ∑x2i – ( ∑ x i ) 2 = = 1 [ 127 – ( 21 ) 2 ] = 9,7

n – 1 n 4 5

3.5 DESVIO PADRÃO AMOSTRAL

Como explicado no item acima, o cálculo da variância é obtido pela soma dos quadrados dos desvios em relação à media. Assim é que, se a variável sob análise for medida em metros, a variância deverá ser expressa em m2 ( metros ao quadrado). Ou seja, a variância é expressa pelo quadrado da unidade de medida da variável que está sendo estudada. Para melhor interpretar a dispersão de uma variável, calcula-se a raiz

19

Page 20: Apostila Probabilidade e a

quadrada da variância, obtendo-se o desvio padrão que será expresso na unidade da mediada original. Assim:

S = √ S2

O desvio padrão das cincos medidas amostrais do exemplo 1 acima é dado por:

S = √S2 = √9.7 = 3,1

Exemplo 2: As velocidades máximas das cinco voltas dadas em um teste de fórmula 1, em Km/h foram: 190; 196; 204 e 202. Nessas condições, determine:a) a média das velocidades;b) a variância c) o desvio padrão.

Exercícios:1) Calcular a variância e o desvio padrão da seguinte distribuição amostral:

xi 5 7 8 9 11fi 2 3 5 4 2

2) A tabela a seguir mostra o número de votos por classe de dois candidatos que estão concorrendo a uma vaga para o centro acadêmico do curso.

Fases/ Candidatos

1a fase 3a fase 5a fase 7a fase 8a fase 9a fase

Vítor 12 15 12 16 14 15Rafael 12 11 18 9 19 15

a) Calcular o desvio padrão de cada um desses candidatos. b) Qual dos dois candidatos é o mais regular?

3. 6 COEFICIENTE DE VARIAÇÃO (C.V)

Em trabalhos experimentais, através deste parâmetro, comprovamos a precisão alcançada, embora não seja apenas esta a sua finalidade. Este coeficiente é expresso em percentagem, sendo utilizado em trabalhos científicos. É calculado utilizando–se a fórmula:

C.V = s. 100 s - desvio padrão - média aritmética

Verificamos, portanto, o que é a relação existente entre o desvio padrão e a média aritmética. Quanto maior a for a dispersão no conjunto de observações, maior será o seu valor. Até 10%-- ótimo; de 11% a 20%-- bom; de e 21% a 30% -- regular.

Exemplo: considerando-se a amostra abaixo, conclui-se que, neste caso o nível de dispersão --20%--é bom. = 40 e s = 8

20

Page 21: Apostila Probabilidade e a

C.V = 8 .100 C.V = 8 . 100 = 20% 40

Exercícios: 1) Determine a média aritmética e o desvio padrão e o coeficiente de variação dos

valores apresentados na tabela seguinte:

xi 2 3 4 5 6 7fi 5 10 15 12 5 3

2) O quadro mostra a distribuição das idades de 400 funcionários de uma empresa.Classes f ;

20 │--- 2525 │--- 3030 │--- 3535 │--- 4040 │--- 4545 │--- 5050 │--- 55

148046120100328

Nessas condições, calcule:a) a média das idadesb) o desvio padrãoc) o coeficiente de variação

2) O quadro nos mostra o número de defeitos por carro de uma determinada marca, numa frota de 40 carros

Defeito por carroxi

Freqüênciafi

012345

697495

Nessas condições determine:a) a média aritméticab) o desvio padrãoc) a variânciad) C.V

21

Page 22: Apostila Probabilidade e a

22