77
54 Unidade II Unidade II 5 MEDIDAS OU PARÂMETROS ESTATÍSTICOS O estudo que fizemos anteriormente diz respeito ao agrupamento de dados coletados e à representação gráfica de alguns deles. Cumpre agora estudarmos as medidas estatísticas. Esses valores nos darão a imagem sintetizada do comportamento de uma amostra, permitindo que, com relativamente poucas informações, possamos chegar a conclusões sobre essa amostra estudada. Existem basicamente dois grandes grupos de medidas estatísticas. O primeiro grupo é formado pelas medidas de tendência central, também chamadas de medidas de posição, que informam a magnitude da amostra estudada. Essas medidas nos dão uma visão global da amostra sem se aterem às características individuais de seus elementos. No entanto, como é necessário que tenhamos ideia das variações dos elementos da amostra em torno de suas medidas centrais, iremos estudar, também, um segundo grupo de medidas estatísticas: as medidas de dispersão, também chamadas de medidas de variabilidade. 5.1 Medidas de posição As medidas de posição ou medidas de tendência central, como o próprio nome indica, preocupam‑se com definir uma posição central da amostra, ou seja, um valor que seja representativo do que é típico da amostra. Iremos trabalhar com as três principais medidas desse tipo: a média, a mediana e a moda. 5.1.1 Média De todas as medidas de posição, a média é, seguramente, a mais usada. É chamada de média simples quando a frequência dos diversos valores é igual a 1, ou seja, cada valor aparece uma única vez na amostra, e de média ponderada quando os dados são dotados de certa frequência. Existem vários métodos diferentes para calcularmos as médias. Iremos nos preocupar com a principal delas, a média aritmética. As demais (geométrica, quadrática e harmônica), além de serem muito menos utilizadas, seguem os mesmos princípios da média aritmética, apenas com a utilização de operações matemáticas diferentes. A média aritmética é o resultado da soma dos valores de todos os elementos dividido pelo número total de elementos, ou seja, pela frequência total. Em outras palavras, se tivermos um

Estatística Unidade II

Embed Size (px)

Citation preview

Page 1: Estatística Unidade II

54

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Unidade II5 MEDIDAS OU PARÂMETROS ESTATÍSTICOS

O estudo que fizemos anteriormente diz respeito ao agrupamento de dados coletados e à representação gráfica de alguns deles. Cumpre agora estudarmos as medidas estatísticas. Esses valores nos darão a imagem sintetizada do comportamento de uma amostra, permitindo que, com relativamente poucas informações, possamos chegar a conclusões sobre essa amostra estudada.

Existem basicamente dois grandes grupos de medidas estatísticas. O primeiro grupo é formado pelas medidas de tendência central, também chamadas de medidas de posição, que informam a magnitude da amostra estudada. Essas medidas nos dão uma visão global da amostra sem se aterem às características individuais de seus elementos.

No entanto, como é necessário que tenhamos ideia das variações dos elementos da amostra em torno de suas medidas centrais, iremos estudar, também, um segundo grupo de medidas estatísticas: as medidas de dispersão, também chamadas de medidas de variabilidade.

5.1 Medidas de posição

As medidas de posição ou medidas de tendência central, como o próprio nome indica, preocupam‑se com definir uma posição central da amostra, ou seja, um valor que seja representativo do que é típico da amostra. Iremos trabalhar com as três principais medidas desse tipo: a média, a mediana e a moda.

5.1.1 Média

De todas as medidas de posição, a média é, seguramente, a mais usada. É chamada de média simples quando a frequência dos diversos valores é igual a 1, ou seja, cada valor aparece uma única vez na amostra, e de média ponderada quando os dados são dotados de certa frequência.

Existem vários métodos diferentes para calcularmos as médias. Iremos nos preocupar com a principal delas, a média aritmética. As demais (geométrica, quadrática e harmônica), além de serem muito menos utilizadas, seguem os mesmos princípios da média aritmética, apenas com a utilização de operações matemáticas diferentes.

A média aritmética é o resultado da soma dos valores de todos os elementos dividido pelo número total de elementos, ou seja, pela frequência total. Em outras palavras, se tivermos um

Page 2: Estatística Unidade II

55

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

conjunto de valores S = {x1, x2, x3,………xn}, a média aritmética desse conjunto será calculada por meio das fórmulas:

Xx x x x

Nn= + + + +1 2 3 ....

Ou

Xx

Ni= Σ

Onde:

X é a média aritmética;

x1, x2, etc. são os diversos valores;

N é a quantidade total de elementos da amostra.

Exemplo 1. Calcular a média aritmética dos valores relacionados a seguir:

S = {2; 5; 7; 9; 10; 12; 16; 18}

Observe que são oito elementos de diferentes valores, portanto:

Xx

NX Xi= ⇒ = + + + + + + + ⇒ =Σ 2 5 7 9 10 12 16 18

89 9,

Exemplo de aplicação

1. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos correspondentes a cada um. Os dados estão na tabela a seguir:

Tabela 25

12% 13% 18% 9% 10% 11%

13% 15% 16% 14% 8% 17%

A partir desse dado, podemos dizer que o rendimento médio dessas aplicações é de:

A) 13%

B) 12%

Page 3: Estatística Unidade II

56

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

C) 15%

D) 18%

E) 16%

Caso os valores sejam repetidos na amostra, ou seja, caso tenham uma frequência diferente de 1 (x1 com f1; x2 com f2 e assim por diante), então a fórmula para o cálculo da média aritmética é:

Xx ffi i

i= Σ

Σ

Este último conceito define a média ponderada; eventualmente, as frequências podem ser substituídas por “pesos” que conferem importância diferenciada a cada valor.

O exemplo a seguir mostra o cálculo para dados não agrupados em classe:

Exemplo 2. Calcular a média aritmética dos valores relacionados a seguir:

Tabela 26

Valor Frequência simples

xi fi

25 37

42 28

57 54

62 62

39 12

Como no exemplo anterior, o cálculo da média aritmética consiste na soma de todos os valores dividida pela quantidade total de elementos. Porém, cada um dos valores da tabela aparece certo número de vezes, diferente de 1; por exemplo, o valor 25 aparece 37 vezes, portanto precisamos somar 25 com ele mesmo 37 vezes; ou, de maneira mais direta, precisamos multiplicar 25 por 37. A coluna C mostra todos os cálculos desse tipo. Quando somamos essa coluna, obtemos o valor 9.491, que corresponde à soma de todos os elementos da amostra (193 elementos). Assim, a média é:

Page 4: Estatística Unidade II

57

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Tabela 27

A B C = A x B

Valor Frequência simples Valor x Frequência

xi fi xi . fi

25 37 925

42 28 1176

57 54 3078

62 62 3844

39 12 468

ft 193 9491

Xx ff

X Xi i

i= ⇒ = ⇒ =Σ

Σ9491193

49 2,

No caso de dados agrupados em classes, o processo de cálculo é idêntico ao anterior, com a diferença de que o valor a ser usado é o ponto médio de classe (lembre‑se de que já definimos esse valor anteriormente):

x pi mi=

O exemplo a seguir mostra‑nos, passo a passo, o cálculo da média aritmética ponderada para dados agrupados por classes:

Exemplo de aplicação

2. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos ocorreram na linha de produção. Na tabela a seguir, estão relacionados as informações referentes aos últimos 120 dias de produção.

Tabela 28

Número de defeitos diários Número de dias

6 20

7 23

8 21

9 18

10 16

12 13

13 5

14 3

15 1

Page 5: Estatística Unidade II

58

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Nessas condições o número médio de defeitos diários é de aproximadamente:

A) 7,9

B) 10,0

C) 9,3

D) 8,0

E) 8,7

Exemplo 3. Dada a tabela de frequências a seguir, calcular a média aritmética.

Tabela 29

A B C D E = (C + D)/2 F = D x E

Classe Limites de classe

li ls

Frequênciasimples

fi

Pontomédio

de classepmi

Frequênciax pontomédio

fi x pmi

1,0 3,0 |‑‑‑‑‑‑‑ 414,0 14,0 208,5 2.919,0

2,0 414,0 |‑‑‑‑‑‑‑ 825,0 19,0 619,5 11.770,5

3,0 825,0 |‑‑‑‑‑‑‑ 1.236,0 41,0 1.030,5 42.250,5

4,0 1.236,0 |‑‑‑‑‑‑‑ 1.647,0 53,0 1.441,5 76.399,5

5,0 1.647,0 |‑‑‑‑‑‑‑ 2.058,0 32,0 1.852,5 59.280,0

6,0 2.058,0 |‑‑‑‑‑‑‑ 2.469,0 27,0 2.263,5 61.114,5

7,0 2.469,0 |‑‑‑‑‑‑‑ 2.880,0 20,0 2.674,5 53.490,0

8,0 2.880,0 |‑‑‑‑‑‑‑ 3.291,0 11,0 3.085,5 33.940,5

9,0 3.291,0 |‑‑‑‑‑‑| 3.702,0 8,0 3.496,5 27.972,0

∑= ft = 225,0 369.136,5

A tabela anterior apresenta os valores e cálculos necessários para determinarmos a média aritmética para uma amostra que estivermos descrevendo.

As áreas sombreadas da tabela mostram os cálculos necessários para a obtenção da média aritmética.

O uso de uma tabela para esses cálculos facilita as operações, além de estas serem mais facilmente trabalhadas em computador.

Nesse exemplo, somamos os valores de todos os elementos da amostra, ficando na seguinte situação: o valor da soma dos 225 elementos da amostra é 369136,5, portanto a média aritmética será de:

Page 6: Estatística Unidade II

59

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Xx ff

X Xi i

i= ⇒ = ⇒ =Σ

Σ369136 5

2251640 6

,,

É importante observar as seguintes propriedades das médias aritméticas:

• a soma algébrica dos afastamentos (ou desvios, ou resíduos) de um conjunto de números tomados em relação à média é nula;

• se multiplicarmos ou dividirmos todas as informações por uma constante, a média aritmética ficará multiplicada ou dividida por essa constante;

• somando‑se ou subtraindo‑se uma constante de todos os valores de um conjunto de informações, a média aritmética ficará somada ou subtraída dessa constante;

• a soma dos quadrados dos desvios tomados em relação à média aritmética é mínima (essa propriedade é muito importante para a definição de desvio‑padrão, que veremos mais à frente)

Exemplo de aplicação

3. Uma pequena agência de publicidade relacionou, na tabela a seguir, o custo das suas 120 últimas campanhas publicitárias:

Tabela 30

Classes Custo das campanhas publicitárias (limites)

Quantidade de campanhas publicitárias (frequência simples)

A R$ 5.000 |‑‑‑‑ R$ 10.000 12

B R$ 10.000 |‑‑‑‑ R$ 15.000 15

C R$ 15.000 |‑‑‑‑ R$ 20.000 18

D R$ 20.000 |‑‑‑‑ R$ 25.000 23

E R$ 25.000 |‑‑‑‑ R$ 30.000 25

F R$ 30.000 |‑‑‑‑ R$ 35.000 14

G R$ 35.000 |‑‑‑‑ R$ 40.000 13

Nessas condições, podemos afirmar que o custo médio das campanhas publicitárias dessa agência é de aproximadamente:

A) R$ 22.833,00

B) R$ 22.500,00

C) R$ 20.000,00

Page 7: Estatística Unidade II

60

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

D) R$ 25.833,00

E) R$ 20.833,00

5.1.2 Mediana

Conceitualmente, definimos mediana como o valor, em um conjunto de valores ordenados, que divide exatamente esse conjunto em duas metades, com 50% dos valores superiores à mediana e 50% inferiores. Essa definição precisa adaptar‑se ao número N de elementos da amostra:

• caso N seja um número ímpar, a mediana será o valor do elemento central (chamado de elemento mediano);

• caso N seja um número par, a mediana será a média aritmética simples dos dois elementos centrais (o elemento mediano passa a ser um elemento teórico intermediário). Veja no exemplo a seguir:

Exemplo 1. Dados os seguintes conjuntos de notas de alunos de Estatística, calcule a mediana:

Grupo A = {6,2; 4,2; 8,7; 6,4; 2,8; 9,1; 5,0; 3,9; 7,1}.

Para calcular a mediana é necessário colocar os dados em ordem crescente:

{2,8; 3,9; 4,2; 5,0; 6,2; 6,4; 7,1; 8,7; 9,1}

Como o número de elementos é ímpar (N = 9), a mediana será o valor do elemento central (o quinto elemento), ou seja, o valor da mediana será 6,2.

Poderíamos dar uma roupagem mais matemática ao cálculo utilizando as fórmulas a seguir, onde: Eme é o elemento mediano e Me a mediana:

EN

E Eme me me= + => = + => =12

9 12

O valor do quinto elemento é a mediana:

Me = 6,2

Grupo B = { 8,4; 6,3; 9,2; 4,9; 6,5; 8,0}

Ordenando:

{4,9; 6,3; 6,5; 8,0; 8,4; 9,2}

Page 8: Estatística Unidade II

61

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

EN

E Eme me meo= + => = + => =1

26 1

23 5,

Evidentemente, não existe um elemento 3,5º. A mediana será a média aritmética entre o valor do terceiro e do quarto elemento:

Mex x

Me Me= + => = + => =3 4

26 5 8 0

27 25

, ,,

Cálculo semelhante se fará quando trabalhamos com dados agrupados, seja em classes ou não. Primeiro, veremos quando os dados não forem agrupados em classes. Nesse caso, o procedimento é semelhante ao feito no Exemplo 1, com a diferença de que precisaremos calcular a frequência acumulada crescente para permitir localizarmos o elemento mediano.

Exemplo de aplicação

4. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos correspondentes a cada um. Os dados estão na tabela a seguir:

Tabela 31

12% 13% 18% 9% 10% 11%

13% 15% 16% 14% 8% 17%

A partir desse dado, podemos dizer que o rendimento mediano dessas aplicações é de:

A) 18%

B) 12%

C) 15%

D) 13%

E) 16%

O exemplo 2 mostra o cálculo em duas situações diferentes:

Exemplo 2. Calcular a mediana para os dados relacionados a seguir, relativos ao número de filhos por família moradora em determinada cidade.

Page 9: Estatística Unidade II

62

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Tabela 32 – Cidade A

Número de filhos por família

Quantidade de familias na cidade Frequência

acumulada crescenteValor Frequência simples

xi fi fac

0 15 15

1 18 33

2 12 45

3 8 53

4 5 58

5 3 61

6 1 62

Mais do que 6 1 63

Soma 63

Perceba que o número de elementos (N = 63) é ímpar, logo o elemento mediano será o 32º:

E Eme me= + => =63 12

32º

O 32º elemento tem o valor 18, isso porque, com os valores ordenados, os 15 primeiros referem‑se a famílias com 0 filho; o 16º ao 33º valor referem‑se a famílias com 1 filho, e assim por diante. Logo a mediana será:

Me = 18

Portanto, podemos afirmar que 50% das famílias têm um filho ou menos, e 50% das famílias têm um filho ou mais.

Tabela 33 – Cidade B

Número de filhos por família

Quantidade de famílias na cidade Frequência acumulada

crescenteValor Frequência simples

xi fi fac

0 15 15

1 21 36

2 16 52

3 9 61

4 6 67

5 4 71

6 1 72

Mais do que 6 0 72

Soma 72

Page 10: Estatística Unidade II

63

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Perceba que o número de elementos (N = 72) é par, logo o elemento mediano seria o 36,5º, que, evidentemente, não existe.

E Eme meo= + => =72 1

236 5,

O 36º elemento tem o valor 1, e o 37º, o valor o valor 2, portanto o 36,5º seria um valor médio entre esses dois valores, ou seja, a mediana será:

Me Me= + => =1 22

15,

Portanto, podemos afirmar que 50% das famílias têm menos de 1,5 filho e 50% das famílias tem mais de 1,5 filho.

Exemplo de aplicação

5. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos ocorreram na linha de produção. Na tabela a seguir estão relacionadas as informações referentes aos últimos 120 dias de produção.

Tabela 34

Número de defeitos diários Número de dias

6 20

7 23

8 21

9 18

10 16

12 13

13 5

14 3

15 1

Nessas condições, o número médio de defeitos diários é de aproximadamente:

A) 7,9

B) 10,0

C) 9,3

Page 11: Estatística Unidade II

64

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

D) 8,0

E) 8,7

O cálculo da mediana, quando trabalhamos com dados agrupados em classes, é mais trabalhoso porque conseguimos determinar o elemento mediano e a classe da qual o elemento faz parte, mas não o valor exato da mediana. A maneira de contornarmos esse inconveniente é utilizando os conceitos de interpolação.

Lembrete

No nosso contexto, interpolar significa encontrar, dentro de uma faixa de valores, aquele valor que melhor corresponde às condições estabelecidas, normalmente situado entre dois outros valores conhecidos.

No caso do cálculo da mediana, o processo de interpolação gera a seguinte fórmula, que sempre iremos usar:

Me liE f

fhMe

me ac ant

Me= + −

×

Onde:

Me = Mediana.

lime = Limite inferior da classe que contém o elemento mediano (classe mediana).

Eme = Elemento mediano.

fac ant = Frequência acumulada crescente até a classe anterior à classe mediana.

fme = Frequência da classe mediana.

h = Amplitude da classe mediana.

O Exemplo 3, a seguir, demonstra o cálculo da mediana para uma distribuição de vendas em reais agrupadas por classe.

Exemplo 3. Calcular a mediana para a tabela a seguir, que apresenta a distribuição de vendas de determinada empresa.

Page 12: Estatística Unidade II

65

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Tabela 35

Classes número

Vendas mensais em R$ Quantidade de meses Frequência acumulada crescenteValor frequência

li ls fi fac

1 R$ 50.000,00 |‑‑‑‑ R$ 80.000,00 12 12

2 R$ 80.000,00 |‑‑‑‑ R$ 110.000,00 18 30

3 R$ 110.000,00 |‑‑‑‑ R$ 140.000,00 27 57

4 R$ 140.000,00 |‑‑‑‑ R$ 170.000,00 26 83

5 R$ 170.000,00 |‑‑‑‑ R$ 200.000,00 21 104

6 R$ 200.000,00 |‑‑‑‑ R$ 230.000,00 18 122

7 R$ 230.000,00 |‑‑‑‑ R$ 260.000,00 12 134

8 R$ 260.000,00 |‑‑‑| R$ 290.000,00 9 143

TOTAL 143

O elemento mediano é dado por:

E Eme me= + => =143 12

72º

O 72º elemento está na quarta classe, que chamamos de classe mediana, ou seja, a mediana é um valor entre R$ 140.000,00 e R$ 170.000,00. Obteremos o resultado usando a fórmula da interpolação:

Me liE f

fhMe

me ac ant

Me= + −

× = + −

×. .140 00072 57

2630 0000 157 307 69=> =Me . ,

Portanto, podemos afirmar que 50% das vendas mensais dessa empresa estão acima de R$ 157.307,69, e 50%, abaixo desse valor.

Exemplo de aplicação

6. Uma pequena agência de publicidade relacionou, na tabela seguinte, o custo das suas 120 últimas campanhas publicitárias:

Tabela 36

Classes Custo das campanhas publicitárias Quantidade de campanhas publicitárias (frequência simples)

A R$ 5.000 ï‑‑‑‑ R$ 10.000 12

B R$ 10.000 ï‑‑‑‑ R$ 15.000 15

C R$ 15.000 ï‑‑‑‑ R$ 20.000 18

D R$ 20.000 ï‑‑‑‑ R$ 25.000 23

E R$ 25.000 ï‑‑‑‑ R$ 30.000 25

F R$ 30.000 ï‑‑‑‑ R$ 35.000 14

G R$ 35.000 ï‑‑‑‑ R$ 40.000 13

Page 13: Estatística Unidade II

66

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Nessas condições podemos afirmar que o custo mediano das campanhas publicitárias dessa agência é de aproximadamente:

A) R$ 22.370

B) R$ 22.500

C) R$ 23.370

D) R$ 25.833

E) R$ 20.833

5.1.3 Moda

O conceito de moda é o mais simples entre as medidas estatísticas. Trata‑se do valor que mais vezes se repete numa distribuição de frequências, ou seja, aquele dotado de maior frequência.

O cálculo da moda para dados isolados ou para dados não agrupados em classes é imediato: decorre de simples observação, como mostra o Exemplo 1; já para dados agrupados necessitamos adotar algumas recomendações feitas por estatísticos renomados. No Exemplo 2, apresentamos um cálculo deste último tipo de distribuição.

Exemplo 1. Calcular a moda para os conjuntos de dados mostrados a seguir, referentes ao consumo de rolamentos (em unidades) em várias linhas de produção.

Linha A: {21; 22; 24; 24; 25; 25; 25; 27; 28}

A moda evidentemente é: Mo = 25

Linha B: {8; 8; 9; 9; 9; 9; 10; 11; 11; 11; 11; 12; 12; 12}

Neste conjunto temos duas modas: Mo = 9 e Mo = 11. Chamamos de amostra multimodal.

Linha C: {15; 18; 25; 32; 43; 50; 61}

Não existe um valor que se repita mais de uma vez. Temos uma amostra sem moda, ou seja, amodal.

Page 14: Estatística Unidade II

67

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Tabela 37

Quantidade de rolamentos conumidos

Número de vezes em que ocorreu o consumo

xi fi

Valor Frequência

8 18

10 25

12 32

13 45

15 28

16 21

17 12

21 8

A moda é o valor de maior frequência; portanto, para a linha D, teríamos Mo = 13

Exemplo de aplicação

7. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos correspondentes a cada um. Os dados estão na tabela que segue:

Tabela 38

12% 13% 18% 9% 10% 11%

13% 15% 16% 14% 8% 17%

A partir desse dado, podemos dizer que o rendimento modal dessas aplicações é de:

A) 18%

B) 13%

C) 15%

D) 12%

E) 16%

8. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos ocorreram na linha de produção. Na tabela a seguir estão relacionadas as informações referentes aos últimos 120 dias de produção.

Page 15: Estatística Unidade II

68

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Tabela 39

Número de defeitos diários

Número de dias

6 20

7 23

8 21

9 18

10 16

12 13

13 5

14 3

15 1

Nessas condições, o número modal de defeitos diários é de aproximadamente:

A) 7,0

B) 6,0

C) 9,0

D) 8,0

E) 8,7

Exemplo 2. Calcular a moda para a distribuição de rendas familiares apresentada na tabela a seguir.

Classes número

Rendas familiares mensais em R$ Quantidade de meses

Valor Frequência

li ls fi

1 R$ 650,00 |‑‑‑‑ R$ 1.100,00 16

2 R$ 1.100,00 |‑‑‑‑ R$ 1.550,00 21

3 R$ 1.550,00 |‑‑‑‑ R$ 2.000,00 28

4 R$ 2.000,00 |‑‑‑‑ R$ 2.450,00 31

5 R$ 2.450,00 |‑‑‑‑ R$ 2.900,00 18

6 R$ 2.900,00 |‑‑‑‑ R$ 3.350,00 16

7 R$ 3.350,00 |‑‑‑‑ R$ 3.800,00 12

Total 142

Page 16: Estatística Unidade II

69

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Você pode notar que os valores se repetem mais na classe 4 (a frequência é a maior de todas), logo a moda deve ser um valor entre R$ 2.000,00 e R4 2.450,00. Mas exatamente qual é o valor da moda?

Normalmente esse cálculo pode ser feito por três recomendações diferentes: as formulas de Czuber, King e Pearson, que utilizaremos a seguir.

Observação

Recomendação é diferente de equacionamento matemático. Decorre de estudos, normalmente empíricos, que apresentam validade prática, mas não exatidão matemática. São, portanto, aproximações.

Recomendação de Czuber

Para utilizarmos a recomendação de Czuber devemos inicialmente localizar a classe que tem maior frequência, a chamada classe modal. No nosso exemplo essa classe é a de número 4, como já falamos. Em seguida aplicamos a seguinte fórmula:

Mo lif f

f f f fhMo

Mo ant

Mo ant Mo post= + −

− + −

×( )( ) ( )

Onde:

Mo = Moda.

Limo = Limite inferior da classe modal.

fmo = Frequência da classe modal.

fant = Frequência da classe imediatamente anterior à classe modal.

fpost = Frequência da classe imediatamente posterior à classe modal.

h = Amplitude da classe modal.

No nosso exemplo, ficaria:

Mo Mo R= + −−( ) + −

× => =2 000

31 2831 28 31 18

450 2 034 61.( )

( )$ . ,

Page 17: Estatística Unidade II

70

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Recomendação de King

Como no cálculo anterior, para utilizarmos a recomendação de King, devemos inicialmente localizar a classe que tem maior frequência, a chamada classe modal. No nosso exemplo, essa classe é a de número 4, como já falamos. Em seguida, aplicamos a seguinte fórmula:

Mo lif

f fhMo

post

ant post= +

+

×

Onde:

Mo = Moda.

limo = Limite inferior da classe modal.

fant = Frequência da classe imediatamente anterior à classe modal.

fpost = Frequência da classe imediatamente posterior à classe modal.

h = Amplitude da classe modal.

No nosso exemplo ficaria:

Mo Mo R= ++

× => =2 00018

28 18450 2 176 09. $ . ,

Recomendação de Pearson

No caso de Pearson, a recomendação parte de conceito diferente do adotado nas anteriores. Baseia‑se no uso da média e da mediana:

Mo Me X= × − ×3 2

Onde:

Mo = Moda.

Me = Mediana.

X = Média.

Page 18: Estatística Unidade II

71

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

No nosso exemplo teríamos:

Me = R$ 2.094,36

X = R$ 2.123,59

Logo, a moda seria:

Mo = 3 x 2.094,36 ‑ 2 x 2.123,59 => Mo = R$ 2.035,90

Cada recomendação resultou em um valor diferente. Isso ocorre porque são recomendações que partem de considerações diferentes. A experiência nos ensina qual é a melhor recomendação a utilizar em cada caso prático.

Exemplo de aplicação

9. Uma pequena agência de publicidade relacionou na seguinte tabela o custo das suas 120 últimas campanhas publicitárias:

Tabela 40

Classes Custo das campanhas publicitárias (limites)

Quantidade de campanhas publicitárias

(frequência simples)

A R$ 5.000 |‑‑‑‑ R$ 10.000 12

B R$ 10.000 |‑‑‑‑ R$ 15.000 15

C R$ 15.000 |‑‑‑‑ R$ 20.000 18

D R$ 20.000 |‑‑‑‑ R$ 25.000 23

E R$ 25.000 |‑‑‑‑ R$ 30.000 25

F R$ 30.000 |‑‑‑‑ R$ 35.000 14

G R$ 35.000 |‑‑‑‑ R$ 40.000 13

Nessas condições, podemos afirmar que o custo modal (pelo Método de King) das campanhas publicitárias dessa agência é de aproximadamente:

A) R$ 27.500

B) R$ 30.000

C) R$ 28.370

D) R$ 25.000

E) R$ 26.892

Page 19: Estatística Unidade II

72

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

O uso de cada uma dessas medidas depende da situação prática que se apresenta. Bruni (2007) apresenta uma série de vantagens e desvantagens de cada uma delas, as quais podem ser resumidas no quadro a seguir:

Quadro 2

Medida de posição Vantagens Desvantagens

Média

É de fácil compreensão, podendo ser calculada diretamente usando‑se calculadoras apropriadas.

É afetada por valores extremos da série, não representando com precisão a distribuição em que esses valores ocorrem com frequencia acentuada.

Depende de todos os valores da distribuição, usando todos os dados disponíveis.

É necessário conhecer todos os valores da distribuição.

Evidencia bastante estabilidade de amostra para amostra.

A média não tem, necessáriamente, existência real.

Possibilita a manipulação de dados, com cálculo de médias combinadas

Pode ser obtida uma média de número fracionario inexistente, por exemplo, 6,7 alunos.

Pode ser facilmente incluida em equações matemáticas

Mediana

Mesmo que alguns valores da série sejam modificados, ela pode manter‑se inalterada

Se for determinada a mediana dos grupos separados, não será encontrada a mediana do grupo.

Os valores extremos não interferem no seu resultado, por isso é indicada quando existem valores discrepantes.

Mesmo que os valores mais altos ou mais baixos da série não estejam definidos, ela pode ser determinada.

Pode ser utilizada para dados que têm a possibilidade de ser ordenados.

Moda

Caso algum valor da série seja modificado, não necessariamente a moda se alterará.

A moda tem de ter, necessariamente, um valor real, já que ela é representada por algum valor da série.

Os valores extremos não interferem no seu resultado.

Quando utilizadas para calcular distribuições de classe aberta, não pode ser determinada a moda empregando‑se algum procedimento aritmético elementar.

Pode ser calculada em distribuições que possuam classe indeterminada.

Fonte: Bruni (2007).

5.2 Medidas de dispersão

As medidas de dispersão completam a informação contida nas medidas de posição, revelando o afastamento ou o desvio dos elementos do valor central. Quanto menor for a dispersão de uma amostra, maior será a qualidade da informação contida na medida de posição, ou, em outras palavras, menor a margem de erro que será assumida, considerando a medida de posição como representante de toda a amostra.

Page 20: Estatística Unidade II

73

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Essas medidas, também chamadas de medidas de variabilidade, caracterizam a homogeneidade ou heterogeneidade da amostra. Quanto menor o valor, mais homogênea a amostra será.

Existem basicamente dois grandes grupos de medidas de dispersão:

• medidas de dispersão absolutas: levam em conta a dispersão propriamente dita;

• medidas de dispersão relativas: levam em conta, simultaneamente, uma medida de posição e a medida de dispersão correspondente. São úteis para efetuarmos comparações entre amostras.

O objetivo deste tópico é tomarmos contato com ambos os grupos.

5.2.1 Medidas de dispersão absolutas

5.2.1.1 Amplitude total

A amplitude total (AT) já é nossa conhecida e é a mais elementar das medidas de dispersão. É extremamente fácil de ser calculada, mas de difícil interpretação, em especial quando os dados extremos são muito grandes ou muito pequenos. Portanto, é mais utilizada quando as distribuições apresentam certa homogeneidade. Por exemplo, suponha que tenhamos as valorizações mensais das ações de duas diferentes empresas, A e B, com os seguintes valores (dados em porcentagem):

Empresa A = {21,5; 18,0; 26,3; 32,4; 45,1; 18,6; 37,6}

Empresa B = {15,3; 19,7; 23,9; 16,7; 25,9; 14,6; 18,9; 25,8}

As amplitudes seriam, respectivamente, de 45,1 – 18,0 = 27,1% para as ações da empresa A e de 25,9 – 14,6 = 11,3% para a empresa B. Em outras palavras, as variações máximas seriam de 27,1% para as ações da empresa A e de 11,3% para a empresa B. Logo, o risco de oscilação é maior para a empresa A do que para a empresa B.

5.2.1.2 Desvio médio

Definido como a média aritmética do módulo dos desvios dos elementos em relação à média destes.

Lembrete

Módulo ou valor absoluto de um número é a distância deste número para zero, independentemente do sinal, ou seja, módulo de um número será o próprio número, se ele for positivo, ou seu simétrico (positivo), se for negativo.

Page 21: Estatística Unidade II

74

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Saiba mais

Os conceitos básicos sobre módulo ou valor absoluto podem ser revistos no seguinte artigo:

MIRANDA, D. Definição de módulo de um número real. Mundo Educação, Goiânia, [s.d.]. Disponível em: <http://www.mundoeducacao.com/matematica/definicao‑modulo‑um‑numero‑real.htm>. Acesso em: 6 dez. 2013.

Entende‑se por desvio a diferença entre o valor de um elemento da amostra e a média dessa mesma amostra:

d x Xi i= −

Portanto, o desvio médio será dado pela fórmula:

dmd

Nin

i= =Σ 1| |

O exemplo a seguir deixará mais claro esse processo.

Exemplo 1. Calcular o desvio médio da amostra {18; 21; 22; 27; 28; 29; 32; 37}.

O primeiro passo será calcular a média aritmética desses valores e, em seguida, os desvios de cada um dos valores. Depois, somaremos o módulo desses valores dividindo‑os pelo número total de elementos da amostra. A tabela a seguir mostra passo a passo esses cálculos:

Tabela 41

Ordem dos elementos

Valoresxi

Desviosdi = xi - X

Módulo dos desvios| di = xi - X |

1 18 18 ‑ 27 = ‑9 9

2 21 21 ‑ 27 = ‑6 6

3 22 22 ‑ 27 = ‑5 5

4 27 27 ‑ 27 = 0 0

5 28 28 ‑ 27 = 1 1

6 29 29 ‑ 27 = 2 2

7 33 33 ‑ 27 = 6 6

8 38 38 ‑ 27 = 11 11

Soma 216 0 40

Média ( X ) 216/8=27 Desvio médio (dm) 40/8 = 5

Observe que a soma dos desvios é zero. O próprio conceito de média (valor equidistante de todos os elementos da amostra) nos conduz a isso. O conceito de desvio médio só tem sentido quando utilizamos

Page 22: Estatística Unidade II

75

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

o módulo dos desvios. Para ficar mais claro, veja a seguir os cálculos feitos, utilizando‑se das fórmulas informadas:

Cálculo da média:

Xx

NX Xi= ⇒ = ⇒ =Σ 216

827

Cálculo do desvio médio:

dmd

Ndm dmi

ni= => = => ==∑ 1 40

85

| |

Quando trabalhamos com dados agrupados em classes ou não, utilizamos exatamente o mesmo processo de cálculo, evidentemente, com alterações nas fórmulas de cálculo, introduzindo o conceito de frequência simples, como mostramos a seguir:

dmd f

fi

ni i

i

ni

=

=

∑∑

1

1

| |

Observar que, para dados agrupados em classes, o cálculo dos desvios é dado por:

d pm Xi i= −

Os exemplos a seguir demonstram esses cálculos.

Exemplo 2. Calcular o desvio médio da amostra de distribuição a seguir, relativa ao número de acidentes diários numa estrada federal.

Tabela 42 – Distribuição de acidentes por dia – Estrada X

Número de acidentes diários Dias pesquisados Valor x

frequência Desvios Módulo dos desvios

Módulo dos desvios x

FrequênciaValor Frequência

xi fi xi.fi di = xi ‑ X | di = xi ‑ X | | di | x fi

0 12 0 ‑3,6 3,6 43,5

1 15 15 ‑2,6 2,6 39,4

2 28 56 ‑1,6 1,6 45,6

4 23 92 0,4 0,4 8,6

5 19 95 1,4 1,4 26,1

6 8 48 2,4 2,4 19,0

8 6 48 4,4 4,4 26,2

Page 23: Estatística Unidade II

76

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

10 4 40 6,4 6,4 25,5

11 2 22 7,4 7,4 14,7

12 1 12 8,4 8,4 8,4

Somas 118 428 257,0

Média 3,6 Desvio médio 2,2

dmd f

fdm dmi

ni i

i

ni

=> = => ==

=

∑∑

1

1

257118

2 2| |

,

Exemplo 3. Calcular o desvio médio da amostra de distribuição a seguir, relativa ao tempo de mão de obra gasto com a manutenção dos aviões de uma empresa aérea.

Tabela 43 – Distribuição de horas de manutenção – Aero X

ClassesLimites de classes

Pontos médios

de classe

Manutenções pesquisadas

Valor x frequência Desvios Módulo dos

desvios

Módulo dos desvios x

frequência

Valor Frequência

li ls pmi fi pmi.fi di = xi - X | di = xi - X | | di | x fi

1 0 |‑‑‑ 3 1,5 26 39 ‑4,1 4,1 106,0

2 3 |‑‑‑ 6 4,5 20 90 ‑1,1 1,1 21,5

3 6 |‑‑‑ 9 7,5 16 120 1,9 1,9 30,8

4 9 |‑‑‑ 12 10,5 10 105 4,9 4,9 49,2

5 12 |‑‑| 15 13,5 6 81 7,9 7,9 47,5

Somas 78 435 255,1

Média 5,6 Desvio médio 3,3

dmd f

fdm dmi

ni i

i

ni

=> = => ==

=

∑∑

1

1

255 178

3 3| | ,

,

5.2.1.3 Variância

A definição de desvio médio leva em consideração os desvios dos elementos tomados à primeira potência. Matematicamente, demonstra‑se que os efeitos de desvio são mais bem‑representados quando tomados ao quadrado.

Observação

Dois motivos justificam os desvios ao quadrado: a soma dos quadrados dos desvios tomados ao quadrado é mínima; e, elevando ao quadrado, resolvemos o problema de alguns desvios serem positivos e outros negativos, gerando soma algébrica zero.

Page 24: Estatística Unidade II

77

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Essa consideração nos leva à definição das duas mais importantes medidas de variabilidade absolutas: a variância e o desvio‑padrão, que veremos em seguida.

A variância é o somatório dos desvios tomados ao quadrado, ou seja, é basicamente a mesma definição do desvio médio, alterando‑se apenas a potência dos desvios:

Sd

Ni

ni2 12

1=

−=∑

Observação

O denominador N – 1 justifica‑se pelos chamados graus de liberdade, que podem ser entendidos com o número de espaços entre os dados. No decorrer do curso, utilizaremos a fórmula apresentada para amostras e a mesma fórmula com denominador igual a N para populações.

No caso em que estivermos trabalhando com dados agrupados, a fórmula, naturalmente, deverá incluir o conceito de frequência simples, ou seja:

Sd f

fi

ni i

i

ni

2 12

11

−=

=

∑∑

Os Exemplos de 1 a 3 no próximo subtópico mostram o cálculo da variância nos vários casos possíveis.

5.2.1.4 Desvio‑padrão

O cálculo ou a análise da variância tem um grande inconveniente prático: apresenta unidades ao quadrado em relação à medida de tendência central. Por exemplo, suponha que queiramos descrever uma amostra de salários de uma empresa. Poderíamos afirmar que o salário médio da empresa é de 1.340 reais, e a variância, de 11.025 reais ao quadrado.

Observe a estranheza que causa a unidade: “reais ao quadrado”. Sem falar do número extravagante que resultou dos cálculos. Para contornar esse problema, define‑se a mais utilizada das medidas de variabilidade: o desvio‑padrão.

Conceitualmente, o desvio‑padrão é a raiz quadrada da variância e é simbolizado pela letra S (maiúscula). Dessa forma, é calculado pelas fórmulas:

Sd

Ni

ni=

−=∑ 1

2

1

Page 25: Estatística Unidade II

78

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

para dados isolados e

Sd f

fi

ni i

i

ni

−=

=

∑∑

12

11

para dados agrupados em classes ou não.

Nos Exemplos de 1 a 3 a seguir, são calculados os valores do desvio‑padrão e da variância, de maneira semelhante ao que foi feito anteriormente para o desvio médio. Observe que o cálculo obedece aos seguintes passos, em ambos os casos:

• calcular a média da distribuição;

• calcular os desvios de cada elemento;

• calcular o quadrado dos desvios;

• somar o quadrado dos desvios (usando o conceito de frequência, caso sejam dados agrupados);

• dividir a soma obtida pelo número de elementos menos 1, obtendo‑se a variância;

• extrair a raiz quadrada, obtendo‑se o desvio‑padrão.

Exemplo 1. Calcular a média e o desvio‑padrão da amostra {18; 21; 22; 27; 28; 29; 32; 37}.

Tabela 44

Ordem dos elementos

Valoresxi

Desviosdi = xi - X

Desvios ao quadrado di

2

1 18 18 ‑ 27 = ‑9 81

2 21 21 ‑ 27 = ‑6 36

3 22 22 ‑ 27 = ‑5 25

4 27 27 ‑ 27 = 0 0

5 28 28 ‑ 27 = 1 1

6 29 29 ‑ 27 = 2 4

7 33 33 ‑ 27 = 6 36

8 38 38 ‑ 27 = 11 121

Soma 216 0 304

Média 216/8=27Variância 304/7 = 43,4

Desvio‑padrão 6,6

Page 26: Estatística Unidade II

79

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Cálculo da média:

Xx

NX Xi= ⇒ = ⇒ =Σ 216

827

Cálculo da variância:

Sd

NS Si

ni2 12

2 2

13048 1

43 4=−

=> =−

=> ==∑,

Cálculo do desvio‑padrão:

Sd

NS S Si

ni=

−=> =

−=> = => ==∑ 1

2

13048 1

43 4 6 6, ,

Mo = 26.892

Exemplo de aplicação

10. As últimas dez ligações telefônicas para um call center duraram, em minutos, os seguintes valores:

Tabela 45

15 12 16 18 14

11 17 16 12 13

Para esses dados, podemos dizer que o valor aproximado do desvio‑padrão é:

A) 3,0

B) 3,2

C) 1,6

D) 2,4

E) 2,2

Page 27: Estatística Unidade II

80

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Exemplo 2. Calcular a variância e o desvio‑padrão da amostra de distribuição a seguir, relativa ao número de acidentes diários numa estrada federal.

Tabela 46 – Distribuição de acidentes por dia – Estrada X

Número de acidentes diários Dias pesquisados Valor

x Frequência

Desvios Quadrado dos desvios

Quadrado dos desvios x FrequênciaValor Frequência

xi fi xi.fi di = xi ‑ X di2 di

2 x fi

0 12 0 ‑3,6 13,2 157,9

1 15 15 ‑2,6 6,9 103,5

2 28 56 ‑1,6 2,6 74,1

4 23 92 0,4 0,1 3,2

5 19 95 1,4 1,9 35,8

6 8 48 2,4 5,6 45,0

8 6 48 4,4 19,1 114,7

10 4 40 6,4 40,6 162,5

11 2 22 7,4 54,4 108,7

12 1 12 8,4 70,1 70,1

Somas 118 428 875,6

Média 3,6 Variância 7,5

Desvio médio 2,7

Cálculo da variância:

Sd f

fS Si

ni i

i

ni

2 12

1

2 2

1

875 6118 1

7 5=×

−=> =

−=> ==

=

∑∑

,,

Cálculo do desvio‑padrão:

Sd f

fS S Si

ni i

i

ni

−=> =

−=> = => ==

=

∑∑

12

11

875 6118 1

7 5 2 7,

, ,

Exemplo de aplicação

11. A CIPA de uma empresa relacionou o número de acidentes ocorridos nos últimos seis anos, montando a seguinte tabela:

Page 28: Estatística Unidade II

81

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Tabela 47

Número de acidentes por mês Número de meses

0 38

1 12

2 9

3 7

4 4

5 2

O desvio‑padrão dos acidentes nessa empresa é de:

A) 0,4

B) 0,5

C) 0,6

D) 0,7

E) 0,8

Exemplo 3. Calcular o desvio‑padrão da amostra de distribuição a seguir, relativa ao tempo de mão de obra gasto com a manutenção dos aviões de uma empresa aérea.

Tabela 48 – Distribuição das horas de manutenção – Aero X

ClassesLimites de

classes

Pontos médios de

classe

Manutençõespesquisadas Valor x

Frequência DesviosQuadrado

dos desvios

Quadrado dos

desvios x FrequênciaValor Frequência

li ls pmi fi pmi.fi di = xi - X di2 di

2 x fi

1 0 |‑‑‑ 3 1,5 26 39 ‑4,1 16,6 432,2

2 3 |‑‑‑ 6 4,5 20 90 ‑1,1 1,2 23,2

3 6 |‑‑‑ 9 7,5 16 120 1,9 3,7 59,2

4 9 |‑‑‑ 12 10,5 10 105 4,9 24,2 242,4

5 12 |‑‑| 15 13,5 6 81 7,9 62,8 376,7

Somas 78 435 1133,5

Média 5,6 Variância 14,7

Desvio‑padrão 3,8

Page 29: Estatística Unidade II

82

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Cálculo da variância:

Sd f

fS Si

ni i

i

ni

2 12

1

2 2

1

1133 578 1

14 7=×

−=> =

−=> ==

=

∑∑

,,

Cálculo do desvio‑padrão:

Sd f

fS S Si

ni i

i

ni

−=> =

−=> = => ==

=

∑∑

12

11

1133 578 1

14 7 3 8,

, ,

O desvio‑padrão é a mais utilizada medida de dispersão, e, quando relacionada com a média, informa a quantidade de elementos da amostra ou da população que se situam em torno da média.

O mais comum, na Estatística, é que essa relação entre média e desvio‑padrão seja feita pela chamada distribuição normal, à qual nós voltaremos na disciplina Estatística Aplicada. Nessa relação, válida na maior parte dos casos práticos, há os seguintes intervalos:

• entre a média mais uma vez o desvio‑padrão e a média menos uma vez o desvio‑padrão, estão contidos 68% dos elementos da amostra ou da população;

• entre a média mais duas vezes o desvio‑padrão e a média menos duas vezes o desvio‑padrão, estão contidos 85% dos elementos da amostra ou da população;

• entre a média mais três vezes o desvio‑padrão e a média menos três vezes o desvio‑padrão, estão contidos 99,74% dos elementos da amostra ou da população;

• entre a média mais quatro vezes o desvio‑padrão e a média menos quatro vezes o desvio‑padrão, estão contidos 100% dos elementos da amostra ou da população.

Exemplo 4. Um estudo estatístico com 4.850 alunos de Administração da Produção de uma universidade mostrou que a nota final média deles foi de 5,3 com desvio‑padrão de 1,2. Quantos alunos tiveram médias finais entre 4,1 e 6,5?

Observe que as notas: 4,1 e 6,5 correspondem exatamente à média menos um desvio‑padrão (5,3 – 1,2 = 4,1) e à média mais um desvio‑padrão (5,3 + 1,2 = 6,5). Portanto, 68% dos alunos estão contidos nesse intervalo, ou seja: 68% de 4.850 são 3.298 alunos.

Como 60% de 4.850 é 3.298, podemos afirmar que essa é a quantidade de alunos que tiveram notas entre 4,1 e 6,5.

Page 30: Estatística Unidade II

83

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Exemplo de aplicação

12. Certa repartição pública anotou e relacionou os tempos de inspeção que faz nas empresas, chegando à seguinte distribuição de frequências:

Tabela 49

Tempo de inspeção em minutos

Número de inspeções realizadas

10 ï‑‑‑‑ 20 3

20 ï‑‑‑‑ 30 6

30 ï‑‑‑‑ 40 15

40 ï‑‑‑‑ 50 36

50 ï‑‑‑‑ 60 19

O desvio‑padrão do tempo de inspeção nessa repartição é:

A) 10,2

B) 9,5

C) 12,3

D) 11,9

E) 8,3

5.2.2 Medidas de dispersão relativas

A maneira mais comum de se informar de maneira sintética (resumida) dados quantitativos é por meio de uma medida de posição (média, mediana ou moda) em conjunto com uma medida de dispersão absoluta (desvio médio, variância ou desvio‑padrão). O mais comum é o par de informações média – desvio‑padrão.

Frequentemente, no entanto, é interessante utilizar as chamadas medidas de dispersão relativas, que analisam simultaneamente uma medida de posição e a mediada de dispersão correspondente. São especialmente interessantes essas medidas quando fazemos comparações entre amostras diferentes.

A rigor, podemos obter essas medidas, costumeiramente chamadas de coeficientes de variação, dividindo uma medida de dispersão por uma medida de posição; no entanto, as mais comuns são:

1. Coeficiente de variação de Pearson: divisão do desvio‑padrão pela média:

CvS

XCv

S

Xp p= = ×ou 100

Page 31: Estatística Unidade II

84

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

2. Coeficiente de variação de Thorndike: divisão do desvio‑padrão pela mediana:

CvS

MeCv

SMep p= = ×ou 100

O Exemplo 1 a seguir mostra uma aplicação dos coeficientes de variação, num caso de ordem prática.

Exemplo 1. Um especialista estudou, estatisticamente, dois tipos de investimentos, chegando às conclusões da tabela que segue. Qual é o investimento que apresenta menor risco?

EstatísticasAplicações

ObservaçõesX Y

Retorno esperado 12% 20%

O especialista teria chegado a essas conclusões através de um estudo estatístico no qual pesquisou e resumiu os retornos ocorridos no passado, conforme vimos no item 3.1.1

Desvio‑padrão 9% 10%Analogamente o especialista teria calculado o desvio‑padrão conforme vimos no item 3.2.1.4

Observe que se o especialista comparasse as aplicações somente com base em seus desvios padrões, ele preferiria a aplicação X, uma vez que essa aplicação tem um desvio‑padrão menor que Y (9% versus 10%). Essa comparação seria baseada no fato de que, sendo mais homogênea a aplicação A, “daria menos sustos”. No entanto, se ele calculasse e comparasse os coeficientes de variação, chegaria a conclusões diferentes:

EstatísticasAplicações

X Y

Retorno esperado 12% 20%

Desvio‑padrão 9% 10%

Coeficiente de Variação de Pearson 75% 50%

Cv Cvpa pa= × => =9

12100 75%

Cv Cvpb pa= × => =10

20100 50%

A comparação dos coeficientes de variação das aplicações mostra que o especialista estaria cometendo um erro sério se escolhesse a aplicação X em vez da aplicação Y, já que a dispersão relativa, ou risco, das aplicações, conforme refletida no coeficiente de variação, é menor para o ativo Y do que para o X (50% versus 75%). Evidentemente, o uso do coeficiente de variação para comparar o risco da aplicação é melhor porque este também considera o tamanho relativo, ou retorno esperado, das aplicações.

Page 32: Estatística Unidade II

85

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Exemplo de aplicação

13. A tabela a seguir relaciona médias e desvios‑padrões de três diferentes amostras de investimentos feitos por um aplicador financeiro:

Tabela 50

Investimento Rendimento médio Desvio-padrão

A 18,0% 6,0%

B 14,5% 4,9%

C 9,3% 5,0%

Acerca dessas informações, não podemos dizer que:

A) A maior rentabilidade média é a do investimento C.

B) O investimento que apresenta maior homogeneidade é o investimento B.

C) O melhor compromisso entre posição e variabilidade é o do investimento C.

D) O maior coeficiente de variação é o do investimento A e vale 33,3%.

E) O coeficiente de variação do investimento C é o menor e vale 25,9%.

14. Foram comparados os dados referentes a acidentes de trabalho em dois grupos de ramos diferentes de indústria. Nas 35 indústrias do ramo A foi notada uma taxa média de 2,62 acidentes por mil homens/hora de trabalho, com desvio‑padrão de 0,72. Nas 35 empresas das indústrias do ramo B foi notada taxa média de 3,10 acidentes por mil homens/hora de trabalho, com desvio‑padrão de 0,80. Com base nesses dados, informou‑se:

I – Em termos absolutos, as empresas do ramo A apresentaram menor variação na taxa de acidentes porque o desvio‑padrão delas é menor.

II – Em termos relativos, as empresas do ramo A também apresentam menor variação na taxa de acidentes, porque têm maior coeficiente de variação.

III – As empresas do ramo B apresentam menor variação relativa, pois têm menor coeficiente de variação.

Em relação a essas afirmativas, podemos garantir que:

A) Todas estão corretas.

B) Estão corretas as afirmativas I e II.

Page 33: Estatística Unidade II

86

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

C) Estão corretas as afirmativas I e III.

D) Estão corretas as afirmativas II e III.

E) Todas estão erradas.

6 RELAÇÕES GRÁFICAS ENTRE AS MEDIDAS ESTATÍSTICAS

Nos estudos e análises estatísticos, é interessante e importante visualizar as informações contidas nos dados por meio do uso dos diversos gráficos, assunto que tratamos na unidade I.

Quando utilizamos os histogramas, é facilmente perceptível que as frequências dos valores mais centrais tendem a ser maiores que as dos valores extremos. Esse comportamento nos permitirá tirar conclusões importantes no tópico da Estatística Indutiva, porque, via de regra, ocorre de modo repetitivo.

Observações do padrão de comportamento das distribuições mostram que grande parte delas tende a apresentar‑se da maneira conhecida como distribuição normal.

A figura 22 mostra o comportamento estatístico de uma distribuição de frequências relativa aos pesos de um grupo de pessoas qualquer. Observe que os pesos próximos da média têm maior frequência, e os mais afastados, menor frequência. Observe também a curva que se forma pela distribuição das colunas.

30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105

Peso em quilos

Freq

uênc

ia s

impl

es

40

35

30

25

20

15

10

5

0

Figura 23 – Pesos corporais

No curso de Estatística Aplicada, retornaremos ao assunto, quando diremos, por exemplo, que é pouco provável alguém ter peso acima de 100 kg ou abaixo de 35 kg, e utilizaremos essa curva para determinar qual é essa probabilidade, se houver.

Page 34: Estatística Unidade II

87

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Por ora, iremos nos preocupar com a variação de formatos desse tipo de curva, chamada de curva normal, curva de Gauss ou, ainda, de curva do sino.

Em teoria, espera‑se que essa curva tenha o comportamento mostrado nas curvas desenhadas em linha contínua nas Figuras 23 e 24. Na prática, porém, ocorrem deformações nessas curvas, demonstradas nas curvas pontilhadas das mesmas figuras. Essas deformações são chamadas, respectivamente, de assimetria (Figura 23) e curtose (Figura 24).

Média00 Variável

Freq

uênc

ia si

mpl

es Assimétrica positiva Assimétrica negativa

Simétrica

Figura 24 – Assimetria

Curva platicúrtica

Curva mesocúrtica

Curva leptocúrtica

Freq

uênc

ia si

mpl

es

Média Variável

Figura 25 – Curtose

6.1 Assimetria

A assimetria mede o quanto a distribuição se afasta da média. Esse afastamento pode ocorrer para a direita ou para a esquerda, gerando, respectivamente, as assimetrias positiva e negativa.

O grau de assimetria é dado, frequentemente, pelo chamado 1º coeficiente de Pearson:

As X MeS= −

Page 35: Estatística Unidade II

88

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Onde:

As = Coeficiente de assimetria.

X = Média.

Me = Mediana.

S = Desvio‑padrão.

Esse coeficiente pode assumir diferentes valores. De acordo com o sinal desses valores, a assimetria será numa direção, como se vê a seguir:

As = 0 – A distribuição é simétrica.

As > 0 – A distribuição é assimétrica positiva ou à direita.

As < 0 – A distribuição é assimétrica negativa ou à esquerda.

Por esse critério, costuma‑se classificar as distribuições da seguinte maneira:

Caso As ≤ ‑1: assimétrica negativa forte.

Caso ‑1 < As < 0: assimétrica negativa fraca.

Caso As = 0: simétrica.

Caso 0 < As < 1: assimétrica positiva fraca.

Caso As ≥ 1: assimétrica positiva forte.

6.2 Curtose

A curtose mede o quanto a distribuição se alonga ou se achata em relação à curva teórica. A curva teórica é chamada de mesocúrtica; as mais alongadas, de leptocúrticas; e as mais achatadas, de platicúrticas.

O grau de curtose é dado, frequentemente, pelo coeficiente:

K

d f

f

S

i i

i=

×

∑∑

4

4 3

Page 36: Estatística Unidade II

89

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Onde:

K = Coeficiente de curtose.

di = Desvios.

fi = Frequências simples.

S = Desvio‑padrão.

Assim como na assimetria, também na curtose os coeficientes podem assumir diferentes valores. De acordo com o sinal desses valores, a assimetria será numa direção, como se vê a seguir:

K = 0: a distribuição é mesocúrtica.

K > 0: a distribuição é leptocúrtica.

K < 0: a distribuição é platicúrtica.

Lembrete

Existem outras medidas de assimetria e curtose além das apresentadas aqui, mas que não são objeto do nosso curso.

Vamos usar o exemplo a seguir para demonstrar o cálculo da assimetria e da curtose de uma distribuição referente ao consumo de energia elétrica entre 1.245 famílias de determinada região.

Observando os resultados obtidos (expostos a seguir), notamos que a distribuição (e a curva dela decorrente) é assimétrica negativa fraca, ou seja, ligeiramente deslocada para a nossa direita, e que é platicúrtica, ou seja, achatada. A curva teria a aparência aproximada da figura que segue (a curva pontilhada é a do exercício; a cheia é a padrão):

Média Variável

Freq

uênc

ia si

mpl

es

Figura 26 – Assimetria e curtose

Page 37: Estatística Unidade II

90

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Tabela 51

Classes número

Consumo mensal por número

de famílias

Pontos médios

de classe

Frequência acumulada crescente

Pontos médios x

FrequênciasDesvios

Desvios ao

quadrado

Desvio ao

quadrado x

Frequências

Desvios à quarta

potência

Desvios à quarta potência x

Frequências

Valor Frequência

li | ‑‑‑‑ ls fi pmi fac pmi x fi di = xi ‑ X di2 di

2 x fi di4 di

4 x fi

1 0 | ‑‑‑‑ 50 158 25 158 3.950 ‑192 36.944 5.837.189 1.364.876.602 215.650.503.107

2 50 | ‑‑‑‑ 100 100 75 258 7.500 ‑142 20.223 2.022.335 408.984.000 40.898.400.046

3 100 | ‑‑‑‑ 150 112 125 370 14.000 ‑92 8.502 952.277 72.291.984 8.096.702.259

4 150 | ‑‑‑‑ 200 164 175 534 28.700 ‑42 1.782 292.180 3.174.048 520.543.855

5 200 | ‑‑‑‑ 250 175 225 709 39.375 8 61 10.623 3.685 644.833

6 250 | ‑‑‑‑ 300 280 275 989 77.000 58 3.340 935.149 11.154.389 3.123.228.929

7 300 | ‑‑‑‑ 350 84 325 1.073 27.300 108 11.619 975.991 134.999.655 11.339.970.993

8 350 | ‑‑‑‑ 400 63 375 1.136 23.625 158 24.898 1.568.577 619.912.976 39.054.517.468

9 400 | ‑‑‑‑ 450 56 425 1.192 23.800 208 43.177 2.417.921 1.864.267.846 104.398.999.377

10 450|

‑‑‑‑ |500 53 475 1.245 25.175 258 66.456 3.522.183 4.416.437.760 234.071.201.262

Somatórios 1.245 270.425 18.534.426 657.154.712.129

• Cálculo da média:

x f

fi i

i= =>= =>=∑

∑270 4251 245

217 2.

.,

• Cálculo do desvio‑padrão:

Sd f

fS S Si

ni i

i

ni

−=> =

−=> = => ==

=

∑∑

12

11

18 534 4261 245 1

14 899 1. ..

. 222 1,

• Cálculo da mediana:

— elemento mediano:

EN

E Eme me me= + => = + => =12

1 245 12

623.

º

— mediana:

Me liE f

fh MeMe

me ac ant

Me= + −

× = + −

× =>200623 534

17550 == 225 4,

Page 38: Estatística Unidade II

91

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Cálculo da assimetria:

AsX

SAs As= − => = − => = −Me 217 2 225 4

122 10 067

, ,,

,

Portanto, a curva é fracamente assimétrica negativa.

• Cálculo da curtose:

K

d f

f

SK K

i i

i=

×

− => = − => = −

∑∑

4

4 43

657 154 712 1291245

122 13 0 6

. . .

( , ), 225

Portanto, a curva é platicúrtica.

Exemplo de aplicação

15. Com relação à assimetria e à curtose das distribuições, foram feitas as seguintes afirmações:

I – Uma curva assimétrica positiva tem uma média superior à curva simétrica.

II – Curvas platicúrticas têm desvio‑padrão maior do que curvas leptocúrticas.

III – Curvas com coeficiente menor do que zero têm deslocamento para a esquerda em relação à curva simétrica.

IV – Análise da curtose consiste em estudar o achatamento ou o alongamento da distribuição.

Em relação a essas afirmações, podemos dizer que:

A) Todas estão incorretas.

B) Existe uma alternativa incorreta.

C) Existem duas alternativas incorretas.

D) Existem três alternativas incorretas.

E) Todas estão corretas.

16. Duas distribuições foram estudadas e chegou‑se aos seguintes coeficientes mostrados a seguir:

Page 39: Estatística Unidade II

92

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Tabela 52

Distribuição Coeficiente de assimetria

Coeficiente de curtose

A ‑ 1,34 1,89

B 0,87 ‑1,34

A partir desses coeficientes, não podemos afirmar:

A) A distribuição A tem menor média do que se fosse simétrica e é mais achatada do que a mesocúrtica.

B) A distribuição B tem menor média do que se fosse simétrica e é mais achatada do que a mesocúrtica.

C) Ambas as distribuições não são simétricas nem mesocúrticas.

D) A curva A é mais alongada do que a curva B.

E) As duas curvas têm assimetrias opostas.

7 TEORIA ELEMENTAR DAS PROBABILIDADES

Em Estatística, quando nos referimos a uma previsão de comportamento de uma população a partir do conhecimento de uma amostra, ou, ao contrário, à previsão do comportamento esperado de uma amostra retirada de uma população conhecida, temos o cuidado de utilizar a palavra provavelmente antes de cada informação.

Assim, por exemplo, quando após uma pesquisa eleitoral o veículo de comunicação informa que se a eleição fosse naquele momento o candidato X teria 35% dos votos, ele quer dizer que provavelmente o candidato X tivesse essa quantidade de votos. É uma afirmação provável de ocorrer, não quer dizer que certamente ocorrerá. Uma tolerância nessa informação é esperada.

Neste tópico veremos o que significa e como são calculadas as probabilidades, ramo de estudo da Matemática, e não exatamente da Estatística. Inicialmente iremos verificar casos absolutamente teóricos e posteriormente evoluiremos para situações mais próximas da realidade.

Tentaremos utilizar o raciocínio lógico para resolver as questões e, no final do tópico, faremos uma revisão teórica, apresentando os conceitos e as fórmulas utilizadas na Teoria Elementar das Probabilidades. O importante é você dominar o mecanismo de cálculo da probabilidade.

7.1 Definições de probabilidades

Caso você procure a definição de probabilidade em um dicionário, o Houaiss (2009), por exemplo, irá encontrar algo do tipo:

Page 40: Estatística Unidade II

93

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

“Probabilidade: característica do que é provável; perspectiva favorável de que algo venha a ocorrer; possibilidade, chance.”

Como é fácil de notar, essa definição não acrescenta nada ao conceito intuitivo que temos de probabilidade; isso porque esse conceito é circular, ou seja, define‑se probabilidade utilizando‑se seus próprios termos.

Desenvolve‑se atualmente uma abordagem axiomática na definição de probabilidade, mantendo‑se seu conceito indefinido, algo semelhante ao que acontece em Geometria com as definições de ponto e reta.

Estatisticamente, no entanto, adotam‑se três abordagens diferentes na definição de probabilidades: a abordagem clássica, a abordagem como frequência relativa e a abordagem subjetiva.

Antes de seguirmos, no entanto, na definição de probabilidade, é necessário definir alguns termos que serão utilizados.

• Experimento: significará, para nós, observar ou executar determinado processo sob certas circunstâncias controladas. Todas as nossas questões e problemas trabalhados em estatísticas são experimentos que devem ser corretamente definidos. Podemos citar alguns exemplos para clarear nosso entendimento. O comportamento das ações numa Bolsa de Valores; a produtividade de um processo; a variação de estoques ao longo de determinado período; o controle de qualidade dos produtos recebidos por um empresa; os resultados de um jogo, por exemplo, a Mega‑Sena, entre outros, são exemplos de experimentos.

• Experimento aleatório: são aqueles que, apesar de serem repetidos exatamente da mesma maneira, não apresentam resultados obrigatoriamente iguais. Por exemplo: você pode jogar um dado exatamente da mesma maneira duas vezes, e nada garantirá que irá obter o mesmo resultado. Rigorosamente, experimentos aleatórios são, exclusivamente, jogos de azar. Em Administração, vamos trabalhar, normalmente, com experimentos aproximadamente aleatórios, os quais, apesar de apresentarem determinado grau de aleatoriedade, não são exclusivamente aleatórios. Por exemplo, o jogo de cartas conhecido como 21 é aleatório; já o “buraco” é aproximadamente aleatório.

Saiba mais

A obra a seguir é um interessante estudo sobre o efeito do acaso (aleatoriedade) nas nossas vidas. Vale a pena ler:

MLODINOW, L. O andar do bêbado: como o acaso determina nossas vidas. Rio de Janeiro: Zahar, 2009.

Page 41: Estatística Unidade II

94

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

• Espaço amostral (ou conjunto universo ou espaço das probabilidades): é o conjunto formado por todos os resultados possíveis de um experimento aleatório. Por exemplo, o espaço amostral de um jogo de um dado “honesto” é dado por:

S = {1, 2, 3, 4, 5, 6}. O dado deve ser “honesto”; se não for, o experimento não será aleatório.

• Evento: é um determinado subconjunto formado por um ou mais elementos do espaço amostral. Por exemplo, num jogo de dados, o evento número primo é formado por:

E = {1, 2, 3, 5}

Observação

Por definição, um número positivo será primo se for maior do que 1 e for divisível apenas por 1 e por ele mesmo. Por essa definição, o número 1 seria primo, apesar de que, por conveniência, normalmente não é considerado como tal. Neste material, será incluído entre os números primos.

7.2 Cálculos das probabilidades elementares

Usando esses conceitos, podemos determinar estatisticamente o termo probabilidade.

• Abordagem clássica: probabilidade é a razão (divisão) entre o número de elementos (ou resultados) favoráveis a um determinado evento e o número total de elementos (ou resultados) do espaço amostral, ou seja:

P An An S

( )( )( )

=

Sendo:

P(A) a probabilidade de ocorrer o evento A.

n(A) o número de elementos favoráveis ao evento A.

n(S) o número total de elementos do espaço amostral.

Por exemplo:

Qual é a probabilidade de, ao jogarmos um dado “honesto”, obtermos um número primo?

E A n An meros primosú : , , , ( )= { }∴ =12 3 5 4 S n A= { }∴ =12 3 4 5 6 6, , , , , ( )

Page 42: Estatística Unidade II

95

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

P An An S

P A( )( )( )

( ) , , %= ⇒ = = =46

0 667 66 7

• Abordagem como frequência relativa: probabilidade é a razão entre o número de vezes em que determinado resultado ocorre, quando repetimos o experimento aleatório (ou aproximadamente aleatório) por um número elevado de vezes. Por exemplo: jogamos uma moeda mil vezes, e em 512 dessas vezes saiu cara. Podemos dizer, por esta definição, que a probabilidade de sair cara nessa moeda é de 512/1000, ou seja, 51,2%. Esse raciocínio seria simbolizado da seguinte forma:

P A fff

P A fRAA

TRA

( ) ( ) , , %= = ⇒ = = = =5121000

0 512 512

Esse resultado não é o mesmo que o calculado pela definição anterior (50%). Isso pode decorrer do fato de a moeda usada não ser “honesta” (portanto, com resultados aleatórios), ou do fato de o número de jogadas não ter sido suficientemente grande. Aumentando o número de jogadas, a probabilidade tenderá ao valor teórico de 50%, se a moeda for “honesta”.

• Abordagem subjetiva: ao contrário das definições anteriores, nesta, a probabilidade não é um valor objetivo, mas algo que indica a “crença” do analista naquela ocorrência. Evidentemente essa probabilidade não é fruto de um “palpite, um chute”, mas algo embasado em dados objetivos, mas complementados por aspectos pessoais. É o caso, por exemplo, do meteorologista que prevê 80% de chances de ocorrerem chuvas num determinado período. Esse tópico da Estatística é estudado em Análise Bayesiana de Decisão.

Durante nosso curso iremos utilizar as duas primeiras abordagens, de acordo com o campo de estudo em que estivermos. Deve‑se notar que a primeira abordagem é eminentemente teórica e pressupõe experimentos aleatórios em que os elementos são equiprováveis. Já na segunda abordagem podem ser introduzidos fatores diversos, característicos de determinadas situações não totalmente aleatórias.

Apesar de basicamente o cálculo de probabilidades envolver uma das duas relações descritas, existem axiomas, teoremas e propriedades que devem ser conhecidos para o correto uso da teoria. Antes de nos preocuparmos com a teoria envolvida, porém, iremos nos ater à lógica que permeia o cálculo de probabilidades. Para tanto, analisaremos as questões a seguir.

1. Uma moeda “honesta” é jogada uma única vez; qual é a probabilidade de que o resultado seja cara?

Pelo modo como o exercício é proposto, devemos calcular a probabilidade como uma razão entre o número de elementos favoráveis ao evento cara e o número total de elementos possíveis.

Número de elementos do evento cara: n(A) = 1, porque A = {cara}

Número de elementos total: n(S) = 2, porque S = {cara; coroa}

Page 43: Estatística Unidade II

96

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

P An An S

P cara( )( )( )

( )= ⇒ = 12

2. Duas moedas “honestas” são jogadas simultaneamente; qual é a probabilidade de que pelo menos uma seja cara?

Neste caso, o espaço amostral tornou‑se ligeiramente mais complexo:

S = {CaraCara; CaraCoroa; CoroaCara; CoroaCoroa)

O evento pedido é:

E = {CaraCara; CaraCoroa; CoroaCara)

Logo, a probabilidade é:

Pn An S

P( )( )( )

( )pelo menos uma cara pelo menos uma cara= ⇒ = =34

00 75 75, %=

Observação

Do ponto de vista do cálculo de probabilidade, jogar simultaneamente duas moedas é o mesmo que jogar uma, anotar o resultado e depois jogar outra.

7.3 Árvores de decisões

O cálculo de probabilidades é, no fundo, um exercício de lógica, característica na qual, muitas vezes, reside sua dificuldade. Para facilitar esse raciocínio lógico, costuma‑se usar a árvore de decisões, que, por meio de uma sistemática de análise e síntese, conduz à compreensão do experimento. Trata‑se de uma ferramenta relativamente trabalhosa, mas costuma ser importante no entendimento de problemas mais complexos ou extensos. Por meio da continuação da sequência de exercícios, aprenderemos o funcionamento dessa ferramenta.

3. Quatro moedas são jogadas simultaneamente; qual é a probabilidade de que se obtenham pelo menos duas caras?

Ficou muito mais complexo estabelecer o espaço amostral e o evento solicitado. O princípio é o mesmo dos exercícios anteriores, mas, como o número de moedas aumentou, as dificuldades envolvidas também aumentaram.

Para facilitar nosso raciocínio, introduziremos a árvore de decisões e, na sequência, a análise combinatória.

Page 44: Estatística Unidade II

97

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

A árvore de decisões consiste em representar graficamente todas as possibilidades de resultados dos experimentos aleatórios, de modo que não percamos nenhum evento e, ao mesmo tempo, compreendamos a mecânica do experimento.

Joga‑se umamoeda “honesta”.

Os resultadospodem ser:

Coroa

Cara

Figura 27

A seguir está desenhada a árvore de decisões do experimento “jogar quatro moedas ‘honestas’ simultaneamente”. Com certeza, não esquecemos nenhum dos resultados possíveis.

Coroa

CaraCara

Cara

Cara

Cara

Cara

Cara

Cara

Cara

Cara

Cara

Cara

Cara

Cara

Cara

Coroa

Coroa

Coroa

Joga‑se uma

moeda “honesta” sucessiva‑ mente 4

vezes

Coroa

Coroa

Coroa

Coroa

Coroa

Coroa

Coroa

Coroa

Coroa

Coroa

Coroa

Caminho 2

Caminho 4

Caminho 6

Caminho 8

Caminho 10

Caminho 12

Caminho 14

Caminho 16

Caminho 1

Resulta‑ dos da:

1ª moeda jogada

2ª moeda jogada

3ª moeda jogada

4ª moeda jogada

Caminho 3

Caminho 5

Caminho 7

Caminho 9

Caminho 11

Caminho 13

Caminho 15

Figura 28

De posse da árvore de decisões, conseguimos responder mais facilmente ao solicitado na Questão 3. Depois de jogarmos a moeda pela quarta vez, teremos um total de 16 soluções (caminhos) possíveis.

Page 45: Estatística Unidade II

98

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Observe o caminho nº 1: na primeira vez em que jogamos a moeda, saiu cara; na segunda jogada, saiu cara de novo, assim como na terceira e na quarta jogada, ou seja, o caminho nº 1 formado pelos eventos sucessivos: cara – cara – cara – cara.

Da mesma forma, teremos outras 15 combinações possíveis, das quais as de números 1, 2, 3, 4, 5, 6, 7, 9, 10, 11 e 13 apresentam a resposta que desejamos, ou seja, pelo menos duas caras; as demais apresentam uma ou nenhuma cara, portanto não nos interessam. Assim, temos uma total de 16 elementos no espaço amostral, e 11 deles são favoráveis à nossa pergunta, portanto a probabilidade de que ocorra pelo menos uma cara é de 11 possibilidades em 16, ou seja:

P An An S

P( )( )( )

( ) , , %= ⇒ = = =pelo menos uma cara1116

0 6875 68 75

O número de possibilidades (ou seja, elementos) do espaço amostral cresce continuamente. Caso jogássemos uma quinta vez a moeda, teríamos 32 resultados diferentes. Uma maneira de trabalharmos com essa grande quantidade de números é o uso da análise combinatória.

Observação

Aqui trabalharemos superficialmente com esse assunto. Utilizaremos apenas as ferramentas que nos são importantes neste tópico.

Saiba mais

Com a leitura dos textos a seguir, você poderá recordar e complementar seus conhecimentos sobre análise combinatória:

MIRANDA, D. Análise combinatória. Brasil Escola, Goiânia, [s.d]. Disponível em: <http://www.brasilescola.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.

______. Análise combinatória. Mundo Educação, Goiânia, [s.d.]. Disponível em: <http://www.mundoeducacao.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.

7.4 Análises combinatórias

O cálculo de probabilidade continuará a ser feito por meio da razão entre o número de elementos favoráveis ao evento que estamos estudando e o número total de elementos do espaço amostral. A análise combinatória nos servirá para calcular de maneira menos trabalhosa essas quantidades.

Page 46: Estatística Unidade II

99

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Se você olhar a árvore de decisões do jogo de moedas, perceberá que o espaço amostral aumenta em número de elementos da seguinte maneira:

Tabela 53

Número de jogadas da moeda Número de resultados diferentes

1 2

2 4

3 8

4 16

É fácil notar que a relação matemática existente entre o número de jogadas e o número de resultados possíveis é de ab, onde a é o número de resultados possíveis de ocorrer numa única repetição do experimento (no caso, a = 2, porque os resultados possíveis são cara ou coroa) e b é o número de repetições do experimento (no caso da tabela anterior, temos n variando de 1 a 4). Desse modo, se quisermos saber o número de elementos do espaço amostral de seis jogadas de uma moeda, bastaria fazermos o cálculo 26 = 64 resultados diferentes.

Em análise combinatória, esse procedimento é conhecido como cálculo do número de arranjos com repetição.

Ar an xb

, =

Observação

A fórmula anterior é lida da seguinte forma: “número de arranjos com repetições de a elementos repetidos b vezes”.

Em contrapartida, observando a árvore de decisões, podemos contar o número de caras que podem aparecer na quarta jogada montando a tabela que segue.

Tabela 54

Número de coroas que apareceu

Número de caras que apareceu

“Caminhos” Quantidade de caminhos

4 0 16 1

3 1 8‑12‑14‑15 4

2 2 4‑6‑7‑10‑11‑13 6

1 3 2‑3‑5‑9 4

0 4 4 1

Page 47: Estatística Unidade II

100

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Segundo a análise combinatória, o número de caminhos é dado pelo número de combinações, obtido por meio da fórmula:

Cn

x n xn x,!

!( )!=

Onde:

n = número total de repetições do experimento; no caso, n = 4 (quatro vezes em que a moeda é jogada).

x = números de resultados desejados; no caso, x varia de 0 a 4 (número de caras desejadas).

Observação

A fórmula anterior é lida da seguinte forma: “número de combinações de n elementos tomados x a x vezes”. Utiliza o conceito de fatorial (!).

Lembrete

Fatorial de um número a, simbolizado por a!, é a multiplicação de todos os números inteiros e positivos desde a unidade até o valor a, ou seja:

a! = 1 x 2 x 3 x 4 x..... x a

Por exemplo: 6! é igual a 720 porque:

6! = 1 x 2 x 3 x 4 x 5 x 6 = 720

Por definição, 0! é igual a 1.

A tabela a seguir mostra o cálculo das combinações do exemplo dado. Verifique que coincide com os números obtidos por meio da árvore de decisões.

Page 48: Estatística Unidade II

101

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Tabela 55

Número de caras que queremos obter Fórmula do cálculo das combinações Números de

combinações obtidas

Zero cara C4 04

0 4 04

0 424

1 241,

!!

!! !

=−( ) = ( ) =

×= 1

Uma cara C4 14

1 4 14

0 124

1 64,

!!

!! !

=−( ) = ( ) =

×= 4

Duas caras C4 24

2 4 24

2 224

2 26,

!!

!! !

=−( ) = ( ) =

×= 6

Três caras C4 34

3 4 34

3 124

6 14,

!!

!! !

=−( ) = ( ) =

×= 4

Quatro caras C4 44

4 4 44

4 024

24 14,

!!

!! !

=−( ) = ( ) =

×= 1

Temos agora todas as informações necessárias para o cálculo das probabilidades envolvidas no experimento referente a “quatro jogadas sucessivas de uma moeda ‘honesta’”. A tabela a seguir resume esses valores.

Tabela 56

Eventos

Número total de resultados do espaço amostral

(número de “caminhos”) Calculado usando-se

arranjos com repetições

Número total de resultados favoráveis ao evento Calculado usando-se

combinações

Probabilidade de ocorrência

Obter zero cara 16 11

160 0625 6 25= =, , %

Obter uma cara 16 44

160 2500 25 00= =, , %

Obter duas caras 16 66

160 3750 37 50= =, , %

Obter três caras 16 44

160 2500 25 00= =, , %

Obter quatro caras 16 11

160 0625 6 25= =, , %

Somatório 100%

Page 49: Estatística Unidade II

102

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Essa tabela resume todos os possíveis resultados do experimento de “jogar quatro vezes uma moeda ‘honesta’”. Cada um desses resultados é um evento diferente, e a probabilidade de cada um destes ocorrer é obtida pela divisão do número de vezes em que ocorre pelo número total de resultados do experimento.

O evento pedido na questão, “pelo menos duas caras”, é a soma dos eventos, encontrados no quadro anterior, “obter duas ou três ou quatro caras”, ou seja:

0,3750 + 0,2500 + 0,0625 = 0,6875 = 68,75

Como já havíamos determinado anteriormente.

Com esses conceitos podemos calcular o exemplo a seguir, mais trabalhoso:

4. Vinte moedas são jogadas simultaneamente; qual é a probabilidade de que se obtenham exatamente oito caras?

Essa questão é muito semelhante à anterior, mas envolve uma quantidade de moedas e resultados que inviabiliza o uso da árvore de decisões. Sabemos, porém, calcular questões desse tipo usando os conceitos de análise combinatória:

• O número total de resultados possíveis é o número de arranjos com repetições de vinte moedas que podem apresentar dois resultados diferentes.

Ar an xb

, . .= = =2 1 048 57620

• O número total de resultados que nos interessam é o número de combinações de vinte moedas das quais oito sejam caras.

Cn

x n xCn x, ,

!!( )!

!!( )!

!! !

. . .=−

⇒ =−

=20 820

8 20 820

8 122 432 902 008.. . .

. . ..

176 640 00040 320 479 001 600

125 970×

=

• A probabilidade de ocorrer oito caras é de:

P An An S

P( )( )( )

( ).

. .,= ⇒ = =exatamente 8 caras

125 9701 048 576

0 12001 12 01= , %

Observação

Os números envolvidos no exemplo anterior são relativamente grandes, mas, com uma calculadora científica ou na planilha de Excel®, o trabalho é

Page 50: Estatística Unidade II

103

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

relativamente simples. Mesmo o cálculo do número de combinações poderá ser facilitado se utilizarmos o conceito de simplificação, como mostrado a seguir:

C20 8

220

8 1212 13 14 15 16 17 18 19 20

1 2 3 4 5 6, ! !=

×= × × × × × × × ×

× × × × ×

••

• • •

×× × ×=

7 8 12125 970

!.

Vamos utilizar esses conhecimentos adquiridos para fazer um cálculo que talvez não deixe você satisfeito.

5. Qual é a probabilidade de se ganhar o prêmio máximo na Mega‑Sena fazendo‑se um jogo com sete dezenas?

Observe que na Mega‑Sena é necessário acertar seis dezenas para se ganhar o prêmio máximo. Caso se jogue sete dezenas, temos sete chances de acertar as seis dezenas:

Cn

x n xCn x, ,

!!( )!

!!( )!

!! !

=−

⇒ =−

=7 67

6 7 67

6 15040

720 17

Mas quantos resultados diferentes podem ocorrer?

Na Mega‑Sena existem sessenta números possíveis, dos quais você deve acertar seis, ou seja:

Cn

x n xCn x, ,

!!( )!

!!( )!

!! !

=−

⇒ =−

=60 660

6 60 660

6 5450.063.860

Resumindo, você tem 7 chances em 50.063.860 de acertar na Mega‑Sena, o que dá uma probabilidade de:

P An An S

P( )( )( )

( ). .

= ⇒ = =ganhar na mega sena 0,00000017

50 063 86044 0,000014 = %

Melhor continuar estudando, não é?

7.5 Experimentos aproximadamente aleatórios

Até aqui, sempre que nos referimos às moedas, frisamos que eram honestas. Por que isso? Porque uma moeda “honesta” é absolutamente aleatória, ou seja, por mais que a joguemos, nunca iremos saber qual o próximo resultado que irá ocorrer, e também porque a probabilidade de cair cara numa moeda “honesta” é de 50% assim como de sair coroa.

Page 51: Estatística Unidade II

104

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Nem sempre será assim. Poderemos ter moedas “viciadas”, e, em situações mais próximas da realidade do dia a dia, com certeza os experimentos não serão absolutamente aleatórios, mas aproximadamente aleatórios, e as probabilidades de ocorrência serão dadas pelas frequências relativas observadas.

Imagine que você tenha nas mãos uma moeda, que não sabe se é “honesta” ou “viciada”. Como poderia saber? Testando‑a, ou seja, jogando‑a repetidas vezes e anotando os resultados.

Caso os resultados tendam para 50% de sair cara e 50% de sair coroa, a moeda é “honesta”; caso contrário, é “viciada”. Obviamente, quanto maior o número de vezes que a testar, maior a segurança que terá nessa resposta.

O quadro a seguir mostra uma sucessão teórica de testes em duas moedas:

Tabela 57

Número de vezes em que a moeda foi lançada

Moeda A Moeda B

Nº de caras

Probabilidade de cara

Nº de coroas

Probabilidade de coroa

Nº de caras

Probabilidade de cara

Nº de coroas

Probabilidade de coroa

10 6 60,0% 4 40,0% 5 50,0% 5 50,0%

30 14 46,7% 16 53,3% 16 53,3% 14 46,7%

40 19 47,5% 21 52,5% 23 57,5% 17 42,5%

50 27 54,0% 23 46,0% 29 58,0% 21 42,0%

100 52 52,0% 48 48,0% 57 57,0% 43 43,0%

500 249 49,8% 251 50,2% 290 58,0% 210 42,0%

1000 505 50,5% 495 49,5% 589 58,9% 411 41,1%

10000 5010 50,1% 4990 49,9% 5809 58,1% 4191 41,9%

Algumas características importantes:

• Para poucos lançamentos, não é possível assumir se as moedas são “honestas” ou “viciadas”. O número de observações não é suficiente. Isso é constante na Estatística Indutiva. Precisamos de uma quantidade de observações mínima para chegarmos a alguma conclusão.

• À medida que o número de observações vai crescendo, cristalizamos a ideia de que a moeda A é “honesta”, e a moeda B, “viciada”. Perceba que, em dez jogadas, não há nada de estranho em obtermos seis caras e quatro coroas, mas, quando jogamos a moeda cem vezes e obtemos 57 caras, algo não acidental está ocorrendo. Não é possível que seja uma questão de “sorte” ou “azar”.

• A partir dessas observações, podemos assumir que a moeda A é “honesta” e que a probabilidade de obtermos cara é igual à de obtermos coroa, no valor de 50% (o fato de os cálculos não resultarem exatamente em 50% é efeito de variações aceitáveis).

Page 52: Estatística Unidade II

105

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

• Já a moeda B é “viciada”: a probabilidade de obtermos cara é de 58% (aproximadamente), e a de obtermos coroa é de 42%.

A partir desses conceitos, podemos expandir um pouco mais os nossos cálculos, resolvendo a questão do próximo tópico.

7.6 Eventos soma e Eventos produto

6. Jogamos a moeda B, mencionada anteriormente, três vezes em sequência. Qual é a probabilidade de obtermos pelo menos duas caras?

Vamos entender a questão por meio do uso da árvore de decisões. É a mesma árvore usada anteriormente, com uma diferença: sobre cada decisão (simbolizada pelas flechas) colocaremos a probabilidade correspondente:

Cada “caminho” será formado por várias decisões em sequência, cada uma delas com probabilidades diferentes. A probabilidade de ocorrência de um caminho em especial é dada pela multiplicação das probabilidades individuais. A isso chamamos evento produto.

Observe, na figura a seguir, o cálculo dos vários caminhos:

Cara

0,58

0,58

0,58

0,58

0.42

0.42

0.42

0.42

0.42

0.42

0.42

0,58

0,58

0,58

Cara

Cara

Cara

Cara

Cara

Cara

Coroa

Coroa

Coroa

Joga‑se uma

moeda “viciada”

sucessiva‑ mente 4

vezes

Coroa

Coroa

Coroa

Coroa

Caminho 2 0.58 x 0.58 x 0.42 = 0.582 x 0.42 = 0.1413

Probabilidades de cada caminho:

Somatório = 1 ou 100%

Caminho 4 0.58 x 0.42 x 0.42 = 0.58 x 0.422 = 0.1023

Caminho 6 0.42 x 0,58 x 0.42 = 0.58 x 0.422 = 0.1023

Caminho 8 0.42 x 0.42 x 0,42 = 0.423 = 0,0741

Caminho 1 0.58 x 0.58 x 0.58 = 0.583 = 0.1951

Resulta‑ dos da:

1ª moeda jogada

2ª moeda jogada

3ª moeda jogada

Caminho 3 0.58 x 0.42 x 0.58 = 0.582 x 0.42 = 0.1413

Caminho 5 0.42 x 0.58 x 0,58 = 0.582 x 0.42 = 0.1413

Caminho 7 0.42 x 0.42 x 0,58 = 0.58 x 0.422 = 0.1023

Figura 29

Page 53: Estatística Unidade II

106

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Pelo menos duas caras significa duas ou três caras, logo os caminhos 1, 2, 3, e 5 nos interessam; os demais ou têm apenas uma cara, ou nenhuma.

Qualquer um desses quatro caminhos que vierem a ocorrer responderá à nossa pergunta, ou seja, a probabilidade de ocorrer pelo menos duas caras é a soma das probabilidades de ocorrer o caminho nº 1, ou então o nº 2, ou então o nº 3, ou, ainda, o nº 5. Poderíamos escrever isso assim:

P P P P( ( ( (pelo menos uma cara) ca-ca-ca) ca-ca-co) ca-co-ca)= + + ++ P(co-ca-ca) Logo, o resultado seria:

P( , , , , ,pelo menos uma cara) = + + + = =0 1951 0 1413 0 1413 0 1413 0 6190 66190, %

Essa soma de eventos gera o que chamamos de evento soma.

Cada vez que jogamos a moeda, ocorre um resultado diferente. A cada um desses resultados damos o nome de evento. Vários eventos podem ser combinados, criando os eventos soma e os eventos produto, já mostrados anteriormente.

O evento soma representa uma alternativa entre vários eventos simples, caracterizando‑se pela palavra ou. Por exemplo, a questão “Qual é a probabilidade de um aluno passar em Estatística?” é respondida por um evento soma: o aluno pode passar sem exame ou com exame. A probabilidade será a soma das probabilidades dos dois eventos simples.

O evento produto representa uma obrigação entre várias situações e caracteriza‑se pela palavra e. Por exemplo, “Qual é a probabilidade de um aluno cursar Administração e passar em Estatística?”. O aluno tem de cursar Administração e passar em Estatística. A probabilidade será o produto entre a probabilidade de um aluno estudar Administração e a probabilidade de passar de Estatística.

Vamos firmar esse conceito por meio do seguinte exemplo:

7. Dois caçadores, Pedro e João, atiram contra uma caça simultaneamente. Sabemos que Pedro tem uma probabilidade de acertar esse tipo de caça de 40%, enquanto João acerta em 55% das vezes. Calcular a probabilidade de:

a) A caça ser atingida.

b) Ambos atingirem simultaneamente a caça.

Antes de resolvermos a questão, vamos sublinhar como foram obtidas essas probabilidades. Presumimos que Pedro e João já foram caçar diversas vezes esse tipo de caça e, a cada tiro que deram, anotaram o resultado. Após algum tempo, eles têm uma série de observações suficientemente grande para calcular as probabilidades relacionadas.

Page 54: Estatística Unidade II

107

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Pedro atirou um número x de vezes e acertou quatro a cada dez tiros que deu; assim, ele pode afirmar que tem 40% de chances de acertar um tiro qualquer nessas mesmas condições. João, em raciocínio semelhante, chegou à probabilidade de 55%.

Se Pedro tem 40% de chances de acertar, tem 60% de chances de errar, assim como João tem 55% de probabilidade de acertar e 45% de errar. Chegamos a essa conclusão porque acertar e errar são eventos complementares, ou seja, um completa o outro sem a existência de um terceiro, e a soma dos dois resulta em 100%.

Com essas probabilidades individuais, podemos montar a árvore de decisões apropriada:

Pedro atira

0,40

0,45

Cálculo das Probabilidades

0,40 x 0,55 = 0,22 ou 22%

0,40 x 0,45 = 0,18 ou 18%

0,60 x 0,55 = 0,33 ou 33%

0,60 x 0,45 = 0,27 ou 27%

0,45

0,55

0,55

0,60

Acerta o tiro

Acerta o tiro

Acerta o tiro

João atira

Erra o tiro

Erra o tiro

Erra o tiro

João atira

Figura 30

Podemos então responder às questões.

A caça será atingida se Pedro ou João ou os dois a atingirem. Existe alternativa, portanto é um evento soma:

P(caça ser atingida) == P (Pedro acertar e João acertar) + P(Pedro acertar e João errar) + P(Pedro errar e João acertar)P(caça ser atingida) = 0,22 + 0,18 + 0,33 = 0,73 = 73%

Portanto, a resposta ao item a) é: a probabilidade de a caça ser atingida é de 73%.

Page 55: Estatística Unidade II

108

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Já para ambos atingirem a caça, é necessário que Pedro e João a atinjam, ou seja, é um evento produto:

P(ambos atingirem a caça) = P(Pedro acertar) x P(João acertar)

P(ambos atingirem a caça) = 0,40 x 0,55 = 0,22 = 22%

Portanto, a resposta ao item b) é: a probabilidade de ambos acertarem a caça é de 22%.

7.7 Eventos independentes e eventos vinculados

Na questão anterior, os tiros de Pedro não interferem nos tiros de João e vice‑versa, ou seja, o fato de Pedro acertar ou errar não torna mais ou menos provável os acertos ou erros de João. É o que se chama de eventos independentes.

Nem sempre, entretanto, isso ocorre. Eventualmente, a ocorrência de um evento altera a probabilidade de ocorrência do evento seguinte. São os eventos vinculados, ou condicionados, ou dependentes.

A próxima questão exemplifica esse conceito:

8. Temos uma caixa que contém um total de 45 bolinhas, sendo 20 verdes, 15 brancas e 10 pretas. Retiramos dessa caixa uma bolinha, anotamos sua cor, colocamos de lado e, em seguida, retiramos da caixa uma segunda bolinha.

a) Qual é a probabilidade de as duas bolinhas retiradas formarem a combinação verde e branca?

b) Qual é a probabilidade de as duas bolinhas retiradas formarem a combinação preta e branca?

Uma combinação verde e branca corresponde a retirar uma primeira bolinha verde e uma segunda bolinha branca, ou uma primeira bolinha branca e uma segunda bolinha verde. Raciocínio semelhante é utilizado para a combinação preta e branca.

Novamente vamos utilizar a árvore de decisões para entender e esquematizar o problema, seguindo o raciocínio anteriormente estabelecido:

Page 56: Estatística Unidade II

109

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Total de 45 bolinhas

Cálculo das Probabilidades

1

2

3

4

5

6

7

8

9

Total de 44 bolinhas

Total de 44 bolinhas

Depois de retirada a 1ª bolinha a caixa irá ficar com:

Depois de retirada a 1ª bolinha a caixa irá ficar com:

Depois de retirada a 1ª bolinha a caixa irá ficar com:

Bolinha verde

Bolinha verde

Bolinha verde

Bolinha verde

Bolinha branca

Bolinha branca

Bolinha branca

Bolinha branca

Bolinha preta

Bolinha preta

Bolinha preta

Bolinha preta

Caixa contendo:20 bolinhas verdes;

15 brancas e 10 pretas

Caixa contendo:19 bolinhas verdes;

15 brancas e 10 pretas

Caixa contendo:20 bolinhas verdes;

14 brancas e 10 pretas

Caixa contendo:20 bolinhas verdes;

15 brancas e 9 pretas

2045

1545

1045

1944 15

44

2044

1444

1044

2044 15

44

944

2045

1944

3801980

0 1919× = = ,

2045

1544

3001980

0 1515× = = ,

2045

1044

2001980

0 1010× = = ,

1545

2044

3001980

0 1515× = = ,

1545

1444

2101980

0 1061× = = ,

1545

1044

1501980

0 0757× = = ,

1045

2044

2001980

0 1010× = = ,

1045

1544

1501980

0 0757× = = ,

1045

944

901980

0 0455× = = ,

Figura 31

Observe que, dos nove caminhos existentes (eventos produtos), dois correspondem a uma combinação verde e branca: os caminhos 2 e 4. Portanto, um ou outro atendem ao solicitado (portanto, evento soma). Dessa forma:

P(combinação verde e branca) = P(1ª verde / 2ª branca) + P(1ª bolinha branca / 2ª verde)P(combinação verde e branca) = 0,1515 = 0,1515 = 0,3030 = 30,30%

A probabilidade de obtermos uma combinação verde e branca é de 30,30%.

Raciocínio semelhante é feito para a combinação preta e branca (siga os caminhos 6 e 8):

P(combinação verde e branca) = P(1ª branca / 2ª preta) + P(1ª bolinha preta/ 2ª branca)P(combinação preta e branca) = 0,0757 + 0,0757 = 0,1514 = 15,14%

Exemplo de aplicação

17. Uma caixa contém 20 canetas iguais, das quais 7 são defeituosas, e outra caixa contém 12, das quais 4 são defeituosas. Uma caneta é retirada aleatoriamente de cada caixa. As probabilidades de que ambas não sejam defeituosas e de que uma seja perfeita e a outra não são, respectivamente, de:

A) 88,33% e 45,00%

B) 43,33% e 45,00%

Page 57: Estatística Unidade II

110

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

C) 43,33% e 55,00%

D) 23,33% e 45,00%

E) 23,33% e 55,00%

18. Certo tipo de motor pode apresentar dois tipos de falhas: mancais presos e queima do induzido. Sabendo‑se que as probabilidades de ocorrência dos defeitos são de 0,2 e 0,03, respectivamente, determine a probabilidade de que, num motor daquele tipo, selecionado ao acaso, não ocorram, simultaneamente, as duas falhas.

A) 6%

B) 19,4%

C) 99,4%

D) 21,8%

E) 77,6%

8 REVISÃO TEÓRICA DOS CONCEITOS ESTUDADOS

• Experimento: processo pelo qual ocorre uma determinada sucessão de acontecimentos. Por exemplo: realizar uma reação química; investir em ações; jogar dados.

• Experimento matemático ou determinístico: é aquele em que os resultados podem ser previstos de modo exato utilizando‑se a ciência. Por exemplo: realizar uma reação química.

• Experimento aleatório: é aquele cujos resultados não são sempre os mesmos, apesar de se repetirem várias vezes em condições semelhantes. Por exemplo: jogar dados.

• Experimentos aproximadamente aleatórios: são aqueles que, apesar de terem uma tendência de ocorrência, não podem ter seus resultados definidos de modo exato pela ciência. Por exemplo: investir em ações.

• Espaço amostral ou conjunto universo: conjunto formado por todos os resultados possíveis de um experimento. Por exemplo: o conjunto formado pelos números 1; 2; 3; 4; 5 e 6, resultados possíveis de um jogo de dados.

• Evento: é qualquer subconjunto de um espaço amostral. Por exemplo, os números 2; 4 e 6, evento “números pares” de um jogo de dados.

Page 58: Estatística Unidade II

111

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

• Evento simples: é aquele formado por um único elemento do espaço amostral. Por exemplo, o número 5 num jogo de dados.

• Evento composto: é aquele formado por mais de um elemento do espaço amostral. Por exemplo, os números 1; 3 e 5, evento “números ímpares” de um jogo de dados.

• Evento complementar: de um evento A qualquer, é o evento B (chamado complementar de A), tal que todos os elementos do espaço amostral que não pertençam a A pertençam a B e vice‑versa. Observar que S = A + B. Por exemplo, o conjunto A = {1, 3, 5} é complementar ao conjunto B = {2, 4, 6}, num jogo de dados, visto que, ao serem somados, dão origem ao espaço amostral S = {1, 2, 3, 4, 5, 6}. Não falta nem sobra elemento algum.

• Eventos mutuamente exclusivos: Suponha dois eventos A e B, no qual a ocorrência de A impede a ocorrência de B e vice‑versa. Dizemos que eles são mutuamente exclusivos. Por exemplo: num jogo de dados, a ocorrência de um número par (1, 2, 3) impede a ocorrência de um número ímpar (2, 4, 5), portanto tais eventos são mutuamente exclusivos. Não confunda eventos complementares com eventos mutuamente exclusivos. Todos os eventos complementares são mutuamente exclusivos, mas o contrário não é verdade.

• Eventos independentes: dizemos que dois ou mais eventos são independentes quando não exercem ações recíprocas, comportando‑se cada um da maneira que lhe é própria, sem influenciar os demais. Por exemplo: o lançamento de duas moedas, simultaneamente.

• Eventos vinculados ou condicionados: são eventos cujo aparecimento de um dependa do aparecimento de outro (ou seja influenciado por este), no mesmo experimento. Por exemplo: retirada de duas cartas de um baralho. Quando você retira a primeira carta, existem 52 cartas no baralho, 26 vermelhas e 26 pretas. Quando você for retirar a segunda carta, o baralho terá apenas 51 cartas, e poderão ser 25 vermelhas e 26 pretas ou 26 vermelhas e 25 pretas, dependendo da cor da primeira carta. Portanto, o segundo evento está condicionado ou vinculado ao primeiro.

• Evento soma: quando relacionamos dois eventos de um mesmo experimento e a ocorrência de um ou de outro nos interessa, temos o evento soma. Perceba a importância da palavra ou na formulação do princípio e da ideia de alternativa. Por exemplo: jogo um dado e quero que saia um número par ou um número primo. Os números pares são {2, 4, 6}, e os números primos são {1, 2, 3, 5}. Como me interessam os números pares ou primos, fico satisfeito com a ocorrência de qualquer um dos seguintes números {1, 2, 3, 4, 5}. Esse conjunto é a soma dos dois anteriores, descontadas as intersecções (no caso, o número 2).

• Evento produto: quando relacionamos dois eventos de um mesmo experimento e a ocorrência de um e simultaneamente a do outro nos interessa, temos o evento produto. Perceba a importância da palavra e na formulação do princípio, e da ideia de obrigação. Por exemplo: jogo um dado e quero que saia um número par e primo. Os números pares são {2, 4, 6}, e os números primos são {1, 2, 3, 5}. Como me interessa que o número seja par e simultaneamente primo, fico satisfeito

Page 59: Estatística Unidade II

112

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

somente com a ocorrência do número: {2}. Note que esse conjunto é a intersecção dos dois anteriores, ou seja, valores que pertencem simultaneamente aos dois conjuntos.

• Definição de probabilidades matemática: é a razão (divisão) entre o número de elementos do evento estudado pelo número de elementos do espaço amostral, ou seja:

P An An S

( )( )( )

=

• Definição de probabilidades estatística: presumindo que um experimento seja repetido uma quantidade considerável de vezes e seus resultados sejam anotados, definimos a probabilidade de ocorrência de eventos daquele experimento como a frequência relativa deste:

P A fffRAA

T( ) = =

• Axiomas das probabilidades: são verdades a partir das quais se estabelecem os conceitos de probabilidades:

— Dado um evento A, dentro de um espaço amostral S, temos:

0 1≤ ≤P A( )

— A probabilidade do espaço amostral, ou da soma de todos os eventos possíveis, é:

P(S) = 1

Para dois eventos mutuamente exclusivos, temos:

P A B P A P B( ) ( ) ( )∪ = +

Se o evento A é complementar de B, então:

P(A) + P(B) = 1 ou P(A) = 1 ‑ P(B)

Lembrete

Houaiss (2009) define axioma como “premissa considerada necessariamente evidente e verdadeira, fundamento de uma demonstração, porém ela mesma indemonstrável, originada, segundo a tradição racionalista, de princípios inatos da consciência ou, segundo os empiristas, de generalizações da observação empírica”.

Page 60: Estatística Unidade II

113

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Teorema da Soma: se A e B são dois eventos não mutuamente exclusivos, a probabilidade da ocorrência de A ou B ou ambos é dada por:

P A B P A P B P A B( ) ( ) ( ) ( )∪ = + − ∩

Exemplo: numa caixa existem oito bolinhas idênticas, numeradas de 1 a 8. Qual a probabilidade de, ao retirarmos uma bolinha, ela ser múltiplo de 2 ou de 5?

Espaço amostral: S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} ‑> n(S) = 10

Evento A – múltiplos de 2: A = {2, 4, 6, 8, 10) ‑> n(A) = 5

Evento B – múltiplos de 5: B = {5, 10) ‑> n(B) = 2

Intersecção entre A e B: A∩B = {10} ‑> n(A∩B) = 1

P A B P A P B P A B P A Bn An S

n Bn S

n A Bn S

( ) ( ) ( ) ( ) ( )( )( )

( )( )

( )(

∪ = + − ∩ ⇒ ∪ = + − ∪))

P A B( ) , %∪ = + − = = =510

210

110

610

0 60 60

• Teorema do Produto para eventos independentes: caso tenhamos dois eventos, A e B, que não sejam mutuamente exclusivos, a probabilidade de ocorrer um resultado que pertença simultaneamente aos dois eventos é dada por:

P A B P A xP B( ) ( ) ( )∩ =

Esse conceito pode ser estendido para mais de dois eventos.

Por exemplo: temos duas caixas com bolinhas nas seguintes quantidades:

— Caixa A: 10 bolinhas azuis, 15 bolinhas brancas e 30 bolinhas vermelhas. Total 55: bolinhas.

— Caixa B: 20 bolinhas azuis, 18 bolinhas brancas e 22 bolinhas vermelhas. Total: 60 bolinhas.

Retiramos uma bolinha de cada urna. Qual é a probabilidade de que ambas as bolinhas retiradas sejam azuis?

— Caixa A: probabilidade de uma bolinha retirada ser azul:

Page 61: Estatística Unidade II

114

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

P Azul( ) = 1055

— Caixa B: probabilidade de uma bolinha retirada ser azul:

P Azul( ) = 2060

Probabilidade de ambas serem azuis:

P Azul Azul P xP( ) ( ) ( )∩ = Urna A/bolinha Azul Urna B/bolinha Azul == × =1055

2060

2003300

P Azul Azul( ) , , %∩ = =0 0606 6 06

• Teorema do Produto para eventos vinculados: a probabilidade de ocorrência simultânea de dois eventos A e B vinculados é dada pelo produto da probabilidade de um dos eventos pela probabilidade condicional do outro evento:

P A B P A xP B A( ) ( ) ( / )∩ =

O símbolo P(B/A) é lido como: probabilidade de ocorrência do evento B tendo ocorrido o evento A. É a chamada probabilidade condicional. Esse conceito pode ser estendido para mais de dois eventos.

O exemplo a seguir deixa essa situação mais evidente:

Retiramos sem reposição três caras de um baralho de 52 cartas. Qual a probabilidade de que as três sejam vermelhas?

Probabilidade de a primeira carta ser vermelha:

P vermelha( ) = 2652

Probabilidade de a segunda carta ser vermelha:

P vermelha( ) = 2551

Probabilidade de a terceira carta ser vermelha:

Page 62: Estatística Unidade II

115

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

P vermelha( ) = 2450

Probabilidade de as três serem vermelhas:

P Vrm Vrm Vrm P xP( ) ( ) ( /∩ ∩ = 1 2 1a a a carta Vrm carta Vrm carta Vrm)) ( / )xP 3 2a a carta Vrm carta Vrm

P Vrm Vrm Vrm( )..

∩ ∩ = × × = × ×× ×

=2652

2551

2450

26 25 2452 51 50

15 626132 6000

0 1178 1178= =, , %

Exemplo de aplicação

19. Suponhamos que existam, num certo mercado, duas fábricas de lâmpadas. A fábrica A produz 500 lâmpadas, das quais 25% apresentam defeitos, e a fábrica B produz 550 lâmpadas, das quais 26% são defeituosas; vamos supor também que as 1.050 lâmpadas sejam vendidas por um único vendedor. Por fim, suponhamos que um cliente vá comprar uma lâmpada sem especificar marca e que estas tenham sido dispostas ao acaso na prateleira. Calcular:

I – A probabilidade de ele receber uma lâmpada defeituosa.

II – A probabilidade de, tendo recebido uma lâmpada perfeita, ela ser da marca B.

A alternativa que apresenta as respostas corretas é a:

A) I = 47,62% e II = 26,00%

B) I = 26,00% e II = 52,05%

C) I = 25,52% e II = 26,00%

D) I = 25,50% e II = 50,00%

E) I = 25,52% e II = 52,05%

Resumo

Nesta unidade voltamos nossos olhares para o cálculo das chamadas medidas estatísticas e, em seguida, para o estudo elementar das probabilidades. Esses assuntos são importantes porque a partir do conhecimento de uma amostra e da probabilidade de o comportamento dessa amostra reproduzir uma população é que poderemos prever ou induzir acontecimentos.

Page 63: Estatística Unidade II

116

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Medidas ou parâmetros estatísticos são informações resumidas e focadas de uma população e vão, em estudos posteriores, permitir a extensão dessas informações para as populações.

Iniciamos estudando as medidas de posição, também chamadas de medidas de tendência central, que, como o próprio nome indica, dão uma ideia central da amostra. Vimos as médias, as medianas e as modas, as mais importantes, porém não únicas, medidas de posição. Para cada uma dessas medidas, verificamos como devem ser feitos os cálculos, seja quando apresentados de maneira isolada, seja quando agrupados em classes. Alguns termos muito importantes para a Estatística foram definidos, como média aritmética, média ponderada etc. Além disso, foram consideradas as diferenças entre média, mediana e moda, bem como enfatizado que, apesar de muito importantes, as medidas de posição não são suficientes para entendermos uma amostra.

Para o correto entendimento de uma amostra e, posteriormente, de uma população, conceituamos as medidas de dispersão, também chamadas de medidas de variabilidade. Essas medidas tentam mostrar como cada um e todos os elementos de uma amostra se desviam da medida de posição. São especialmente importantes, nesse campo, o desvio‑padrão e a variância. Observamos também a maneira de se comparar duas ou mais amostras utilizando os coeficientes de variação, em especial o de Pearson. Por fim, nesta etapa, vimos o comportamento gráfico das distribuições de frequência, assimetria e curtose, assunto que iremos recuperar no próximo semestre.

Com medidas desses três grupos é possível entendermos como uma amostra se comporta e, futuramente, em Estatística Aplicada, como a população da qual essa amostra foi retirada se comporta. Essa relação entre populações e amostras é possível porque uma amostra retirada de uma população tem comportamentos provavelmente iguais.

Isso nos conduziu ao último item do nosso curso, a Teoria Elementar das Probabilidades, na qual verificamos o que é probabilidade, como podemos calcular uma probabilidade e os conceitos que envolvem o estudo das probabilidades. Neste momento, conceituamos o que são experimentos e eventos aleatórios; como se encadeiam esses eventos em eventos soma e eventos produto e, também, em eventos vinculados e independentes, e abrimos frente para o estudo das distribuições de probabilidades, a ser feito na disciplina de Estatística Aplicada. Nessa linha de raciocínio, passamos os olhos também sobre análise combinatória, que foi e será importante para os cálculos mais complexos, ainda a serem feitos.

Page 64: Estatística Unidade II

117

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

Como resultado deste nosso curso, sabemos como coletar, organizar e trabalhar dados estatísticos de uma amostra, permitindo entendê‑la e obter conclusões, e, em contrapartida, compreender como probabilidades são importantes para entender as relações entre populações e amostras. De posse dessas informações, estamos preparados para adentrar a Estatística Indutiva, nosso próximo campo de trabalho.

Exercícios

Questão 1 (SEFAZ 2011 – Adaptado). Com base no resultado do concurso para o cargo de Especialista em Políticas Públicas e Gestão Governamental da Seplag, prova realizada pelo Ceperj em 1º ago. 2010, as frequências para o número de acertos obtidos nas cinco questões de Estatística pelos 1.535 candidatos que realizaram a prova estão mostradas na tabela a seguir:

Tabela 58

Nenhum acerto → 393 candidatos

1 acerto → 627 candidatos

2 acertos → 417 candidatos

3 acertos → 81 candidatos

4 acertos → 12 candidatos

5 acertos → 5 candidatos

Total 1.535 candidatos

A figura que segue mostra a frequência relativa dos acertos.

45,0%

40,0%

35,0%

30,0%25,6%

40,8%

Estatística – Prova para EPPGG

27,2%

5,3%

0,8% 0,3%

25,0%

20,0%

15,0%

10,0%

5,0%

0,0%

Figura 32

Page 65: Estatística Unidade II

118

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Unidade II

Com base na tabela e na figura, julgue as afirmativas a seguir:

I – A moda e a mediana da distribuição são iguais.

II – A amplitude interquartílica é igual a 2.

III – A média da distribuição é igual a 2.

IV – A probabilidade de um candidato, escolhido ao acaso entre os 1.535, ter acertado no máximo duas questões é igual a 66,4%.

São corretas apenas as afirmativas:

A) I e II.

B) I e III.

C) I, III e IV.

D) II, III e IV.

E) II e IV.

Resposta correta: alternativa A.

Análise das afirmativas

I) Afirmativa correta.

Justificativa: a moda será igual a 1 (valor com maior frequência) e a mediana também será igual a 1 (neste valor, a frequência já alcançará 50% da distribuição).

II) Afirmativa correta.

Justificativa: o primeiro quartil será igual a 0 (neste valor, a frequência já alcançará 25% da distribuição), e o terceiro quartil será igual a 2 (neste valor, a frequência já alcançará 75% da distribuição). A amplitude interquartílica será: Q3 ‑ Q1 = 2 ‑ 0 = 2.

III) Afirmativa incorreta.

Justificativa: podemos usar a frequência relativa para calcular a média do número de acertos, igual a: (0 × 0,256) + (1 × 0,408) + (2 × 0,272) + (3 × 0,053) + (4 × 0,008) + (5 × 0,003) = 0 + 0,408 + 0,544 + 0,159 + 0,032 + 0,015 = 1,158.

Page 66: Estatística Unidade II

119

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ESTATÍSTICA

IV) Afirmativa incorreta.

Justificativa: a probabilidade de ter acertado, no máximo, duas questões (acertar 0, 1 ou 2 questões) será de: 25,6% + 40,8% + 27,2% = 93,6%.

Questão 2. Fez‑se uma pesquisa sobre o número de pacientes que frequentaram os estabelecimentos de saúde públicos e particulares no Brasil. Os dados a seguir representam o sumário da pesquisa.

Tabela 59

EspécieEstabelecimentos

Públicos (PU) Particulares (PA)

Hospital (H)

Pronto‑socorro (PS)

Policlínicas (P)

Outros¹ (O)

1.002

150

1.531

14.393

5.132

156

6.136

472

¹ Inclui postos de saúde, centros de saúde e unidades mistas

Fonte: VIEIRA (2008, p.18).

Retira‑se, ao acaso, um estabelecimento da população de 28.972 unidades. Sejam H, PS, P e O os eventos que representam se o estabelecimento retirado é hospital, pronto‑socorro, policlínicas ou outros, respectivamente. Da mesma forma, PU e PA são eventos que representam o tipo de estabelecimento (público ou particular). Assinale a alternativa incorreta.

A) A probabilidade de o paciente ter escolhido o estabelecimento público é de aproximadamente 0,5894, ou 58,94%.

B) A probabilidade de o paciente ter escolhido o hospital ou ser um estabelecimento particular é de 0,6223, ou 62,23%.

C) A probabilidade de o paciente ter escolhido o pronto‑socorro e ser um estabelecimento público é de 0,0052, ou 0,52%.

D) A probabilidade de o paciente ter escolhido o hospital ou policlínicas é de 0,4764, ou 47,64%.

E) A probabilidade de o paciente ter escolhido o hospital e ser um estabelecimento particular é de 0,1771, ou 17,71%.

Resolução desta questão na plataforma.

Page 67: Estatística Unidade II

120

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

REFERÊNCIAS

ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Thomson Learning, 2007.

BRUNI, A. B. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007.

BUSSAB, W. O.; MORETIN, P. A. Estatística básica. 3. ed. São Paulo: Atual, 1986.

COSTA NETO, P. L. O. Estatística. São Paulo: Edgard Blücher, 1979.

COSTA NETO, P. L. O.; CYMBALISTA, M. Probabilidades. São Paulo: Edgard Blücher, 1974.

DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 1998.

FONSECA, J. S.; MARTINS, G. A.; TOLEDO, G. L. Estatística aplicada. São Paulo: Atlas, 1995.

GITMAN, L. J. Princípios de administração financeira. São Paulo: Harbra, 2003.

GUERRA, M.; GUERRA, M. J.; DONAIRE, D. Estatística aplicada. São Paulo: Ciência e Tecnologia, 1991.

HOUAISS, A. Dicionário eletrônico Houaiss da língua portuguesa. Rio de Janeiro: Objetiva, 2009. 1 CD‑ROM.

KAZMIER, L. J. Estatística aplicada a economia e administração. São Paulo: Makron Books, 1982.

KUNE, H. Métodos estatísticos para a melhoria da qualidade. São Paulo: Gente, 1993.

LAPPONI, J. A. Estatística usando Excel. 4. ed. Rio de Janeiro: Elsevier, 2005.

MEDEIROS, E. et al. Estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São Paulo: Atlas, 1997. v. 1‑2.

______. Tabelas de estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São Paulo: Atlas, 1999.

MEYER, P. L. Probabilidade: aplicações à estatística. Rio de Janeiro: Livros Técnicos e Científicos, 1976.

MILONE, G.; ANGELINI, F. Estatística aplicada. São Paulo: Atlas, 1995.

MIRANDA, D. Análise combinatória. Brasil Escola, Goiânia, [s.d]. Disponível em: <http://www.brasilescola.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.

______. Análise combinatória. Mundo Educação, Goiânia, [s.d.]. Disponível em: <http://www.mundoeducacao.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.

Page 68: Estatística Unidade II

121

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

MLODINOW, L. O andar do bêbado: como o acaso determina nossas vidas. Rio de Janeiro: Zahar, 2009.

MOORE, D. A estatística básica e sua prática. Rio de Janeiro: LTC, 2000.

MOORE, D. et al. A prática da estatística empresarial: como usar dados para tomar decisões. Rio de Janeiro: LTC, 2006.

SALSBURG, D. Uma senhora toma chá: como a Estatística revolucionou a ciência no século XX. Rio de Janeiro: Zahar, 2009.

SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1993.

STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Habra, 1981.

TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC, 2005.

VIEIRA, S. Introdução à Bioestatística. 3. ed. Rio de Janeiro: Elsevier, 2008. p. 18.

WITTE, R. S.; WITTE, J. S. Estatística. 7. ed. Rio de Janeiro: LTC, 2005.

Sites

<http://super.abril.com.br/>.

<http://www.alea.pt>.

<www.ibge.gov.br>.

Exercícios

Unidade I – Questão 3: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (Enade) 2006: Administração. Questão 7, p. 5. Disponível em: <http://download.inep.gov.br/download/enade/2006/Provas/PROVA_DE_ADMINISTRACAO.pdf>. Acesso em: 9 dez. 2013.

Unidade I – Questão 11: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (Enade) 2006: Administração. Questão 6, p. 5. Disponível em: <http://download.inep.gov.br/download/enade/2006/Provas/PROVA_DE_ADMINISTRACAO.pdf>. Acesso em: 9 dez. 2013.

Unidade II – Questão 1: CEPERJ. Prova do Concurso Público de Fiscal da Fazenda. Rio de Janeiro, 2011. Questão 42, p.7. Disponível em: <http://www.concurso.ceperj.rj.gov.br/concursos/sefazfazenda/prova.pdf>. Acesso em: 23 dez. 2013.

Page 69: Estatística Unidade II

122

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

ANEXO 1 – GABARITO

Unidade I

1. B.

2. B.

3. E.

4. C.

5. D.

6. D.

7. B.

8. B.

9. C.

10. C.

11. A.

Unidade II

1. A.

2. E.

3. A.

4. D.

5. D.

6. C.

7. B.

8. A.

Page 70: Estatística Unidade II

123

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

9. E.

10. D.

11. C.

12. A.

13. D.

14. C.

15. B.

16. A.

17. B.

18. C.

19. E.

Page 71: Estatística Unidade II

124

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Page 72: Estatística Unidade II

125

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Page 73: Estatística Unidade II

126

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Page 74: Estatística Unidade II

127

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Page 75: Estatística Unidade II

128

ADM

/ CC

TB -

Rev

isão:

Julia

na M

aria

Men

des -

Dia

gram

ação

: Luc

as M

ansin

i - d

ata

13/1

2/20

13 /

/ Ex

ercí

cios

- Ju

liana

- D

iagr

amaç

ão: M

árci

o -

26/1

2/20

13

Page 76: Estatística Unidade II
Page 77: Estatística Unidade II

Informações:www.sepi.unip.br ou 0800 010 9000