35
Estatística Descrittiva – Profº Celso Brazil Estatística Descrittiva – Profº Celso Brazil 1 Definições: Estatística: parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e a interpretação de dados. O objetivo da Estatística é transformar dados em informações que auxiliem na tomada de decisões. População: define-se população como o conjunto formado por todos os elementos que desejamos coletar dados e que apresentam pelo menos uma característica em comum. Uma população pode ser classificada como finita ou infinita. População finita: o número de elementos não é muito grande, a entrevista e a análise das informações podem envolver todos os elementos do conjunto. Ex: alunos de uma instituição de ensino de pequeno porte. População infinita: o número de elementos é elevado, sendo considerado infinito. Ex: população do Estado do RJ. Amostra: parte de uma população selecionada através de técnicas de amostragem.A amostra deve ser representativa da população, isto é, deve possuir as mesmas características básicas da população. Tipos de Variáveis Uma variável poderá ser qualitativa ou quantitativa. A variável será qualitativa quando resultar de uma classificação por tipos ou atributos. Exs: População: alunos de uma universidade. Variável: sexo (masculino ou feminino). População: moradores de uma cidade. Variável: tipo de habitação (casa, apartamento, barraco, etc.). População: peças produzidas por uma máquina. Variável: qualidade (perfeita ou defeituosa). População: Óbitos em um hospital, nos últimos cinco anos Variável: causa mortis (moléstia cardiovasculares, cânceres, etc). A variável será quantitativa quando seus valores forem expressos em números. Pode ser subdivida em: - quantitativa discreta: pode assumir apenas valores pertences a um conjunto enumerável. São resultantes de contagens. - quantitativa contínua: pode assumir qualquer valor em um certo intervalo de variação. São resultantes de medições. Alguns exemplos de variáveis quantitativas discretas são:

Aula Curs...pdf

Embed Size (px)

Citation preview

Page 1: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 1

Definições: Estatística: parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e a interpretação de dados. O objetivo da Estatística é transformar dados em informações que auxiliem na tomada de decisões. População: define-se população como o conjunto formado por todos os elementos que desejamos coletar dados e que apresentam pelo menos uma característica em comum. Uma população pode ser classificada como finita ou infinita. População finita: o número de elementos não é muito grande, a entrevista e a análise das informações podem envolver todos os elementos do conjunto. Ex: alunos de uma instituição de ensino de pequeno porte. População infinita: o número de elementos é elevado, sendo considerado infinito. Ex: população do Estado do RJ. Amostra: parte de uma população selecionada através de técnicas de amostragem.A amostra deve ser representativa da população, isto é, deve possuir as mesmas características básicas da população. Tipos de Variáveis Uma variável poderá ser qualitativa ou quantitativa. A variável será qualitativa quando resultar de uma classificação por tipos ou atributos. Exs: População: alunos de uma universidade. Variável: sexo (masculino ou feminino). População: moradores de uma cidade. Variável: tipo de habitação (casa, apartamento, barraco, etc.). População: peças produzidas por uma máquina. Variável: qualidade (perfeita ou defeituosa). População: Óbitos em um hospital, nos últimos cinco anos Variável: causa mortis (moléstia cardiovasculares, cânceres, etc). A variável será quantitativa quando seus valores forem expressos em números. Pode ser subdivida em: - quantitativa discreta: pode assumir apenas valores pertences a um conjunto enumerável. São resultantes de contagens. - quantitativa contínua: pode assumir qualquer valor em um certo intervalo de variação. São resultantes de medições. Alguns exemplos de variáveis quantitativas discretas são:

Page 2: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 2

População: habitações de uma cidade. Variável: número de banheiros. População: casais residentes em uma cidade. Variável: número de filhos. População: aparelhos produzidos em uma linha de montagem. Variável: número de defeitos por unidade. População: Bolsa de valores de São Paulo. Variável: número de ações negociadas. Alguns exemplos de variáveis quantitativas contínuas são: População: estação meteorológica de uma cidade. Variável: precipitação pluviométrica durante um mês. População: pregos produzidos por uma máquina. Variável: comprimento. População: propriedades agrícolas do Brasil. Variável: produção de algodão. População: pessoas residentes em uma cidade. Variável: idade. Gráfico Estatístico O gráfico estatístico é uma forma de apresentação dos dados estatísticos que visa tornar mais rápida e clara a compreensão do resultado do fenômeno estudado. Os gráficos devem ser simples, claros e trazer informações verídicas. Tipos de gráficos: Gráficos de colunas Dados que estejam organizados em colunas ou linhas em uma planilha podem ser plotados em um gráfico de colunas. Gráficos de colunas são úteis para mostrar as alterações de dados em um período de tempo ou para ilustrar comparações entre itens.

Page 3: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 3

Gráficos de linha Gráficos de linhas podem exibir dados contínuos ao longo do tempo, definidos em relação a uma escala comum e são, portanto, ideais para mostrar tendências em dados a intervalos iguais.

Gráficos de pizza Gráficos de pizza mostram o tamanho de itens em uma série de dados, de modo proporcional à soma dos itens. Os pontos de dados em um gráfico de pizza são exibidos como um percentual de toda a pizza.

Page 4: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 4

Gráficos de barras Gráficos de barras ilustram comparações entre itens individuais.

Gráficos de área Gráficos de área enfatizam a magnitude da mudança no decorrer do tempo e podem ser usados para chamar atenção para o valor total ao longo de uma tendência. Por exemplo, os dados que representam o lucro no decorrer do tempo podem ser plotados em um gráfico de área para enfatizar o lucro total. Exibindo a soma dos valores plotados, o gráfico de área mostra também a relação das partes com um todo.

Gráficos de dispersão (XY) Gráficos de dispersão mostram as relações entre os valores numéricos em várias seqüências de dados ou plotam dois grupos de números como uma seqüência de coordenadas XY. Um gráfico de dispersão tem dois eixos de valores, mostrando um conjunto de dados numéricos ao longo do eixo horizontal (eixo X) e outro ao longo do eixo vertical (eixo Y). Ele combina esses valores em pontos de dados únicos e os exibe a intervalos irregulares,

Page 5: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 5

ou agrupamentos. Gráficos de dispersão costumam ser usados para exibir e comparar valores numéricos, como dados científicos, estatísticos e de engenharia.

Outros tipos de gráfico: Gráficos de ações Gráficos de superfície Gráficos de rosca Gráficos de bolhas Gráficos de radar Distribuições de Freqüência Definições: Freqüência simples ( if )

Definimos como freqüência de um valor de uma variável (qualitativa ou quantitativa) como sendo o número de vezes que aquele valor se repete no conjunto de dados.

∑ = nf i

onde, n = tamanho da amostra. Exemplo Número de filhos de 50 funcionários de uma empresa

N

if

Page 6: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 6

0 10 1 20 2 5 3 7 4 8 ∑ 50

Tipos de freqüência Freqüência relativa simples ( rf ) É a razão entre a freqüência simples de cada valor observado e a freqüência total.

n

ff i

r = , onde ∑ = %1001 ouf r

Freqüência acumulada ( iF )

A freqüência acumulada é igual à soma da freqüência simples ( if ) deste valor com todos

as freqüências simples ( if ) dos valores anteriores.

Freqüência relativa acumulada ( rF ) A freqüência relativa acumulada é igual à soma da freqüência relativa ( rf ) deste valor

com todos as freqüências relativas ( rf ) dos valores anteriores. Também pode ser obtida através da razão entre a freqüência acumulada até um valor e a freqüência total.

n

FF i

r =

nº de filhos if iF rf rF

0 10 10 0,20 0,20 1 20 30 0,40 0,60 2 5 35 0,10 0,70 3 7 42 0,14 0,84 4 8 50 0,16 1,0 ∑ 50 1,0

Page 7: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 7

Histograma O histograma é uma forma gráfica de apresentar a distribuição de freqüências de uma variável. O histograma é um gráfico de barras verticais construído com os resultados de uma tabela de freqüências. Histograma de freqüência simples ( if )

10

20

57

8

0

5

10

15

20

25

0 1 2 3 4

Nº de Filhos

Fre

qu

ên

cia

(fi

)

Histograma de freqüência relativa ( rf )

0,2

0,4

0,1

0,140,16

-

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0 1 2 3 4

Nº de Filhos

Fre

qu

ên

cia

rela

tiva (

fr)

Histograma de freqüência acumulada ( iF )

Page 8: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 8

10

3035

42

50

0

10

20

30

40

50

60

0 1 2 3 4

Nº de Filhos

Fre

qu

ên

cia

Acu

mu

lad

a (

Fi)

Histograma de freqüência relativa acumulada ( rF )

0,2

0,6

0,7

0,84

1

-

0,10

0,20

0,30

0,40

0,50

0,60

0,70

0,80

0,90

1,00

0 1 2 3 4

Nº de Filhos

Fre

qu

ên

cia

rela

tiva

acu

mu

lad

a (

Fr)

Distribuição de freqüências e sua representação gráfica para variáveis quantitativas contínuas As variáveis quantitativas contínuas diferem um pouco das discretas na sua forma de representação gráfica. Para entender essa diferença temos que nos lembrar que as variáveis contínuas, por definição, têm os seus valores definidos num intervalo contínuo dos números reais. Portanto, não tem sentido falar em freqüência de repetição de um determinado valor, pois os valores raramente se repetem. Dados Brutos São dados coletados que ainda não foram numericamente organizados.

ESTATURAS DE 40 ALUNOS DA FACULDADE A 166 160 161 150 162 160 165 167 164 160 162 168 161 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161

Rol

Page 9: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 9

São dados classificados em ordem crescente ou decrescente

ESTATURAS DE 40 ALUNOS DA FACULDADE A 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173

Tabela de freqüências É uma tabela onde os valores são apresentados associados as suas respectivas freqüências (número de repetições). Mas o processo dado é ainda inconveniente, já que exige muito mais espaço, mesmo quando o número de valores da variável (n) é de tamanho razoável. Sendo possível, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em vários intervalos.

ESTATURAS (cm)

FREQ

150 151 152 153 154 155 156 157 158 160 161 162 163 164 165 166 167 168 169 170 172 173

1 1 1 1 1 4 3 1 2 5 4 2 2 3 1 1 1 2 1 1 1 1

Total 40 Assim, se um dos intervalos for, por exemplo, 154 �— 158 (é um intervalo fechado à esquerda e aberto à direita, tal que: 154 ≤ x < 158), em vez de dizermos que a estatura

Page 10: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 10

de 1 aluno é de 154 cm; de 4 alunos, 155 cm; de 3 alunos, 156 cm; e de 1 aluno, 157 cm, dizemos que 9 alunos têm estaturas entre 154, inclusive, e 158 cm.

i ESTATURAS (cm)

fi pm fr Fi Fr

1 2 3 4 5 6

150 �— 154 154 �— 158 158 �— 162 162 �— 166 166 �— 170 170 �— 174

4 9 11 8 5 3

152 156 160 164 168 172

0,100 0,225 0,275 0,200 0,125 0,075

4 13 24 32 37 40

0,100 0,325 0,600 0,800 0,925 1,000

∑ 40 1,000 Histograma de freqüência simples ( if )

4

9

11

8

5

3

0

2

4

6

8

10

12

152 156 160 164 168 172

Altura

Fre

qu

ên

cia

(fi

)

Histograma de freqüência relativa (

rf )

0,100

0,225

0,275

0,200

0,125

0,075

-

0,05

0,10

0,15

0,20

0,25

0,30

152 156 160 164 168 172

Altura

Fre

qu

ên

cia

rela

tiva (

fr)

Histograma de freqüência acumulada ( iF )

Page 11: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 11

4

13

24

32

3740

-

5

10

15

20

25

30

35

40

45

152 156 160 164 168 172

Altura

Fre

qu

ên

cia

Acu

mu

lad

a (

Fi)

Histograma de freqüência relativa acumulada ( rF )

0,100

0,325

0,600

0,800

0,9251,000

-

0,10

0,20

0,30

0,40

0,50

0,60

0,70

0,80

0,90

1,00

152 156 160 164 168 172

Altura

Fre

qu

ên

cia

re

lati

va

Ac

um

ula

da

(F

r)

Elementos de uma Distribuição de Freqüência 1) Classes de freqüência ou, simplesmente, classes são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k (onde k é o número total de classes da distribuição). Assim, em nosso exemplo, o intervalo 154 ι— 158 define a segunda classe (i = 2). Como a distribuição é formada de seis classes, podemos afirmar que k = 6. 2) Denominamos limites de classe os extremos de cada classe. O menor número é o limite inferior da classe ( il ) e o maior número, o limite superior

da classe ( sL ).

Na segunda classe, por exemplo, temos:

2l = 154 e

2L = 158

Page 12: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 12

Nota: · Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do IBGE, em termos desta quantidade até menos aquela, empregando, para isso, o símbolo �— (inclusão de li e exclusão de Li). Assim, o indivíduo com uma estatura de 158 cm está incluído na terceira classe (i = 3) e não na segunda. 3) Amplitude de um intervalo de classe, ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por

ih . Assim:

iii lLh −=

No exemplo, temos: cmlLh 4154158

222=−=−=

4) Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo):

minmaxlLAT −=

Em nosso exemplo, temos: cmlLAT 24150174minmax

=−=−=

5) Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da amostra: AA = x(máx) – x(mín) Em nosso exemplo, temos: AA = 173 - 150 = 23 cm Observe que a amplitude total da distribuição jamais coincide com a amplitude amostral. 6) Ponto médio de uma classe (xi) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais.

2

is lLpm

+=

Assim, o ponto médio da segunda classe, em nosso exemplo, é:

Page 13: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 13

1562

312

2

154158

2==

+=

+= is lL

pm

Número de Classes – Intervalos de Classe A primeira preocupação que temos, na construção de uma distribuição de freqüência, é a determinação do número de classes e, conseqüentemente, da amplitude e dos limites dos intervalos de classe. Para a determinação do número de classes de uma distribuição podemos lançar mão da regra de Sturges, que nos dá o número de classes em função do número de valores da variável: i ≈ 1 + 3,3 . log n onde: i é o número de classe; n é o número total de dados. Regra da raiz

ni =

Amplitude de classe (h)

i

AAh =

Quando o resultado não é exato, devemos arredondá-lo para mais.

Medidas de Tendência Central

As medidas de tendência central recebem este nome porque seus valores “tendem” para o centro da distribuição de valores. As principais medidas de tendência central são: média, mediana, moda.

Média aritmética

Dados não agrupados

Exemplo:

X = {2, 3, 4, 5, 6, 7} n = 6

Fórmula: n

xx

n

i i∑ == 1

5,46

27

6

7654321 ==+++++

==∑ =

n

xx

n

i i

Page 14: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 14

Dados agrupados sem intervalos de classe

xi fi xifi 0 10 0 1 20 20 2 5 10 3 7 21 4 8 32

∑ 50 83

Fórmula: n

fxx

n

i ii∑ == 1

66,150

831 ===∑ =

n

fxx

n

i ii

Dados agrupados com intervalos de classe

ESTATURAS i (cm) fi pm fipm

1 150 �— 154 4 152 608 2 154 �— 158 9 156 1404 3 158 �— 162 11 160 1760 4 162 �— 166 8 164 1312 5 166 �— 170 5 168 840 6 170 �— 174 3 172 516 ∑ 40 6440

Fórmula: n

pmfx

n

i i∑ == 1

16140

64401 ===∑ =

n

pmfx

n

i i

Page 15: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 15

Mediana (Me)

Dados não agrupados ou agrupados sem intervalos de classe

A mediana de um conjunto de números, classificados em ordem crescente ou decrescente, é o valor central (N impar) ou a média aritmética dos dois valores centrais (N par).

Exemplos:

{3, 4, 4, 5, 6, 8, 8, 8, 10} n = 9 (ímpar)

52

10

2

19

2

1

,

65

==+

=+

=

===

np

onde

EEMe p

A mediana será o valor central ���� Me = 6

{5, 6, 7, 9, 11, 12, 13, 17} n = 8 (par)

A mediana será a média aritmética entre os dois valores centrais.

512

81

2

42

8

2

,

102

20

2

119

22

2

1

5421

=+=+=

===

==+

=+

=+

=

np

np

onde

EEEEMe

pp

xi fi Fi 0 10 10 1 15 25 2 10 35 3 7 42 4 8 50

∑ 50

Page 16: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 16

n = 50 (par)

2612

50

252

50

,

5,12

3

2

21

22

2

1

262521

=+=

==

==+

=+

=+

=

p

p

onde

EEEEMe

pp

Dados agrupados com intervalos de classe

hxf

FPliMe

me

ant−+=

onde,

il =limite inferior da classe que contém a mediana.

antF =freqüência acumulada (Fi) até a classe anterior à classe que contém a mediana.

mef =freqüência simples (fi) da classe que contém a mediana.

h = amplitude de classe.

Classe que contém a mediana é a 1ª classe com freqüência acumulada PFi ≥ , tal que

nn

P ∀=2

.

para todo.

Exemplo:

ESTATURAS i (cm) fi Fi

1 150 �— 154 4 4 2 154 �— 158 9 13 3 158 �— 162 11 24

Page 17: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 17

4 162 �— 166 8 32 5 166 �— 170 5 37 6 170 �— 174 3 40 ∑ 40 40

202

40==P

55,160411

1320158 =

−+=

−+= xhx

f

FPliMe

me

ant

Moda (Mo)

A moda é o valor que ocorre com mais freqüência. Um conjunto pode ser:

Amodal: quando não apresentar moda, isto é, todos os valores do conjunto apresentam a mesma freqüência.

Exemplos:

{3, 3, 4, 4, 5, 5 , 8, 8, 10, 10} ���� Mo = { }

{3, 4, 5, 10} ���� Mo = { }

Xi Fi 0 10 1 10 2 10 3 10 4 10

∑ 50

Mo = { }

Unimodal: quando apresentar um único valor modal.

Exemplos:

{3, 3, 3, 4, 5, 5 , 8, 8, 10, 10} ���� Mo = {3}

{3, 4, 5, 5, 10} ���� Mo = {5}

Page 18: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 18

Xi Fi 0 10 1 15 2 5 3 10 4 10

∑ 50

Mo = {1}

Bimodal: quando apresentar dois valores modais.

Exemplos:

{3, 3, 3, 4, 5, 5 , 5, 8, 8, 10, 10} ���� Mo = {3, 5}

{3, 4, 4, 5, 5, 10} ���� Mo = {4, 5}

Xi Fi 0 10 1 15 2 15 3 5 4 5

∑ 50

Mo = {1, 2}

Multimodal ou Plurimodal: quando apresentar três ou mais valores modais.

Exemplos:

{3, 3, 3, 4, 5, 5, 5, 8, 8, 8, 10, 10} ���� Mo = {3, 5, 8}

{3, 4, 4, 5, 5, 10, 10} ���� Mo = {4, 5, 10}

Xi Fi 0 12 1 12 2 12 3 4

Page 19: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 19

4 10

∑ 50

Mo = {0, 1, 2}

Moda para dados agrupados com intervalos de classe.

hxfff

ffliM

ipostiantmo

iantmo

o)(2 +−

−+=

il = limite inferior da classe que contém o valor modal;

mof = frequência simples da classe que contém o valor modal

iantf = frequência simples da classe anterior a classe modal

ipostf = frequência da classe posterior a classe modal

h= amplitude do intervalo de classe

Exemplo:

ESTATURAS i (cm) fi Fi

1 150 �— 154 4 4 2 154 �— 158 9 13 3 158 �— 162 11 24 4 162 �— 166 8 32 5 166 �— 170 5 37 6 170 �— 174 3 40 ∑ 40 40

4,1584,0158)17(22

2158

)89(112

911158

)(2=+=

−+=

+−

−+=

+−

−+=

xhx

fff

ffliM

ipostiantmo

iantmo

o

Medidas separatrizes

Page 20: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 20

As principais separatrizes são: quartil, decil e centil (ou percentil). A Mediana divide o conjunto em duas partes iguais. Já o Quartil, separa o conjunto em quatro partes iguais; o Decil, em dez partes e o Centil (ou Percentil) em cem partes iguais.

!-------------------!-------------------!

Md

!---------!---------!---------!---------!

Q1 Q2 Q3

!---!---!---!---!---!---!---!---!---!---!

D1 D2 D3 D4 D5 D6 D7 D8 D9

!---!---!---!---!---!---!---!---!---!---!

C10 C20 C30 C40 C50 C60 C70 C80 C90

Md = Q2 = D5 = C50

Fórmulas

Mediana

hxf

Fn

liMei

ant−

+=2

Quartil

hxf

Fkn

liQi

ant

k

+=4

Decil

hxf

Fkn

liDi

ant

k

+=10

Centil ou Percentil

Page 21: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 21

hxf

Fkn

liPi

ant

k

+=100

onde,

il =limite inferior da classe que contém a separatriz.

antF =freqüência acumulada (Fi) até a classe anterior à classe que contém a separatriz.

if =freqüência simples (fi) da classe que contém a separatriz.

h = amplitude de classe.

Classe que contém a separatriz é a 1ª classe com freqüência acumulada PFi ≥ .

k � índice da medida separatriz que desejamos calcular. Ex: C25 � k = 25.

Exemplo:

ESTATURAS i (cm) fi Fi

1 150 �— 154 4 4 2 154 �— 158 9 13 3 158 �— 162 11 24 4 162 �— 166 8 32 5 166 �— 170 5 37 6 170 �— 174 3 40 ∑ 40 40

67,15667,215449

61544

9

44

401

1541 =+=+=

+= xx

x

Q

Medidas de dispersão ou variabilidade Dispersão ou Variabilidade:

Page 22: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 22

É a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central (média ou mediana) tomado como ponto de comparação. A média - ainda que considerada como um número que tem a faculdade de representar uma série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z: X = {70, 70, 70, 70, 70} Y = {68, 69, 70 ,71 ,72} Z = {5, 15, 50, 120, 160} Observamos então que os três conjuntos apresentam a mesma média aritmética = 350/5 = 70. Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média representativa. Concluímos então que o conjunto X apresenta dispersão nula e que o conjunto Y apresenta uma dispersão menor que o conjunto Z. MEDIDAS DE DISPERSÃO ABSOLUTA Amplitude total (At) : É a única medida de dispersão que não tem na média o ponto de referência. Quando os dados não estão agrupados a amplitude total é a diferença entre o maior e o menor valor observado: AA = x máximo - x mínimo. Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total será: At = 70 - 40 = 30 Quando os dados estão agrupados sem intervalos de classe ainda temos : At = x máximo - x mínimo. Com intervalos de classe a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. Então At = smáxL -

minil .

A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem muita exatidão. Desvio médio (DM) É a média aritmética do valor absoluto dos desvios em relação à média. Dados não agrupados Exemplo:

x = {2, 3, 4, 5, 6, 7} n = 6

5,46

27

6

7654321 ==+++++

==∑ =

n

xx

n

i i

Page 23: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 23

Fórmula: n

xxDM

n

i i∑ =−

=1

Xi xxi − xxi −

2 -2,5 2,5 3 -1,5 1,5 4 -0,5 0,5 5 0,5 0,5 6 1,5 1,5

7 2,5 2,5

∑ 9,0

5,16

96

1==

−=∑ =

n

xxDM

i i

Dados agrupados sem intervalos de classe

Xi Fi Xifi xxi − xxi − xxfi i −

0 10 0 -1,66 1,66 16,6 1 20 20 -0,66 0,66 13,2 2 5 10 0,34 0,34 1,7 3 7 21 1,34 1,34 9,38 4 8 32 2,34 2,34 18,72

∑ 50 83 59,6

n

fxx

n

i ii∑ == 1 66,150

831 ===∑ =

n

fxx

n

i ii

Fórmula: 49,140

6,591==

−=∑ =

n

xxfiDM

n

i i

Dados agrupados com intervalos de classe

ESTATURAS i (cm) fi pm fipm xpm − xpm − xpmfi −

Page 24: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 24

1 150 �— 154 4 152 608 -9 9 36 2 154 �— 158 9 156 1404 -5 5 45 3 158 �— 162 11 160 1760 -1 1 11 4 162 �— 166 8 164 1312 3 3 24 5 166 �— 170 5 168 840 7 7 35 6 170 �— 174 3 172 516 11 11 22 ∑ 40 6440 184

n

pmfx

n

i i∑ == 1 16140

64401 ===∑ =

n

pmfx

n

i i

Fórmula: 6,440

1841==

−=∑ =

n

xpmfiDM

n

i

Desvio padrão É a medida de dispersão mais geralmente empregada, pois leva em consideração a totalidade dos valores da variável em estudo. É um indicador de variabilidade bastante estável. O desvio padrão baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida como : a raiz quadrada da média aritmética dos quadrados dos desvios e é representada por σ (populacional) ou s (amostral). O desvio padrão apresenta algumas propriedades, dentre as quais destacamos: 1ª) Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio padrão não se altera. 2ª) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado ( ou dividido) por essa constante. Dados não agrupados Exemplo:

x = {2, 3, 4, 5, 6, 7} n = 6

5,46

27

6

7654321 ==+++++

==∑ =

n

xx

n

i i

Fórmulas:

desvio padrão amostral : ( )

1

2

1

−=∑ =

n

xxs

n

i i

Page 25: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 25

Processo Breve:

−=

∑∑2

2

1 n

x

n

x

n

ns

ii

desvio padrão populacional: ( )n

xxn

i i

2

1∑ =−

Xi xxi − ( )2

xxi −

2 -2,5 6,25 3 -1,5 2,25 4 -0,5 0,25 5 0,5 0,25 6 1,5 2,25

7 2,5 6,25

∑ 17,5

( )87,15,3

5

5,17

1

2

1 ===−

−=∑ =

n

xxs

n

i i

Dados agrupados sem intervalos de classe

Xi Fi Xifi xxi − ( )2

xxi − ( )2

xxfi i −

0 10 0 -1,66 2,756 27,56 1 20 20 -0,66 0,436 8,712 2 5 10 0,34 0,116 0,578 3 7 21 1,34 1,796 12,57 4 8 32 2,34 5,476 43,8

∑ 50 83 93,22

n

fxx

n

i ii∑ == 1 66,150

831 ===∑ =

n

fxx

n

i ii

Page 26: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 26

Fórmula: ( )

379,190,149

22,93

1

2

1 ===−

−=∑ =

n

xxfis

n

i i

Dados agrupados com intervalos de classe

ESTATURAS i (cm) fi pm Fipm xpm − ( )2

xpm − ( )2

xpmfi −

1 150 �— 154 4 152 608 -9 81 324 2 154 �— 158 9 156 1404 -5 25 225 3 158 �— 162 11 160 1760 -1 1 11 4 162 �— 166 8 164 1312 3 9 72 5 166 �— 170 5 168 840 7 49 245 6 170 �— 174 3 172 516 11 121 363 ∑ 40 6440 1240

n

pmfx

n

i i∑ == 1 16140

64401 ===∑ =

n

pmfx

n

i i

Fórmula: ( )

64,579,3139

1240

1

2

1 ===−

−=∑ =

n

xpmfis

n

i

Variância É o desvio padrão elevado ao quadrado. σ² � variância populacional s² � variância amostral Observação: O desvio padrão tem a unidade de medida igual a unidade de medida original da variável, entretanto a variância apresentará a unidade de medida elevada ao quadrado. Quando se deseja comparar a variabilidade de duas ou mais distribuições, mesmo quando essas se referem a diferentes fenômenos e sejam expressas em unidades de medidas distintas, podemos utilizar o Coeficiente de Variação de Pearson (medida de dispersão relativa). Coeficiente de variação de Pearson Notação: CV = coeficiente de variação de Pearson ou apenas coeficiente de variação. Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um desvio

Page 27: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 27

padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada de CV: Coeficiente de Variação de Pearson (é a razão entre o desvio padão e a média referentes a dados de uma mesma série).

100.x

sCV =

se,

dispersãoaltaCV

dispersãomédiaCV

dispersãobaixaCV

→≥

→<≤

→<≤

%30

%30%15

%15%0

Exemplo: Exemplo:

x = {2, 3, 4, 5, 6, 7} n = 6

5,46

27

6

7654321 ==+++++

==∑ =

n

xx

n

i i

Xi xxi − ( )2

xxi −

2 -2,5 6,25 3 -1,5 2,25 4 -0,5 0,25 5 0,5 0,25 6 1,5 2,25

7 2,5 6,25

∑ 17,5

( )87,15,3

5

5,17

1

2

1 ===−

−=∑ =

n

xxs

n

i i

%56,41100.5,4

87,1100. ===

x

sCV alta dispersão.

Page 28: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 28

Exercícios Questões Prova: CESGRANRIO - 2008 - CAPES - Assistente em Ciência e Tecnologia Para responder às questões abaixo, utilize os dados do gráfico a seguir, relativos à Avaliação Trienal dos cursos e programas de pós-graduação realizada pela Capes em 2007.

O número total de programas, na área, avaliados pela Capes foi (a) 7 (b) 17 (c) 20 (d) 49 (e) 68 O conceito médio atribuído aos programas avaliados nesse período é (a) 1,7 (b) 2,8 (c) 3,8 (d) 4,0 (e) 7,0 O percentual de programas que tiveram conceito mínimo igual a 4,0 é (a) 15,0%

Page 29: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 29

(b) 28,5% (c) 32,0% (d) 34,6% (e) 65,3% Prova: CESPE - 2008 - TJ-DF - Analista Judiciário - Área Administrativa

A tabela acima apresenta a distribuição de freqüência absoluta das notas dadas por 125 usuários de um serviço público, em uma avaliação da qualidade do atendimento. Considerando essas informações, julgue os próximos itens. A média, a moda e a mediana dos valores apresentados na tabela são superiores a 2,8 e inferiores a 3,3. ( ) Certo ( ) Errado O desvio-padrão das notas apresentadas na tabela é superior a 1,1. ( ) Certo ( ) Errado Prova: FUNDAÇÃO SOUSÂNDRADE - 2007 - BNB - Analista Bancário A tabela a seguir indica a distribuição de freqüência das estaturas das crianças de um acampamento infantil.

A altura média das crianças desse acampamento é: (a) 145 cm (b) 143 cm

Page 30: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 30

(c) 147 cm (d) 153 cm (e) 138 cm Prova: CESGRANRIO - 2010 - BACEN - Analista do Banco Central - Área 4 A viabilidade financeira do projeto de uma microempresa leva em consideração dados históricos de 100 projetos semelhantes. A tabela abaixo mostra a distribuição de freqüências do VPL - Valor Presente Líquido (valores em milhões de reais) de um conjunto de microempresas similares.

Um projeto alternativo para o investidor apresenta um VPL esperado, em reais, de 6 milhões e um risco (desvio padrão) de 2 milhões. Pela ótica do risco relativo, qual o melhor investimento, a microempresa ou o projeto alternativo? (a) A microempresa, pois apresenta um Coeficiente de Variação maior. (b) A microempresa, pois apresenta um Coeficiente de Variação menor. (c) O projeto alternativo, pois apresenta um Coeficiente de Variação maior. (d) O projeto alternativo, pois apresenta um Coeficiente de Variação menor. (e) É indiferente, pois os investimentos apresentam Coeficientes de Variação iguais. Utilizando os dados históricos acima, o valor esperado para o VPL da microempresa, em milhões de reais, é (a) -10 (b) 0 (c) 5 (d) 10 (e) 20

Segundo os dados históricos, o valor, em milhões de reais, que mais se aproxima do desvio padrão do VPL da microempresa é

(a) 1 (b) 2 (c) 2,5 (d) 4 (e) 4,5

Prova: CESGRANRIO - 2010 - IBGE - Analista de Sistemas - Desenvolvimento de Aplicações A tabela abaixo apresenta a distribuição de freqüências das idades de um grupo de crianças.

Page 31: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 31

A mediana da distribuição de freqüências apresentada é (a) 5,5 (b) 5,6 (c) 5,7 (d) 5,8 (e) 5,9 A média das idades dessas crianças, em anos, é (a) 5,0 (b) 5,2 (c) 5,4 (d) 5,6 (e) 5,8 Prova: FCC - 2009 - TRT - 3ª Região (MG) - Analista Judiciário - Estatística A tabela abaixo apresenta a distribuição conjunta das freqüências das variáveis "tipo de processo" (Y) e "setor" (X), referente aos processos autuados, em um período analisado, numa repartição pública:

A porcentagem dos processos autuados no Setor B ou que não são do tipo III é (a) 92,5% (b) 87,5%

Page 32: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 32

(c) 62,5% (d) 37,5% (e) 32,5% Para responder às questões abaixo considere a distribuição de freqüências relativas acumuladas abaixo,correspondente aos salários dos 400 empregados de uma empresa no mês de setembro de 2009 (K > 0):

Calculando a média aritmética dos salários dos empregados da empresa, considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo, observa-se que seu valor pertence ao intervalo de classe que contém (a) 5% dos empregados. (b) 10% dos empregados. (c) 20% dos empregados. (d) 25% dos empregados. (e) 40% dos empregados O valor da mediana dos salários dos empregados, obtido pelo método da interpolação linear, é igual a (a) R$ 3.250,00 (b) R$ 3.375,00 (c) R$ 3.450,00 (d) R$ 3.600,00 (e) R$ 3.750,00 O número de empregados que ganham menos de R$ 4.200,00, utilizando o método da interpolação linear, é (a) 316 (b) 324 (c) 328 (d) 332 (e) 336 A distribuição dos salários dos 200 funcionários, em R$ 1.000,00, de determinada carreira profissional em um órgão público está representada pelo histograma abaixo. No eixo vertical estão assinaladas as respectivas densidades de freqüências, em (R$ 1.000,00) .

Page 33: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 33

Define-se densidade de freqüência de um intervalo de classe como sendo o quociente da divisão da respectiva freqüência relativa pela correspondente amplitude do intervalo.

Considerando todos os intervalos de classe fechados à esquerda e abertos à direita, tem-se que a quantidade de funcionários que possuem salários maiores ou iguais a R$ 4.000,00 e inferiores a R$ 8.000,00 é (a) 60 (b) 80 (c) 90 (d) 140 (e) 160 Prova: CESGRANRIO - 2011 - Petrobrás - Administrador Júnior

No histograma acima, os pontos médios das classes inicial e final são 40 e 80, respectivamente. Sabendo-se que todas as classes têm a mesma amplitude, a estimativa adequada para a média e para a mediana dessa distribuição são, respectivamente,

Page 34: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 34

(a) 59,5 e 59,5 (b) 59,5 e 60 (c) 60 e 59 (d) 60 e 59,5 (e) 60 e 60 Prova: CESGRANRIO - 2008 - CAPES - Assistente em Ciência e Tecnologia

O número médio de bolsas de mestrado oferecidas, por ano, nesse período foi

(a) 5.631,8. (b) 6.158,0. (c) 8.150,7. (d) 11.942,2. (e) 18.100,2. Prova: Prova: CESGRANRIO – 2010 - PETROBRÁS – Engenheiro de Petróleo Jr

Considere a amostra de uma variável aleatória, cujos valores estão todos expressos em uma mesma unidade.

Amostra : 36 38 26 40 40 28 46 40 38 28 Sobre essa amostra, tem-se que (A) a média é igual à mediana. (B) a média é maior que a moda. (C) se retirarmos um dos valores da amostra, a média, necessariamente, será alterada. (D) a mediana é maior que a moda.

Page 35: Aula Curs...pdf

Estatística Descrittiva – Profº Celso Brazil

Estatística Descrittiva – Profº Celso Brazil 35

(E). a mediana é maior que a média. Dada a amostra, tem-se que (A) o desvio padrão é menor que 6. (B) o desvio padrão é igual a 6. (C) a variância não será alterada, se retirarmos o valor igual a 36 da amostra. (D). a variância aumentará, se retirarmos o valor igual a 36 da amostra. (E) apenas dois valores da amostra estão afastados da média mais do que um desvio padrão.