49
Capítulo 5 Medidas Descritivas

Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Embed Size (px)

Citation preview

Page 1: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Capítulo 5

Medidas Descritivas

Page 2: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.1 - Introdução

• Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características como a tendência central, a dispersão, e a forma da distribuição dos dados.

• Estas características podem ser descritas por parâmetros denominados medidas descritivas de uma população ou amostra de dados.

Page 3: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.2. MEDIDAS DE TENDÊNCIA CENTRAL

• Refere-se à concentração dos dados de uma amostra ou população em torno de um valor intermediário.

• As principais medidas de tendência central são a média aritmética, a mediana e a moda.

Page 4: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.2.1. MÉDIA ARITMÉTICA SIMPLES

• A média aritmética ou simplesmente média de uma variável quantitativa pode ser simples ou ponderada.

• É definida como o quociente da divisão da soma dos dados da amostra (população) pelo tamanho da amostra (população).

• Se x1, x2, ..., xN constituem a população de dados de uma variável quantitativa X, a média aritmética simples desta população é:

Page 5: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

• Se x1, x2, ..., xN constituem a população de dados de uma variável quantitativa X, a média aritmética simples desta população é:

• No caso de uma amostra de n dados de uma variável quantitativa X, a média aritmética é: n

ixx

=

N

xN

ii

1==

Page 6: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.2.1.2. MÉDIA ARITMÉTICA PONDERADA

• Em algumas situações, ao se determinar a média, atribui-se uma importância maior ou menor a determinada observação.

• A importância de um valor é determinada por um fator denominado peso ou ponderação.

• Neste caso, a média aritmética definida como o quociente da divisão da soma dos produtos das observações pelos respectivos pesos, pela soma dos pesos, sendo denominada média aritmética ponderada.

Page 7: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

• Assim, se x1, x2, ..., xN, constituem a população de N dados de uma variável quantitativa X, sendo atribuídos a este dados os pesos p1, p2, ..., pN, , a média aritmética ponderada desta população é

• Por outro lado, se x1, x2, ..., xn, constituem uma amostra de n dados de uma variável quantitativa X, sendo atribuídos a este dados os pesos p1, p2, ..., pn, , a média aritmética ponderada desta amostra é

N

ii

N

iii

p

px

p

1=

1==

n

ii

n

iii

p

px

px

1=

1==

Page 8: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.2.2. MEDIANA

• A mediana de N dados da população de uma variável quantitativa é o valor que se localiza no centro do conjunto de dados quando estes são dispostos em ordem crescente. Conseqüentemente, metade ou 50% dos dados estão abaixo da mediana e a metade ou os 50% restantes estão acima da mesma.

• Se N é ímpar, a mediana é o valor que ocupa a posição (N+1)/2; se N é par, a mediana e, por convenção, a média aritmética entre o valor de posição N/2 e o de posição (N/2)+1.

Page 9: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.2.3. MODA

• Denomina-se moda o dado mais frequente da população ou de uma amostra de dados de uma variável quantitativa.

• A moda pode não existir e se existir, pode não ser única. Assim sendo, uma distribuição de dados pode ser amodal quando não tem moda, unimodal quando tem moda única, bimodal quando tem duas modas e, em geral multimodal, se tiver várias modas.

Page 10: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.2.4. PERCENTIS • O percentil de ordem k de n dados de uma variável quantitativa

dispostos em ordem crescente é um valor tal k/100 ou k % destes n dados estão abaixo e 1k/100 ou 100k% restantes estão acima do referido valor.

• Se k = 50, o percentil de ordem correspondente é a mediana; • se k = 25, 50 e 75, os percentis com as ordens correspondentes

são denominados 1.ºquartil, 2.º quartil e 3.º quartil, respectivamente; se k = 10, 20, 30, ..., 90, os percentis de ordem correspondentes são denominados 1.º decil, 2.º decil, 3.º decil, ..., 9.º decil, respectivamente.

• O késimo percentil de uma população de N dados quando estes estão dispostos em ordem crescente é o valor de posição k(N+1)/100. No caso de uma amostra de n dados, o késimo percentil da amostra é o valor de posição k(n + 1)/100.

Page 11: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.2.5. MEDIDAS DE TENDÊNCIA CENTRAL DE DADOS AGRUPADOS

• Média aritmética

• Mediana – l é o limite inferior da classe mediana– F(ant) é a frequencia acumulada da

classe anterior a classe mediana– f frequencia da classe mediana– h amplitude da classe medana

• Moda– l é o limite inferior da (s) classe (s) de

maior freqüência (classe modal), – h é a amplitude da classe (s) modal

(is), – fm é a freqüência da classe modal, – fa é a freqüência da classe adjacente

anterior – fp é a freqüência da classe adjacente

posterior.

f

hantFkn

lX

)(

100~

i

ii

f

fxx

pam

am

fffffhmo--2

-+=

Page 12: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.2.6. EMPREGO DAS MEDIDAS DE TENDÊNCIA CENTRAL

• A média é a medida mais utilizada devido as suas propriedades aritméticas.

• Porém esta medida é fortemente influenciada por valores discrepantes e neste caso utiliza-se a mediana.

• A moda é pouco utilizada. • Porém, se a freqüência do valor que mais ocorre

é acentuadamente maior que as dos demais valores, a moda pode ser utilizada como medida de tendência central.

Page 13: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.3. MEDIDAS DE DISPERSÃO

• Estas medidas indicam o grau de dispersão dos dados de uma população ou amostra de uma variável quantitativa em torno de uma medida de tendência central.

• A dispersão pode ser absoluta ou relativa

Page 14: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.3.1. MEDIDAS DE DISPERSÃO ABSOLUTAS

• 5.3.1.1. Variância• Se x1, x2, ..., xn constituem a

população com média de N dados de uma variável quantitativa X, a variância desta população é

• onde xi (i = 1, 2, ..., N) são os desvios dos dados em relação à média da população. A variância é a média dos quadrados dos desvios em relação à média aritmética.

• A fórmula acima pode ser modificada, considerando-se que

• Esta fórmula além de ser mais prática, fornece um resultado mais exato do que a fórmula original porque evita os arredondamentos quando o valor da média apresenta casas decimais.

N

xN

ii

1

2

2)(

2

1 1

2

1

2 2)( NxxxN

i

N

iii

N

ii

2

2

11

2

2

N

x

N

xN

ii

N

ii

Page 15: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

• Por outro lado, se x1, x2, ..., xn constituem uma amostra de n dados de uma variável quantitativa X, a variância desta amostra é

• A razão do divisor n 1 em lugar de n será explicada futuramente em estudos mais avançados.

• Modificando-se a fórmula acima como no caso da variância de uma população e omitindo-se os índices dos somatórios tem-se que

1

)(1

2

2

n

xx

s

n

ii

)1(1

222

nn

x

n

xs ii

Page 16: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características
Page 17: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características
Page 18: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Propriedadesda Variância

• Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores uma constante arbitrária, a variância não se altera

• Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores por um valor constante, a variância fica multiplicada (ou dividida) pelo quadrado da constante

Page 19: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.3.1.2. Desvio padrão

• Sendo a variância expressa em termos do quadrado da unidade de medida da variável em estudo, define-se uma medida de dispersão que é a raiz quadrada da variância.

• Esta medida é denominada desvio ou afastamento padrão que, ao contrário da variância, expressa a dispersão em termos da unidade de medida da variável, sendo portanto mais fácil de ser interpretada.

N

xi2)(

22

)1(1

nn

x

n

xs ii

Page 20: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características
Page 21: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Propriedades do Desvio Padrão

• Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores uma constante arbitrária, o desvio padrão não se altera

• Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores por um valor constante, desvio padrão fica multiplicado (ou dividido) pela constante

Page 22: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.3.2. Dados Agrupados2

11

2

2

N

fx

N

fx i

nc

iii

nc

ii

• onde xi e fi (i = 1, 2, ..., nc) são, respectivamente, o ponto médio e a freqüência da i-ésima classe e N = (população) ou n = (amostra).

)1(1

222

nn

fx

n

fxs iiii

Page 23: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características
Page 24: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características
Page 25: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.3.1.3. Amplitude total ou Range (R)

• A amplitude total ou amplitude de variação dos dados de população ou de uma amostra de uma variável quantitativa é definida como a diferença a entre os valores extremos.

• É uma medida pouco utilizada porque não detecta a dispersão dos valores intermediários.

• Se os dados estiverem agrupados em classes numa tabela de distribuição de freqüências, a amplitude total é dada pela diferença entre o limite inferior da primeira classe e o limite superior da última classe.

Page 26: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Exemplo

• Exemplo: Sejam as seguintes amostras A e B:

• A= {5, 6, 7, 8, 25}

• B= {5, 8, 11, 19, 25}

• Ambas as amostras apresentam Range (R): R = 25 - 5 = 20 .Porém, em B há uma maior variabilidade, que a amplitude total não deixa clara.

Page 27: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.3.1.2. Desvio semi-interquartílico

• Mede a dispersão em torno da mediana, definido como a média das diferenças absolutas entre os quartis extremos (1.º e 3.º) e a mediana,

• simplificando, tem-se finalmente que

• O desvio semi-interquartílico mede a dispersão dos dados entre Q1 e Q3desprezando a dispersão dos dados abaixo de Q1 e acima de Q3.

QQ me Q me me Q Q me

= - - - + -1 3 1 3

2 2

213 QQ

Q

Page 28: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.3.1.4. Desvio médio

• desvio médio é definido como a média aritmética dos desvios.

N

xDM i

n

xxDM i

Page 29: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.3.2. MEDIDAS DE DISPERSÃO RELATIVA

• Comparar as dispersões de dois ou mais conjuntos de valores de diferentes variáveis.

• Se as variável em estudo são medidas em diferentes unidades de medida ou mesmo que as unidades de medidas sejam as mesmas, os valores apresentam diferentes ordens de grandeza. Neste caso deve-se utilizar as medidas de dispersão relativa que são adimensionais

%100

CV %100x

sCV

Page 30: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

• Exemplo: Sejam os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos.

Page 31: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características
Page 32: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.4. MEDIDAS DE ASSIMETRIA E DE CURTOSE

• Estes parâmetros fornecem informações sobre a forma como se distribuem os valores observados de uma variável.

• A medida de assimetria indica se há mais valores abaixo ou acima da média de uma população ou de uma amostra.

• A medida de curtose indica se os valores intermediários de uma amostra ou população são dispersos ou concentrados.

Page 33: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.4.1. DEFINIÇÃO DE ASSIMETRIA

0

1

2

3

4

5

6

7

8

11 13 15 17 19valores

freq

üênc

ia

0

1

2

3

4

5

6

7

8

11 13 15 17 19Valores

Freq

üênc

ia

0

1

2

3

4

5

6

7

8

11 13 15 17 19Valores

Freq

üênc

ia

Figura 5.1. Distribuição simétrica

Figura 5.2. Distribuição assimétrica positiva Figura 5.3. Distribuição assimétrica negativa

Page 34: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.4.2. COEFICIENTE DE ASSIMETRIA

• Um coeficiente de assimetria indica o grau da assimetria de uma distribuição de dados. Um dos coeficientes de assimetria mais utilizados é:

forte assimetria 1

moderada assimetria 115,0

mediana x~média

)~(3

As

As

xs

xxAs

Page 35: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.4.3. CONCEITO DE CURTOSE

Figura 5.4a. Distribuição leptocúrtica Figura 5.4b. Distribuição mesocúrtica Figura 5.4c. Distribuição platicúrtica

Page 36: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.4.4. COEFICIENTE DE CURTOSE

caplaticúrti curva - 0,263C

caleptocúrti curva - 0,263C

amesocúrtic curva - 0,263C

percentil 10º-

percentil 90º-

quartil 1º-

quartil 3º-

)(2

10

90

1

3

1090

13

P

P

Q

Q

PP

QQC

Page 37: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

5.5. ANÁLISE DE DADOS A PARTIR DAS ESTATÍSTICAS DE ORDEM

• As características de uma distribuição são em geral descritas informando os valores da média e do desvio padrão e, algumas vezes do coeficiente de assimetria.

• Porém a média e o desvio padrão são fortemente influenciados pela presença de valores discrepantes.

• Para contornar esta dificuldade, John Tukey (1977) propôs descrever as características de uma distribuição através das estatísticas de ordem que são, a mediana, os quartis ou juntas e os extremos, apresentados no esquema a seguir.

n x~ x~ J Q1 Q3 E Ei Es

onde n é o número de observações,

x~ é a mediana, J as juntas (1º quartil e 3º quartil) e E os extremos (o menor valor observado, Ei e o maior valor observado, Es

Page 38: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

• As características da distribuição da população pode ser analisada a partir do diagrama de Tukey (boxplot em inglês), devido a sua configuração.

• A diferença DI = Q3 Q1 é denominada desvio interquartílico e pode ser empregada como medida de dispersão.

• Este diagrama indica as seguintes características: a) tendência central: é dada pela posição da mediana na escala de medida da variável; b) dispersão: medida pelo valor de DI; c) assimetria: indicada a partir da comparação das diferenças Q1 e Q3 .

• Todos os valores observados inferiores a e superiores a são discrepantes (outliers).

• Os valores a e b são o menor valor observado não discrepante e o maior valor observado não discrepante, respectivamente.

Ei a Q1 x~ Q3 b Es DI

Page 39: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Medidas de Posição Relativa

• As medidas de posição relativa nos permitem determinar o quão um valor em particular está afastado da média. As principais são: – Escore Padronizado, – Regra de Chebyshev e a – Regra Empírica.

Page 40: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Escore Padronizado (z-score)

Page 41: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Exemplo

• Em um exame final de Estatística, o grau médio de um grupo de 150 estudantes foi 78 e o desvio padrão, 8.0. Em Contabilidade, entretanto, o grau médio final do grupo foi 73 e o desvio padrão, 7.6.

• Um estudante obteve os graus 90 em Estatística e 85 em Contabilidade. Em qual dos exames ele obteve melhor desempenho?

Page 42: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características
Page 43: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Regra de Chebyshev

Page 44: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Exemplo

• O Controle se qualidade de uma empresa recebeu um lote de 1000 peças com a medida principal apresentando média igual a 50 e desvio padrão igual a 2. O gerente do controle de qualidade deseja determinar o número de peças que se encontram nos seguintes intervalos:

• a. 47 a 53 • b. 45 a 55 • c. 44 a 56

Page 45: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características
Page 46: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Regra Empírica

• • Usada somente quando o conjunto de dados é

normalmente distribuído. Para dados que têm uma distribuição de freqüência descrita pela curva normal: – Aproximadamente 68% das observações estão

dentro de 1 desvio padrão da média. – Aproximadamente 95% das observações estão

dentro de 2 desvios padrão da média. – Aproximadamente 99,7 % das observações estão

dentro de 3 desvios padrão da média.

Page 47: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características
Page 48: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características

Exemplo

• Suponha que um conjunto de dados tenha distribuição normal com média igual a 30 e desvio padrão, 5. Use a Regra empírica para determinar a porcentagem de dados que se encontram dentro de cada um dos seguintes intervalos.

• a. 20 a 40 • b. 15 a 45 • c. 25 a 35

Page 49: Capítulo 5 Medidas Descritivas. 5.1 - Introdução Conforme foi visto no capítulo 3, ao se analisar uma distribuição de freqüências, deve-se observar características