37
Estatística Descritiva Estatística Descritiva

Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Embed Size (px)

Citation preview

Page 1: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Estatística DescritivaEstatística Descritiva

Page 2: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

SUMARIZANDO DADOS MENSURADOSSUMARIZANDO DADOS MENSURADOS

Medidas de tendência centra: média, mediana, moda.

Separatrizes: quartis, decis percentis

Medidas de dispersão: variância, desvio padrão, coeficiente de variação.

Page 3: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Média aritméticaMédia aritmética

N

XnXXX ...321 .N

X

N

XjN

j 1X

Page 4: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

MedianaMediana

É o valor central ou a média aritmética dos dois valores centrais.

Mediana

c

fmediana

fN

L

121

Page 5: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Em que:

L1 = limite inferior da classe mediana (isto é,

da classe que contém a mediana);

N = número de itens dos dados (isto é,

freqüência total);

(f)1 = soma de todas as freqüências das

classes inferiores à mediana;

fmediana = freqüência da classe mediana;

c = amplitude do intervalo da classe

mediana.

Page 6: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

ModaModa

É o valor que ocorre com a maior freqüência, ou seja, é o valor mais comum. A moda pode não existir e, mesmo que exista, pode não ser única.

.21

11 cLModa

Page 7: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Em que:

L1 = limite inferior da classe modal (isto é, a

que contém a moda);

1 = excesso da freqüência modal sobre a

da classe imediatamente inferior;

2 = excesso da freqüência modal sobre a da

classe imediatamente superior;

c = amplitude do intervalo da classe modal.

Page 8: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Quartis, decis e percentisQuartis, decis e percentis

De maneira geral, os quartis, decis e percentis e outros valores obtidos mediante subdivisões dos dados em partes iguais são denominados quantis.

Page 9: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Variância, desvio padrãoVariância, desvio padrão

N

XXj

s

N

j

1

2

Page 10: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Para as distribuições normaisPara as distribuições normais

(a) 68,27% dos casos estão incluídos entre X

-s e X + s (isto é, um desvio padrão de

cada lado da média);

(b) 95,45% dos casos estão incluídos entre

X - 2s e X + 2s (isto é, dois desvios

padrões de cada lado da média);

(c) 99,73% dos casos estão incluídos entre X

- 3s e X + 3s (isto é, três desvios padrões

de cada lado da média).

Page 11: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Se a dipersão absoluta é o desvio padrão s e média é a aritmética X, a dispersão relativa é denominada coeficiente de variação ou de dispersão.

.X

sVoedeVariaçãCoeficient

Page 12: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

A arte de representar dadosA arte de representar dados

Page 13: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Mas por que usar gráficos?Mas por que usar gráficos?

Uma imagem vale mais que ...Ganho considerável de tempo para o

leitorA informação fica mais concisaAtrai mais a atenção

Page 14: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Com o quê estamos lidando?Com o quê estamos lidando?

Variáveis qualitativas ou quantitativas. Qualitativas– são caracterizadas por estados, níveis

ou categorias– ordenadas e não ordenadas

Quantitativas– níveis expressos numericamente– discretas ou contínuas

Page 15: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Preparando os GráficosPreparando os Gráficos

Diretrizes gerais, não regras

Page 16: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Preparando os gráficosPreparando os gráficos

Requerer mínimo esforço do leitor– Nível de esforço para ler e entender o

gráfico– Ex: direct labeling vs. legend box

B A

C

Número de usuários

Tempo deResposta

ABC

Número de usuários

Tempo deResposta

Page 17: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Preparando os gráficos (cont.)Preparando os gráficos (cont.)

Maximizar informação– O gráfico deve ser auto-explicativo– Eixos devem ser informativos

Usar práticas usualmente aceitas– Exs: origem em (0,0); escala cresce da

esquerda pra direita; escalas lineares...

Page 18: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Preparando os gráficos (cont.)Preparando os gráficos (cont.)

Evitar ambigüidades– Identificar todos os elementos do

gráfico(eixos, escala, origem, curvas individuais...)

Minimizar tinta

Dia da semana

Disponibilidade

1

1 2 3 4 5

Dia da semana

Indisponibilidade

0.1

1 2 3 4 5

Page 19: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Preparando os gráficos (cont.)Preparando os gráficos (cont.)

Os eixos de coordenadas são mostrados e rotulados?

As escalas e divisões são mostradas em ambos os eixos?

O número de curvas é razoável? Todos os gráficos usam a mesma escala? As unidades de medida são indicadas? O gráfico usa as convenções de representação? Não existem curvas, símbolos, ou textos que

podem ser removidos sem afetar a informação?

Page 20: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Erros ComunsErros Comuns

Como falhar apresentando resultados

Page 21: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Erros comunsErros comuns

Apresentar muitas alternativas num único gráfico

Apresentar muitas “imagens” num único gráfico

Informações “não interessantes” Selecionar variação de escala imprópria

Page 22: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Erros comuns (cont.)Erros comuns (cont.)

Uso de símbolos ao invés de texto

=1 =3

=2

l

R

(a)Símbolos

1 job/seg 3 jobs/seg

2 jobs/seg

Taxa de chegada

ResponseTime

(b)Palavras Chave

Page 23: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Erros comuns (cont.)Erros comuns (cont.)

Usar gráficos de linha ao invés de coluna

Tipo da CPU

MIPS

8000 8100 8200 8300

Page 24: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Levando VantagemLevando Vantagem

“Jogando” com as imagens

Page 25: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Levando vantagemLevando vantagem

Usando origens diferentes de (0,0) para enfatizar diferenças

5200

0

MINE

YOURS

2610

2600

MINE

YOURS

Page 26: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Levando vantagem (cont.)Levando vantagem (cont.)

Usando duas curvas diferentes num mesmo gráfico para enfatizar o contraste

Número de Usuários

VazãoTempo de Resposta

Page 27: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Levando vantagem (cont.)Levando vantagem (cont.)

Plotar quantidades aleatórias sem indicar intervalos de confiança

MINE

YOURS

MINE

YOURS

(a) Com intervalo de confiança (a) Sem intervalo de confiança

Page 28: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Levando vantagem (cont.)Levando vantagem (cont.)

Figuras modificadas em escala pela altura

MINE

YOURS

Page 29: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Levando vantagem (cont.)Levando vantagem (cont.)

Escolha “errada” do tamanho das células num histograma

Frequência

Tempo de Resposta

[0,2]0

4

6

8

10

12

[2,4] [4,6] [6,8] [8,10] [10,12]

2

Frequência

Tempo de Resposta

[0,6]0

6

9

12

15

18

[6,12]

3

Page 30: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Levando vantagem (cont.)Levando vantagem (cont.)

Usar escalas quebradas em gráficos de coluna

Tempo deResposta

Sistema

A0

4

6

8

10

12

B C D E F

2

Tempo deResposta

9

10

11

12

Sistema

A0 B C D E F

Page 31: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Gráficos de GanttGráficos de Gantt

Usado para exibir a duração relativa de qualquer número de condições booleanas.

Cada condição é mostrada como um conjunto de segmentos de reta horizontais

Os segmentos de reta são arranjados de forma que a sobreposição das retas representa a sobreposição das condições

Page 32: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Gráficos de Gantt (cont.)Gráficos de Gantt (cont.)

0% 20% 40% 60% 80% 100%

CPU

Canal de I/O

Rede

60

20 20

30 10 5 15

Page 33: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Gráficos de KiviatGráficos de Kiviat

Auxilia no reconhecimento de problemas de performance

Gráfico circular em que as métricas são plotadas sobre retas radiais

Parâmetros: 50% HB, 50% LB Devido a essa configuração, o gráfico

ideal é uma estrela!

Page 34: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Gráficos de Kiviat (cont.)Gráficos de Kiviat (cont.)CPUbusy90%CPU only

busy10%

CPU/Channeloverlap

80%

CPU inproblem state

80%

CPU insupervisor state

10%

CPUwait10%

Channel onlybusy10%

Any Channelbusy90%

O gráfico idealpara um sistema balanceado

Page 35: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Gráficos de Kiviat (cont.)Gráficos de Kiviat (cont.)CPUbusy90%CPU only

busy10%

CPU/Channeloverlap

80%

CPU inproblem state

80%

CPU insupervisor state

10%

CPUwait10%

Channel onlybusy10%

Any Channelbusy90%

Exemplo de umsistema comproblemas de balançeamento

Page 36: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Mas e se tudo isso nãoMas e se tudo isso nãofuncionar para convencer osfuncionar para convencer os

decision makersdecision makers??

Page 37: Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas

Rejeitando uma análiseRejeitando uma análise

O problema precisa de mais análise A carga do sistema precisa ser melhor

entendida “Isso vai aumentar a complexidade e o

custo” Isso vai violar o IEEE, ANSI, CCITT, ou

qualquer outro padrão ... ... ...