Capítulo 2 Descrição, Exploração e Comparação de Dados Prof. Paulo Renato de Morais...

Preview:

Citation preview

Capítulo 2Capítulo 2

Descrição, Exploração e Descrição, Exploração e Comparação de DadosComparação de Dados

Prof. Paulo Renato de MoraisProf. Paulo Renato de Morais

ESTATÍSTICA APLICADAESTATÍSTICA APLICADA

Descrevendo Descrevendo Dados QualitativosDados Qualitativos

Classe Freqüência Freq. RelativaCurso No Estudantes Proporção

Engenharia 130 0,65Economia 20 0,10Administração 50 0,25Total 200 1,00

Classe Freqüência Freq. RelativaCurso No Estudantes Proporção

Engenharia 130 0,65Economia 20 0,10Administração 50 0,25Total 200 1,00

Tabela de FreqüênciasTabela de Freqüências

1.1. Lista categorias e no. elementos na categoriaLista categorias e no. elementos na categoria

2.2. Obtida tabulando respostas na categoriaObtida tabulando respostas na categoria

3.3. Pode mostrar freqüências, % ou ambasPode mostrar freqüências, % ou ambas

Tabul.:Tabul.:|||| |||||||| |||||||| |||||||| ||||

Gráfico em ColunasGráfico em Colunas

0

50

100

150

Eng. Econ. Adm.

0

50

100

150

Eng. Econ. Adm.

Coluna mostra Coluna mostra freqüência ou %freqüência ou %

1/2 a 1 largura da coluna1/2 a 1 largura da coluna

Larguras iguaisLarguras iguais

Ponto ZeroPonto Zero

FreqüênciaFreqüência

CursoCurso

Econ.10%

Adm.25%

Eng.65%

Gráfico em SetoresGráfico em Setores

1. Mostra divisão da 1. Mostra divisão da quantidade total quantidade totalem categoriasem categorias

2. Útil para mostrar 2. Útil para mostrar diferenças relativasdiferenças relativas

3. Valor do ângulo:3. Valor do ângulo: (360°)(Porcentagem) (360°)(Porcentagem)

Cursos

(360°) (10%) = 36°

36°

QuestãoQuestão

Você deseja analisar a Você deseja analisar a divisão de mercado divisão de mercado dos fabricantes de dos fabricantes de programas para programas para Windows em 1992. Windows em 1992. Construa um gráfico Construa um gráfico em em colunascolunas e um e um gráfico em gráfico em setoressetores para descrever os para descrever os dados.dados.

MarcaMarca Div. Merc. (%)Div. Merc. (%)LotusLotus 1515MicrosoftMicrosoft 6060WordPerfectWordPerfect 1010OutrosOutros 1515

Solução do Gráfico em Solução do Gráfico em ColunasColunas

0%

20%

40%

60%

OutrosWordperfMicrosoftLotus

0%

20%

40%

60%

OutrosWordperfMicrosoftLotus

Div. Mercado (%)Div. Mercado (%)Div. Mercado (%)Div. Mercado (%)

MarcaMarcaMarcaMarca

Solução do Gráfico em Solução do Gráfico em SetoresSetores

Divisão do MercadoDivisão do Mercado

LotusLotus15%15%

OutrosOutros15%15%WordperfectWordperfect

10%10%

MicrosoftMicrosoft60%60%

Descrevendo Descrevendo Dados QuantitativosDados Quantitativos

1.1. Condensa dados agrupando valores Condensa dados agrupando valores similares em similares em classesclasses num gráfico num gráfico

2.2. Pode mostrar freqüências (contagens) Pode mostrar freqüências (contagens) ou freqüências relativas (proporções)ou freqüências relativas (proporções)

3.3. Primeiro deve-se construir uma tabela Primeiro deve-se construir uma tabela de distribuição de freqüênciasde distribuição de freqüências

HistogramaHistograma

Tabela de Distribuição de Tabela de Distribuição de FreqüênciasFreqüências

1.1. Determine amplitude totalDetermine amplitude total

2.2. Selecione número de classesSelecione número de classes UsualmenteUsualmente entre 5 e 20 inclusive entre 5 e 20 inclusive

3.3. Calcule intervalos de classe (comprimento)Calcule intervalos de classe (comprimento)

4.4. Determine limites das classesDetermine limites das classes

5.5. Calcule pontos médios das classesCalcule pontos médios das classes

6.6. Conte observações e designe a classesConte observações e designe a classes

Tabela de Distribuição de Tabela de Distribuição de FreqüênciasFreqüências

Dados: Dados: 2424, , 2626, , 2424, , 2121, , 27, 27, 3027, 27, 30, , 4141, , 3232, , 3838

LimitesLimites (Limite superior + inferior) / 2(Limite superior + inferior) / 2

Amplit. Amplit. = 10= 10

ClasseClasse P. médioP. médio FreqüênciaFreqüência

15 |---- 2515 |---- 25 2020 33

25 |---- 3525 |---- 35 3030 55

35 |---- 4535 |---- 45 4040 22

Tabela de Distribuição de Tabela de Distribuição de Freqüência Relativa e % Freqüência Relativa e %

Distribuição PercentualDistribuição PercentualDistribuição de Freqüência Distribuição de Freqüência RelativaRelativa

ClasseClasse Prop.Prop.

15 |---- 2515 |---- 25 0,30,3

25 |---- 3525 |---- 35 0,50,5

35 |---- 4535 |---- 45 0,20,2

ClasseClasse %%

15 |---- 2515 |---- 25 30,030,0

25 |---- 3525 |---- 35 50,050,0

35 |---- 4535 |---- 45 20,020,0

00

11

22

33

44

55

HistogramaHistograma

FreqüênciaFreqüência

Freqüência Freqüência RelativaRelativa

PorcentagemPorcentagem

00 1515 2525 3535 4545 5555

LimitesLimites

Colunas Colunas se tocamse tocam

ContagemContagem

Métodos Numéricos Métodos Numéricos para Dados Quantitativospara Dados Quantitativos

NotaçãoNotação

MedidaMedida AmostraAmostra PopulaçãoPopulação

MédiaMédia XX

Desvio padrãoDesvio padrão SS

VariânciaVariância SS22 22

TamanhoTamanho nn NN

Propriedades de Dados Propriedades de Dados QuantitativosQuantitativos

Tendência Central Tendência Central (Localização)(Localização)

Variação Variação (Dispersão)(Dispersão)

FormaForma

Métodos Numéricos Métodos Numéricos para Dados Quantitativospara Dados Quantitativos

PropriedadesNuméricas

MédiaMédia

MedianaMediana

ModaModa

TendênciaCentral

AmplitudeAmplitude

VariânciaVariânciaVariânciaVariância

Desvio PadrãoDesvio Padrão

Intervalo InterquartílicoIntervalo Interquartílico

Variação Forma

SimetriaSimetria

Medidas de Tendência Medidas de Tendência CentralCentral

MédiaMédia

1.1. Medida de tendência centralMedida de tendência central

2.2. Medida mais comumMedida mais comum

3.3. Funciona como ‘ponto de equilíbrio’Funciona como ‘ponto de equilíbrio’

4.4. Afetada por valores extremos (‘outliers’)Afetada por valores extremos (‘outliers’)

MédiaMédia

1.1. Medida de tendência centralMedida de tendência central

2.2. Medida mais comumMedida mais comum

3.3. Funciona como ‘ponto de equilíbrio’Funciona como ‘ponto de equilíbrio’

4.4. Afetada por valores extremos (‘outliers’)Afetada por valores extremos (‘outliers’)

5. 5. Fórmula (média amostral)Fórmula (média amostral)

XXXX

nn

XX XX XX

nn

iiii

nn

nn

11 11 22

Exemplo de MédiaExemplo de Média

Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7

XXXX

nn

XX XX XX XX XX XXiiii

nn

11 11 22 33 44 55 66

66

1010 33 44 99 88 99 111177 66 33 7,7,77

66

88 3030

,, ,, ,, ,, ,, ..

,,

MedianaMediana

1.1. Medida de tendência centralMedida de tendência central

2.2. Valor central numa seqüência ordenadaValor central numa seqüência ordenada Se n é ímpar, valor central da seqüênciaSe n é ímpar, valor central da seqüência Se n é par, média dos 2 valores centraisSe n é par, média dos 2 valores centrais

MedianaMediana

1.1. Medida de tendência centralMedida de tendência central

2.2. Valor central numa seqüência ordenadaValor central numa seqüência ordenada Se n é ímpar, valor central da seqüênciaSe n é ímpar, valor central da seqüência Se n é par, média dos 2 valores centraisSe n é par, média dos 2 valores centrais

3. 3. Posição da mediana na seqüência: Posição da mediana na seqüência:

PosiçãoPosição nn 11

22

MedianaMediana

1.1. Medida de tendência centralMedida de tendência central

2.2. Valor central numa seqüência ordenadaValor central numa seqüência ordenada Se n é ímpar, valor central da seqüênciaSe n é ímpar, valor central da seqüência Se n é par, média dos 2 valores centraisSe n é par, média dos 2 valores centrais

3. 3. Posição da mediana na seqüência Posição da mediana na seqüência

4.4. Não é afetada por valores extremosNão é afetada por valores extremos

PosiçãoPosição nn 1122

Exemplo de Mediana: Exemplo de Mediana: Amostra Tamanho ÍmparAmostra Tamanho Ímpar

Dados:Dados: 24,124,1 22,622,6 21,521,5 23,723,7 22,622,6

Ordenação:Ordenação: 21,521,5 22,622,6 22,622,6 23,723,7 24,124,1

Posição:Posição: 11 22 33 44 55

PosiçãoPosição

MedianaMediana

nn 11

2255 11

2233

2222 66,,

Exemplo de Mediana Exemplo de Mediana Amostra Tamanho ParAmostra Tamanho Par

Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7

Ordenação:Ordenação: 4,94,9 6,36,3 7,77,7 8,98,9 10,310,311,711,7

Posição:Posição: 11 22 33 44 5566 PosiçãoPosição

MedianaMediana

nn 11

2266 11

2233 55

77 77 88 99

2288 33

,,

,, ,,,,

ModaModa

1.1. Medida de tendência centralMedida de tendência central

2.2. Valor que ocorre mais freqüentementeValor que ocorre mais freqüentemente

3.3. Não é afetada por valores extremosNão é afetada por valores extremos

4.4. Pode haver nenhuma moda ou várias Pode haver nenhuma moda ou várias modasmodas

5.5. Pode ser usada para dados quantitativos e Pode ser usada para dados quantitativos e qualitativosqualitativos

Exemplo de ModaExemplo de Moda

Nenhuma Moda:Nenhuma Moda:Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,3 7,77,7

Uma Moda:Uma Moda:Dados:Dados: 6,36,3 4,94,9 8,98,9 6,3 6,3 4,94,9 4,94,9

Mais de Uma Moda:Mais de Uma Moda:Dados:Dados: 2121 2828 2828 4141 4343 4343

QuestãoQuestão

Você deve analisar dados de um teste sobre um Você deve analisar dados de um teste sobre um determinado parâmetro de vôo. Os dados são:determinado parâmetro de vôo. Os dados são:

17, 16, 21, 18, 13, 16, 12, 1117, 16, 21, 18, 13, 16, 12, 11

Descreva estes dados em termos de Descreva estes dados em termos de tendência tendência centralcentral..

Solução da Tendência Solução da Tendência CentralCentral

MédiaMédia

XXXX

nn

XX XX XXiiii

nn

11 11 22 88

88

1717 1616 2121 1818 1313 1616 1212 1111

88

1515 55,,

Solução da Tendência Solução da Tendência CentralCentral

MedianaMediana

Dados:Dados: 1717 1616 2121 1818 1313 1616 1212 1111

Ordenados:Ordenados: 1111 1212 1313 1616 1616 1717 1818 2121

Posição:Posição: 11 22 33 44 55 66 77 88

PosiçãoPosição

MedianaMediana

nn 11

22

88 11

2244 55

1616 1616

221616

,,

Solução da Tendência Solução da Tendência CentralCentral

ModaModa

Dados:Dados: 1717 1616 2121 1818 1313 1616 12121111

Ordenados:Ordenados: 1111 1212 1313 1616 1616 1717 18182121Moda = 16Moda = 16

Resumo das Resumo das Medidas de Tendência Medidas de Tendência

Central Central

MedidaMedida EquaçãoEquação DescriçãoDescriçãoMédiaMédia XXii / / nn Ponto de EquilíbrioPonto de EquilíbrioMedianaMediana ((nn+1)+1) PosiçãoPosição

22Valor CentralValor CentralQuando OrdenadosQuando Ordenados

ModaModa NenhumaNenhuma Mais FreqüenteMais Freqüente

Medidas de VariaçãoMedidas de Variaçãoou Dispersãoou Dispersão

Amplitude TotalAmplitude Total

1.1. Medida de dispersãoMedida de dispersão

2.2. Diferença entre maior e menor Diferença entre maior e menor observaçãoobservação

AmplitudeAmplitude XX XXmaiormaior menormenor

Amplitude TotalAmplitude Total

1.1. Medida de dispersãoMedida de dispersão

2.2. Diferença entre maior e menor Diferença entre maior e menor observaçãoobservação

3.3. Ignora como os dados estão distribuídosIgnora como os dados estão distribuídos

AmplitudeAmplitude XX XXmaiormaior menormenor

77 88 99 1010 77 88 99 1010

Variância e Desvio PadrãoVariância e Desvio Padrão

1.1. Medidas de dispersãoMedidas de dispersão

2.2. Medidas mais comunsMedidas mais comuns

3.3. Considera como os dados estão distribuídosConsidera como os dados estão distribuídos

Variância e Desvio PadrãoVariância e Desvio Padrão

1.1. Medidas de dispersãoMedidas de dispersão

2.2. Medidas mais comunsMedidas mais comuns

3.3. Considera como os dados estão Considera como os dados estão distribuídosdistribuídos

4.4. Mostra variação ao redor da média (Mostra variação ao redor da média (XX ou ou ))

44 66 88 1010 1212

XX = 8,3= 8,3

Fórmula da Variância Fórmula da Variância AmostralAmostral

SS

(X(X X)X)

nn

(X(X X)X) (X(X X)X) (X(X X)X)

nn

iiii

nn

nn

22

22

11

1122

2222 22

11

11

Fórmula da Variância Fórmula da Variância AmostralAmostral

nn - 1 no denominador! - 1 no denominador! (Use (Use NN se se VariânciaVariância Populacional)Populacional)SS

(X(X X)X)

nn

(X(X X)X) (X(X X)X) (X(X X)X)

nn

iiii

nn

nn

22

22

11

1122

2222 22

11

11

Fórmula do Desvio Padrão Fórmula do Desvio Padrão AmostralAmostral

SS SS

(X(X X)X)

nn

(X(X X)X) (X(X X)X) (X(X X)X)

nn

iiii

nn

nn

22

22

11

1122

2222 22

11

11

Exemplo da VariânciaExemplo da Variância

Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7

SS

(X(X X)X)

nnXX

XX

nn

SS

iiii

nn

iiii

nn

22

22

11 11

2222 22 22

1188 33

(10(10 33 88 3)3) (4(4 99 88 3)3) (7(7 77 88 3)3)

66 1166 368368

onde onde ,,

,, ,, ,, ,, ,, ,,

,,

QuestãoQuestão

Você deve analisar dados de um teste sobre um Você deve analisar dados de um teste sobre um determinado parâmetro de vôo. Os dados são:determinado parâmetro de vôo. Os dados são: 17, 16, 21, 18, 13, 16, 12, 1117, 16, 21, 18, 13, 16, 12, 11

Quais são a Quais são a variância variância e oe o desvio padrão desvio padrão dos dos dados?dados?

SoluçãoSolução

Variância AmostralVariância Amostral

Dados:Dados: 1717 1616 2121 1818 1313 1616 12121111

SS

(X(X X)X)

nnXX

XX

nn

SS

iiii

nn

iiii

nn

22

22

11 11

2222 22 22

111515 55

(17(17 1515 5)5) (16(16 1515 5)5) (11(11 1515 5)5)

88 1111111414

onde onde ,,

,, ,, ,,

,,

SoluçãoSolução

Desvio Padrão AmostralDesvio Padrão Amostral

SS SS

(X(X X)X)

nn

iiii

nn

22

22

11

1111111414 33 3434,, ,,

Resumo das Medidas de Resumo das Medidas de VariabilidadeVariabilidade

MedidaMedida EquaçãoEquação DescriçãoDescrição

Amplitude TotalAmplitude Total XXmaior maior - - XXmenormenor Dispersão TotalDispersão Total

Interv. InterquartílicoInterv. Interquartílico QQ3 3 - - QQ11 Dispersão 50% CentraisDispersão 50% Centrais

Desvio PadrãoDesvio Padrão(Amostral)(Amostral)

XX XX

nnii

22

11

Dispersão sobreDispersão sobreMédia AmostralMédia Amostral

Desvio PadrãoDesvio Padrão(Populacional)(Populacional)

XX

NNii

22 Dispersão sobreDispersão sobreMédia PopulacionalMédia Populacional

VariânciaVariância(Amostral)(Amostral)

((XXii --XX ))22

nn - 1- 1Dispersão QuadráticaDispersão Quadráticasobre Média Amostralsobre Média Amostral

FormaForma

FormaForma

1. Descreve como os dados estão distribuídos1. Descreve como os dados estão distribuídos

2. Medida pela simetria2. Medida pela simetria

SimétricaSimétricaMédiaMédia = = MedianaMediana = = ModaModa

FormaForma

1. Descreve como os dados estão distribuídos1. Descreve como os dados estão distribuídos

2. Medida pela simetria2. Medida pela simetria

Desvio à direitaDesvio à direitaDesvio à esquerdaDesvio à esquerda SimétricaSimétrica

Méd.Méd. = = MedianMedian = = ModaModaMéd.Méd. MedianMedian ModaModa ModaModa MedianMedian MédiaMédia

QuartisQuartis

QuartisQuartis

1.1. Medida de tendência Medida de tendência não-centralnão-central

2.2. Divide dados ordenados em 4 partesDivide dados ordenados em 4 partes

3.3. Posição do i-ésimo quartilPosição do i-ésimo quartil

25%25% 25%25% 25%25% 25%25%

QQ11 QQ22 QQ33

PosiçãoPosição dede QQii (n(n

ii 1)1)

44

Exemplo de Quartil (QExemplo de Quartil (Q11) )

Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7

Ordenados:Ordenados: 4,94,9 6,36,3 7,77,7 8,98,9 10,310,311,711,7

Posição:Posição: 11 22 33 44 5566Posição QPosição Q

QQ

1 1

11 1)1)

4411 (6(6 1)1)

44117575 22

66 3311

(n(n,,

,,

Exemplo de Quartil (QExemplo de Quartil (Q22))

Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7

Ordenados:Ordenados: 4,94,9 6,36,3 7,77,7 8,98,9 10,310,311,711,7

Posição:Posição: 11 22 33 44 5566Posição QPosição Q

QQ

2 2

22 1)1)

4422 (6(6 1)1)

4433 55

77 77 88 99

2288 3322

(n(n,,

,, ,,,,

Exemplo de Quartil (QExemplo de Quartil (Q33) )

Dados:Dados: 10,310,3 4,94,9 8,98,9 11,711,7 6,36,37,77,7

Ordenados:Ordenados: 4,94,9 6,36,3 7,77,7 8,98,9 10,310,311,711,7

Posição:Posição: 11 22 33 44 5566Posição QPosição Q

QQ

3 3

33 1)1)

4433 (6(6 1)1)

4455 2525 55

1010 3333

(n(n,,

,,

Intervalo InterquartílicoIntervalo Interquartílico

1.1. Medida de dispersãoMedida de dispersão

2.2. Também chamado dispersão centralTambém chamado dispersão central

3.3. Diferença entre terceiro e primeiro quartisDiferença entre terceiro e primeiro quartis

4.4. Dispersão dos 50% centraisDispersão dos 50% centrais

5.5. Não é afetado por valores extremosNão é afetado por valores extremos

IntervaloIntervalo InterquartílicoInterquartílico QQ QQ33 11

QuestãoQuestão

Você deve analisar dados de um teste sobre um Você deve analisar dados de um teste sobre um determinado parâmetro de vôo. Os dados são: determinado parâmetro de vôo. Os dados são:

17, 16, 21, 18, 13, 16, 12, 1117, 16, 21, 18, 13, 16, 12, 11

Quais são os Quais são os quartis Qquartis Q11 ee Q Q3 3 e o e o intervalo intervalo

interquartílicointerquartílico??

QQ11

Dados:Dados: 1717 1616 2121 1818 1313 1616 12121111

Ordenados:Ordenados: 1111 1212 1313 1616 1616 1717 18182121

Posição:Posição: 11 22 33 44 55 66 77 88

Solução do QuartilSolução do Quartil

Posição QPosição Q

QQ

1 1

11 1)1)

44

11 (8(8 1)1)

442225 25 22

121211

(n(n,,

Solução do QuartilSolução do Quartil

QQ33

Dados:Dados: 1717 1616 2121 1818 1313 1616 12121111

Ordenados:Ordenados: 1111 1212 1313 1616 1616 1717 18182121

Posição:Posição: 11 22 33 44 55 66 77 88Posição QPosição Q

QQ

33

33 1)1)

44

33 (8(8 1)1)

4466 7575 77

181833

(n(n,,

Solução do Intervalo Solução do Intervalo InterquartílicoInterquartílico

Intervalo InterquartílicoIntervalo Interquartílico

Dados:Dados: 1717 1616 2121 1818 1313 1616 12121111

Ordenados:Ordenados: 1111 1212 1313 1616 1616 1717 18182121

Posição:Posição: 11 22 33 44 55 66 77 88Intervalo Interquart.Intervalo Interquart. QQ QQ33 11 1818 1212 66

Recommended