40
Métodos Quantitativos PROF. DR. Renato Vicente

Métodos Quantitativos - ALESP · Métodos Quantitativos PROF. DR. Renato Vicente. Kit Básico de Estatística Descritiva 1. Procure sempre representar seus dados graficamente através

  • Upload
    hahanh

  • View
    229

  • Download
    0

Embed Size (px)

Citation preview

Métodos Quantitativos

PROF. DR. Renato Vicente

Kit Básico de Estatística Descritiva

1. Procure sempre representar seus dados graficamente atravésde um histograma ou gráfico de dispersão;

2. Procure por possíveis padrões tais como forma geral dohistograma (simetria, centro, dispersão) ou a presença deobservações muito diferentes da maioria (outliers);

3. Faça um sumário estatístico dos dados, calcule medidas de3. Faça um sumário estatístico dos dados, calcule medidas dedispersão e de posição. Faça um sumário de 5 números (min,max, q1,q3,mediana) ou calcule a média e o desvio padrão;

4. Se precisar comparar distribuições construa boxplots

Aula 3A

Estatística Descritiva: Exercícios

Exercício 1: Rendimento de um Plantação de Milho

Qual taxa de plantas por acre você sugeriria ?

MilPlantas/acre

Rendimento (1000 kg/acre)

12 3,8 2,9 3,0 3,612 3,8 2,9 3,0 3,616 4,2 3,1 3,4 3,820 4,2 3,3 3,5 3,824 3,4 3,5 4,028 3,0 3,8

Exercício 1: Rendimento de um Plantação de Milho

A. Construímos um gráfico de dispersão

3,5

4

4,5

Ren

dim

ento

(10

00 k

g/a

cre)

2

2,5

3

10 15 20 25 30

Mil Plantas/acre

Ren

dim

ento

(10

00 k

g/a

cre)

Exercício 1: Rendimento de um Plantação de Milho

B. Calculamos as medidas resumo

Mil Plantas/Acre Rendimento médio DP12 3,3 0,4416 3,6 0,4816 3,6 0,4820 3,7 0,3924 3,6 0,3228 3,4 0,57

Exercício 1: Rendimento de um Plantação de Milho

C. Costruímos um gráfico com barras de erro

3,5

4

4,5

Ren

dim

ento

(10

00 k

g/a

cre)

2

2,5

3

10 15 20 25 30

Mil Plantas/acre

Ren

dim

ento

(10

00 k

g/a

cre)

Exercício 2:Perdas ósseas em lactantes

Lactantes realmente perdem mais cálcio?

Mulheres em fase de amamentação

Outras mulheres

-4,7 -2,5 -4,9 -2,7 -0,8 2,4 0,0 0,9 -0,2 1,0-5,3 -8,3 -2.1 -6,8 -4,3 1,7 2,9 -0,6 -1,6 -2,22,2 -7,8 -3,1 -1,0 -6,5-1,8 -5,2 -5,7 -7,0 -0,3

Exercício 2:Perdas ósseas em lactantes

A. Organizam-se rols.

Mulheres em fase de amamentação

Outras mulheres

-8,3 -7,8 -7,0 -6,8 -6,5 -2,2 -1,6 -0,6 -0,2 0,0-8,3 -7,8 -7,0 -6,8 -6,5 -2,2 -1,6 -0,6 -0,2 0,0

-5,7 -5,3 -5.2 -4,9 -4,7 0,9 1,0 1,7 2,4 2,9

-4,3 -3,1 -2,7 -2,5 -2,1

-1,8 -1,0 -0,8 -0,3 2,2

Exercício 2:Perdas ósseas em lactantes

B. Calculam-se sumários de 5 números

Mulheres em fase de amamentação

Outras mulheres

MIN Q1 MED Q3 MAX MIN Q1 MED Q3 MAXMIN Q1 MED Q3 MAX MIN Q1 MED Q3 MAX

-8,3 -6,1 -4,5 -1,95 2,2 -2,2 -0,6 0,45 1,7 2,9

Exercício 2:Perdas ósseas em lactantes

C. Constrói-se o Box plot básico

-2

0+2

+4

PERDAÓSSEA

-8

-6

-4

-2

LACTANTES NÃO-LACTANTES

ÓSSEA (%)

Aula 3B

Estatística Descritiva: Exercícios II

Exercício 3: Cestinhas de Basquete

Qual o melhor jogador ?

JOGADOR A JOGADOR B

15 45 32 16 30 50 12 46 10 2090 26 52 34 40 0 52 44 10 45

Exercício 3: Cestinhas de Basquete

A. Organizamos o rol

Jogador A: 15 16 26 30 32 34 40 45 52 90

Jogador B: 0 10 10 12 20 44 45 46 50 52

Exercício 3: Cestinhas de Basquete

B. Calculamos sumários de 5 números

A: MIN=15 Q1=21 M=33 Q3=48 MAX=90

B: MIN=0 Q1= 10 M=32 Q3=48 MAX=52

Exercício 3: Cestinhas de Basquete

B. Construimos o box plot basico

60

70

80

90

100

1 2-10

0

10

20

30

40

50

CESTAS

JOGADOR

Exercício 4: Experimento de Darwin

A fertilização cruzada produz plantas que crescem mais?

Exercício 4: Experimento de Darwin

Calculamos sumários de 5 números.

Fertilizacao Cruzada AutoQ1 19.75 16.4MIN 12 12.8MEDIANA 21.5 18MEDIANA 21.5 18MAX 23.5 20.4Q3 22.1 18.6

Exercício 4: Experimento de Darwin

Construimos o boxplot (no Excel, apenas o esboçamos)

15

20

25

0

5

10

15

Cruzada Auto

Exercício 4: Experimento de Darwin

Boxplot no Excel

Curiosamente, não há uma forma de fazer um boxplot que sejaautomatizada no Excel. Para construí-lo é necessário seguir osseguintes passos:

1. Monte uma tabela com o sumário de 5 números na seqüênciaindicada abaixo:

SEXO F MQ1 1,6 1,72MIN 1,52 1,62

MEDIANA 1,66 1,75MAX 1,79 1,9Q3 1,7 1,82

Boxplot no Excel

2. Marque a tabela inteira, inclusive os títulos e selecione “InserirGráfico”. Escolha um gráfico de linhas e selecione “Seqüênciasem Linhas” ( o padrão é “Seqüências em Colunas”). Conclua aoperação, ajuste a escala e apague as legendas automáticas.Ao final deste passo você terá obtido:

2

1,4

1,5

1,6

1,7

1,8

1,9

2

F M

Boxplot no Excel

3. Selecione qualquer uma das séries, vá a “Formatar seqüênciasde dados> Opções”, escolha “Linhas de máximo e mínimo” e“Barras superiores/inferiores”.

2

1,4

1,5

1,6

1,7

1,8

1,9

F M

Exercício 5: Vermes e Plantas

Vermes afetam o crescimento e mudas ?

Quant. de Nematóides

Aumento na altura das mudas em centímetros

0 10,8 9,1 13,5 9,20 10,8 9,1 13,5 9,21000 11,1 11,1 8,2 11,35000 5,4 4,6 7,4 5,010000 5,8 5,3 3,2 7,5

Exercício 5: Vermes e Plantas

A. Construimos um gráfico de dispersão

810121416

Cre

scim

ento

(cm

)

02468

0 2000 4000 6000 8000 10000

Quantidade de Nematóides

Cre

scim

ento

(cm

)

Exercício 5: Vermes e Plantas

B. Calculamos medidas resumo.

Quantidade Média DP0 10,8 9,1 13,5 9,2 10,7 2,1

1000 11,1 11,1 8,2 11,3 10,4 1,5

Crescimento cm

5000 5,4 4,6 7,4 5 5,6 1,210000 5,8 5,3 3,2 7,5 5,5 1,8

Exercício 5: Vermes e Plantas

C. Construo um gráfico com barras de erro.

810121416

Cre

scim

ento

(cm

)

02468

0 2000 4000 6000 8000 10000

Quantidade de Nematóides

Cre

scim

ento

(cm

)

Aula 3C

Estatística Descritiva: Correlação

Variável Explicativa e Variável Resposta

Vinho é bom para o coração ?

150

200

250

300

350M

ort

es a

nu

ais

po

r p

rob

lem

as

card

íaco

s (a

cad

a 10

0.00

0 h

abit

ante

s)

0

50

100

0 2 4 6 8 10

Litros anuais de álcool proveniente do vinho por habitante

Mo

rtes

an

uai

s p

or

pro

ble

mas

ca

rdía

cos

(a c

ada

100.

000

hab

itan

tes)

A variável resposta mede o resultado de um estudo. A variável explicativa explica ou influencia a variável resposta.

Gráficos de Dispersão: PIB vs IDH

40

60

80

100

120

140R

anki

ng

do

PIB

(d

o m

ais

po

bre

p

ara

o m

ais

rico

)

0

20

0 0,2 0,4 0,6 0,8 1 1,2

Índice de Desenvolvimento Humano

Ran

kin

g d

o P

IB (

do

mai

s p

ob

re

par

a o

mai

s ri

co)

São a melhor maneira de visualizar a relação entre duas variáveis quantitativas.

Gráfico de Dispersão 2: Migração de Pássaros

Ocupação de Colônias de Pássaros

60

80

100

% d

e av

es d

o a

no

an

teri

or

qu

e re

torn

aram

0

20

40

0 5 10 15 20 25

Novos Adultos

% d

e av

es d

o a

no

an

teri

or

qu

e re

torn

aram

Gráfico de Dispersão 3: Cérebro e Inteligência

Há relação entre o tamanho do cérebro e inteligência ?

110115120125130

80859095

100105110

800 900 1000 1100 1200 1300 1400 1500

Volume do Cérebro (cm3)

QI

Gráfico de Dispersão 4: Cérebro e Inteligência, Homens e Mulheres

Há relação entre o tamanho do cérebro e inteligência ?

100

110

120

130

QI

80

90

100

800 900 1000 1100 1200 1300 1400 1500

Volume do Cérebro (cm3)homens mulheres

Quantificando associações lineares: Correlação de Pearson

O coeficiente de correlação de Pearson é definido da seguinte maneira:

http://www.stat.tamu.edu/~west/applets/rplot.html

Estudo de Caso: Classificação de um Fóssil

O Archaeopteryx é uma espécieextinta que possuía penas como umpássaro mas também possuíadentes e uma calda parecida com osrépteis. Ele é considerado umaespécie de elo perdido entre osrépteis e as aves.

Estudo de Caso: Classificação de um Fóssil

Seis fósseis já encontrados possuem características que os ligariam àespécie Archaeopteryx. No entanto eles diferem bastante emtamanho e há dúvidas quanto ao fato de todos representarem amesma espécie.

Estudo de Caso: Classificação de um Fóssil

Medimos os comprimentos dos ossos:

Fêmur (cm) 38 56 59 64 74

Úmero (cm) 41 63 70 72 84

Calculemos a correlação entre os comprimentos.

Estudo de Caso: Classificação de um Fóssil

Classificação de fósseis do Archaeopterix

50

60

70

80

90

Co

mp

rim

ento

do

úm

ero

(c

m)

30

40

50

30 40 50 60 70 80

Comprimento do fêmur (cm)

Co

mp

rim

ento

do

úm

ero

r = 0,994

Estudo de Caso2: Há motivação econômica na guerra do Iraque ?

O cientista político Daniel Drezner argumentou com base no gráfico acimaque Bush não estaria favorecendo empresas que contribuíram em suacampanha.

Estudo de Caso2: Há motivação econômica na guerra do Iraque ?

Utilizando os logaritmos das quantidades ao invés das quantidades ocoeficiente de correlação é bem maior r=06017. A correlação linear sóserve para detectar dependências lineares.