42
Análise Bidimensional Análise Bidimensional

Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Análise BidimensionalAnálise Bidimensional

Page 2: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Associação entre variáveis qualitativas

Tabelas de Contigência

Page 3: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Podemos construir tabelas de freqüências conjuntas

(tabelas de contingência), relacionando duas

variáveis qualitativas.

Exemplo 1Exemplo 1: Há indícios de associação entre Sexo e

Hábito de fumar?

Como concluir?

Qual é o significado dos valores desta tabela?

Sexo Fuma Não Fuma Total

Masculino 20 37 57

Feminino 8 27 35

Total 28 64 92

Hábito de Fumar

Page 4: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

MTB > Table 'Sex' 'Smokes';

SUBC> Frequencies C3;

SUBC> Counts.

Rows: Sex Columns: Smokes

1 2 All

1 20 37 57

2 8 27 35

All 28 64 92

Page 5: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Verificar associação através da:Verificar associação através da:-- porcentagem segundo as colunasporcentagem segundo as colunas, ou, ou-- porcentagem segundo as linhas.porcentagem segundo as linhas.

Como concluir? Será que saber se uma pessoa é do sexo masculino ou feminino ajuda a prever se ela é fumante ? Ajuda muito ? Não ajuda muito ? E vice-versa ?

Sexo Fuma Não Fuma Total

Masculino 71,43% 57,81% 61,96%

Feminino 28,57% 42,19% 38,04%

Total 100% 100% 100%

Hábito de Fumar

Qual é o significado dos valores desta tabela?

Page 6: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

MTB > Table 'Sex' 'Smokes';MTB > Table 'Sex' 'Smokes';

SUBC> Frequencies C3;SUBC> Frequencies C3;

SUBC> ColPercentsSUBC> ColPercents. .

(RowPercents/(RowPercents/TotPercentsTotPercents))

Rows: Sex Columns: SmokesRows: Sex Columns: Smokes

1 2 All1 2 All

1 1 71,43 57,81 61,9671,43 57,81 61,96

2 2 28,57 42,19 38,0428,57 42,19 38,04

All All 100,00 100,00 100,00100,00 100,00 100,00

Page 7: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

MTB > Table 'Sex' 'Smokes';

SUBC> Frequencies C3;

SUBC> Counts;

SUBC> RowPercents.

Rows: Sex Columns: Smokes

1 2 All

1 20 37 57

35,0935,09 64,9164,91 100,00

2 8 27 35

22,8622,86 77,1477,14 100,00

All 28 64 92

30,4330,43 69,5769,57 100,00

Cell Contents – Count - % of Row

Page 8: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Associação entre variáveis quantitativas

Correlação e Regressão

Page 9: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Exemplos:Exemplos:Idade e altura das criançasTempo de prática de esportes e ritmo cardíacoTempo de estudo e nota na provaTaxa de desemprego e taxa de criminalidadeExpectativa de vida e taxa de analfabetismo

ObjetivoObjetivoEstudar a relação entre duas variáveis quantitativas.

Page 10: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

a)Quantificando a força dessa relação: correlação.

b)Explicitando a forma dessa relação: regressão.

Representação gráfica de duas variáveis quantitativas: Diagrama de dispersão

Investigaremos a presença ou ausência de relação linear sob dois pontos de vista:

Page 11: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Exemplo 1: nota da prova e tempo de estudo

X : tempo de estudo (em horas)Y : nota da prova

1050

9,5

8,5

7,5

6,5

5,5

4,5

3,5

Tempo

Nota

Diagrama de Dispersão

No MINITABMINITAB

Tempo:valores de X

Nota:valores de Y

MTB > plot Tempo*Nota

Tempo(X) Nota(Y)

3,0 4,5

7,0 6,5

2,0 3,7

1,5 4,0

12,0 9,3

Pares de observações (Xi , Yi) para cada estudante

Page 12: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Coeficiente de correlação linearCoeficiente de correlação linearÉ uma medida que avalia o quanto a “nuvem de pontos”no diagrama de dispersão aproxima-se de uma reta.

Produção

Preço do Litro de Leite

Page 13: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

O coeficiente de correlação linear de Pearsoncoeficiente de correlação linear de Pearson é dado por:

sendo que,

mente.respectivaY, e X de padrão desvios os são S e S

mente,respectiva Y, e X de amostrais médias as são Y e X

YX

Page 14: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Fórmula alternativa:

1)(

n

1i

=

∑=

n

XnX

S

i

22

2

Page 15: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

No exemplo:Tempo (X) Nota (Y)

3,0 4,5

7,0 6,5

2,0 3,7

1,5 4,0

12,0 9,3

25,5 28,0 41,2

25,53

5,76

5,89

1,71

2,31

)-X - (X )

-Y - (Y

5,6 -Y 5,1

-X ==

2,34 S 5,47 4

21,9

4(3,7)... (-1,1)

S

4,42 S 19,55 4

78,2

4(6,9)... (-2,1)

S

y

222y

x

222x

=⇒==++

=

=⇒==++

=

0,9959 2,34 . 4,42 . 4

41,2 r

Então,

==

00

3,76,9

-1,6-3,6

-1,9-3,1

0,91,9

-1,1-2,1

)-X - (X )

-Y - (Y

Page 16: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

No MINITAB temos:

MTB > corr Tempo Nota

Pearson correlation of Tempo and Nota = 0,996

Page 17: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Propriedade: -1 ≤≤≤≤ r ≤≤≤≤ 1

Casos particulares:

r = 1 ⇒⇒⇒⇒ correlação linear positiva e perfeitar = -1 ⇒⇒⇒⇒ correlação linear negativa e perfeitar = 0 ⇒⇒⇒⇒ inexistência de correlação linear

Page 18: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

r = 1, correlação linear positiva e perfeita

r = -1, correlação linear negativa e perfeita

Page 19: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

r 0≅

5040302010

40

30

20

10

X

Y

X

Y

121086420

6

5

4

3

2

1

Page 20: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

rr 11≅ rr --11≅

Page 21: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Exemplo 2: criminalidade e analfabetismo

Considere as duas variáveis observadas em 50 estados norte-americanos.

Y: taxa de criminalidadeX: taxa de analfabetismo

Page 22: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Diagrama de dispersão

Podemos notar que, conforme aumenta a taxa de analfabetismo (X), a taxa de criminalidade (Y) tende a aumentar. Nota-se também uma tendência linear.

Page 23: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Cálculo da correlação

Correlação entre X e Y:

Y= 7,38 _

(média de Y) e SY = 3,692 (desvio padrão de Y)

(média de X) e Sx = 0,609 (desvio padrão de X)X= 1,17_

ΣΣΣΣXiYi = 509,12

Page 24: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Exemplo 3: expectativa de vida e analfabetismo

Considere as duas variáveis observadas em 50 estados norte-americanos.

Y: expectativa de vidaX: taxa de analfabetismo

Page 25: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Diagrama de dispersão

Podemos notar que, conforme aumenta a taxa de analfabetismo (X), a expectativa de vida (Y) tende a diminuir. Nota-se também uma tendência linear.

Page 26: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Cálculo da correlação

Correlação entre X e Y:

Y= 70,88 _

(média de Y) e SY = 1,342 (desvio padrão de Y)

(média de X) e Sx = 0,609 (desvio padrão de X)X= 1,17_

ΣΣΣΣXiYi = 4122,8

Page 27: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Comentário:• Na interpretação do coeficiente de correlação é importante

visualizar o diagrama de dispersão.

Row X Y1 Y2 Y3 X4 Y4

1 10 8,04 9,14 7,46 8 6,58

2 8 6,95 8,14 6,77 8 5,76

3 13 7,58 8,74 12,74 8 7,71

4 9 8,81 8,77 7,11 8 8,84

5 11 8,33 9,26 7,81 8 8,47

6 14 9,96 8,10 8,84 8 7,04

7 6 7,24 6,13 6,08 8 5,25

8 4 4,26 3,10 5,39 19 12,50

9 12 10,84 9,13 8,15 8 5,56

10 7 4,82 7,26 6,42 8 7,91

11 5 5,68 4,74 5,73 8 6,89

ARQUIVO FA.MTW : 6 variáveis são medidas em 11 indivíduos

Pearson correlation of X and Y1 = 0,816

Pearson correlation of X and Y2 = 0,816

Pearson correlation of X and Y3 = 0,816

Pearson correlation of X4 and Y4 = 0,817

MTB > corr X Y1

⇒ Mesmos valores de correlação.

⇒ Qual a forma esperada da dispersão

conjunta destas variáveis?

Page 28: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Diagramas de dispersão e Coeficientes de Correlação

ARQUIVO FA.MTW

r = 0,816

X4

Y4

2018161412108

13

12

11

10

9

8

7

6

5

X

Y3

15,012,510,07,55,0

13

12

11

10

9

8

7

6

5

X

Y2

15,012,510,07,55,0

10

9

8

7

6

5

4

3

Dispersão

esperada!

X

Y1

15,012,510,07,55,0

11

10

9

8

7

6

5

4

Pontos

influentes!

Page 29: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Diagramas de Dispersão

Análise de Regressão

⇒⇒⇒⇒ Explicar a forma da relação por meio de uma função matemática: Y = a + bX

Page 30: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Reta ajustada:

O que são a e b?

a : intercepto

b : inclinação ou coeficiente angular

Análise de Regressão

Page 31: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Análise de Regressão

•Iguais coeficientes angulares

•Diferentes interceptos

•Diferentes coeficientes angulares

•Iguais interceptos

Page 32: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Reta ajustada:

Interpretação de b:

Para cada aumento de uma unidade em X, temos um aumento médio de b unidades em Y.

byy

xx

yy

xx

yytag

=−=

−+

−=

−=

12

11

12

12

12

1)(α

b

11 +x1x

2y

1y

Page 33: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Reta ajustada Reta ajustada (método de mínimos quadrados)(método de mínimos quadrados)

e1

e1

Page 34: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Reta ajustada Reta ajustada (método de mínimos quadrados)(método de mínimos quadrados)

Os coeficientes a e b são calculados da seguinte maneira:

( ) 2

1

1 X

n

i

ii

Sn

YXnYX

b−

=

∑=

XbYa −=

Page 35: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

No Exemplo 2,

A reta ajustada é:

Para um aumento de uma unidade na taxa do analfabetismo (X), a taxa de criminalidade (Y) aumenta, em média, 4,257 unidades.

smoanalfabeti de taxa :X

adecriminalid de taxa a para predito valor :Y

Interpretação de b:

Page 36: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Graficamente, temos

Como desenhar a reta no gráfico?

Page 37: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

No exemplo 3,

A reta ajustada é:

Interpretação de b:

smoanalfabeti de taxa:X

vidade aexpectativ a para predito valor :Y

Para um aumento de uma unidade na taxa do analfabetismo (X), a expectativa de vida (Y) diminui, em média, 1,296 anos.

Page 38: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Graficamente, temos

Page 39: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Exemplo 4: consumo de cerveja e temperatura

Y: consumo de cerveja diário por mil habitantes,em litros.

X: temperatura máxima (em ºC).

As variáveis foram observadas em novelocalidades com as mesmas característicasdemográficas e sócio-econômicas.

Page 40: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

Dados:

Localidade Temperatura Consumo Localidade Temperatura Consumo

(X) (Y) (X) (Y)

1 16 290

2 31 374

3 38 393

4 39 425

5 37 406

6 36 370

7 36 365

8 22 320

9 10 269

Page 41: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

40302010

400

350

300

Temperatura

Con

su

mo

Diagrama de dispersão

A correlação entre X e Y é r = 0,962.

Page 42: Aula 3 - Descritiva III B22010 [Modo de Compatibilidade]lane/home/MAE0116vet/Aula3Descritiva3ve… · Exemplo 3: expectativa de vida e analfabetismo Considere as duas variáveis observadas

A reta ajustada é:

Qual é o consumo previsto para uma temperatura de 25ºC?

Qual é a interpretação de b?

Aumentando-se um grau de temperatura (X), o consumo de cerveja (Y) aumenta, em média, 4,74 litros por mil habitantes.

( ) litros 87,3352574,437,217ˆ =+=Y