41
CE225 - Modelos Lineares Generalizados Cesar Augusto Taconeli 05 de agosto, 2019 Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 1 / 41

CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

CE225 - Modelos Lineares Generalizados

Cesar Augusto Taconeli

05 de agosto, 2019

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 1 / 41

Page 2: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Aula 1 - Introdução

Aula 1 - Introdução

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 2 / 41

Page 3: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Aula 1 - Introdução

Uma breve reflexão. . .

George BoxAll models are wrong but some are useful

Richard FeynmanNo matter how beautiful your theory, no matter how clever you are or whatyour name is, if it disagrees with experiment, it’s wrong.

John W. TukeyFar better an approximate answer to the right question, which is oftenvague, than an exact answer to the wrong question, which can always bemade precise.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 3 / 41

Page 4: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Aula 1 - Introdução

Modelos Lineares

Exemplos de modelos lineares:

Modelos de regressão linear;Modelos de análise de variância;Modelos de análise de covariância.

Nesta disciplina, frequentemente vamos usar o termo regressão deforma genérica, contemplando toda a classe de modelos lineares(generalizados).

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 4 / 41

Page 5: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Aula 1 - Introdução

Modelos Lineares

Modelos lineares descrevem a relação entre uma variável aleatória(resposta) e um conjunto de variáveis (fatores) explicativas.

Algumas restrições se aplicam aos modelos lineares:A relação entre as variáveis (reposta e explicativas) é descrita por umconjunto de parâmetros, por meio de uma função linear;

Condicional aos valores das variáveis explicativas, as respostas sãoindependentes, tem distribuição Normal e igual variância.

Embora válidas em muitos casos, tais suposições nem sempre sãosatisfeitas, tornando necessária a utilização de métodos mais flexíveis.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 5 / 41

Page 6: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Aula 1 - Introdução

Modelos Lineares Generalizados

Origem: Nelder e Wedderburn (1972): “Generalized Linear Models”,publicado em Journal of the Royal Statistical Society;

Extensão dos modelos lineares, incorporando, sob uma teoria unificada,diversos outros modelos propostos até então;

Tais modelos permitem contemplar, num contexto de análise deregressão, variáveis respostas pertencentes à família exponencial dedistribuições;

Como casos particulares da família exponencial temos as distribuiçõesbinomial, Poisson, Normal, Gama e Normal Inversa, dentre outras.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 6 / 41

Page 7: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Aula 1 - Introdução

Ilustração - alguns problemas abordados em MLG

Figura 1: Regressão com erros normais - I

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 7 / 41

Page 8: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Aula 1 - Introdução

Ilustração - alguns problemas abordados em MLG

Figura 2: Regressão com erros normais - II

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 8 / 41

Page 9: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Aula 1 - Introdução

Ilustração - alguns problemas abordados em MLG

Figura 3: Regressão para dados contínuos assimétricos

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 9 / 41

Page 10: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Aula 1 - Introdução

Ilustração - alguns problemas abordados em MLG

0.0

0.2

0.4

0.6

0.8

1.0

0 2 4 6 8 10 12 14 16

01

01

01

01

01

01

● ●

● ● ●●

●●

●● ● ●●

● ●

● ●

● ●●

● ●

●●

Figura 4: Regressão para dados bináriosCesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 10 / 41

Page 11: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Aula 1 - Introdução

Ilustração - alguns problemas abordados em MLG

0

1

2

3

4

5

6

1 2 3 4 5 6 7 8 9

●●

● ●

●●

● ●

Figura 5: Regressão para dados de contagensCesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 11 / 41

Page 12: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplos de motivação

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 12 / 41

Page 13: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 1 - Resistência de fibra sintética

Exemplo 1Dados de um experimento planejado com o objetivo de avaliar a resistênciade fibra sintética usada na fabricação de camisas. Foram consideradostecidos com diferentes quantidades de algodão em sua composição.

Variável resposta: Resistência da fibra (libras/pol2);

Variável explicativa: Porcentagem de algodão no tecido, fator comcinco níveis (15, 20, 25, 30 e 35%).

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 13 / 41

Page 14: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 1 - Resistência de fibra sintética

Tabela 1: Resistência (em libras/pol2) das amostras de tecido.

% Algodão Resistência do tecido15 7 7 15 11 920 12 17 12 18 1825 14 18 18 19 1930 19 25 22 19 2335 7 10 11 15 11

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 14 / 41

Page 15: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 1 - Resistência de fibra sintética

15 20 25 30 35

10

15

20

25

Porcentagem de algodão

Res

istê

ncia

do

teci

do

Figura 6: Gráfico de dispersão para as resistências das fibras sob cinco diferentesporcentagens de algodão

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 15 / 41

Page 16: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 1 - Resistência de fibra sintética

Objetivos da análise:

Analisar o efeito da porcentagem de algodão na resistência da fibrasintética;

Estimar a porcentagem ótima de algodão (aquela que proporcionamáxima resistência).

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 16 / 41

Page 17: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 2 - Mortalidade da praga do algodão

Exemplo 2Dados de um experimento planejado com o objetivo de avaliar amortalidade de insetos submetidos a doses crescentes de cipermetrina.Vinte insetos machos e 20 fêmeas foram submetidos a cada dose. Após 72horas de experimento, foram contados os insetos mortos.

Variável resposta: Número de insetos mortos;

Variáveis explicativas:Dose de cipermetrina: 1, 2, 4, 8, 16, 32 u.m.;Sexo (Macho ou Fêmea).

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 17 / 41

Page 18: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 2 - Mortalidade da praga do algodão

Tabela 2: Números de insetos mortos para as diferentes doses de cipermetrina

Dose Log2(Dose) Machos Fêmeas

1 0 1 02 1 4 24 2 9 68 3 13 1016 4 18 1232 5 20 16

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 18 / 41

Page 19: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 2 - Mortalidade da praga do algodão

0.00

0.25

0.50

0.75

1.00

0 1 2 3 4 5Log(Dose)

Pro

porç

ão d

e in

seto

s m

orto

s

Sexo

Femeas

Machos

Figura 7: Proporção de insetos mortos segundo sexo e dose de inseticida

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 19 / 41

Page 20: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 2 - Mortalidade da praga do algodão

Objetivos da análise:

Descrever (modelar) a variação na mortalidade de insetos segundo adose aplicada de inseticida;

Comparar as curvas de mortalidade de insetos machos e fêmeas;

Estimar doses efetivas (letais), que matam determinada proporção deinsetos.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 20 / 41

Page 21: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 3 - Diagnóstico de diabetes em mulheresindígenas

Exemplo 3Diagnóstico de diabetes e outras variáveis clínicas avaliadas em uma amostrade mulheres adultas indígenas de uma comunidade próxima a Phoenix,Arizona. A amostra contém os registros completos de 532 habitantes.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 21 / 41

Page 22: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 3 - Diagnóstico de diabetes em mulheresindígenas

Variável resposta:Diabetes: Diagnóstico de diabetes de acordo com o teste de glicemiaem jejum (0 - Negativo; 1 - Positivo);

Variáveis explicativas:Gest: Número de gestações;GlicOral: Concentração de glicose no teste oral de tolerância à glicose;Pressao: Pressão arterial diastólica (em mmHg);Prega: Espessura da prega tricipital (mm);IMC: Índice de massa corporal (peso/altura2);Pedigree: Índice referente ao histórico de diabetes na família;Idade: em anos.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 22 / 41

Page 23: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 3 - Diagnóstico de diabetes em mulheresindígenas

Tabela 3: Primeiras linhas da base

Gest GlicOral Pressao Prega IMC Pedigree Idade Diabetes

1 6 148 72 35 33.6 0.627 50 Sim2 1 85 66 29 26.6 0.351 31 Não4 1 89 66 23 28.1 0.167 21 Não5 0 137 40 35 43.1 2.288 33 Sim7 3 78 50 32 31.0 0.248 26 Sim9 2 197 70 45 30.5 0.158 53 Sim14 1 189 60 23 30.1 0.398 59 Sim15 5 166 72 19 25.8 0.587 51 Sim17 0 118 84 47 45.8 0.551 31 Sim19 1 103 30 38 43.3 0.183 33 Não

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 23 / 41

Page 24: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 3 - Diagnóstico de diabetes em mulheresindígenas

Tabela 4: Resumo - dados sobre diabetes

Gest GlicOral Pressao Prega

Min. : 0.000 Min. : 56.00 Min. : 24.00 Min. : 7.001st Qu.: 1.000 1st Qu.: 98.75 1st Qu.: 64.00 1st Qu.:22.00Median : 2.000 Median :115.00 Median : 72.00 Median :29.00Mean : 3.517 Mean :121.03 Mean : 71.51 Mean :29.18

3rd Qu.: 5.000 3rd Qu.:141.25 3rd Qu.: 80.00 3rd Qu.:36.00Max. :17.000 Max. :199.00 Max. :110.00 Max. :99.00

Tabela 5: Resumo - dados sobre diabetes (cont)

IMC Pedigree Idade Diabetes

Min. :18.20 Min. :0.0850 Min. :21.00 Não:3551st Qu.:27.88 1st Qu.:0.2587 1st Qu.:23.00 Sim:177Median :32.80 Median :0.4160 Median :28.00Mean :32.89 Mean :0.5030 Mean :31.61

3rd Qu.:36.90 3rd Qu.:0.6585 3rd Qu.:38.00Max. :67.10 Max. :2.4200 Max. :81.00

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 24 / 41

Page 25: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 3 - Diagnóstico de diabetes em mulheresindígenas

0

5

10

15

Não Sim

Diabetes

Ges

taçõ

es

50

100

150

200

Não Sim

Diabetes

Glic

ose

oral

20

40

60

80

100

Não Sim

Diabetes

Pre

ssão

Dia

stól

ica

25

50

75

100

Não Sim

Diabetes

Pre

ga tr

icip

ital

20

30

40

50

60

Não Sim

Diabetes

IMC

0.0

0.5

1.0

1.5

2.0

2.5

Não Sim

Diabetes

Ped

igre

e

20

40

60

80

Não Sim

Diabetes

Idad

e

Figura 8: Distribuição das variáveis explicativas segundo o diagnóstico de diabetes

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 25 / 41

Page 26: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 3 - Diagnóstico de diabetes em mulheresindígenas

Objetivos da análise:

Determinar um modelo preditivo para o diagnóstico de diabetes, comoalternativa ao teste de glicemia em jejum.

Identificar fatores de risco associados à diabetes.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 26 / 41

Page 27: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 4 - Acasalamento de elefantes

Exemplo 4Dados referentes ao número de acasalamentos bem sucedidos e idades de41 elefantes machos de uma população africana.

Variável resposta:Matings: Número de acasalamentos bem sucedidos;

Variável explicativa:Age: Idade (em anos).

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 27 / 41

Page 28: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 4 - Acasalamento de elefantes

Tabela 6: Dez linhas da base selecionadas ao acaso para visualização

Age Matings

32 247 741 343 243 929 043 028 129 239 1

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 28 / 41

Page 29: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 4 - Acasalamento de elefantes

0.0

2.5

5.0

7.5

30 35 40 45 50

Idade

Núm

ero

de a

casa

lam

ento

s

Figura 9: Número de acasalamentos versus idade.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 29 / 41

Page 30: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 4 - Acasalamento de elefantes

Objetivos da análise:

Analisar se há predominância de animais mais velhos na incidência deacasalamentos (o que pode induzir maior longevidade da espécie, pelatransmissão da carga genética).

Estimar a variação na taxa de acasalamentos bem sucedidos conformea idade.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 30 / 41

Page 31: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 5 - Infecções de ouvido em soldadosnorte-americanos

Exemplo 5Dados referentes à incidência de infecções de ouvido em uma amostra de287 soldados norte-americanos durante o ano de 1990.

Variável resposta:ninfec: Número de episódios de infecção (auto-declarado);

Variáveis explicativas:habito: Frequência com que costuma nadar (ocasional ou frequente);local: Local em que costuma nadar (praia ou piscina);idade: Categorizada em três faixas (15-19, 20-24 e 25-29);sexo: F: feminino; M: masculino.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 31 / 41

Page 32: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 5 - Infecções de ouvido em soldadosnorte-americanos

0

5

10

15

frequente ocasional

habito

Núm

ero

de in

fecç

ões

0

5

10

15

praia piscina

local

Núm

ero

de in

fecç

ões

0

5

10

15

15−19 20−24 25−29

idade

Núm

ero

de in

fecç

ões

0

5

10

15

F M

sexo

Núm

ero

de in

fecç

ões

Figura 10: Distribuição das frequências de episódios de infecção no ouvido

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 32 / 41

Page 33: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 5 - Infecções de ouvido em soldadosnorte-americanos

0.5 1.0 1.5 2.0 2.5

05

1015

Fitted values

Res

idua

ls

Residuals vs Fitted

47

31

249

−3 −2 −1 0 1 2 3

02

46

Theoretical Quantiles

Sta

ndar

dize

d re

sidu

als

Normal Q−Q

47

31

249

0.5 1.0 1.5 2.0 2.5

0.0

0.5

1.0

1.5

2.0

2.5

Fitted values

Sta

ndar

dize

d re

sidu

als

Scale−Location47

31

249

0.000 0.010 0.020 0.030

−2

02

46

Leverage

Sta

ndar

dize

d re

sidu

als

Cook's distance

Residuals vs Leverage

47

31

249

Figura 11: Gráficos de resíduos para o ajuste de um modelo linear

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 33 / 41

Page 34: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 5 - Infecções de ouvido em soldadosnorte-americanos

Objetivos da análise:

Verificar se há associação entre a frequência e o local onde os soldadoscostumam nadar e a incidência de infecção nos ouvidos.

Identificar perfis de soldados mais propensos a apresentar infecção.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 34 / 41

Page 35: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 6 - Sinistros em apólices de seguros deautomóveisExemplo 6Dados de 4624 apólices de seguros de automóveis que registraram sinistrono período de um ano, entre 2004 e 2005, para uma seguradora.

Variável resposta:claimcst0: Valor (somado) dos sinistros apresentados no período.

Variáveis explicativas:veh_value: Valor do veículo (em 10.000 dólares);veh_body: Tipo de veículo (12 categorias);veh_age: Idade do veículo (em quatro níveis - 1, 2, 3 ou 4, dos maisnovos aos mais antigos);gender: Sexo do motorista principal (F: feminino; M: masculino);area: Área da residência do motorista (seis áreas - A, B, C, D, E e F);agecat:Idade do motorista (em quatro níveis - 1, 2, 3, 4, 5 ou 6, dosmais novos aos mais velhos).Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 35 / 41

Page 36: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 6 - Sinistros em apólices de seguros deautomóveis

Tabela 7: Dez primeiras linhas da base

claimcst0 veh_value veh_body veh_age gender area agecat

15 0.0669510 1.66 SEDAN 3 M B 617 0.0806610 1.51 SEDAN 3 F F 418 0.0401805 0.76 HBACK 3 M C 441 0.1811710 1.89 STNWG 3 M F 265 0.5434440 4.06 STNWG 2 M F 366 0.0865790 1.39 HBACK 3 F A 496 0.1105770 2.66 STNWG 1 F F 599 0.0200000 0.50 HBACK 4 F A 5116 0.0739230 1.16 STNWG 4 F B 2125 0.3230600 3.56 MCARA 3 M F 4

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 36 / 41

Page 37: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 6 - Sinistros em apólices de seguros deautomóveis

Tabela 8: Resumo - dados sobre valores de sinistros

claimcst0 veh_value veh_body veh_age gender area agecat

Min. :0.02000 Min. : 0.000 SEDAN :1476 1: 825 F:2648 A:1085 1: 4961st Qu.:0.03538 1st Qu.: 1.100 HBACK :1264 2:1259 M:1976 B: 965 2: 932Median :0.07616 Median : 1.570 STNWG :1173 3:1362 C:1412 3:1113Mean :0.20144 Mean : 1.859 UTE : 260 4:1178 D: 496 4:1104

3rd Qu.:0.20914 3rd Qu.: 2.310 HDTOP : 130 E: 386 5: 614Max. :5.59221 Max. :13.900 TRUCK : 120 F: 280 6: 365

(Other): 201

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 37 / 41

Page 38: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 6 - Sinistros em apólices de seguros deautomóveis

0

1000

2000

0 2 4

Valor dos sinistros

Fre

quên

cia

Figura 12: Distribuição de frequências - seguros de automóveis

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 38 / 41

Page 39: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 6 - Sinistros em apólices de seguros deautomóveis

0

2

4

1 2 3 4 5 6 7 8 9 10 11 12 13

veh_body

Val

or d

os s

inis

tros

0

2

4

1 2 3 4

veh_ageV

alor

dos

sin

istr

os

0

2

4

0 5 10

Idade

Val

or d

os s

inis

tros

0

2

4

F M

gender

Val

or d

os s

inis

tros

0

2

4

A B C D E F

area

Val

or d

os s

inis

tros

0

2

4

1 2 3 4 5 6

agecatV

alor

dos

sin

istr

os

Figura 13: Distribuição dos valores de sinistros segundo as covariáveis

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 39 / 41

Page 40: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 6 - Sinistros em apólices de seguros deautomóveis

0.0

0.5

1.0

1.5

1 2 3 4 5 6 7 8 9 10 11 12 13

veh_body

Val

or d

os s

inis

tros

0.0

0.5

1.0

1.5

1 2 3 4

veh_ageV

alor

dos

sin

istr

os

0.0

0.5

1.0

1.5

0 5 10

Idade

Val

or d

os s

inis

tros

0.0

0.5

1.0

1.5

F M

gender

Val

or d

os s

inis

tros

0.0

0.5

1.0

1.5

A B C D E F

area

Val

or d

os s

inis

tros

0.0

0.5

1.0

1.5

1 2 3 4 5 6

agecatV

alor

dos

sin

istr

os

Figura 14: Distribuição dos valores de sinistros segundo as covariáveis(desconsiderando sinistros superiores a 15.000 dólares.

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 40 / 41

Page 41: CE225 - Modelos Lineares Generalizadostaconeli/CE22519/Aula1.pdf · Aula1-Introdução Umabrevereflexão... GeorgeBox Allmodelsarewrongbutsomeareuseful RichardFeynman Nomatterhowbeautifulyourtheory,nomatterhowcleveryouareorwhat

Exemplos de motivação

Exemplo 6 - Sinistros em apólices de seguros deautomóveis

Objetivos da análise:

Identificar fatores associados a maiores valores de sinistros;

Estabelecer um modelo para precificação de apólices.

Mãos a obra!

Cesar Augusto Taconeli CE225 - Modelos Lineares Generalizados 05 de agosto, 2019 41 / 41