27
Modelos de regress˜ ao para dados correlacionados Cibele Russo [email protected] ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo (ICMC USP) Modelos para dados correlacionados 1 / 27

Modelos de regress~ao para dados correlacionados · Modelos de regress~ao para dados correlacionados Cibele Russo [email protected] ICMC USP Mini-curso oferecido no Workshop on Probabilistic

Embed Size (px)

Citation preview

Modelos de regressao

para dados correlacionados

Cibele [email protected]

ICMC USP

Mini-curso oferecido no

Workshop on Probabilistic and Statistical Methods

28 a 30 de janeiro de 2013

Cibele Russo (ICMC USP) Modelos para dados correlacionados 1 / 27

Conteudo do curso

Modelos de regressao

Modelos lineares com efeitos mistos

Modelo marginal × modelo hierarquico

Analise de diagnostico

Modelos nao lineares com efeitos mistos

Cibele Russo (ICMC USP) Modelos para dados correlacionados 2 / 27

Principais referencias bibliograficas

Pinheiro and Bates (2000) ‘Mixed-effects Models in S and S-PLUS’,

Springer.

Searle, S. R., Casella, G. McCulloch, C. E. 2006, Variance Components.

Wiley Series in Probability and Statistics.

Verbeke G. and Molenberghs G. (2000) ‘Linear mixed models for

longitudinal data,’ Springer Series in Statistics, Springer-Verlag, New-York.

Mini-curso de Geert Molenberghs ‘Models for Longitudinal and Incomplete

Data’ na ESALQ USP em 2010.

Mini-curso de Dimitris Rizopoulos ‘An Introduction to Joint Models for

Longitudinal & Survival Data, with Applications in R’ (Erasmus University

Medical Center) no 27th International Workshop on Statistical Modelling,

Prague.

... outras

Cibele Russo (ICMC USP) Modelos para dados correlacionados 3 / 27

Conteudo da aula

Introducao ao R

Motivacao

Modelos de regressao

Dados correlacionados

I Dados longitudinais

I Medidas repetidas

Objetivos da aulaApos esta aula, espera-se que os participantes sejam capazes de

Entender a utilidade de modelos de regressao

Identificar a presenca de correlacao entre observacoes

Acessar conjuntos de dados disponıveis no pacote R

Cibele Russo (ICMC USP) Modelos para dados correlacionados 4 / 27

Apoio computacional: R

O que e R?

R e uma linguagem e um ambiente para o desenvolvimento computacional

e grafico de ferramentas estatısticas.

E um software livre e de codigo aberto.

Download em www.r-project.org

Cibele Russo (ICMC USP) Modelos para dados correlacionados 5 / 27

Apoio computacional: R

Instrucoes:

Serao disponibilizados comandos em R, indicados pelo sımbolo ”>”, que

devera ser excluıdo no momento da execucao dos comandos.

Exercıcio: Instalar os pacotes que serao utilizados no curso.

Abra o R e execute o comando abaixo (apenas deixe de selecionar ”>”)

> install.packages(c(”stats”, ”nlme”, ”Hmisc”, ”lattice”))

Obs: Embora esteja no comando acima, ”stats” ja vem instalada R.

Certifique-se que os comandos foram passados corretamente para o R. Se preferir, utilize o

bloco de notas ou um editor para R, como o Tinn-R.

Cibele Russo (ICMC USP) Modelos para dados correlacionados 6 / 27

Apoio computacional: R

Algumas funcoes(bibliotecas) uteis em R para modelos de regressao e

modelos de regressao com efeitos mistos:

lm (stats): ajusta modelos lineares

nls (stats): ajusta modelos nao lineares

lme (nlme): ajusta modelos lineares com efeitos mistos

nlme (nlme): ajusta modelos nao lineares com efeitos mistos

Para mais informacoes, utilize comandos do tipo:

> ?lm

> ?lme

Cibele Russo (ICMC USP) Modelos para dados correlacionados 7 / 27

Modelos de regressao

Analise de regressao e uma ferramenta estatıstica que investiga a

relacao entre duas ou mais variaveis.

Modelo de regressao e um modelo matematico que envolve relacoes entre

as variaveis, parametros de interesse e componentes aleatorias.

Muitas vezes, existe correlacao entre medidas de uma certa variavel. Essa

correlacao deve ser levada em conta pelo modelo de regressao.

Cibele Russo (ICMC USP) Modelos para dados correlacionados 8 / 27

Motivacao: Dados correlacionados (Machines)

Com o objetivo de verificar a produtividade obtida com a utilizacao de tres

tipos de maquinas em um processo industrial, um experimento foi

realizado com seis trabalhadores, escolhidos ao acaso entre os funcionarios

de uma fabrica.

Cada funcionario utilizou cada maquina tres vezes (replicas), e foi obtido

um ındice de produtividade que levava em conta o numero e a qualidade

dos componentes produzidos.

Esse conjunto de dados esta disponıvel no pacote R com o nome

Machines{nlme}.

(Milliken, G. A. and Johnson, D. E. (1992), Analysis of Messy Data, Volume I: Designed

Experiments, Chapman and Hall, London.)

Cibele Russo (ICMC USP) Modelos para dados correlacionados 9 / 27

Motivacao: Dados de produtividade

Productivity score

Wor

ker

6

2

4

1

3

5

45 50 55 60 65 70

● ●●

● ●●

●●●

● ●●

● ●●

●● ●

● ● ●

●●●

●● ●

●●●

●●●

● ●●

●●●

●● ●

●●●

● ●●

●●●

●●●

● ● ●A B C

Cibele Russo (ICMC USP) Modelos para dados correlacionados 10 / 27

Motivacao: Dados de produtividade industrial

45

50

55

60

65

70

Machine

mea

n of

sco

re

A B C

Worker

531426

Grafico de interacao score × maquina

Cibele Russo (ICMC USP) Modelos para dados correlacionados 11 / 27

Como acessar os dados no R: Machines{nlme}

> library(nlme)

> data(Machines)

> names(Machines)

> plot(Machines)

Certifique-se que os comandos foram passados corretamente para o R.

Cibele Russo (ICMC USP) Modelos para dados correlacionados 12 / 27

Motivacao: Orthodont (dados ortodonticos)

Com o objetivo de estudar a variabilidade da distancia do centro da

pituitaria a fissura pterio maxilar em criancas, um experimento contou

com 27 criancas (16 meninos e 11 meninas) de idades entre 8 e 14 anos.

A cada dois anos foi feita uma medicao de tal distancia.

(Potthoff, R. F. and Roy, S. N. (1964), “A generalized multivariate analysis of variance model

useful especially for growth curve problems”, Biometrika, 51, 313-326.)

Cibele Russo (ICMC USP) Modelos para dados correlacionados 13 / 27

Motivacao: Orthodont (dados ortodonticos)

Fonte das figuras: http://diseases.blogcu.com/skull-base-anatomy/6229186

http://www.uchospitals.edu/online-library/content=CDR579645

Cibele Russo (ICMC USP) Modelos para dados correlacionados 14 / 27

Motivacao: Orthodont (dados ortodonticos)

Orthodont data

age

dist

ance

20

25

30

8 9 10 11 12 13 14

●●

●●

●●

● ●

●●

●●

● ●●

●●

● ●●

●●

●●

●●

●●

●●

● ●

●●

● ●●

●●

● ●●

●●

● ●

Cibele Russo (ICMC USP) Modelos para dados correlacionados 15 / 27

Motivacao: Orthodont (dados ortodonticos)

Estudar a relacao entre a distancia do centro da pituitaria a fissura pterio

maxilar em criancas, a idade e o genero.

Orthodont data

age

dist

ance

20

25

30

8 9 10 11 12 13 14

●●

●●

●●

● ●

●●

●●

● ●●

●●

● ●●

●●

Male

8 9 10 11 12 13 14

●●

●●

●●

●●

● ●

●●

● ●●

●●

● ●●

●●

● ●

Female

Cibele Russo (ICMC USP) Modelos para dados correlacionados 16 / 27

Motivacao: Orthodont (dados ortodonticos)

Estudar a relacao entre a distancia do centro da pituitaria a fissura pterio

maxilar em criancas, a idade e o genero levando em consideracao a

correlacao entre as observacoes.

Orthodont data

age

dist

ance

20

25

30

8 9 10 11 12 13 14

●●

●●

● ●●

● ●

●●

●●

● ●●

●●

●●

●●

Male

8 9 10 11 12 13 14

● ●●

●●

● ●

●●

●●

●●

● ●●

●●

●●

●●

● ●

Female

Cibele Russo (ICMC USP) Modelos para dados correlacionados 17 / 27

Como acessar os dados no R: Orthodont {nlme}

> library(nlme)

> data(Orthodont)

> names(Orthodont)

> plot(Orthodont)

Cibele Russo (ICMC USP) Modelos para dados correlacionados 18 / 27

Motivacao: Dados correlacionados

Exemplo: Dados de hemodialise (Vonesh & Carter, 1992)

Estudar a relacao entre a taxa de ultrafiltracao (UFR) e a pressao da

transmembrana (TMP) em pacientes em hemodialise levando em

consideracao a presenca de grupos.

Dialyzer data

pressure

rate

0

20

40

60

0.5 1.0 1.5 2.0 2.5 3.0

●●

●●

●● ●

● ●●

●●

●● ●

● ●

●●

●●

● ●

●●

● ● ●

● ●

●●

● ●

●●

(Vonesh, E. F. and Carter, R. L. (1992). Mixed-effects nonlinear regression for unbalanced repeated measures, Biometrics 48:

1–18.)

Cibele Russo (ICMC USP) Modelos para dados correlacionados 19 / 27

Motivacao: Dados correlacionados

Exemplo: Dados de hemodialise (Vonesh & Carter, 1992)

Estudar a relacao entre a taxa de ultrafiltracao (UFR) e a pressao da

transmembrana (TMP) em pacientes em hemodialise.

Dialyzer data

pressure

rate

0

20

40

60

0.5 1.0 1.5 2.0 2.5 3.0

●●

●●

●● ●

● ●●

●●

●● ●

● ●

●●

●●

200

0.5 1.0 1.5 2.0 2.5 3.0

●●

● ●

●●

● ● ●

● ●

● ●●

● ●

●●

●●

300

Cibele Russo (ICMC USP) Modelos para dados correlacionados 20 / 27

Motivacao: Dados correlacionados

Exemplo: Dados de hemodialise (Vonesh & Carter, 1992)

Estudar a relacao entre a taxa de ultrafiltracao (UFR) e a pressao da

transmembrana (TMP) em pacientes em hemodialise levando em

consideracao a correlacao entre as observacoes.

Dialyzer data

pressure

rate

0

20

40

60

0.5 1.0 1.5 2.0 2.5 3.0

●●

●●

●● ●

●●

● ●●

●●

●● ●

● ●

●●

200

0.5 1.0 1.5 2.0 2.5 3.0

● ●

●●

●●

●●

● ● ●

● ●

● ●●

●●

● ●

300

Cibele Russo (ICMC USP) Modelos para dados correlacionados 21 / 27

Como acessar os dados no R: Dialyzer

> library(nlme)

> data(Dialyzer)

> names(Dialyzer)

> plot(Dialyzer)

Cibele Russo (ICMC USP) Modelos para dados correlacionados 22 / 27

Motivacao: Dados correlacionados

Exemplo: Dados farmacocineticos de theophylline

A concentracao da substancia anti asmatica theophylline no sangue e

medida apos a administracao oral da substancia.

Theophylline data

Time

conc

0

2

4

6

8

10

0 5 10 15 20 25

●●

●● ●

●●

●●

●●

●●

● ●

●●

●●

●●

● ●

● ●

● ●

● ●

Cibele Russo (ICMC USP) Modelos para dados correlacionados 23 / 27

Motivacao: Dados correlacionados

Exemplo: Dados farmacocineticos de theophylline

A concentracao da substancia anti asmatica theophylline no sangue e

medida apos a administracao oral da substancia levando em consideracao

a correlacao existente entre as observacoes.

Theophylline data

Time

conc

0

2

4

6

8

10

0 5 10 15 20 25

● ●

●●

●●

●●

● ●

●●

●●

●● ●

●●

●●

● ●

● ●

● ●

●●

Cibele Russo (ICMC USP) Modelos para dados correlacionados 24 / 27

Motivacao: Dados correlacionados

Exemplo: Dados farmacocineticos de theophylline

A concentracao da substancia anti asmatica theophylline no sangue e

medida apos a administracao oral da substancia levando em consideracao

a correlacao existente entre as observacoes.

Theophylline data

Time

conc

0

2

4

6

8

10

0 5 10 15 20 25

● ●

●●

●●

●●

● ●

●●

●●

●● ●

●●

●●

● ●

● ●

● ●

●●

Cibele Russo (ICMC USP) Modelos para dados correlacionados 25 / 27

Como acessar os dados no R: Theophylline

> library(nlme)

> data(Theoph)

> names(Theoph)

> plot(Theoph)

Cibele Russo (ICMC USP) Modelos para dados correlacionados 26 / 27

Proxima aula

Modelos de regressao

Cibele Russo (ICMC USP) Modelos para dados correlacionados 27 / 27