Upload
dangkhanh
View
220
Download
0
Embed Size (px)
Citation preview
Modelos de regressao
para dados correlacionados
Cibele [email protected]
ICMC USP
Mini-curso oferecido no
Workshop on Probabilistic and Statistical Methods
28 a 30 de janeiro de 2013
Cibele Russo (ICMC USP) Modelos para dados correlacionados 1 / 27
Conteudo do curso
Modelos de regressao
Modelos lineares com efeitos mistos
Modelo marginal × modelo hierarquico
Analise de diagnostico
Modelos nao lineares com efeitos mistos
Cibele Russo (ICMC USP) Modelos para dados correlacionados 2 / 27
Principais referencias bibliograficas
Pinheiro and Bates (2000) ‘Mixed-effects Models in S and S-PLUS’,
Springer.
Searle, S. R., Casella, G. McCulloch, C. E. 2006, Variance Components.
Wiley Series in Probability and Statistics.
Verbeke G. and Molenberghs G. (2000) ‘Linear mixed models for
longitudinal data,’ Springer Series in Statistics, Springer-Verlag, New-York.
Mini-curso de Geert Molenberghs ‘Models for Longitudinal and Incomplete
Data’ na ESALQ USP em 2010.
Mini-curso de Dimitris Rizopoulos ‘An Introduction to Joint Models for
Longitudinal & Survival Data, with Applications in R’ (Erasmus University
Medical Center) no 27th International Workshop on Statistical Modelling,
Prague.
... outras
Cibele Russo (ICMC USP) Modelos para dados correlacionados 3 / 27
Conteudo da aula
Introducao ao R
Motivacao
Modelos de regressao
Dados correlacionados
I Dados longitudinais
I Medidas repetidas
Objetivos da aulaApos esta aula, espera-se que os participantes sejam capazes de
Entender a utilidade de modelos de regressao
Identificar a presenca de correlacao entre observacoes
Acessar conjuntos de dados disponıveis no pacote R
Cibele Russo (ICMC USP) Modelos para dados correlacionados 4 / 27
Apoio computacional: R
O que e R?
R e uma linguagem e um ambiente para o desenvolvimento computacional
e grafico de ferramentas estatısticas.
E um software livre e de codigo aberto.
Download em www.r-project.org
Cibele Russo (ICMC USP) Modelos para dados correlacionados 5 / 27
Apoio computacional: R
Instrucoes:
Serao disponibilizados comandos em R, indicados pelo sımbolo ”>”, que
devera ser excluıdo no momento da execucao dos comandos.
Exercıcio: Instalar os pacotes que serao utilizados no curso.
Abra o R e execute o comando abaixo (apenas deixe de selecionar ”>”)
> install.packages(c(”stats”, ”nlme”, ”Hmisc”, ”lattice”))
Obs: Embora esteja no comando acima, ”stats” ja vem instalada R.
Certifique-se que os comandos foram passados corretamente para o R. Se preferir, utilize o
bloco de notas ou um editor para R, como o Tinn-R.
Cibele Russo (ICMC USP) Modelos para dados correlacionados 6 / 27
Apoio computacional: R
Algumas funcoes(bibliotecas) uteis em R para modelos de regressao e
modelos de regressao com efeitos mistos:
lm (stats): ajusta modelos lineares
nls (stats): ajusta modelos nao lineares
lme (nlme): ajusta modelos lineares com efeitos mistos
nlme (nlme): ajusta modelos nao lineares com efeitos mistos
Para mais informacoes, utilize comandos do tipo:
> ?lm
> ?lme
Cibele Russo (ICMC USP) Modelos para dados correlacionados 7 / 27
Modelos de regressao
Analise de regressao e uma ferramenta estatıstica que investiga a
relacao entre duas ou mais variaveis.
Modelo de regressao e um modelo matematico que envolve relacoes entre
as variaveis, parametros de interesse e componentes aleatorias.
Muitas vezes, existe correlacao entre medidas de uma certa variavel. Essa
correlacao deve ser levada em conta pelo modelo de regressao.
Cibele Russo (ICMC USP) Modelos para dados correlacionados 8 / 27
Motivacao: Dados correlacionados (Machines)
Com o objetivo de verificar a produtividade obtida com a utilizacao de tres
tipos de maquinas em um processo industrial, um experimento foi
realizado com seis trabalhadores, escolhidos ao acaso entre os funcionarios
de uma fabrica.
Cada funcionario utilizou cada maquina tres vezes (replicas), e foi obtido
um ındice de produtividade que levava em conta o numero e a qualidade
dos componentes produzidos.
Esse conjunto de dados esta disponıvel no pacote R com o nome
Machines{nlme}.
(Milliken, G. A. and Johnson, D. E. (1992), Analysis of Messy Data, Volume I: Designed
Experiments, Chapman and Hall, London.)
Cibele Russo (ICMC USP) Modelos para dados correlacionados 9 / 27
Motivacao: Dados de produtividade
Productivity score
Wor
ker
6
2
4
1
3
5
45 50 55 60 65 70
● ●●
● ●●
●●●
● ●●
● ●●
●● ●
● ● ●
●●●
●● ●
●●●
●●●
● ●●
●●●
●● ●
●●●
● ●●
●●●
●●●
● ● ●A B C
Cibele Russo (ICMC USP) Modelos para dados correlacionados 10 / 27
Motivacao: Dados de produtividade industrial
45
50
55
60
65
70
Machine
mea
n of
sco
re
A B C
Worker
531426
Grafico de interacao score × maquina
Cibele Russo (ICMC USP) Modelos para dados correlacionados 11 / 27
Como acessar os dados no R: Machines{nlme}
> library(nlme)
> data(Machines)
> names(Machines)
> plot(Machines)
Certifique-se que os comandos foram passados corretamente para o R.
Cibele Russo (ICMC USP) Modelos para dados correlacionados 12 / 27
Motivacao: Orthodont (dados ortodonticos)
Com o objetivo de estudar a variabilidade da distancia do centro da
pituitaria a fissura pterio maxilar em criancas, um experimento contou
com 27 criancas (16 meninos e 11 meninas) de idades entre 8 e 14 anos.
A cada dois anos foi feita uma medicao de tal distancia.
(Potthoff, R. F. and Roy, S. N. (1964), “A generalized multivariate analysis of variance model
useful especially for growth curve problems”, Biometrika, 51, 313-326.)
Cibele Russo (ICMC USP) Modelos para dados correlacionados 13 / 27
Motivacao: Orthodont (dados ortodonticos)
Fonte das figuras: http://diseases.blogcu.com/skull-base-anatomy/6229186
http://www.uchospitals.edu/online-library/content=CDR579645
Cibele Russo (ICMC USP) Modelos para dados correlacionados 14 / 27
Motivacao: Orthodont (dados ortodonticos)
Orthodont data
age
dist
ance
20
25
30
8 9 10 11 12 13 14
●
●
●
●
●
●●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●●
●●
● ●●
●
●
●●
●
●
●
●
●
●
● ●●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●●
●
●
●●
●
●
● ●
●
●
●●
●
● ●●
●
●
●
●●
●
● ●●
●●
● ●
Cibele Russo (ICMC USP) Modelos para dados correlacionados 15 / 27
Motivacao: Orthodont (dados ortodonticos)
Estudar a relacao entre a distancia do centro da pituitaria a fissura pterio
maxilar em criancas, a idade e o genero.
Orthodont data
age
dist
ance
20
25
30
8 9 10 11 12 13 14
●
●
●
●
●
●●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●●
●●
● ●●
●
●
●●
●
●
●
●
●
●
● ●●
●
●
●
●
●●
●
●
Male
8 9 10 11 12 13 14
●
●
●
●
●●
●
●
●
●●
●
●
●●
●
●
●●
●
●
● ●
●
●
●●
●
● ●●
●
●
●
●●
●
● ●●
●●
● ●
Female
Cibele Russo (ICMC USP) Modelos para dados correlacionados 16 / 27
Motivacao: Orthodont (dados ortodonticos)
Estudar a relacao entre a distancia do centro da pituitaria a fissura pterio
maxilar em criancas, a idade e o genero levando em consideracao a
correlacao entre as observacoes.
Orthodont data
age
dist
ance
20
25
30
8 9 10 11 12 13 14
●●
●
●
●
●
●
●
●
●●
●
● ●●
●
● ●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
● ●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●●
Male
8 9 10 11 12 13 14
●
● ●●
●
●
●●
●
● ●
●
●
●
●
●
●
●●
●
●
●●
●
●●
●
●
● ●●
●
●
●●
●
●
●●
●
●●
● ●
Female
Cibele Russo (ICMC USP) Modelos para dados correlacionados 17 / 27
Como acessar os dados no R: Orthodont {nlme}
> library(nlme)
> data(Orthodont)
> names(Orthodont)
> plot(Orthodont)
Cibele Russo (ICMC USP) Modelos para dados correlacionados 18 / 27
Motivacao: Dados correlacionados
Exemplo: Dados de hemodialise (Vonesh & Carter, 1992)
Estudar a relacao entre a taxa de ultrafiltracao (UFR) e a pressao da
transmembrana (TMP) em pacientes em hemodialise levando em
consideracao a presenca de grupos.
Dialyzer data
pressure
rate
0
20
40
60
0.5 1.0 1.5 2.0 2.5 3.0
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●● ●
●
●
●
●
● ●●
●
●
●
●
●●
●
●
●
●
●● ●
●
●
●
●
●
● ●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●●
●
●
●
●
●
● ● ●
●
●
●
●
●
● ●
●
●
●
●
●●
●
●
●
●
●
●
● ●
●●
●
●
●
●
●
(Vonesh, E. F. and Carter, R. L. (1992). Mixed-effects nonlinear regression for unbalanced repeated measures, Biometrics 48:
1–18.)
Cibele Russo (ICMC USP) Modelos para dados correlacionados 19 / 27
Motivacao: Dados correlacionados
Exemplo: Dados de hemodialise (Vonesh & Carter, 1992)
Estudar a relacao entre a taxa de ultrafiltracao (UFR) e a pressao da
transmembrana (TMP) em pacientes em hemodialise.
Dialyzer data
pressure
rate
0
20
40
60
0.5 1.0 1.5 2.0 2.5 3.0
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●● ●
●
●
●
●
● ●●
●
●
●
●
●●
●
●
●
●
●● ●
●
●
●
●
●
● ●
●
●
●
●
●●
●●
200
0.5 1.0 1.5 2.0 2.5 3.0
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●●
●
●
●
●
●
● ● ●
●
●
●
●
●
● ●
●
●
●
●
● ●●
●
●
●
●
●
● ●
●●
●
●
●
●●
300
Cibele Russo (ICMC USP) Modelos para dados correlacionados 20 / 27
Motivacao: Dados correlacionados
Exemplo: Dados de hemodialise (Vonesh & Carter, 1992)
Estudar a relacao entre a taxa de ultrafiltracao (UFR) e a pressao da
transmembrana (TMP) em pacientes em hemodialise levando em
consideracao a correlacao entre as observacoes.
Dialyzer data
pressure
rate
0
20
40
60
0.5 1.0 1.5 2.0 2.5 3.0
●
●
●
●●
●●
●
●
●
●● ●
●
●
●
●
●
●●
●
●
●
●
●
● ●●
●
●
●
●
●
●●
●
●
●
●
●● ●
●
●
●
●
● ●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
200
0.5 1.0 1.5 2.0 2.5 3.0
●
●
●
●
●
● ●
●●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
● ● ●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
● ●●
●
●
●
●
●●
●
●
●
●
●
●
● ●
300
Cibele Russo (ICMC USP) Modelos para dados correlacionados 21 / 27
Como acessar os dados no R: Dialyzer
> library(nlme)
> data(Dialyzer)
> names(Dialyzer)
> plot(Dialyzer)
Cibele Russo (ICMC USP) Modelos para dados correlacionados 22 / 27
Motivacao: Dados correlacionados
Exemplo: Dados farmacocineticos de theophylline
A concentracao da substancia anti asmatica theophylline no sangue e
medida apos a administracao oral da substancia.
Theophylline data
Time
conc
0
2
4
6
8
10
0 5 10 15 20 25
●
●
●
●
●
●●
●
●
●
●
●
●
●● ●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●●
●
●
● ●
●
●
●
●
●
●
●
● ●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
Cibele Russo (ICMC USP) Modelos para dados correlacionados 23 / 27
Motivacao: Dados correlacionados
Exemplo: Dados farmacocineticos de theophylline
A concentracao da substancia anti asmatica theophylline no sangue e
medida apos a administracao oral da substancia levando em consideracao
a correlacao existente entre as observacoes.
Theophylline data
Time
conc
0
2
4
6
8
10
0 5 10 15 20 25
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●● ●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
● ●
● ●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Cibele Russo (ICMC USP) Modelos para dados correlacionados 24 / 27
Motivacao: Dados correlacionados
Exemplo: Dados farmacocineticos de theophylline
A concentracao da substancia anti asmatica theophylline no sangue e
medida apos a administracao oral da substancia levando em consideracao
a correlacao existente entre as observacoes.
Theophylline data
Time
conc
0
2
4
6
8
10
0 5 10 15 20 25
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●● ●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
● ●
● ●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Cibele Russo (ICMC USP) Modelos para dados correlacionados 25 / 27
Como acessar os dados no R: Theophylline
> library(nlme)
> data(Theoph)
> names(Theoph)
> plot(Theoph)
Cibele Russo (ICMC USP) Modelos para dados correlacionados 26 / 27