128
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear LGN5830 - Biometria de Marcadores Genéticos Tópico 7: Mapeamento de QTLs I Análise dos Marcadores Individualmente Antonio Augusto Franco Garcia http://about.me/augusto.garcia [email protected] Departamento de Genética ESALQ/USP 2017

LGN5830 - Biometria de Marcadores Genéticos - Tópico 7 ...augustogarcia.me/Biometria-de-Marcadores/pdfs/aula7.pdf · AnálisedosMarcadoresIndividualmente ModelosLineares RegressãoLinear

Embed Size (px)

Citation preview

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

LGN5830 - Biometria de Marcadores GenéticosTópico 7: Mapeamento de QTLs I

Análise dos Marcadores Individualmente

Antonio Augusto Franco Garciahttp://about.me/augusto.garcia

[email protected]

Departamento de GenéticaESALQ/USP

2017

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Conteúdo

1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas

2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes

3 Regressão LinearResultadosReferências

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Conteúdo

1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas

2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes

3 Regressão LinearResultadosReferências

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Conteúdo

1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas

2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes

3 Regressão LinearResultadosReferências

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Introdução

Conteúdo

1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas

2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes

3 Regressão LinearResultadosReferências

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Introdução

O que são QTLs?

Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo

Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar

1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E

Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)

Mapeamento: primeiro passo em direção a estudos mais detalhados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Introdução

O que são QTLs?

Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo

Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar

1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E

Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)

Mapeamento: primeiro passo em direção a estudos mais detalhados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Introdução

O que são QTLs?

Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo

Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar

1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E

Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)

Mapeamento: primeiro passo em direção a estudos mais detalhados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Introdução

O que são QTLs?

Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo

Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar

1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E

Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)

Mapeamento: primeiro passo em direção a estudos mais detalhados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Introdução

O que são QTLs?

Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo

Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar

1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E

Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)

Mapeamento: primeiro passo em direção a estudos mais detalhados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Introdução

O que são QTLs?

Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo

Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar

1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E

Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)

Mapeamento: primeiro passo em direção a estudos mais detalhados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Introdução

O que são QTLs?

Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo

Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar

1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E

Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)

Mapeamento: primeiro passo em direção a estudos mais detalhados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Introdução

O que são QTLs?

Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo

Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar

1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E

Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)

Mapeamento: primeiro passo em direção a estudos mais detalhados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Introdução

O que são QTLs?

Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo

Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar

1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E

Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)

Mapeamento: primeiro passo em direção a estudos mais detalhados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Introdução

O que são QTLs?

Quantitative Trait Loci: locos que contribuem para a variação de umcaráter quantitativo

Mapeamento: identificação de tais locos em cruzamentosexperimentaisArquitetura Genética: estimar

1 Número de QTLs2 Localização dos mesmos no mapa/genoma3 Seus efeitos4 Interações entre si (epistasia)5 Interações QTL× E

Importância: melhor entendimento dos caracteres de importância(agronômica, biológica, evolutiva, econômica, etc)

Mapeamento: primeiro passo em direção a estudos mais detalhados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Conteúdo

1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas

2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes

3 Regressão LinearResultadosReferências

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Marcadores - dados brutosAzul: Aa; amarelo: AA

1 2 3 4 5 6 7 8 9 10 11 12 13 14

17

1422

3038

4654

6270

7886

9410

3

Mouse Data

Marcadores

Indi

vídu

os

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Mapa Genético estimado

1 2 3 4 5 6 7 8 9 10 11 12 13 14

17

1422

3038

4654

6270

7886

9410

3

Mouse Data

Marcadores

Indi

vídu

os

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Mapa Genético

2 4 6 8 10 12 14

2

4

6

8

10

12

14

Markers

Mar

kers

c1

c1

Mapa construído

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Mapa Genético

0 10 20 30 40 50

Chromosome c1

Location (cM)

Indi

vidu

al

302928272625242322212019181716151413121110

987654321 ●

●●

●●

●●●●

●●●

●●

●●

●●●●

●●●

●●

●●

●●●●

●●●

●●

●●

●●●●

●●●

●●●

●●

●●●●

●●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●●●

●●●

●●●

●●●●

●●

●●

●●

●●●●

●●●

●●

●●

●●●●

●●●

●●

●●

●●●●

●●●

●●

●●

●●●●

●●●

●●●

●●

●●●●

●●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●

●●●●

●●●

●●

●●●

●●

●●●●

●●●

●●

●●●

●●●

●●●●

●●●

●●●

●●●●

●●

●●

●●●

●●●●●

●●

●●

●●●

●●●●●

●●

●●

●●●

●●●●●

●●

●●

●●●

●●●●●

●●

●●

●●

●●●●●

●●

●●

●●

●●●●

●●

●●●●

●●●

●●

●●●●

●●●

●●

●●●●

●●●

●●

●●●●

●●●

●●

●●●●

●●●

●●

●●●●

●●●

●●

●●●●

●●

●●●

●●●

●●●●

●●

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Dados Fenotípicos e Genotípicos

Mouse DataBW

[1,] 50 1 1 1 1 1 1 1 1 1 1 1 1 1 1[2,] 54 1 1 1 1 1 1 1 1 1 1 1 1 1 0[3,] 49 0 1 1 1 1 1 1 1 1 1 1 1 1 1[4,] 41 0 0 0 0 0 0 0 0 0 0 0 0 0 0[5,] 36 1 1 1 1 1 1 1 1 1 1 1 1 1 1

...[99,] 50 0 0 0 0 0 0 0 0 0 0 0 0 0 0

[100,] 45 1 1 1 1 0 0 0 0 0 0 0 0 0 0[101,] 43 1 1 1 0 0 0 0 0 0 0 0 0 0 0[102,] 37 0 0 0 0 0 0 0 0 0 0 0 0 0 1[103,] 35 1 0 0 0 0 0 0 0 0 0 0 0 0 0

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Caráter Quantitativo

2040

6080

100

BW (peso corporal)

Caráter Quantitativo

Indi

vídu

os

Histograma

BW

Fre

quên

cia

30 40 50 60 70 80

05

1015

20

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Dados Fenotípicos e Genotípicos

1 2 3 4 5 6 7 8 9 10 11 12 13 14

15

914

2026

3238

4450

5662

6874

8086

9298

Marcadores

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Dados Fenotípicos e GenotípicosAzul: Aa; amarelo: AA

1 2 3 4 5 6 7 8 9 10 11 12 13 14

15

914

2026

3238

4450

5662

6874

8086

9298

Marcadores

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Dados Fenotípicos e Genotípicos

1 2 3 4 5 6 7 8 9 10 11 12 13 14

14

710

1418

2226

3034

3842

4650

5458

6266

7074

7882

8690

9498

102

Marcadores

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Conteúdo

1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas

2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes

3 Regressão LinearResultadosReferências

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Motivação

Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)

Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas

Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)

Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…

Single Marker Analysis vs Análise de Marcas Simples (?)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Motivação

Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)

Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas

Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)

Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…

Single Marker Analysis vs Análise de Marcas Simples (?)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Motivação

Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)

Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas

Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)

Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…

Single Marker Analysis vs Análise de Marcas Simples (?)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Motivação

Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)

Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas

Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)

Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…

Single Marker Analysis vs Análise de Marcas Simples (?)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Motivação

Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)

Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas

Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)

Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…

Single Marker Analysis vs Análise de Marcas Simples (?)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Classes genotípicas

Mouse data

1 2 3 4 5 6 7 8 9 10 11 12 13 14

14

710

1418

2226

3034

3842

4650

5458

6266

7074

7882

8690

9498

102

Marcadores

30

40

50

60

70

80

Genotype

BW

M1

●●

● ●

●●

AA AB

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Classes genotípicas

Mouse data, M1

30

40

50

60

70

80

Genotype

BW

M1

●●

● ●

●●

AA AB

●●

●●

●●

●●

●●

●●

●●

●●

● ●

0 1

3040

5060

7080

M1

Genótipo

Fen

ótip

o

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Regressão Linear Simples

Modelo Linear, Retrocruzamento

yj = µ+ βxj + εj

j = 1, 2, . . . , n

yj = valor fenotípico do indivíduo j

µ = intercepto

xj =

{1 se o indivíduo j tem genótipoMi/Mi

0 se o indivíduo j tem genótipoMi/mi

β = coeficiente de regressão linear (efeitos genéticos)

εj ∼ N(0, σ2)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Regressão Linear Simples

Mouse - M1

●●

●●

●●

●●

●●

●●

●●

●●

● ●

0 1

3040

5060

7080

M1

Genótipo

Fen

ótip

o

Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0

Note que β = tan(α) = µ1−µ0

1 = µ1 − µ0

Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0

Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Regressão Linear Simples

Mouse - M1

●●

●●

●●

●●

●●

●●

●●

●●

● ●

0 1

3040

5060

7080

M1

Genótipo

Fen

ótip

o

Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0

Note que β = tan(α) = µ1−µ0

1 = µ1 − µ0

Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0

Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Regressão Linear Simples

Mouse - M1

●●

●●

●●

●●

●●

●●

●●

●●

● ●

0 1

3040

5060

7080

M1

Genótipo

Fen

ótip

o

Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0

Note que β = tan(α) = µ1−µ0

1 = µ1 − µ0

Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0

Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Análises Estatísticas

Regressão Linear Simples

Mouse - M1

●●

●●

●●

●●

●●

●●

●●

●●

● ●

0 1

3040

5060

7080

M1

Genótipo

Fen

ótip

o

Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0

Note que β = tan(α) = µ1−µ0

1 = µ1 − µ0

Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0

Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Conteúdo

1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas

2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes

3 Regressão LinearResultadosReferências

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Motivação

y: variável resposta

x: variável preditora (independente)

y = f(x) (Função, processo determinístico)

Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)

EsperançaVariânciaDistribuição de Probabilidades(Incerteza)

George Box

“All models are wrong, but some are useful”

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Motivação

y: variável resposta

x: variável preditora (independente)

y = f(x) (Função, processo determinístico)

Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)

EsperançaVariânciaDistribuição de Probabilidades(Incerteza)

George Box

“All models are wrong, but some are useful”

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Motivação

y: variável resposta

x: variável preditora (independente)

y = f(x) (Função, processo determinístico)

Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)

EsperançaVariânciaDistribuição de Probabilidades(Incerteza)

George Box

“All models are wrong, but some are useful”

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Motivação

y: variável resposta

x: variável preditora (independente)

y = f(x) (Função, processo determinístico)

Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)

EsperançaVariânciaDistribuição de Probabilidades(Incerteza)

George Box

“All models are wrong, but some are useful”

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Motivação

y: variável resposta

x: variável preditora (independente)

y = f(x) (Função, processo determinístico)

Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)

EsperançaVariânciaDistribuição de Probabilidades(Incerteza)

George Box

“All models are wrong, but some are useful”

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Motivação

y: variável resposta

x: variável preditora (independente)

y = f(x) (Função, processo determinístico)

Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)

EsperançaVariânciaDistribuição de Probabilidades(Incerteza)

George Box

“All models are wrong, but some are useful”

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Motivação

y: variável resposta

x: variável preditora (independente)

y = f(x) (Função, processo determinístico)

Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)

EsperançaVariânciaDistribuição de Probabilidades(Incerteza)

George Box

“All models are wrong, but some are useful”

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Motivação

y: variável resposta

x: variável preditora (independente)

y = f(x) (Função, processo determinístico)

Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)

EsperançaVariânciaDistribuição de Probabilidades(Incerteza)

George Box

“All models are wrong, but some are useful”

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Motivação

y: variável resposta

x: variável preditora (independente)

y = f(x) (Função, processo determinístico)

Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)

EsperançaVariânciaDistribuição de Probabilidades(Incerteza)

George Box

“All models are wrong, but some are useful”

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Motivação

y: variável resposta

x: variável preditora (independente)

y = f(x) (Função, processo determinístico)

Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)

EsperançaVariânciaDistribuição de Probabilidades(Incerteza)

George Box

“All models are wrong, but some are useful”

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Sistemas de Equações

Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g

yi = g

Sistema inconsistente

Abordagem ingênua do problema

(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Sistemas de Equações

Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g

yi = g

Sistema inconsistente

Abordagem ingênua do problema

(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Sistemas de Equações

Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g

yi = g

Sistema inconsistente

Abordagem ingênua do problema

(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Sistemas de Equações

Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g

yi = g

Sistema inconsistente

Abordagem ingênua do problema

(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Sistemas de Equações

Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g

yi = g

Sistema inconsistente

Abordagem ingênua do problema

(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Sistema de Equações

Feijão

yi = g + eiy1 = 4 = g + e1y2 = 5 = g + e2y3 = 2 = g + e3y4 = 3 = g + e4

ei: variável aleatóriaDistribuição de ProbabilidadesE(ei), V ar(ei)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Sistema de Equações

Feijão

yi = g + eiy1 = 4 = g + e1y2 = 5 = g + e2y3 = 2 = g + e3y4 = 3 = g + e4

ei: variável aleatóriaDistribuição de ProbabilidadesE(ei), V ar(ei)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Sistema de Equações

Feijão

yi = g + eiy1 = 4 = g + e1y2 = 5 = g + e2y3 = 2 = g + e3y4 = 3 = g + e4

ei: variável aleatóriaDistribuição de ProbabilidadesE(ei), V ar(ei)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Distribuição de Probabilidades do Erro

Distribuição Normal

0.0

0.2

0.4

0.0 2.5 5.0 7.5 10.0g

ei ∼ N(µ, σ2)

Sem viés: ei ∼ N(0, σ2)

Viés? Pode ser algum efeito que não mensuramos!

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Distribuição de Probabilidades do Erro

Distribuição Normal

0.0

0.2

0.4

0.0 2.5 5.0 7.5 10.0g

ei ∼ N(µ, σ2)

Sem viés: ei ∼ N(0, σ2)

Viés? Pode ser algum efeito que não mensuramos!

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Distribuição de Probabilidades do Erro

Distribuição Normal

0.0

0.2

0.4

0.0 2.5 5.0 7.5 10.0g

ei ∼ N(µ, σ2)

Sem viés: ei ∼ N(0, σ2)

Viés? Pode ser algum efeito que não mensuramos!

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Distribuição de Probabilidades do Erro

Distribuição Normal

0.0

0.2

0.4

0.0 2.5 5.0 7.5 10.0g

ei ∼ N(µ, σ2)

Sem viés: ei ∼ N(0, σ2)

Viés? Pode ser algum efeito que não mensuramos!

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Efeito não incluído no modelo

Feijão, problema na irrigação

yi = g + eiy1 = 4 + 1 = g + e1y2 = 5 + 1 = g + e2y3 = 2 + 0 = g + e3y4 = 3 + 0 = g + e4

Claramente, o erro não é centrado em 0 (e sim em 1/2)g será superestimado se assumirmos ei ∼ N(0, σ2)Violação de suposição

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Efeito não incluído no modelo

Feijão, problema na irrigação

yi = g + eiy1 = 4 + 1 = g + e1y2 = 5 + 1 = g + e2y3 = 2 + 0 = g + e3y4 = 3 + 0 = g + e4

Claramente, o erro não é centrado em 0 (e sim em 1/2)g será superestimado se assumirmos ei ∼ N(0, σ2)Violação de suposição

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Efeito não incluído no modelo

Feijão, problema na irrigação

yi = g + eiy1 = 4 + 1 = g + e1y2 = 5 + 1 = g + e2y3 = 2 + 0 = g + e3y4 = 3 + 0 = g + e4

Claramente, o erro não é centrado em 0 (e sim em 1/2)g será superestimado se assumirmos ei ∼ N(0, σ2)Violação de suposição

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Erro centrado

g = yi =

∑yi

ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g

Diferença entre erro (modelo) e resíduos (após ajuste do modelo)

ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)

Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Erro centrado

g = yi =

∑yi

ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g

Diferença entre erro (modelo) e resíduos (após ajuste do modelo)

ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)

Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Erro centrado

g = yi =

∑yi

ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g

Diferença entre erro (modelo) e resíduos (após ajuste do modelo)

ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)

Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Erro centrado

g = yi =

∑yi

ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g

Diferença entre erro (modelo) e resíduos (após ajuste do modelo)

ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)

Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Erro centrado

g = yi =

∑yi

ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g

Diferença entre erro (modelo) e resíduos (após ajuste do modelo)

ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)

Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Fundamentos

Erro centrado

g = yi =

∑yi

ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g

Diferença entre erro (modelo) e resíduos (após ajuste do modelo)

ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)

Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Conteúdo

1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas

2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes

3 Regressão LinearResultadosReferências

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Notação matricial

Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente

Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11

Ax = b

Am,n =

[2 31 −4

]; xn,1 =

[x1x2

]; bm,1 =

[13

−11

]Am,nxn,1 = bm,1

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Notação matricial

Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente

Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11

Ax = b

Am,n =

[2 31 −4

]; xn,1 =

[x1x2

]; bm,1 =

[13

−11

]Am,nxn,1 = bm,1

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Notação matricial

Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente

Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11

Ax = b

Am,n =

[2 31 −4

]; xn,1 =

[x1x2

]; bm,1 =

[13

−11

]Am,nxn,1 = bm,1

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Notação matricial

Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente

Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11

Ax = b

Am,n =

[2 31 −4

]; xn,1 =

[x1x2

]; bm,1 =

[13

−11

]Am,nxn,1 = bm,1

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Notação matricial

Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente

Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11

Ax = b

Am,n =

[2 31 −4

]; xn,1 =

[x1x2

]; bm,1 =

[13

−11

]Am,nxn,1 = bm,1

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Notação matricial

Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente

Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11

Ax = b

Am,n =

[2 31 −4

]; xn,1 =

[x1x2

]; bm,1 =

[13

−11

]Am,nxn,1 = bm,1

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Álgebra

Soma

Am,n +Bm,n =

[1 34 2

]+

[2 40 3

]=

[3 74 5

]Subtração

Am,n −Bm,n =

[1 34 2

]−

[2 40 3

]=

[−1 −14 −1

]Transposição

A⊤ =

[1 43 2

]; B⊤ =

[2 04 3

]

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Álgebra

Soma

Am,n +Bm,n =

[1 34 2

]+

[2 40 3

]=

[3 74 5

]Subtração

Am,n −Bm,n =

[1 34 2

]−

[2 40 3

]=

[−1 −14 −1

]Transposição

A⊤ =

[1 43 2

]; B⊤ =

[2 04 3

]

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Álgebra

Soma

Am,n +Bm,n =

[1 34 2

]+

[2 40 3

]=

[3 74 5

]Subtração

Am,n −Bm,n =

[1 34 2

]−

[2 40 3

]=

[−1 −14 −1

]Transposição

A⊤ =

[1 43 2

]; B⊤ =

[2 04 3

]

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Algumas Operações

Multiplicação[1 34 2

] [2 40 3

]=

[1(2) + 3(0) 1(4) + 3(3)4(2) + 2(0) 4(4) + 2(3)

]=

[2 138 22

][1 34 2

] [23

]=

[1(2) + 3(3)4(2) + 2(3)

]=

[1114

]

x =

[12

]; x⊤x =

[1 2

] [12

]= 1(1) + 2(2) = 12 + 22 = 5

x⊤x: Soma de Quadrados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Algumas Operações

Multiplicação[1 34 2

] [2 40 3

]=

[1(2) + 3(0) 1(4) + 3(3)4(2) + 2(0) 4(4) + 2(3)

]=

[2 138 22

][1 34 2

] [23

]=

[1(2) + 3(3)4(2) + 2(3)

]=

[1114

]

x =

[12

]; x⊤x =

[1 2

] [12

]= 1(1) + 2(2) = 12 + 22 = 5

x⊤x: Soma de Quadrados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Algumas Operações

Multiplicação[1 34 2

] [2 40 3

]=

[1(2) + 3(0) 1(4) + 3(3)4(2) + 2(0) 4(4) + 2(3)

]=

[2 138 22

][1 34 2

] [23

]=

[1(2) + 3(3)4(2) + 2(3)

]=

[1114

]

x =

[12

]; x⊤x =

[1 2

] [12

]= 1(1) + 2(2) = 12 + 22 = 5

x⊤x: Soma de Quadrados

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Inversão

Notação: A−1

Buscar matrizA−1 tal queAA−1 = I (matriz identidade)

Não é trivial

Só é possível para matrizes de posto completo (não singulares)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Inversão

Notação: A−1

Buscar matrizA−1 tal queAA−1 = I (matriz identidade)

Não é trivial

Só é possível para matrizes de posto completo (não singulares)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Inversão

Notação: A−1

Buscar matrizA−1 tal queAA−1 = I (matriz identidade)

Não é trivial

Só é possível para matrizes de posto completo (não singulares)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Inversão

Notação: A−1

Buscar matrizA−1 tal queAA−1 = I (matriz identidade)

Não é trivial

Só é possível para matrizes de posto completo (não singulares)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Inversão

R

> A <- matrix(c(1,4,3,2),2)> A

[,1] [,2][1,] 1 3[2,] 4 2> solve(A)

[,1] [,2][1,] -0.2 0.3[2,] 0.4 -0.1> A %*% solve(A)

[,1] [,2][1,] 1 -5.551115e-17[2,] 0 1.000000e+00

> B <- matrix(c(2,1,3,-4),2)> B

[,1] [,2][1,] 2 3[2,] 1 -4> solve(B)

[,1] [,2][1,] 0.36363636 0.2727273[2,] 0.09090909 -0.1818182> B %*% solve(B)

[,1] [,2][1,] 1 0[2,] 0 1

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Inversão

R

> C <- matrix(c(4,2,8,4),2)> C

[,1] [,2][1,] 4 8[2,] 2 4> solve(C)Erro em solve.default(C) :Lapack routine dgesv: system is exactly singular: U[2,2] = 0

> det(C)[1] 0> det(A)[1] -10

Pergunta: Matriz C : duas equações e duas incógnitas?

Resp.: Não, única equação: sistema inconsistente ou indeterminado

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Inversão

R

> C <- matrix(c(4,2,8,4),2)> C

[,1] [,2][1,] 4 8[2,] 2 4> solve(C)Erro em solve.default(C) :Lapack routine dgesv: system is exactly singular: U[2,2] = 0

> det(C)[1] 0> det(A)[1] -10

Pergunta: Matriz C : duas equações e duas incógnitas?

Resp.: Não, única equação: sistema inconsistente ou indeterminado

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Inversão

R

> C <- matrix(c(4,2,8,4),2)> C

[,1] [,2][1,] 4 8[2,] 2 4> solve(C)Erro em solve.default(C) :Lapack routine dgesv: system is exactly singular: U[2,2] = 0

> det(C)[1] 0> det(A)[1] -10

Pergunta: Matriz C : duas equações e duas incógnitas?

Resp.: Não, única equação: sistema inconsistente ou indeterminado

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Álgebra de Matrizes

Sistema de Equações

Solução única deAx = b: x0 = A−1b

> (A <- matrix(c(2,1,3,-4),2))[,1] [,2]

[1,] 2 3[2,] 1 -4> (b <- matrix(c(13,-11),2))

[,1][1,] 13[2,] -11> (x0 <- solve(A) %*% b)

[,1][1,] 1.727273[2,] 3.181818> (x0 <- solve(A,b))

[,1][1,] 1.727273[2,] 3.181818

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Conteúdo

1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas

2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes

3 Regressão LinearResultadosReferências

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Modelo Estatístico

y1 = 4 = gy2 = 5 = gy3 = 2 = gy4 = 3 = g

y = Xθ4523

=

1111

[g]

Obviamente, o sistema é inconsistente

Não há solução possível para g

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Modelo Estatístico

y1 = 4 = gy2 = 5 = gy3 = 2 = gy4 = 3 = g

y = Xθ4523

=

1111

[g]

Obviamente, o sistema é inconsistente

Não há solução possível para g

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Quadrados Mínimos

Equações Normais

X⊤Xθ = X⊤y

θ0 = (X⊤X)−1(X⊤y)

Demonstra-se que a solução é tal que e⊤e (SQres) é mínimaCaso não seja possível inverter X⊤X: inversa generalizaday = Xθ + e (Modelo de Gauss-Markov)

Ajustes

y = Xθ0

e = y− y

Sob normalidade, estimativas de quadrados mínimos também sãoMLEs

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Quadrados Mínimos

Equações Normais

X⊤Xθ = X⊤y

θ0 = (X⊤X)−1(X⊤y)

Demonstra-se que a solução é tal que e⊤e (SQres) é mínimaCaso não seja possível inverter X⊤X: inversa generalizaday = Xθ + e (Modelo de Gauss-Markov)

Ajustes

y = Xθ0

e = y− y

Sob normalidade, estimativas de quadrados mínimos também sãoMLEs

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Quadrados Mínimos

Equações Normais

X⊤Xθ = X⊤y

θ0 = (X⊤X)−1(X⊤y)

Demonstra-se que a solução é tal que e⊤e (SQres) é mínimaCaso não seja possível inverter X⊤X: inversa generalizaday = Xθ + e (Modelo de Gauss-Markov)

Ajustes

y = Xθ0

e = y− y

Sob normalidade, estimativas de quadrados mínimos também sãoMLEs

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Quadrados Mínimos

Equações Normais

X⊤Xθ = X⊤y

θ0 = (X⊤X)−1(X⊤y)

Demonstra-se que a solução é tal que e⊤e (SQres) é mínimaCaso não seja possível inverter X⊤X: inversa generalizaday = Xθ + e (Modelo de Gauss-Markov)

Ajustes

y = Xθ0

e = y− y

Sob normalidade, estimativas de quadrados mínimos também sãoMLEs

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Quadrados Mínimos

Equações Normais

X⊤Xθ = X⊤y

θ0 = (X⊤X)−1(X⊤y)

Demonstra-se que a solução é tal que e⊤e (SQres) é mínimaCaso não seja possível inverter X⊤X: inversa generalizaday = Xθ + e (Modelo de Gauss-Markov)

Ajustes

y = Xθ0

e = y− y

Sob normalidade, estimativas de quadrados mínimos também sãoMLEs

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Resultados

Feijão (cont.)

X⊤X =[1 1 1 1

] 1111

= 4

X⊤y =[1 1 1 1

] 4523

= 14

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Resultados

Feijão (cont.)

θ0 =1

4[14] =

7

2

y =

1111

[72

]=

72727272

e = y− y =

4

5

2

3

72727272

=

1232

−32

−12

Erro centrado, óbvio (por construção!)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Análise de Variância

Decomposição da variância de y

Somas de Quadrados

SQtot = y⊤y

SQres = e⊤e

SQpar = θo⊤X⊤y

Graus de liberdade: n, n− r[X] e r[X], respectivamenter[X]: “rank” de X (número de linhas/colunas linearmenteindependentes)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Análise de Variância

Feijão (cont.)

SQtot = y⊤y = 54

SQres = e⊤e = 5

SQpar = θo⊤X⊤y = 49

Para este modelo, SQpar é também chamada de “correção”

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Extensão

Feijão, genotipado com ummarcador

g1 = 1,Mm; g2 = 2,MM4 = g + βg2 = g + β(2)5 = g + βg2 = g + β(2)2 = g + βg1 = g + β(1)3 = g + βg1 = g + β(1)

y = Xθ + e 4523

=

1 21 21 11 1

[gβ

]+ e

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Extensão

Feijão, genotipado com ummarcador

g1 = 1,Mm; g2 = 2,MM4 = g + βg2 = g + β(2)5 = g + βg2 = g + β(2)2 = g + βg1 = g + β(1)3 = g + βg1 = g + β(1)

y = Xθ + e 4523

=

1 21 21 11 1

[gβ

]+ e

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Análise Estatística

X⊤Xθ = X⊤y

> (y <- matrix(c(4,5,2,3),4))[,1]

[1,] 4[2,] 5[3,] 2[4,] 3> (X <- matrix(c(1,1,1,1,2,2,1,1),4))

[,1] [,2][1,] 1 2[2,] 1 2[3,] 1 1[4,] 1 1> (XtX <- crossprod(X,X))

[,1] [,2][1,] 4 6[2,] 6 10> (Xty <- crossprod(X,y))

[,1][1,] 14[2,] 23

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Análise Estatística

θ0 = (X⊤X)−1(X⊤y)

> (teta.zero <- solve(XtX,Xty))[,1]

[1,] 0.5[2,] 2.0

(Interprete os resultados)

y, e

> (y.hat <- X %*% teta.zero)[,1]

[1,] 4.5[2,] 4.5[3,] 2.5[4,] 2.5> (res <- y - y.hat)

[,1][1,] -0.5[2,] 0.5[3,] -0.5[4,] 0.5

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Análise Estatística

SQtot = y⊤y, SQres = e⊤e, SQpar = θo⊤X⊤y> (SQ.tot <- crossprod(y,y))

[,1][1,] 54> (SQ.par <- crossprod(teta.zero,Xty))

[,1][1,] 53> (SQ.res <- crossprod(res))

[,1][1,] 1

SQpar = SQg + SQβ

53 = 49 + 4 (49: modelo anterior)SQtot = SQpar + SQres = SQg + SQβ + SQres

54 = 49 + 4 + 1

Reordenando: 54− 49 = 4 + 1SQtot.corr = SQreg + SQres

R()

Inclusão de novo parâmetro: redução na SQres

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Testes de Hipóteses

Ho : β = 0 vsHa : β = 0

Sob normalidade,QMreg

QMres∼ F[1,GLres]

Mapeamento:

LRT = −2logL(g)

L(g, β)

Verossimilhança:

L(g) =

n∏i=1

1√2πσ2

e−(ei−0)2

2σ2

L(g, β) =n∏

i=1

1√2πσ2

e−(ei−0)2

2σ2

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Testes de Hipóteses

Ho : β = 0 vsHa : β = 0

Sob normalidade,QMreg

QMres∼ F[1,GLres]

Mapeamento:

LRT = −2logL(g)

L(g, β)

Verossimilhança:

L(g) =n∏

i=1

1√2πσ2

e−(ei−0)2

2σ2

L(g, β) =

n∏i=1

1√2πσ2

e−(ei−0)2

2σ2

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Testes de Hipóteses

Ho : β = 0 vsHa : β = 0

Sob normalidade,QMreg

QMres∼ F[1,GLres]

Mapeamento:

LRT = −2logL(g)

L(g, β)

Verossimilhança:

L(g) =

n∏i=1

1√2πσ2

e−(ei−0)2

2σ2

L(g, β) =n∏

i=1

1√2πσ2

e−(ei−0)2

2σ2

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Testes de Hipóteses

Ho : β = 0 vsHa : β = 0

Sob normalidade,QMreg

QMres∼ F[1,GLres]

Mapeamento:

LRT = −2logL(g)

L(g, β)

Verossimilhança:

L(g) =

n∏i=1

1√2πσ2

e−(ei−0)2

2σ2

L(g, β) =n∏

i=1

1√2πσ2

e−(ei−0)2

2σ2

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Conclusão

ModelosNotem o caráter geral da teoria apresentadaExemplos:

yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk

Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares

(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Conclusão

ModelosNotem o caráter geral da teoria apresentadaExemplos:

yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk

Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares

(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Conclusão

ModelosNotem o caráter geral da teoria apresentadaExemplos:

yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk

Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares

(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Conclusão

ModelosNotem o caráter geral da teoria apresentadaExemplos:

yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk

Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares

(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Conclusão

ModelosNotem o caráter geral da teoria apresentadaExemplos:

yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk

Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares

(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Conclusão

ModelosNotem o caráter geral da teoria apresentadaExemplos:

yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk

Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares

(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Estimação e Testes

Conclusão

ModelosNotem o caráter geral da teoria apresentadaExemplos:

yi = µ+ bi + βxi + εiyij = µ+ bi + β1x1j + β2x2j + εijyijk = µ+ bi + gj + gk + sjk + εijk

Quadrados Mínimos: não é o único método a ser considerado paraobter estimativas no contexto de modelos lineares

(Modelos Mistos, Modelos de Misturas, Modelos Bayesianos, ModelosLineares Generalizados, . . .)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Resultados

Conteúdo

1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas

2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes

3 Regressão LinearResultadosReferências

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Resultados

Análise no R

mouse.data <- read.csv("http://dl.dropbox.com/u/1968009/mouse.csv")mouse.data[1:10,]

plot(mouse.data[,2]~mouse.data[,3])

modelo <- lm(mouse.data[,2]~mouse.data[,3])

summary(modelo)

class(modelo)names(modelo)coefficients(modelo)

resumo <- summary(modelo)class(resumo)names(resumo)resumo$fstatisticresumo$coefficientsresumo$coefficients[2,1]resumo$coefficients[2,4]resumo$r.squared

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Resultados

Efeito do Marcador

Mouse data

●●

●●

● ●

●●

● ●

30

40

50

60

70

80

0 1M1

BW

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Resultados

Regressão Linear

Mouse data

●●

●●

● ●

30

40

50

60

70

80

0.00 0.25 0.50 0.75 1.00M1

BW

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Resultados

Teste F

Mouse data

0 10 20 30 40 50

10

15

20

25

30

Análise de cada marcador − teste F

Mapa

Est

atís

tica

F

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Resultados

p-valores

Mouse data

0 10 20 30 40 50

10

15

20

25

30

Análise de cada marcador − teste F

Mapa

Est

atís

tica

F

●●

●●

0 10 20 30 40 50

2

3

4

5

6

Análise de cada marcador − p−valores

Mapa

−lo

g 10(p

−va

lor)

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Referências

Conteúdo

1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas

2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes

3 Regressão LinearResultadosReferências

Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear

Referências

Principais Referências

G. StrangIntroduction to Linear Algebra, 3rd ed.Wellesley-Cambridge Press, 2003, 578 p..

J. J. FarawayLinear Models with RChapman & Hall, 2009, 240 p.

M. Lynch, B. WalshGenetics and Analysis of Quantitative Traits, 1 ed.Sinauer Associates, Inc., 1998.

K.W. Broman, S. SenA Guide to QTL Mapping with R/qtl, 1 ed.New York, Springer, 2009.