137
Princípios de Associação e Seleção Genômica Aplicados ao Melhoramento Genético de Animais Domésticos h 2 r G V A Prof. Dr. Fernando Baldi UNESP-FCAV 1

apresentação muito boa

Embed Size (px)

Citation preview

Page 1: apresentação muito boa

Princípios de Associação e Seleção Genômica Aplicados ao

Melhoramento Genético de Animais Domésticos

h2

rG

VA

Prof. Dr. Fernando Baldi UNESP-FCAV

1

Page 2: apresentação muito boa

Objetivos do curso

Adquirir conhecimentos e informações sobre os métodos para utilizar as informações de dezenas de milhares de marcadores SNP no melhoramento genético de animal, bem como conhecer os princípios de desequilíbrio de ligação no genoma de animais, estudos de associação do genoma utilizando marcadores de alta densidade, e introduzir o conceito e princípios da seleção genômica.

2

Page 3: apresentação muito boa

Data Assunto Horário e Lugar

6 de agosto Seleção assistida por marcadores e

desequilíbrio de ligação 9:00-12:00 / 14:00-

15:30

7 de agosto Controle de qualidade e Associação

Genômica 9:00-12:00 / 14:00-

15:30

8 de agosto Seleção Genômica 9:00-12:00 / 14:00-

15:30

10 de agosto Seleção Genômica 9:00-12:00 / 14:00-

15:30

Calendário do curso

3

Page 4: apresentação muito boa

Programa do curso

• Seleção assistida por Marcadores

• Medidas de desequilíbrio de ligação

• Causas de desequilíbrio de ligação em populações de animais

• Controle de qualidade de dados genômicos

• Estudos de associação do genoma global

• Princípios da Seleção genômica

• Seleção genômica em populações de animais domésticos.

• Métodos de seleção genômica

• Matriz de parentesco com informações genômicas

• Imputação de dados genômicos e painéis de baixa densidade

• Estratégias de genotipagem para seleção genômica

4

Page 5: apresentação muito boa

Programa do dia

• Conceitos básicos

• Seleção assistida por marcadores

• Genotipagem com marcadores de alta densidade

• Desequilíbrio de ligação (LD)

• Medidas utilizadas para medir o LD

• Fatores que afetam o LD da população

• Desequilíbrio de ligação em animais e plantas

• Persistência do LD entre diferentes raças

• Estratégias para a inferência dos haplótipos

5

Page 6: apresentação muito boa

Conceitos básicos

6

Page 7: apresentação muito boa

Aonde esta localizada a informação genética?

• A informação genética é contida nos cromossomos

• Cromossomos: acido desoxirribonucléico (DNA) + proteínas

• O DNA é uma grande molécula de dois fitas

• Cada fita é composta por açucares e radicais de fosfato

• Bases nitrogenadas ligam as pentoses

– Adenina (A), Guanina (G), Citosina (C), Tiamina (T)

– A com T (2 pontes de nitrogênio)

– C com G (3 pontes de nitrogênio)

• As fitas são conectadas através de pontes de hidrogênio

7

Page 8: apresentação muito boa

Aonde esta localizada a informação genética?

8

Page 9: apresentação muito boa

• Os cromossomos são arranjos lineares de DNA • ATTTGATCGCGCGTT

• Par de cromossomos homólogos (indivíduos diplóides) – Bovinos 2n:60; Suínos 2n:38; Ovinos 2n:54

• Loci (plural: locos): A posição de um gene ou de um marcador genético em um cromossomo.

• Alelos: formas alternativas de um gene

• Haplótipos: Alelos em diferentes loci localizados de forma próxima em um cromossomo tendem a ser herdados conjuntamente (Ligação)

Aonde esta localizada a informação genética?

http://www.faunativa.com.br/downloads/pesquisa/glossario_biologico.pdf 9

Page 10: apresentação muito boa

• Meiose (I e II): um tipo especial de divisão celular que ocorre no processo de formação das gametas, através do qual uma célula tem o seu número de cromossomos reduzido pela metade.

• Os cromossomos segregam de forma aleatória (Meiose I)

• “Crossing-over” ou recombinação: troca de segmentos cromossômicos entre homólogos durante a meiose (Meiose I)

Separação de homólogos, [2n] —> 2 [n]

Separação das cromátides 2 [n] —> 4 [n]

10

Page 11: apresentação muito boa

• Uma forte correlação entre a fração de recombinação e a distância em pares de bases

• O crossing-over ocorre quando existe troca de segmentos de cromossomos homólogos (ex, os cromossomos paternos e maternos)

Que é crossing-over?

11

Page 12: apresentação muito boa

A variação genética é devido a diferenças na seqüência de DNA

• Os genes são uma sequência de DNA (ex: AGTCTAGGGATTAGA)

• As diferenças genéticas entre indivíduos são devidas às diferenças na sequência de DNA:

Animal 1 AGTCTAG

Animal 2 AGTGTAG

• As diferenças genéticas são devido a variações naturais na seqüência do DNA (polimorfismos)

• Nem sempre as diferenças a nível genética (DNA) determinam diferenças no fenótipo – Depende se a variação estiver numa região codificante

– Exon/Intron

12

Page 13: apresentação muito boa

Melhoramento genético das características de interesse

econômico

13

Page 14: apresentação muito boa

Antecedentes

• Algumas características são controladas por poucos (um) genes – Cor da pelagem – Algumas doenças genéticas – Dupla musculatura – Presença de chifres

• A maioria das características produtivas são controladas por vários genes e por efeitos ambientais - Muitos genes + efeito ambiental - Modelo infinitesimal (Fischer, 1918)

Fenótipo= Musculatura dupla Genótipo=mm

Proc. Natl. Acad. Sci. USA.1997 94:12457–12461

14

Page 15: apresentação muito boa

Melhoramento Genético Tradicional

#Genes??

Valor genético aditivo (BLUP)

- Estimamos o efeito acumulativo dos genes

- Não sabemos que genes estão atuando

Pedigree

Métodos estatísticos

15

Page 16: apresentação muito boa

Impacto da seleção sobre as características produtivas

0

1

2

3

4

5

6

0 10 20 30 40 50 60 70 80 90

Pe

so v

ivo

(kg

)

Dias

Evolução de peso de frangos de diferentes linhas e alimentados com diferentes dietas

Linha 2001 / Dieta 2001

Linha 2001 /Dieta 1957

Linha 1957 / Dieta 2001

Linha 1957 / Dieta 1957

0

1

2

3

4

5

0 a 21 0 a 42 0 a 56 0 a 70 0 a 84

Eficiencia de conversão de frangos de diferentes linhas e alimentados mcom diferentes dietas

Linha 2001 / Dieta 2001

Linha 2001 / Dieta 1957

Lina 1957 / Dieta 2001

Linha 1957 / Dieta 1957

16

Page 17: apresentação muito boa

Mensagem I

A seleção depende da disponibilidade de registros fenotípicos

Dependendo da herdabilidade da característica pode fornecer uma idéia ou não do valor genético aditivo do animal

As informações de parentesco genético aditivo são utilizadas para a estimação dos valores genéticos

17

Page 18: apresentação muito boa

Seleção tradicional depende fortemente registros fenotípicos e resposta muito baixa para algumas características:

– Características de difícil mensuração

– Características que são expressos tardiamente na vida do animal

– Caracteres limitados ao sexo

– Características de baixa herdabilidade

Limitações da seleção tradicional

18

Page 19: apresentação muito boa

Resposta à seleção

ΔG: Progresso genético anual

i: intensidade de seleção

r: acurácia de seleção

σa: desvio padrão aditivo

IG: intervalo entre gerações

19

Page 20: apresentação muito boa

Seleção assistida por marcadores

Este tipo de seleção utiliza a informação molecular obtida a partir dos marcadores em conjunto com os dados de produção fenotípicos e do pedigree para a seleção dos animais

Produção de leite

Análise de DNA

Valor Genético

20

Page 21: apresentação muito boa

Seleção assistida por marcadores (SAM)

Dekkers and van der Werf, 2007

Sem SAM

Com SAM

21

Page 22: apresentação muito boa

Detecção de genes de efeito maior (QTL)

• Se temos informação sobre a localização do QTL no genoma podemos:

– Diminuir o intervalo entre gerações

– Aumentar a acurácia dos valores genéticos

– Incrementar a resposta à seleção

•Como encontrar os QTL?

1. -Mapeamento por ligação

2. -Abordagem de genes candidatos

22

Page 23: apresentação muito boa

Podemos observar diretamente os genes que afetam as características quantitativas?

• Localizar os genes que tem grande efeito sobre o fenótipo

• Identificar diferentes alelos destes genes

• Permitem seguir ou rastrear a herança dos genes (ao longo das gerações)

Uso de

marcadores

moleculares

23

Page 24: apresentação muito boa

Informação Molecular

Utilização de marcadores moleculares na busca de QTL ou genes de efeito maior

QTL: região do ADN que

afeta uma característica

quantitativa

QTL: Quantitative trait loci

24

Page 25: apresentação muito boa

O que é um marcador molecular?

• Possuem herança mendeliana

• Permite identificar a presença ou a posição de um gene de interesse

• Conhecendo a sua localização podemos identificar animais geneticamente superiores

Sequências (fragmentos específicos) de nucleotídeos

(bases, DNA) associados com um ou mais genes

Na descendência, as características de

interesse, seguiram normalmente ligadas a

marcadores moleculares.

Portanto, os indivíduos podem ser selecionados

com base na informação molecular, uma vez

que indica a presença da característica

desejada. 25

Page 26: apresentação muito boa

Tipos de marcadores normalmente utilizados

• Hibridação – RFLP – (Restriction Fragment Length Polymorphism) – Minissatélites – VNTR –(Variable Number of Tandem Repeats) • Amplificação de DNA – RAPD – (Random Amplified Polymorphic DNA) – SCAR (Sequence Characterized Amplified Regions) ou ASA (Amplified Specific Amplicon) – Microssatélites –SSR (Simple Sequence Repeats) – AFLP (Amplified Fragment Length Polymorphism)

Todos estes marcadores detectam polimorfismos através de

diferentes técnicas

Abundância no genoma Grau de polimorfismo

Facilidade e custo de genotipagem

26

Page 27: apresentação muito boa

Busca de QTL

• O que necessitamos? – Uma população de animais com genótipos dos

marcadores e os fenótipos para características relevantes

• Princípios chaves na busca – Encontrar marcadores associados com diferenças

nos fenótipos

– O marcador está ligado com um QTL que determina as diferenças de fenótipo

27

Page 28: apresentação muito boa

Exemplo:

Progênie de touros testados agrupados por seu genótipo para um SNP particular

Genótipo do marcador

Produção média de proteína

AA 20

AC 15

CC 10

Diferenças fenotípicas devem ser causada

por um QTL ligado ao marcador

28

Page 29: apresentação muito boa

Uso de marcadores moleculares

1- DIRETAMENTE identificaram o

gene de interesse

Duas

alternativas

Marcadores

diretos

29

Page 30: apresentação muito boa

Aplicação: Análise de Genes Candidatos

• Genes de função conhecida relacionados com o desenvolvimento de uma característica

• Principal vantagem prática: não há necessidade de construção de famílias segregantes, podendo o efeito do gene candidato ser avaliado em qualquer população (marcador direto)

• Outras Vantagens:

– Alto poder estatístico

– Ampla aplicabilidade

– Baixo custo e simplicidade

• Desvantagem: Difícil de encontrar

regiões candidatas

Dekkers and van der Werf, 2007

30

Page 31: apresentação muito boa

Etapas: Estudo de genes candidatos

1. Escolher os genes candidatos

2. Obtenção de primers para amplificar o gene

3. Busca de polimorfismos

4. Associações entre o gene candidato e o

fenótipo

5. Aplicação em larga escala na população

31

Page 32: apresentação muito boa

Uso de marcadores moleculares

2- INDIRETAMENTE

identificação de marcadores

que estão próximos ao gene

ou QTL de interesse

Duas

alternativas

IMPORTANTE:

Distância entre

marcador e a mutação

Marcadores

indiretos

32

Page 33: apresentação muito boa

Porque é que a distância é importante?

Um marcador genético indireto (variantes A e B) ligado a um gene principal (variantes círculo e triângulo):

Se organizamos o sêmen deste touro obtemos:

Gametas não recombinantes

Gametas recombinantes

Sêmen

A distância é proporcional

ao número de

recombinantes 33

Page 34: apresentação muito boa

Mapeamento por ligação para detecção de QTL

• Regiões do cromossomo (anônimas?) são associadas com a variação fenotípica

• Essas regiões levam genes que são desconhecidos

• Utilizar marcadores de DNA (neutros) e estudar a associação entre as variantes alélicas dos marcadores e a variação fenotípica

34

Page 35: apresentação muito boa

• Marcadores em loci diferentes se encontram em associação ao acaso (independentes) são ditos em estado de equilíbrio de ligação (LE) na população.

• Marcadores em loci diferentes não estão em associação ao acaso (não independentes) são ditos em estado de desequilíbrio de ligação (LD) na população.

Mapeamento por ligação: LD e LE

35

Page 36: apresentação muito boa

Desequilíbrio de ligação entre marcador e QTL

Equilíbrio de ligação entre marcador e QTL

Equilíbrio de ligação:

somente considera que

existe LD dentro de

famílias (grande regiões),

mas que diminui em

poucas gerações por

causa da recombinação

O marcador esta em LD

com o QTL em toda a

população. A associação

entre o marcador e o QTL

deve persistir várias

gerações (marcador e

QTL muito próximos!)

36

Page 37: apresentação muito boa

Mutações funcionais

- Genes conhecidos

Marcadores diretos

3 TIPOS DE MARCADORES GENÉTICOS

Marcadores LD LD entre o marcador e a mutação

na população inteira

A fase de ligação ~

consistente através da

população

A fase de ligação não é consistente para todas as famílias

LE entre o marcador e a mutação na

população inteira

Marcadores LE

Touro 1 Touro 2 Touro 3 Touro 4

37

Page 38: apresentação muito boa

Delineamentos experimentais para detecção de QTL

1. Cruzamentos entre linhas (endogamicas) ou raças diferentes

2. Populações comerciais existentes (dentro de famílias)

3. Populações comercias (sem informação de familias)

38

Page 39: apresentação muito boa

Delineamentos experimentais para detecção de QTL

1. Cruzamentos entre linhas (endogâmicas) ou raças diferentes

- Raças que diferem na frequência alélica do marcador e da mutação

- Marcadores e QTL fixados nas populações parentais

- Objetivo: Marcadores e QTL devem segregar

- Cruzamento (F1) cria níveis elevados de LD na população cruzada

- O LD permite a detecção de QTL que estão a certa distância do marcador (acurácia limitada)

39

Page 40: apresentação muito boa

x

x F1

q Q Q

Q q

q m M m M

M m

Separação do marcador (M) e o QTL (Q)

Q q M m

Q q M m

q q m m

Q Q M M F2

Ou retrocruzamento

Q M M

q Q Q M m

Recombinantes Não Recombinantes

40

Page 41: apresentação muito boa

Grupo MM = + (1-r) α

Grupo Mm = + r α

Diferença = (1-2 x r) α

Análises com marcadores individuais:

O efeito do QTL e a distância ao

marcador estão confundidos

41

Page 42: apresentação muito boa

“Interval Mapping” por Análise de

Regressão (Hailey and Knott, 1992)

Modelo de Regressão:

y = μ + a + d + . . . + ε

a = aditividade d = dominância

M1 M2 QTL

42

Page 43: apresentação muito boa

Conceito de probabilidade condicional [P(Q|MiMj)]

P(Q|MN)] = 1- (r1r2/1- r12)

P(Q|Mn)] = (r2- r1r2)/r12

P(Q|mN)] = (r1- r1r2)/r12

P(Q|mn)] = r1r2/(1- r12)

M

N

Q

r1

r2

r1r2

r12 = r1 + r2 – 2 x (r1r2)

P(Q|marcadores)] = XQ

43

Page 44: apresentação muito boa

Marcadores genéticos

Dois possibilidades de genótipos do QTL

Se

Se

Colocando eles juntos com

e

Modelo de regressão 44

Page 45: apresentação muito boa

Regressão por mapeamento por intervalo Estima a posição do QTL e o efeito separadamente

Modelo de regressão retro-cruza

Ajusta modelos para várias posições do QTL A posição com o QMR ou o maior valor de F fornece a melhor estimativa de c1 e bq=(a+d)

Posição cM

Va

lor

de

F

45

Page 46: apresentação muito boa

2. Nas populações comerciais existentes (dentro de famílias)

- Na população os marcadores e o QTL estão em LE, mas dentro de cada família estão em LD

-Delineamento de Netas

-Delineamento de filhas

-A fase de ligação entre os marcador e o QTL pode ser diferente em várias famílias (Famílias de touros)

-O LD permite a detecção de QTL que estão a certa distância do marcador (acurácia limitada)

Delineamentos experimentais para detecção de QTL

Delineamentos experimentais para detecção de QTL

46

Page 47: apresentação muito boa

Q q

M m

Q

M

?

?

q

m

?

?

“Delineamento

de Netas”

(Granddaugther Design)

47

Page 48: apresentação muito boa

Q q

M m

q

m

?

?

Q

M

?

?

“Delineamento defilhas”

(Daughter Design)

48

Page 49: apresentação muito boa

Poder dos delineamentos para detecção de QTL por ligamento depende:

• Fração de recombinação

• Número de animais informativos para o marcador

• Herdabilidade da característica

• Tamanho do efeito do marcador

• Frequência dos alelos do QTL

• Nível de significância estabelecido (erro tipo I)

49

Page 50: apresentação muito boa

Mapeamento de ligação em populações

comerciais sem informação de pedigree

• Alelos do marcador devem estar suficiente próximo do suposto QTL para os marcadores ser validos para toda a população (dentro e entre famílias).

– Mais próximo menos chances de crossing-over

• Na pratica, é baixa a chance de encontrar marcadores (poucos marcadores) o suficientemente próximo do QTL.

• Recentemente que temos a tecnologia disponível para genotipar animais com milhares de marcadores (SNPs) ao mesmo tempo

50

Page 51: apresentação muito boa

Abordagens para a detecção de QTL

• Genes candidatos – inconvenientes – Assume que o gene é responsável pela expressão

fenotípica de uma característica – Procura da mutação – Número de genes candidatos muito grande – Muito difícil escolher candidatos – Pode haver mais de uma mutação que causa o efeito

desejado

• Mapeamento por ligação – inconvenientes

– Com marcadores ligados, as informações sobre a ligação entre o marcador e o alelo QTL é família específica

– Essa fase de ligação tem que ser determinada pela genotipagem, pelo menos duas gerações

51

Page 52: apresentação muito boa

Banco de dados de QTL de animais “Animal Quantitative Trait Loci (QTL) database (AnimalQTLdb)”

0

200

400

600

800

1000

1200

1400

1992 1994 1996 1998 2000 2002 2004 2006 2008 2010

me

ro d

e Q

TLs

Número de QTLs por Ano em que foram publicados

em Gado de corte

http://www.animalgenome.org/cgi-bin/QTLdb/BT/summary

Até o momento, existem 5.920 QTL no banco de dados de 331 publicações

representando 407 caracteres em bovinos

52

Page 53: apresentação muito boa

Exemplos de marcadores em animais domésticos

Gado de leite

Gado de corte

Aves

Suínos

Ovinos

Exemplos de marcadores em animais domésticos

Defeitos congênitos

Apariencia

Qualidade Leite

Qualidade Carne

Doenças

Reprodução

Crescimento e composição

Produção Leite

Dekkers, 2004 53

Page 55: apresentação muito boa

A pesquisa até agora.........

Muitas regiões de interesse tem sido encontradas

Número limitados de genes tem sido identificados

Principalmente genes de efeito maior

Muitos genes de efeito menor / difíceis de detectar

55

Page 56: apresentação muito boa

Distribuição dos efeitos dos QTL

Distribuição dos efeitos dos QTL para 34 características a de qualidade da carne e de carcaça. Dados de mapeamento de três cruzamentos em suínos F2 .

J. Bennewitz & T.H.E. Meuwissen. The distribution of QTL additive and dominance effects in porcine F2 crosses. J. Anim. Breed. Genet. 127 (2010) 171–179

mer

o d

e Q

TL

Efeito aditivo do QTL (desvio padrão fenotípico) Efeito aditivo do QTL (desvio padrão fenotípico)

Den

sid

ade

Distribuição exponencial (linha pontilhada) Distribuição normal de mistura (linha cheia)

Existem alguns casos, um único gene pode ter um grande efeito sobre uma

característica quantitativa (ex: gene DGAT1): DGAT1 explicam 50% da variação

genética em % de gordura, mas não todos os QTL têm um efeito tão grande

56

Page 57: apresentação muito boa

A pesquisa até agora.........

Custo da genotipagem

Dificuldade para incorporar as informações

moleculares nas avaliações genéticas

Intervalos de credibilidade para mapear os QTL

Efeitos marcadores/QTL não são consistentes

57

Page 58: apresentação muito boa

Genotipagem em larga escala com painéis de alta densidade

58

Page 59: apresentação muito boa

Novas oportunidades!

59

Page 60: apresentação muito boa

Genotipagem em larga escala

A sequência de DNA para bovinos foi recentemente publicada (2009). É a seqüência de DNA da vaca raça Hereford Dominette:

3 milhões de pares de bases de DNA

L1 Dominette 01449

http://www.ncbi.nlm.nih.gov/projects/genome/guide/cow/portal.html http://www.ensembl.org/Bos_taurus/index.html,

http://genome.ucsc.edu/ http://bovinegenome.org/

60

Page 61: apresentação muito boa

Marcadores SNPs

• A Single Nucleotide Polymorphism, ou SNP ("snip")

• Variação numa base individual, ou seja, uma base substituída por outra base

• Polimorfismo de nucleotídeos de base única

• Um SNP é que uma das letras (A, T, G, C) diferente, por exemplo, um T no lugar A.

• SNPs muito frequente no genoma (> 3 milhões no genoma bovino)

61

Page 62: apresentação muito boa

Através do sequenciamento do genoma tem permitido a descoberta de milhares de polimorfismos de base única (SNPs)

Genotipagem em larga escala

Os marcadores SNP tem como base as alterações mais elementares da molécula de DNA

62

Page 63: apresentação muito boa

• SNPs muito frequente ---> construção de mapas densos de marcadores

• Alguns SNPs funcionalmente relevantes ---> variações para doenças ou fenótipos complexos

• Os SNPs são mais estáveis (menor taxa de mutação)

• Genotipagem de forma altamente automatizada (muita informação!!)

Marcadores SNPs

1 10K 50K 500K 1000K SNPs

Ano 1985 2000 2003 2005 2008

63

Page 64: apresentação muito boa

Descoberta dos SNPs

Matukumalli, 2007

Vaca Dominette L1

64

Page 65: apresentação muito boa

Matukumalli, 2007

Descoberta dos SNPs

65

Page 66: apresentação muito boa

Uma revolução na tecnologia genética molecular

66

Page 67: apresentação muito boa

Consórcios vem desenvolvendo painéis de Genotipagem para várias espécies

67

Page 68: apresentação muito boa

BovineHD BeadChip

O BovineHD beadchip possui mais de 777 mil SNPs espaçados em todo o genoma bovino.

A leitura do Beadchip é realizada através do iScan.

http://www.illumina.com/products/bovinehd_whole-genome_genotyping_kits.ilmn 69

Page 69: apresentação muito boa

Variação do BovineHD Beadchip

http://www.illumina.com/products/bovinehd_whole-genome_genotyping_kits.ilmn

SNPs informativos em muitas raças e

cruzas

70

Page 70: apresentação muito boa

Infinium® II assay protocol

http://www.illumina.com/Documents/products/workflows/workflow_infinium_ii.pdf 71

Page 71: apresentação muito boa

Aplicação dos polimorfismos de base única (SNPs)

• Uso de painéis de alta densidade de SNP para o melhoramento de animais e plantas:

– Estrutura genética de diferentes populações

– Estimar o grau de diversidade e divergência genética entre e dentro de populações

– Identificar e localizar regiões no genoma sujeitas à seleção

– Mapeamento do genoma amplo (estudo de associação)

– Estimar o valor genético dos animais a partir de dados genômicos (seleção genômica)

72

Page 72: apresentação muito boa

Em definitiva ....

Maior proporção do genoma é coberta:

Número suficiente de marcadores

Maior desequilíbrio de ligação entre os marcadores

Maiores chances de encontrar QTL associados às características produtivas.

Maior proporção da variância genética é explicada pelos marcadores SNPs

O desequilíbrio de ligação é importante nos estudos de associação ampla e seleção genômica

73

Page 73: apresentação muito boa

Desequilíbrio de ligação

74

Page 74: apresentação muito boa

Desequilíbrio de ligação(Linkage Disequilibrium) (LD)

Definição: Ocorre quando dois genes estão suficientemente próximos no genoma que a recombinação durante a meiose entre eles é rara, e os segmentos do cromossomo são conservados de uma geração para a outra.

A B

a b

X

X

B a

b A

75

Page 75: apresentação muito boa

Desequilíbrio de ligação LD

• É um conceito estatístico

– O desequilíbrio de ligação é a medida estatística da associação entre alelos de diferentes locos

• Descreve a associação não-aleatória de dois loci no mesmo cromossoma

• LD diminui na medida que a distância entre os loci aumenta

• Está distribuído de maneira heterogênea pelo genoma

• LD é determinado pela historia da população e pela densidade e tipo de marcadores

76

Page 76: apresentação muito boa

Desequilíbrio de ligação

Distância entre 2 SNPs adjacentes

(r2)

Dese

qu

ilíb

rio

de

lig

açã

o

LD muito variável

+++ distância curtas

77

Page 77: apresentação muito boa

Exemplo: caso bi-alélico

• Loco 1 e loco 2, com alelos A, a, e B, b

• Portanto, as frequências alélicas são:

1. AABB 2. aaBb 3. aabb 4. AABb 5. AABb

p(A)=0.6 p(a)=0.4 p(B)=0.5 p(b)=0.5

78

Page 78: apresentação muito boa

• se independente, p(AB)=0.3 p(ab)=0.2 (HW)

• A proporção esperada é:

A a

B AB (0.3) aB (0.2)

b Ab (0.3) Ab (0.2)

Exemplo: caso bi-alélico

Mais AB e ab do que o esperado

A a

B AB (0.4) aB (0.2)

b Ab (0.1) ab (0.3)

Na realidade:

79

Page 79: apresentação muito boa

Por que precisamos de definir e medir LD?

• Seleção genômica e mapeamento exigem que marcadores estejam em LD com QTL

• Determinar o número de marcadores necessários para mapeamento por LD e/ou seleção genômica

• Parâmetro determinante do poder de mapeamento para detectar QTL através de LD

• Acurácia dos valores genômicos (GEBV)

Definições de LD

80

Page 80: apresentação muito boa

• Quantificar o LD:

D = freq(A1_B1)*freq(A2_B2) - freq(A1_B2)*freq(A2_B1)

– Desvio das frequências observadas em relação às esperadas

– Altamente dependentes de frequências alélicas ou a história da população

– Não apropriado para comparar LD em locais diferentes

Definições de LD

Hill (1981) 81

Page 81: apresentação muito boa

D = freq(A1_B1)*freq(A2_B2)-freq(A1_B2)*freq(A2_B1)

D = 0.4 * 0.4 - 0.1 * 0.1

D = 0.15

Definições de LD

Exemplo:

82

Page 82: apresentação muito boa

r2= D2 / [freq(A1)*freq(A2)*freq(B1)*freq(B2)]

r2 coeficiente de determinação

Mais apropriado pelo fato de apresentar melhores propriedades estatísticas

Facilidade de interpretação (varia de 0 a 1)

O r2 entre um marcador (M) e um QTL (Q) é a proporção da variância de QTL que pode ser explicada pelo marcador

– se de variância devido a um QTL é 200kg2 e r2 entre marcador e QTL é de 0,2, a variação observada no marcador é 40kg2

Definições de LD

Hill e Robertson (1968)

83

Page 83: apresentação muito boa

• Outra estatística é LD D' • D ' =|D|/Dmax Onde Dmax = min[freq(A1)*freq(B2),(1-freq(A2))(1-freq(B1))] se

D>0, ou Dmax = min[freq(A1)(1-freq(B1),(1-(freq(A2))*freq(B2)] se D<0.

• Valor estandardizado de D para o valor máximo que

este pode atingir • Superestima LD em baixas freqüências alélicas e com

tamanho da amostra reduzido

Definições de LD

Leowontin (1964) 84

Page 84: apresentação muito boa

Estimativas de D‘ e r2 para duas populações de bovinos da raça Holandesa (Dutch Black and White Dairy )

Desequilíbrio de ligação

85

Page 85: apresentação muito boa

Medidas multi-alelicas de LD

• Medidas multi-alelicas de LD

• r2 é útil, fácil de calcular e muito utilizado

– Existem estatísticas equivalentes para locos com alelos múltiplos (microsatellites) (Zhao et al., 2005)

• Formula:

Zhao, H., et al. 2005 Evaluation of linkage disequilibrium measures between multi-allelic markers as predictors of linkage disequilibrium between markers and QTL. Genet. Res. 86: 77–87

k

i

m

j ji

ij

BfreqAfreq

D

l 1 1

2

'2

)()()1(

1

.

.

)()()_( jijiij BfreqAfreqBAfreqD 2'2 r

and , freq(Ai) é a frequência do alelo ith no marcador A, freq(Bj) é a frequência do alelo

jth no marcador B, e l é o número mínimo de alelos no marcador A e B. Para marcadores bi-alélicos,

86

Page 86: apresentação muito boa

• Um segmento do cromossomo ancestral é conservado na população atual

Segmento cromossômico homozigoto (CSH) = Probabilidade de dois segmentos de cromossomos extraídos da população ao acaso são derivados de um ancestral comum

Medidas de LD multi-locus

Ben J. Hayes, Peter M. Visscher, Helen C. McPartlan, et al. Genome Res. 2003 13: 635-643

87

Page 87: apresentação muito boa

Definições de LD

A probabilidade de que os dois haplótipos sejam idênticos em estado (IBS) é a homozigose do haplótipo (HH). Dois haplótipos podem ser de duas maneiras IBS:

1. Os dois segmentos são descendentes de um ancestral comum, sem intervir recombinação, por isso são idênticos por descendência (IBD)

2. Os dois haplótipos idênticos por estado, mas não IBD.

A probabilidade de (1) é CSH. Para dois loci:

• Esta equação pode ser resolvida para CSH quando a HH e homozigose do marcador individual são observados a partir dos dados.

Ben J. Hayes, Peter M. Visscher, Helen C. McPartlan, et al. Genome Res. 2003 13: 635-643

A B A B

A B

CSH1

CSH)CSH)(Hom(HomCSHHH BA

88

Page 88: apresentação muito boa

Coeficiente de variação para r2 e CSH em uma população simulada, sobre regiões haplótipos do mesmo comprimento, através de 200 repetições. Há um marcador a cada 0,01 M.

Ben J. Hayes, Peter M. Visscher, Helen C. McPartlan, et al. Genome Res. 2003 13: 635-643

CSH e r2 estimados do conjunto de dados simulados. Os resultados são calculados sobre todas as regiões do haplótipo de um determinado comprimento e mais de 200 repetições

Definições de LD

89

Page 89: apresentação muito boa

LD é continuamente alterada pela recombinação

c =taxa de recombinação

frequência frequência

Meiose

Gametas Gametas

90

Page 90: apresentação muito boa

Diminuição do LD por recombinação

Generação

91

Page 91: apresentação muito boa

LD continuamente alterada pela recombinação: como LD mudam com o tempo?

Seja r0 = frequência de haplótipos A1B1 na geração 0, portanto D0 = r0 – pA1pB1

Qual é a frequência de haplótipos A1B1 na geração 1? Assim, a frequência de A1B1 gametas produzidos pela geração 0 é:

r1 = r0(1-c) + pA pB c

D1 = r1-pApB = r0(1-c)+pA pBc-pA pB =

= r0(1-c)-pA pB(1-c) = (r0+ pA pB)(1-c)

= D0(1-c)

D2 =D1(1-c) ={D0(1-c)} (1-c) =

= D0(1-c)2

Dt = D0(1-c) t D∞ = 0

Queda LD por recombinação ocorre mais rapidamente quando loci estão mais afastados.

Como, , LD medida pelo r2 irá declinar a uma taxa de (1-c) 2 por geração:

BBAA qPqp

Dr

22

r2t = r2

0(1-c) 2t 92

Page 92: apresentação muito boa

Estimativa Ne históricos a partir da LD a uma determinada distância

Onde t = 1/(2c) gerações atrás:

-por exemplo, marcadores separados a 0,1 M (10cM), reflete o tamanho da população de 5 gerações atrás

-Marcadores espaçados a 0,001 (0,1 cM) de distância refletem tamanho efetivo da população 500 gerações atrás

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0 1 2 3 4 5

Length of chromosome segment (cM)

Lin

ka

ge

dis

eq

uilib

iru

m (

CS

H)

Ne=100

Ne=1000

Tamanho do segmento cromossômico (M)

Desequilí

brio d

e lig

ação (

CS

H)

Hayes et al., 2003

c= tamanho do segmento do cromossomo (Morgans)

Ne=tamanho efetivo da população t = 1/(2c)

93

Page 93: apresentação muito boa

Conservação de segmentos de cromossomos

Haplotipo

Tamanho dos segmentos conservados depende de quanto

tempo atrás foi criado o LD:

– Maior número de gerações mais curtos os segmentos

– Segmentos ou haplótipos curtos “mais antigos”

– Segmentos ou haplótipos longos “mais novos” 94

Page 94: apresentação muito boa

Desequilíbrio de Ligação e recombinação

• A magnitude da LD depende da recombinação recente e

daquela que aconteceu várias gerações atrás

• Mudanças recentes e no passado do tamanho da população

afetam o LD:

- LD em distâncias curtas reflete o tamanho efetivada população

muitas gerações atrais (No passado)

- LD em distâncias mais longas reflete a história da população

recentemente (Hoje ou poucas gerações)

c= tamanho do segmento do cromossomo (Morgans)

Ne=tamanho efetivo da população t = 1/(2c)

95

Page 95: apresentação muito boa

Efeito do número de gerações sobre o LD entre loci localizados a diferentes distâncias

Distância (cM)

Gerações de recombinação

96

Page 96: apresentação muito boa

A B

CSH (LD) para diferentes comprimentos de cromossomos (dada a taxa de recombinação) para

as populações: A. aumento linear no tamanho da população, a partir de N = 1000 N = 5000 em

100 gerações B. Decréscimo linear no tamanho da população, a partir de N = 1000 N = 100 por

100 gerações.

Ben J. Hayes, Peter M. Visscher, Helen C. McPartlan, et al. Novel Multilocus Measure of Linkage Disequilibrium to Estimate Past Effective Population Size Genome Res. 2003 13: 635-643

Desequilíbrio de ligação e tamanho da população

97

Page 97: apresentação muito boa

Tamanho efetivo populacional ao longo da história da população, estimada a partir do r2 média a diferente distâncias entre marcadores, para touros da raça Holstein preto e branco da Holanda (HF_NLD), Holstein vermelho e branco da Holanda(RW_NLD), Holstein da Australia(HF_AUS), Angus da Australia (ANG_AUS), Holstein da Nova Zelândia (HF_NZL), e Jersey da Nova Zelândia (JER_NZL). Os pontos de dados foram baseadas em pelo menos 400 pares marcador.

Tamanho efetivo da população estimada para residentes de Utah (A) e várias regiões da África (B) . Para cada cromossomo e para cada par de SNP (0,001 espaçamento cm), Ne foi estimada a partir da r2, usando E (r2) = 1 / (1+ 4Nec). O número de gerações no passado foi calculada como 1 / (2c), e foi truncada em 5000. O tamanho efetivo populacional aumentou dramaticamente nas últimas gerações ~ 1000 (20.000 anos), a partir de um tamanho razoavelmente constante ancestral de ~ 2500 (Utah) e ~ 7000 (África).

Albert Tenesa, Pau Navarro, Ben J. Hayes, et al. Recent human effective population size estimated from linkage disequilibrium Genome Res. 2007 17: 520-526

A. P. W. de Roos, B. J. Hayes, R. J. Spelman and M. E. Goddard. Linkage Disequilibrium and Persistence of Phase in Holstein–Friesian, Jersey and Angus Cattle. Genetics 179: 1503–1512, 2008.

98

Page 98: apresentação muito boa

Mecanismos que geram LD

Fatores recorrentes - operam para criar LD cada geração:

a. DERIVA - em pequenas populações - por acaso ou por amostragem, os haplótipos transferidos para a próxima geração não estão nas frequências LE

b. MIGRAÇÃO PERIÓDICA - Mistura de populações nas quais ocorrem haplótipos em frequências diferentes (por exemplo, Pr (A1B1) = 1 para o pop. 1 e 0 para o pop. 2)

- Cruzamentos entre raças diferentes

c. SELEÇÃO- determinados haplótipos podem ser selecionados, aumento na freqüência

- Seleção também cria LD entre locos que são selecionados mediante

Goddard and Meuwissen (2005)

99

Page 99: apresentação muito boa

Fatores pontuais - funcionam apenas esporadicamente ao longo do tempo para criar LD

a. Mutação - ocorre em um haplótipo específico, que é então é único haplótipo que contém a mutação, resultando ser no LD com a mutação.

b. Mutação+Seleção (Natural ou Aritificial)

Mecanismos que geram LD

Goddard and Meuwissen (2005) 100

Page 100: apresentação muito boa

Amostragem de gametas

Processos que originam LD Deriva aleatória/ população pequena

m q

M Q

M q

M q m Q

m q M Q

M q

M Q

M Q

m q m q

m q

m q

M Q M Q

m Q

101

Page 101: apresentação muito boa

Processos que originam LD

Cruzamento

Linha Consaguinea I Linha Consaguinea II

M Q

M Q

M Q

M Q

M Q M Q

M Q X m q

m q

m q

m q

m q m q

m q

M Q

M Q M Q

M Q

m q

m q

m q

F1

102

Page 102: apresentação muito boa

Delineamento

F2

Linhas parentais

F1

F2

103

Page 103: apresentação muito boa

Seleção

Processos que originam LD

Mutação e Seleção

m q

M Q

m q

m q m q

m q M q

M q

M Q

M Q

M Q M Q

m q

m q

m q M q

Alelo QTL perto do marcador (M) mutou de q para Q, e a seguir aumentou a frequencia por: •Deriva aleatória •Ou seleção para Q (Seleção por barrida “Selection sweeped”)=Bloco entorno de Q em LD

104

Page 104: apresentação muito boa

• Em populações de animais, o tamanho da população finita é geralmente apontada como a principal causa da LD. Isso ocorre porque: – Tamanhos efetivos de população de animais são

relativamente pequenos, gerando quantidades relativamente grandes de LD

– LD devido ao cruzamento (migração) é grande quando o cruzamento ocorre entre linhas puras, e desaparece depois de apenas um número limitado de gerações

– mutações são susceptíveis de ter ocorrido há muitas gerações

– enquanto a seleção é provavelmente uma causa muito importante de LD, o seu efeito tende a ser localizada ao redor de genes específicos (assinaturas de seleção), T

– Tem um efeito relativamente pequeno sobre a quantidade de LD "média" sobre o genoma

105

Page 105: apresentação muito boa

Mutação

Seleção

Seleção

Geração 1

Geração 2

Geração 3

Mutação+Seleção

106

Page 106: apresentação muito boa

Mutação (q --- > Q) ocorreu em haplótipo marcador:

Muitas gerações de recombinação

Seleção em Q --> Varredura seletiva= bloco LD em torno de Q

Seleção para Q

+

107

Page 107: apresentação muito boa

Caracterização do desequilíbrio de ligação do genoma de duas linhas de seleção divergente de vacas leiteiras

Average linkage disequilibrium (r2) between SNP loci situated within 1 million base (1 Mb) intervals, by chromosome number; CON = control, SEL = select line of cows.

108

Page 108: apresentação muito boa

Efeito localizado da seleção sobre determinadas regiões do genoma

• Assinaturas de seleção podem ser identificadas pela comparação de LD em torno de um alelo selecionado em relação ao alelo não-selecionado

• Em populações de animais, a identificação de assinaturas de selecção no genoma devem ser associadas com características de produção (identificação de QTL)

• Alelos selecionados devem aumentar a frequência na população em torno de um segmento do cromossomo

Voight et al. A Map of Recent Positive Selection in the Human Genome. PLoS Biol 4(3): e72, 2006

109

Page 109: apresentação muito boa

• Uma abordagem é comparar o LD em torno do alelo selecionado para o alelo não-selecionados

• A seleção provoca um aumento rápido e incomum na frequência de alelos em determinada região

• Homozigose do Haplótipo (eHH): A maior homozigose do haplótipo na população maior quantidade de animais compartem a mesma combinação de alelos. Comparar o eHH entre população controle e selecionada.

Efeito localizado da seleção sobre determinadas regiões do genoma

110

Page 110: apresentação muito boa

• Ao comparar o grau de homozigose do haplótipo em haplótipos que possuem o alelo primitivo (ancestral) e o selecionado - a presença de uma diferença anormal na homozigose entre os dois alelos pode ser um indicador de seleção (assinatura de selção)

Efeito localizado da seleção sobre determinadas regiões do genoma

Voight et al. A Map of Recent Positive Selection in the Human Genome. PLoS Biol 4(3): e72, 2006

Magnitude de eHH em dados simulados

para um alelo na freqüência 0,5

111

Page 111: apresentação muito boa

iHS

A: alelo primitivo, D: alelo selecionado

If <<0: maior chance de encontrar uma assinatura de seleção (maior eHH) If >>0: menor chance de encontrar uma assinatura de seleção (menor eHH)

Standardized expectation and standard deviation are estimated from the genome-wide empirical distribution, so iHS signals from different SNPs are directly comparable regardless of the allele frequencies at those SNPs

Voight et al. A Map of Recent Positive Selection in the Human Genome. PLoS Biol 4(3): e72, 2006

Escore de Integração dos Haplitpos (iHS): para detectar assinaturas muito

recentes de seleção, em favor dos alelos do SNP que ainda não atingiram a

fixação

iHH: Integral de eHH

112

Page 112: apresentação muito boa

Assinaturas de seleção de bovinos no cromossomo 6

•Investigar as assinaturas seleção no cromossomo 6 de bovinos leiteiros da raça Vermelha Norueguesa •403 SNPs foram genotipadas no BTA6 em 18 famílias de meios-irmãos paternos •Escores do IHS foram calculados para os SNPs do BTA6 •O maior cluster dos escores do IHS extremos foi no intervalo de 35 36.5Mb

0

1

2

3

4

5

6

7

8

9

10

0 20 40 60 80 100 120

Position (Mb)

Sta

nd

ard

ized |iH

S|

Este intervalo contém um QTL com grande efeito sobre o % de proteína

(Olsen et al. 2005)

Em populações de animais altamente selecionados, a detecção de assinaturas de seleção pode revelar QTL para características produtivas

Hayes, B. et al. The origin of selection signatures on bovine chromosome 6. Animal Genetics, 39, 105–111, 2008

113

Page 113: apresentação muito boa

Efeitos do MAF na magnitude da LD em milho

(Yan et al., 2009) Genetic Characterization and Linkage Disequilibrium Estimation of a Global Maize Collection Using SNP Markers. PLoS ONE 4(12): e8451. doi:10.1371/journal.pone.0008451

Estimativa média para LD para três níveis de frequência do alelo menor (MAF)

114

Page 114: apresentação muito boa

Tamanho da amostra sobre o LD estimado

Estimativa média de LD para diferentes distâncias físicas para seis diferentes tamanhos de amostra (25, 50, 100, 200, 400 e 632).

- 632 linhas de milho - As estimativas médias do LD são agrupadas em todos os cromossomos, e seis diferentes tamanhos de amostra usando SNPs com MAF superiores a 0,05.

(Yan et al., 2009) Genetic Characterization and Linkage Disequilibrium Estimation of a Global Maize Collection Using SNP Markers. PLoS ONE 4(12): e8451. doi:10.1371/journal.pone.0008451

115

Page 115: apresentação muito boa

LD em populações de plantas, animais e humanos

116

Page 116: apresentação muito boa

- Illumina GoldenGate Ensaio com 1.536 SNPs em Milho -632 linhagens de milho de clima temperado, tropical e subtropical

LD em plantas

LD em 10 cromossomos do milho medidos com 914 SNPs. Só SNPs com uma freqüência do alelo menor (MAF) maior do que 0,05 são mostrados.

Estimativas médias da LD em diferentes distâncias físicas para subgrupos tropicais e temperados de milho. As estimativas médias do LD são agrupados em todos os cromossomos, e dois subgrupos (A = tropicais, temperadas= B).

(Yan et al., 2009) Genetic Characterization and Linkage Disequilibrium Estimation of a Global Maize Collection Using SNP Markers. PLoS ONE 4(12): e8451. doi:10.1371/journal.pone.0008451

117

Page 117: apresentação muito boa

Análise de LD em várias espécies de mamíferos

Mean LD estimates at different physical distances in cattle, mouse and human

A total of 1,546 Holstein Friesian bulls were genotyped for 15,036 SNPs. A subset of 1,000 bulls (called the reference sample) was selected for LD analysis based on minimizing their pedigree relationship with each other.

Data on 2202 mice genotyped for 13,459 SNPs from the intercrossing of 8 inbred lines to create a population maintained for 50 generations of pseudo-random mating and referred to as heterogeneous stock mice.

Data on 537 participants genotyped for 408,000 SNPs. A sample of 1500 SNPs on one chromosome (HSA15) was selected for estimation of LD parameters and comparison to mouse and cattle.

118

Page 118: apresentação muito boa

Desequilíbrio de ligação do genoma em bovinos

Valores de desequilíbrio de ligação (r2) médios para cada raça.

Em suínos maiores níveis de LD (100kb r2=0,37)

(Mc Kay et al., 2007)

119

Page 119: apresentação muito boa

Average r2 values for inter-marker distances <1 kb for each breed and chromosome. Data are not presented for breed by chromosome combinations for which there were less than 5 informative locus pairs (BTA19)

120

Page 120: apresentação muito boa

Resultados de LD em Nelore com o BovineHD

0

0,1

0,2

0,3

0,4

0,5

0 to 0.99 1 to 1.99 2 to 2.99 3 to 3.99 4 to 4.99 5 to 9.99 10 to 19 20 to 29 30 to 39 40 to 49 50 to 59 60 to 69 70 to 79 80 to 89 90 to 100

r2

Distance between markers (kb)

BTA1 BTA2 BTA3 BTA4 BTA5 BTA6 BTA7 BTA8 BTA9 BTA10 BTA11 BTA12 BTA13 BTA14

0

0,1

0,2

0,3

0,4

0,5

0 to 0.99 1 to 1.99 2 to 2.99 3 to 3.99 4 to 4.99 5 to 9.99 10 to 19 20 to 29 30 to 39 40 to 49 50 to 59 60 to 69 70 to 79 80 to 89 90 to 100

r2

Distance between markers(kb)

BTA16 BTA17 BTA18 BTA19 BTA20 BTA21 BTA22 BTA23 BTA24 BTA25 BTA26 BTA27 BTA28 BTA29

Mean values of r2 per chromosome according to distance between markers

121

Page 121: apresentação muito boa

Desequilíbrio de ligação e persistência da fase em bovinos Holstein-Friesian, Jersey e Angus

Média de desequilíbrio de ligação (r2) como função da distância entre os marcadores para touros da raça Holstein preto e branco da Holanda (HF_NLD), Holstein vermelho e branco da Holanda(RW_NLD), Holstein da Australia(HF_AUS), Angus da Australia (ANG_AUS), Holstein da Nova Zelândia (HF_NZL), e Jersey da Nova Zelândia (JER_NZL) para distâncias entre 0 e 100 kb, e entre 100 e 1000 kb

De Roos et al. (Genetics 2009) 122

Page 122: apresentação muito boa

• Pode o mesmo marcador ser usado em diferentes raças?

• Avaliação da consistência do LD entre SNPs em várias raças

– Comparar r2 entre os mesmos pares de SNPs em diferentes raças

• O LD (r2) entre dois alelos SNPs em raças diferentes pode ser o mesmo, mas a fase de ligação entre os marcadores e QTL ser diferentes

– Utilização da correlação (corr(r1,r2)) entre alelos do SNP ao invés dos quadrados de correlação (r2)

Persistência do LD entre raças

123

Page 123: apresentação muito boa

Três Raças com diferente fase de ligação

A fase de ligação pode variar entre as raças

Na raça A, o alelo G do SNP será herdado, juntamente com o alelo '+' para a característica e do alelo "T" com o alelo - para o caráter . Na raça B esse padrão é invertido e na raça C o gene da característica não é polimórfico.

Persistence of LD across breeds Persistência de LD entre raças

124

Page 124: apresentação muito boa

Persistência de LD entre raças

Raça 1

Raça 2

Raça 3

Marcador B

Marcador A

Marcador A Marcador B

Marcador B Marcador A

Frequencia

Frequencia

Frequencia

Frequencia

Frequencia

Frequencia

125

Page 125: apresentação muito boa

Correlação entre o Desequilíbrio de ligação em bovinos Holstein-Friesian, Jersey e Angus

Correlação de r entre as populações em função da distância genômica, para touros Holstein-Friesian Holandês (preto HF_NLD), para touros Holstein-Friesian Holandês (vermelho RW_NLD), touros Holstein-Friesian australiano (HF_AUS), touros Angus australiano (ANG_AUS), vacas Holstein-Friesian da Nova Zelândia (HF_NZL), Jersey da Nova Zelândia (JER_NZL).

Uma alta correlação significa que espera-se que os

efeitos dos SNP persistem através das raças

De Roos et al. (Genetics 2009)

Correlações entre LD diminui com a distância ---->maior recombinação

Co

rrela

ção

(r 1

,r2)

Distância entre os marcadores

126

Page 126: apresentação muito boa

Correlação entre os valores de r entre as raças (entre pares de SNPs ANG = Angus, RGU = Red Angus, HOL = Holandesa, Vermelho = NRC norueguesa, JER = Jersey, Guernsey GNS = DH = CHL, Hereford = Charolês, Limousin LMS = = BSW Pardo Suíço, PMT = piemontês RMG, = Romagnola , BMA NDA = N'Dama, Beefmaster = = BET Santa Gertrudis, BRM SHK = sheko, Brahman = NEL, = Nelore, Gir = Gir

Gen

om

e-Wid

e Survey o

f SNP

Variatio

n U

nco

vers the G

enetic Stru

cture o

f Cattle B

reeds. Th

e Bo

vine H

apM

ap C

on

sortiu

m. Scien

ce 32

4, 5

28

(20

09

)

127

Page 127: apresentação muito boa

Correlação entre os valores de r em duas linhas de seleção divergente de vacas leiteiras

Correlation of linkage disequilibrium (r2) calculated between the control and select lines of cows by distance (million bases, Mb) between SNP pairs (solid line); dotted line represents overall LD correlation between the 2 lines.

128

Page 128: apresentação muito boa

Para diversas finalidades, é importante saber a persistência da fase de LD através das populações

• A falta de persistência da fase entre duas populações pode explicar porque os marcadores que foram descobertos em uma população não pôdem ser confirmados em uma segunda população

• Predizer a densidade de marcadores necessários para mapeamento de precisão, para um estudo de associação de genoma amplo, ou seleção genômica

• Na seleção genômica utilizar a mesma equação de predição para as duas populações

nnxbxbxby .......2211 129

Page 129: apresentação muito boa

• As correlações entre LD esta relacionado com o número de gerações na qual as linhas/raças foram separadas – mais gerações de separação maior diminuição da LD por recombinação

LD menos consistente

• Raças que divergiram recentemente têm boas perspectivas de um marcador encontrado em uma raça ser utilizado na outra raça.

• Raças mais distantes, serão necessários mapas de marcadores muito mais densos para encontrar marcadores que podem ser utilizados através das raças (Bovine HD??).

• Importante em populações multi-raciais

Persistência de LD entre raças

130

Page 130: apresentação muito boa

Estratégias para a inferência dos haplótipos

131

Page 131: apresentação muito boa

Estratégias para a inferencia dos haplotipos

• O genoma é composto por regiões de alto LD intercaladas com regiões de baixa LD;

• Áreas com alta LD apresentam altos índices de conservação.

• Estas regiões objeto de estudos na busca por SNPs;

132

Page 132: apresentação muito boa

Estratégias para a inferência dos haplotipos

Definição: Um conjunto de marcadores genéticos ligados intimamente presentes em um cromossomo, que tendem a ser herdados juntos (não são facilmente separáveis por recombinação).

Estatisticamente, os haplótipos são um conjunto de alelos de locos

vizinhos e têm significado biológico

– Animal 1 tem o haplótipo “gc” “ca”

– Animal 2 tem o haplótipo “cc” “ga”

ataagtcgatactgatgcatagctagctgactgacgcgat

ataagtccatactgatgcatagctagctgactgaagcgat

ataagtccatactgatgcatagctagctgactgacgcgat

ataagtcgatactgatgcatagctagctgactgaagcgat

Animal 1 – Chromosome 1

Animal 1 – Chromosome 2

Animal 2 – Chromosome 1

Animal 2 – Chromosome 2

133

Page 133: apresentação muito boa

Exemplo: um indivíduo com genótipo A1A2 e B1B2 nos loci A e B, pode ter as seguintes combinações de pares de haplótipos (separados por /):

A1B1 / A2B2 : alelos A1 e B1 recebeu de um dos pais e A2 e B2 do outro pai

A1B2 / A2B1 : alelos A2 e B1 recebeu de um dos pais e A2 e B1 do outro pai

A relação entre as frequências de haplótipos e as frequências dos alelos que compõem cada haplótipo depende se os alelos nos dois locos são dependentes ou independentes

134

Page 134: apresentação muito boa

Principais vantagens e problemas do uso de haplótipos

• Aumento do poder do teste em comparação com a análise de um único locus

– Densidade dos marcadores

• Imputação de genótipos faltantes

• Inferência dos haplotipos

– Método para inferência dos haplotipos

– Incerteza na estimação dos Haplótipos

• Algoritmos para estimação dos haplótipos estão sempre sujeitos a erros

• Minimizar falsas construções de haplótipos

– Maior número de efeitos a serem estimados

Exemplo 2 marcadores bi-alélicos

• 1_1 ; 2_2; 1_2; 2_1

– Haplotipos em baixa frequencia ou raros

135

Page 135: apresentação muito boa

Estratégias para inferir os haplotipos

• Em famílias de meio-irmãos

– Quais dos alelos recebidos do pai ocorrem com maior frequência na progênie

– Haplótipo da mãe é obtido subtraindo o haplótipo do pai na progênie

• Pedigrees complexos

– Não todos os indivíduos são genotipados

– Muito trabalhoso, menos informação por pai, marcadores perdidos, consanguinidade, etc.

– Um gráfico de ascendência genética especifica os caminhos de fluxo gênico

– SimWalk

136

Page 136: apresentação muito boa

• Amostra aleatória de indivíduos de uma população

– Inferir os haplotipos a partir dos dados utilizando o LD e a frequência alélica

– PHASE (Stephens et al., 2001)

• Utiliza as informações a priori das frequências alélicas, frequências dos haplótipos e LD

• O método de reconstrução dos haplótipos considera que os haplótipos são variáveis aleatórias e visa obter a distribuição condicional de probabilidade de cada haplótipo, tendo em consideração os dados do genótipo.

• Uma característica interessante do algoritmo é que uma probabilidade aproximada de cada haplótipo ser correto para cada animal pode ser obtida a partir da distribuição posterior das estimativas.

• Estas probabilidades podem potencialmente ser usadas no processo de mapeamento de QTL

Estratégias para inferir os haplotipos

137

Page 137: apresentação muito boa

Considerações finais

• A utilização das informações moleculares através da genotipagem em larga escala, utilizando painéis de marcadores (SNPs) de alta densidade, para o melhoramento genético de espécies de animais domésticos é uma realidade em muitos países

• O atual nível desequilíbrio de ligação na população é consequência de vários fatores que atuaram sobre a população ao longo das gerações

• O desequilíbrio de ligação entre os marcadores é fundamental nos estudos de associação ampla e seleção genômica

138