Carine Moreira Avaliador: Abadio de Oliveira da Costa BTC 510028 - Biologia Molecular e Métodos...

Preview:

Citation preview

Carine Moreira

Avaliador: Abadio de Oliveira da Costa

BTC 510028 - Biologia Molecular e Métodos Analíticos

Problemática

Polimorfismos em sequências de mRNA marcados – Afeta

afinidade de sondas de Microarray

RESULTADOS FALSO-POSITIVO E FALSO NEGATIVO EM

ESTUDOS DE QTL

QTL – Quantitative trait locus

Locus controladores da expressão gênica

REGIÃO AO LONGO DO CROMOSSOMO RESPONSÁVEIS

PELA EXPRESSÃO DE CARACTERÍSTICAS

QUANTITATIVAS

Características quantitativas:

Reguladas por vários genes + fatores

ambientais

Agropecuária

Processos de seleção para

melhoramento genético

FENÓTIPO DE INTERESSE

ECONÔMICO

Relação - Microarray X QTL

QTL mapeados – análise do perfil de hibridização

Identificação de QTL

Análise do padrão de expressão em larga

escala Chip com perfil de

expressãoSpots/probes

Estudo QTL – dados do scanner do microarray

Conhecimento prévio de mapeamento de QTL

DESVANTAGENS

Custo elevado – desenvolvimento de população experimental (F2);

Marcadores moleculares que cubram todo o genoma;

Estudo da herdabilidade da característica em estudo;

Região cromossômica que possivelmente contêm os genes de interesse

– não define número e nem efeitos exatos desses genes sobre a

característica quantitativa;

Microarrays – Polimorfismos em sondas

Desenho de sondas a partir de uma única referência;

= ≠ Ø

Resultados confusos de eQTL

Sinais falso-positivo e falso-negativo

Informação incompleta de referência de localização de SNPs

Avaliar de uma forma detalhada o problema de polimorfismo em

sondas;

ESTRATÉGIAS

1. 1000 Genomes (Março 2012)

NHLBI Exome Sequencing Project

2. Investigação sistemática do efeito no protocolo de remoção de sinal QTL;

3. Avaliar uma solução para o problema – construindo uma manual e um

website para usuários de como identificar sondas que podem conter

polimorfismos;

Identificação e remoção de sinais suspeitos de

QTL

Pesquisa de dados → Perfil de expressão e genótipo

CRBL – Cerebelo humano

FCTX – cortex frontal

INDIVÍDUOS NORMAIS

Illumina HT12

Perfil de expressão de cérebro de 304 indivíduos Norte Americanos

(NABEC)

Affymetrix Human Exon

Perfil de expressão de cérebro de 134 indivíduos do Reino Unido

(UKBEC)

Illumina HT12

- Sondas 50 oligonucleotídeos (50-mer)

- 48000 sondas

- Alto rendimento

- Custo efetivo

- Ideal para estudos de eQTL

Affymetrix Human Exon

- Sondas 25 oligonucleotídeos (25-mer)

Análise da expressão de QTL e Identificação de sinal LD-resolved →

Software MatrixEQTLR – Estatística computational

LD – linkage desequilibrium - se dois genes estão em desequilíbrio de ligação, isto significa que determinados alelos de cada gene são herdados em conjunto mais frequentemente do que seria esperado por acaso. Isto pode ser devido à ligação genética real - isto é os genes estão estreitamente localizado no mesmo cromossomo, ou pode ser também devido a alguma forma de interação funcional, onde algumas combinações de alelos em dois loci

Pesquisa de dados de referência de polimorfismos e Identificação de

sondas contendo polimorfismos →Suspect-cis-eQTL – cis-eQTL: sonda contendo polimorfismo com

frequência alélica maior que 1% em Europeus;

Conjunto de dados de referência e diferentes variações genéticas - SNPs – Illumina HumanHap550 (NABEC)

Illumina Omni-1 M Quad (UKBEC)

Painel CEU de HapMap

1000 Genome Project

Servidor variantes de exons – NHLBI-ESP

Sondas Affymetrix → Conjunto de quatro sondas

Probe masking

1.Se uma das 4 sondas contêm polimorfismo e a outras não – a análise foi

feita nas 3 – Denominação: Sonda alterada

2.Se mais de uma sonda contêm polimorfismo – Denominação: Sonda

descartada Através dessa metodologia tanto resultados falso-positivo quanto falso-negativo

podem ser recuperados

Proporção de sondas contendo polimorfismos na sequência

Uso diferentes dados de referência para determinar o polimorfismo na sonda;

Porcentagem de sondas com polimorfismos é proporcional a quantidade de dados do

chip;

Porcentagem de sondas alteradas – aumenta de acordo com o aumento de dados dos

bancos de referência;

* Banco de dados

*

* Número de SNPs

*

Proporção de LD-resolved cis-acting eQTL a partir de sondas com

polimorfismo na sequência

Sinais LD suspeitos – porque estão associados a sondas que contêm

polimorfismos;

Maior que a proporção de sondas que contêm polimorfismo;

Affymetrix Human Exon – mais afetado (55-65%);

A presença de polimorfismo em uma sequência longa (Illumina) tem efeito menos

pronunciado na afinidade de ligação do que na sequência curta;

Abordagem para lidar com os supects cis-eQTL a partir de sondas

descartadasAffymetrix Exon – 4 sondas constituintes: Exclui uma que tem

polimorfismo, avalia as três (P-value). Se mais de uma contêm

polimorfismo – descarta a sonda; Recupera dois terços das sondas que contêm polimorfismos (sondas alteradas)

Sondas Illumina???

Probe masking

Três alternativas1.Remover todos os cis-eQTL2.Aplicar análise de associação condicional;3.Aplicar LD-filtering;

Análise de associação condicional – requer conhecimento da sequência da sonda polimórfica – sequenciamento – trabalhoso e caro; < 6% de cis-eQTL resgatados (Affymetrix e Illumina)

LD-filtering: resgata 80% de cis-eQTL – mas resgata falso cis-eQTL – independente do R² aplicado NÃO É RECOMENDADO

Exemplo de falso-positivo e falso-negativo devido a

polimorfismo em sonda – Dois genes

MAPT – Associado a doenças neurodegenerativas

PRICKLE1 – Associado a epilepsia progressiva

Falso-positivo Affymetrix Human Exon

Log

de e

xpre

ssão

Falso-negativo

Log

de e

xpre

ssão

Falso-positivo Illumina HT12Lo

g de

exp

ress

ão

Pequena proporção de sequências contendo polimorfismo –

aumenta o número de sinais cis-eQTL – afeta diretamente o e-

value que define significância;

Aumento de banco de dados – mais SNPs conhecidos – Mais

sondas são avaliadas e identificados os possíveis

polimorfismos;

Tecnologia para análise de expressão – RNA-seq –

Polimorfismos em sondas continuará sendo importante; Microarray – baixo custo;

Dados de eQTLs baseado em Microarray – recomenda-se

reavaliar as sondas para identificar polimorfismos; Principalmente base de dados de grande porte: Phenotype-Genotype Integrator

eQTLbrowser

seeQTL

SNPexpress

GeneVar

Ideal – Base de dados com identificação automática de QTL suspeitos;

SOLUÇÃO: Desenvolvimento de um website:

https://caprica.genetics.kcl.ac.uk/~ilori/pipfinder.php

https://caprica.genetics.kcl.ac.uk/~ilori/pipfinder.php

Prevenção na análise e interpretação de eQTLs

Identificando o problema, este pode ser resolvido;

RESULTADOS DE MODO GERAL

Recommended