Upload
thomaz-canejo-covalski
View
215
Download
1
Embed Size (px)
Citation preview
Carine Moreira
Avaliador: Abadio de Oliveira da Costa
BTC 510028 - Biologia Molecular e Métodos Analíticos
Problemática
Polimorfismos em sequências de mRNA marcados – Afeta
afinidade de sondas de Microarray
RESULTADOS FALSO-POSITIVO E FALSO NEGATIVO EM
ESTUDOS DE QTL
QTL – Quantitative trait locus
Locus controladores da expressão gênica
REGIÃO AO LONGO DO CROMOSSOMO RESPONSÁVEIS
PELA EXPRESSÃO DE CARACTERÍSTICAS
QUANTITATIVAS
Características quantitativas:
Reguladas por vários genes + fatores
ambientais
Agropecuária
Processos de seleção para
melhoramento genético
FENÓTIPO DE INTERESSE
ECONÔMICO
Relação - Microarray X QTL
QTL mapeados – análise do perfil de hibridização
Identificação de QTL
Análise do padrão de expressão em larga
escala Chip com perfil de
expressãoSpots/probes
Estudo QTL – dados do scanner do microarray
Conhecimento prévio de mapeamento de QTL
DESVANTAGENS
Custo elevado – desenvolvimento de população experimental (F2);
Marcadores moleculares que cubram todo o genoma;
Estudo da herdabilidade da característica em estudo;
Região cromossômica que possivelmente contêm os genes de interesse
– não define número e nem efeitos exatos desses genes sobre a
característica quantitativa;
Microarrays – Polimorfismos em sondas
Desenho de sondas a partir de uma única referência;
= ≠ Ø
Resultados confusos de eQTL
Sinais falso-positivo e falso-negativo
Informação incompleta de referência de localização de SNPs
Avaliar de uma forma detalhada o problema de polimorfismo em
sondas;
ESTRATÉGIAS
1. 1000 Genomes (Março 2012)
NHLBI Exome Sequencing Project
2. Investigação sistemática do efeito no protocolo de remoção de sinal QTL;
3. Avaliar uma solução para o problema – construindo uma manual e um
website para usuários de como identificar sondas que podem conter
polimorfismos;
Identificação e remoção de sinais suspeitos de
QTL
Pesquisa de dados → Perfil de expressão e genótipo
CRBL – Cerebelo humano
FCTX – cortex frontal
INDIVÍDUOS NORMAIS
Illumina HT12
Perfil de expressão de cérebro de 304 indivíduos Norte Americanos
(NABEC)
Affymetrix Human Exon
Perfil de expressão de cérebro de 134 indivíduos do Reino Unido
(UKBEC)
Illumina HT12
- Sondas 50 oligonucleotídeos (50-mer)
- 48000 sondas
- Alto rendimento
- Custo efetivo
- Ideal para estudos de eQTL
Affymetrix Human Exon
- Sondas 25 oligonucleotídeos (25-mer)
Análise da expressão de QTL e Identificação de sinal LD-resolved →
Software MatrixEQTLR – Estatística computational
LD – linkage desequilibrium - se dois genes estão em desequilíbrio de ligação, isto significa que determinados alelos de cada gene são herdados em conjunto mais frequentemente do que seria esperado por acaso. Isto pode ser devido à ligação genética real - isto é os genes estão estreitamente localizado no mesmo cromossomo, ou pode ser também devido a alguma forma de interação funcional, onde algumas combinações de alelos em dois loci
Pesquisa de dados de referência de polimorfismos e Identificação de
sondas contendo polimorfismos →Suspect-cis-eQTL – cis-eQTL: sonda contendo polimorfismo com
frequência alélica maior que 1% em Europeus;
Conjunto de dados de referência e diferentes variações genéticas - SNPs – Illumina HumanHap550 (NABEC)
Illumina Omni-1 M Quad (UKBEC)
Painel CEU de HapMap
1000 Genome Project
Servidor variantes de exons – NHLBI-ESP
Sondas Affymetrix → Conjunto de quatro sondas
Probe masking
1.Se uma das 4 sondas contêm polimorfismo e a outras não – a análise foi
feita nas 3 – Denominação: Sonda alterada
2.Se mais de uma sonda contêm polimorfismo – Denominação: Sonda
descartada Através dessa metodologia tanto resultados falso-positivo quanto falso-negativo
podem ser recuperados
Proporção de sondas contendo polimorfismos na sequência
Uso diferentes dados de referência para determinar o polimorfismo na sonda;
Porcentagem de sondas com polimorfismos é proporcional a quantidade de dados do
chip;
Porcentagem de sondas alteradas – aumenta de acordo com o aumento de dados dos
bancos de referência;
* Banco de dados
*
* Número de SNPs
*
Proporção de LD-resolved cis-acting eQTL a partir de sondas com
polimorfismo na sequência
Sinais LD suspeitos – porque estão associados a sondas que contêm
polimorfismos;
Maior que a proporção de sondas que contêm polimorfismo;
Affymetrix Human Exon – mais afetado (55-65%);
A presença de polimorfismo em uma sequência longa (Illumina) tem efeito menos
pronunciado na afinidade de ligação do que na sequência curta;
Abordagem para lidar com os supects cis-eQTL a partir de sondas
descartadasAffymetrix Exon – 4 sondas constituintes: Exclui uma que tem
polimorfismo, avalia as três (P-value). Se mais de uma contêm
polimorfismo – descarta a sonda; Recupera dois terços das sondas que contêm polimorfismos (sondas alteradas)
Sondas Illumina???
Probe masking
Três alternativas1.Remover todos os cis-eQTL2.Aplicar análise de associação condicional;3.Aplicar LD-filtering;
Análise de associação condicional – requer conhecimento da sequência da sonda polimórfica – sequenciamento – trabalhoso e caro; < 6% de cis-eQTL resgatados (Affymetrix e Illumina)
LD-filtering: resgata 80% de cis-eQTL – mas resgata falso cis-eQTL – independente do R² aplicado NÃO É RECOMENDADO
Exemplo de falso-positivo e falso-negativo devido a
polimorfismo em sonda – Dois genes
MAPT – Associado a doenças neurodegenerativas
PRICKLE1 – Associado a epilepsia progressiva
Falso-positivo Affymetrix Human Exon
Log
de e
xpre
ssão
Falso-negativo
Log
de e
xpre
ssão
Falso-positivo Illumina HT12Lo
g de
exp
ress
ão
Pequena proporção de sequências contendo polimorfismo –
aumenta o número de sinais cis-eQTL – afeta diretamente o e-
value que define significância;
Aumento de banco de dados – mais SNPs conhecidos – Mais
sondas são avaliadas e identificados os possíveis
polimorfismos;
Tecnologia para análise de expressão – RNA-seq –
Polimorfismos em sondas continuará sendo importante; Microarray – baixo custo;
Dados de eQTLs baseado em Microarray – recomenda-se
reavaliar as sondas para identificar polimorfismos; Principalmente base de dados de grande porte: Phenotype-Genotype Integrator
eQTLbrowser
seeQTL
SNPexpress
GeneVar
Ideal – Base de dados com identificação automática de QTL suspeitos;
SOLUÇÃO: Desenvolvimento de um website:
https://caprica.genetics.kcl.ac.uk/~ilori/pipfinder.php
https://caprica.genetics.kcl.ac.uk/~ilori/pipfinder.php
Prevenção na análise e interpretação de eQTLs
Identificando o problema, este pode ser resolvido;
RESULTADOS DE MODO GERAL