81
Polimorfismos de nucleotídeos únicos em espécies poliplóides Ramon Oliveira Vidal Email: [email protected] Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador: Gonçalo A.G. Pereira LGE - Laboratório de Genômica e Expressão @ramonvidal

Ramon Oliveira Vidal Email: [email protected]@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Embed Size (px)

Citation preview

Page 1: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Polimorfismos de nucleotídeos únicos em

espécies poliplóides

Ramon Oliveira VidalEmail: [email protected]

Doutorando em Genética e Biologia MolecularSub área: Bioinformática

Orientador: Gonçalo A.G. Pereira

LGE

- L

abor

atór

io d

e G

enôm

ica

e E

xpre

ssão

@ramonvidal

Page 2: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Marcadores Moleculares◦ Marcadores por Hibridação◦ Marcadores por Amplificação

Polimorfismos X mutações SNPs

◦ Origem◦ Aplicações◦ Haplótipos◦ Genotipagem◦ Identificando os SNPs (em genomas e transcriptomas)

Sanger 454 Solexa

Taxa de evolução Identificação de SNPs em Coffea arabica

Tópicos da Apresentação

Page 3: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Fenótipo Propriedades observáveis de um indivíduo, que

se desenvolveram sob a influência de: genótipo do indivíduo fatores ambientais

Fenótipo e Genótipo

Genótipo Constituição genética de um organismo

como revelada pela análise genética e molecular, ou seja, o conjunto completo de genes, tanto dominantes e recessivos.

Page 4: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Qualquer característica morfológica ou molecular que diferencia indivíduos, e que seja facilmente detectável

Marcadores

Page 5: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

É um fenótipo de fácil identificação, normalmente determinado por um único alelo.

Características fenotípicas de fácil identificação visual são utilizadas como marcadores morfológicos desde os tempos de Mendel

Marcadores Morfológicos

Page 6: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Polimorfismo detectado na seqüência de DNA

Vantagens:

- Não é objeto de influências ambientais;

- Praticamente ilimitado em número;

Maior desvantagem é a necessidade de técnicas e

equipamentos mais complexos.

Marcadores de DNA (moleculares)

Page 7: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Reprodutibilidade; Amplamente distribuído através do genoma;

Poder de discriminação; Ausência de influências ambientais; Barato; Fácil de mensurar

Características Desejáveis aos marcadores moleculares

Page 8: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Diplóide: Constituído por duas cópias (homólogos) de cada cromossomo.

Alelo: As formas alternativas de um caráter genético encontrado em um determinado locus de um cromossomo.

Homozigotos: Um organismo diplóide com alelos idênticos de um determinado gene em ambos os cromossomos homólogos.

Heterozigotos :Um organismo diplóide com alelos diferentes de um determinado gene em ambos os cromossomos homólogos.

Alguns conceitos básicos

Page 9: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Diplóide

Haplóide

Alelos

homozigoze

heterozigoze

Page 10: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Hibridação◦ RFLP – (Restriction Fragment Length

Polymorphism)◦ Minissatélites – VNTR –(Variable Number of

Tandem Repeats)

Amplificação de DNA◦ RAPD – (Random Amplified Polymorphic DNA)◦ SCAR (Sequence Characterized Amplified Regions)

ou ASA (Amplified Specific Amplicon)◦ Microssatélites –SSR (Simple Sequence Repeats)◦ AFLP (Amplified Fragment Length Polymorphism)

Tipos de marcadores

Page 11: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

RFLP – Restriction Fragment Length Polymorphism

Page 12: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

RFLP – Restriction Fragment Length Polymorphism

Page 13: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

RAPD - Random Amplified Polymorphic DNA

Polimorfismo de DNA entre indivíduos pode ser devido a:• Ausência do sítio do

primer.• Surgimento de um novo

sítio.• Ao comprimento da

região amplificada entre sítios de primer

Page 14: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Significa Seqüências Simples Repetidas, a qual consiste de pequenas seqüências de nucleotídeos (1 a 4) repetidas em tandem.

Essas seqüências são distribuídas ao acaso no genoma e é um dos marcadores mais utilizados atualmente

Microssatélites – SSR (Simple Sequence Repeats)

Page 15: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Primers específicos (20 a 30 pb).

Diferentes números de elementos simples repetidos.

Cada segmento amplificado de tamanho diferente representa um alelo diferente do mesmo loco

Microssatélites – SSR (Simple Sequence Repeats)

Page 16: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Genótipos na eletroforese

Page 17: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Mutações genéticas◦ Alteração na seqüência de nucleotídeos de uma molécula de

DNA. ◦ O termo "mutação“ é geralmente usado para referir-se a

alterações na seqüência de DNA que não estão presentes na maioria dos indivíduos de uma espécie

Polimorfismos genéticos◦ Diferença na seqüência de DNA entre indivíduos, grupos ou

populações. ◦ Incluem SNPs, seqüências repetitivas, inserções, deleções e

recombinações. Podem dar origem a olhos ou olhos castanhos, cabelo liso ou

cabelos crespo◦ Resultado de processos naturais ou induzidos por agentes

externos (como vírus ou radiação).

Polimorfismos genéticos X Mutações genéticas

Page 18: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Polimorfismos genéticos X Mutações genéticas

Polimorfismos são alterações no DNA que se mantém nas gerações futuras◦ Polimorfismo: variação >1%◦ Mutação: variação <1%

C T T A G C T T

C T T A G T T T

Polimorfismo

C T T A G C T T

C T T A G T T T

Mutação

94%

6%

99.9%

0.1%

Page 19: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

TAAAAAT

TAACAAT

TAAAAAT TAAAAAT TAACAAT TAACAAT TAACAAT

TAAAAAT TAACAAT

TAAAAAT

• Polimorfismos foram mutações que se propagaram ao longo de gerações

Polimorfismos genéticos X Mutações genéticas

Page 20: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Single Nucleotide Polymorphism, ou SNP ("snip"):

◦ pequena mudança, ou variação, que pode ocorrer em um único nucleotídeo numa sequência de DNA em uma porção significativa (mais de 1%) de uma população.

SNPs

Page 21: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

SNPs são as mais frequêntes formas de variações genéticas◦90% das variações genéticas humanas vêm dos SNPs

SNPs tem se tornado marcadores de preferência pela sua grande abundância e pelo desenvolvimento de tecnologias de genotipagem em larga escala.

Single Nucleotide Polymorphism

Page 22: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

SNPs em menor quantidade em genes do que em regiões não-

codificantes

Menor quantidade de SNPs nos cromossomos sexuais (humano).

Dentro de um único cromossomo, SNPs podem se concentrar em

uma região específica, geralmente implicando uma região de

interesse ou de pesquisa.

Em média, ocorrem a cada 300~600 nucleotídeos (humano).

Genes com maior pressão para modificação tem maior frequência

de SNP (resistência, adaptação, interação parasita-hospedeiro,

etc)

Distribuição dos SNPs

Page 23: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Intra espécie◦Diversidade entre os indivíduos de uma

mesma espécie◦Reflete os SNPs entre os alelos (espécies

diplóides) Inter espécies

◦Diversidade entre espécies diferentes

SNPs intra/inter específicos

Page 24: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Não-codificantes Codificantes

Sinônimas Não-sinônimas

conservativas Não-conservativas

Classificação dos SNPTransições

Purina<->PurinaPirimidina<->Pirimidina

TransversõesPurina<->Pirimidina

Page 25: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Genotipagem ◦ Detecção de genótipos de individuos. ◦ Pode ser realizada observando os SNPs.

Haplótipo (genótipo haplóide) ◦ Alelo encontrado em um único cromossomo que

apresenta o mesmo padrão de SNPs. ◦ Blocos haplótipos e tendem a ser herdados

juntos.◦ Podem servir como marcadores de doença

genética. ◦ A análise de haplótipos é útil na identificação

de eventos de recombinação.

Page 26: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Blocos de haplótipos Dentro de um bloco haplótipo, acontece

pouca ou nenhuma recombinação Os SNPs dentro de um bloco haplótipo são

passados juntos nas gerações futuras

Page 27: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

haplótipos Um haplótipo é um conjunto de SNP no

mesmo cromossomo

SNP1 SNP2 SNP3

-A C T T A G C T T-

-A A T T T G C T C-

-A C T T T G C T C-

Haplotype 2

Haplotype 3

C A T

A T C

C T CHaplotype 1

SNP1 SNP2 SNP3

Page 28: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Zonas de recombinação e Blocos de haplótipos

Recombinationhotspots

Chromosome

Haplotypeblocks

C1 C2 C1S1

S2

S3

S4

S5

S1

S2

S3

S4

S5

SNP loci

Haplotype patterns : Major allele

: Minor allele

SNP loci

C2

I1 I2

Page 29: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

SNPs estão relacionados com a diversidade de genótipos de humanos◦ podem ser mapeados relacionando-os a

diversidade de fenótipos. Um SNP individual ou um bloco haplótipo

pode servir de indicação para◦ características agronômicas◦ doenças◦ etc

Essa relação constitui a base e a motivação para a identificação e genotipagem de SNPs.

Blocos de Haplótipos

Page 30: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

O genoma de cada indivíduo contém distintos padrões de SNPs

Pessoas podem ser agrupadas de acordo com esse perfil

Perfil de SNPs são importantes na identificação de respostas a terapias◦ Existe uma correlação entre certos perfis de

SNPs e respostas específicas a tratamentos

Genotipagem e utilizando SNPs como marcadores

Page 31: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Genoma/transcriptoma◦Sanger◦454◦Solexa/Solid/...

Alinhamento de sequências Identificação de Discrepâncias

Identificação de SNPs através da análise de sequencias

Page 32: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Encontrando SNPs: Mineração de SNPs baseados no sequenciamento

(Sanger tradicional)

Sequenciamento De DNA

mRNA

cDNALibrary

ESTOverlap

Genomic

BACLibrary

RRSLibrary

BACOverlap

ShotgunOverlap

Page 33: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Fragment DNA

DNA from multiple individuals

Sequence and Reassemble (known sequence) Assembly with other overlapping

GTTACGCCAATACAGGATCCAGGAGATTACCGTTACGCCAATACAGCATCCAGGAGATTACC

mismatches = SNPs

Encontrando SNPs: Mineração de SNPs baseados no sequenciamento

Page 34: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Base-calling Contig assembly

Sequence viewing

Polymorphism tagging

Relatório de polimorfismos

Genotipagem individual

Polymorphism detection

PolyPhred

Consed

Analysis

Sequenciamento Phred PhrapAmplificação do DNA5’ 3’

Vários indivíduos

Page 35: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

SNP Discovery - Sanger sequencing (EST)

Page 36: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

SNP Discovery - Diploids (heterozygous loci)

Page 37: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Sequenciamentos de Nova geração para a

identificação de SNPs

Page 38: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Método Sanger foi o único utilizado por 30 anos

Sanger processa em paralelo 96 sequencias enquanto NGS processa milhões de sequencias a um custo 6X menor.

Problemas:◦ Fidelidade dos dados◦ Tamanho dos reads◦ Custo da infraestrutura◦ Manipular grandes volumes de dados

Sanger vs NGS

Page 39: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Problemas do tamanho da sequência

Sequencias curtas não mapeiam unicamente em um lugar no genoma.

Solução #1: Reads longos. Solução #2: Reads pareados.

ACTTAAGGCTGACTAGC TCGTACCGATATGCTG

Page 40: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Sequenciamentos de Nova Geração

Page 41: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:
Page 42: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Necessário ter uma montagem de referência

Mapeamento dos reads na referencia

Coberturas médias necessárias:

◦ Solexa - 100X, 454 - 10X

Análise estatística para validar discrepâncias com base na

redundância dos dados

Muitos Softwares disponíveis

Desenvolvimento de algorítmos para aumentar velocidade

de processamento

Ferramentas para descoberta de SNPs em reads curtos

Page 43: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

http://seqanswers.com/wiki/Special:BrowseData

Page 44: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

SNP Discovery: Goal

sequencing errors SNP

Page 45: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:
Page 46: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:
Page 47: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

SNP Discovery

AACGTTAGCATAAACGTTAGCATAAACGTTAGCATA

strain 1

strain 2

strain 3

haploid

individual 1

individual 3

individual 2

diploid

AACGTTCGCATAAACGTTCGCATA

AACGTTAGCATAAACGTTAGCATAAACGTTAGCATA

AACGTTAGCATAAACGTTAGCATAAACGTTCGCATAAACGTTCGCATA

AACGTTCGCATAAACGTTCGCATAAACGTTCGCATAAACGTTCGCATA

AACGTTAGCATAAACGTTAGCATA

Page 48: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Para inferir uma taxa de evolução a um gene são estimados o KA e o KS

KA - é a relação entre substituições não sinônimas e todos os possíveis sitios não sinônimos

KS – é a relação entre substituições sinônimas e todos os possíveis sítios sinônimos

Taxa de Evolução – kaks ou dn/ds

Page 49: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Exemplo:

Prolina:◦CCT◦CCA◦CCG◦CCC

Um sítio sinônimo e dois não sinônimos

Page 50: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

A taxa KA/KS é uma medida clássica da evolução de

maneira global num gene

KA/KS << 1 indica que uma substancial proporção de

mudanças de aminoácidos devem ter sido eliminadas

por seleção de purificação.

KA/KS > 1 indica seleção adaptativa ou positiva

KA/KS (dn/ds)

Page 51: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

NG: Nei, M. and Gojobori, T. (1986) - Faster LWL: Li, W.H., et al. (1985) LPB: Li, W.H. (1993) and Pamilo, P. and

Bianchi, N.O. (1993) MLWL (Modified LWL), MLPB (Modified LPB):

Tzeng, Y.H., et al. (2004) YN: Yang, Z. and Nielsen, R. (2000) MYN (Modified YN): Zhang, Z., et al. (2006) GY: Goldman, N. and Yang, Z. (1994) MS (Model Selection), MA (Model Averaging)

KaKs_calculator - Métodos

Page 52: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

A taxa de KAKS em humanos e chimpanzes é de 0,23.

Assumindo que mutações sinônimas são neutras, esse resultado implica que 77% das alterações de aminoácidos em genes hominideos são suficientemente deletérias e são eliminadas por seleção natural. Como mutações sinônimas não são totalmente neutras, a proporção de alterações de aminoácido neutras com consequências deletérias deve ser maior

Page 53: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Identificação de SNPs e haplótipos na poliplóide Coffea

arábica

Page 54: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Objetivos principais Identificar e caracterizar SNPs em

sequências de EST Identificar os haplótipos com base nos

padrões de SNPs Identificar kaks

Foram utilizados dados de duas espécies de café:◦ Coffea arabica,◦ Coffea canephora

Page 55: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Coffea canephora Espécie diplóide Polinização cruzada: Alógama. Alta variabilidade C. canephora é melhor adaptada ao clima

equatorial úmido e quente Cultivada em baixas e médias altitudes Qualidade de bebida inferior Mais resistente a diversas condições do

que Coffea arabica, em particular a doenças e pragas.

Page 56: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Coffea arabica Allopoliploide (tetraplóide) Autógama Baixa variabilidade Originada de um cruzamento recente

(1mya) entre Coffea eugenoides e Coffea canephora

Espécie mais cultivada. Ocupa 75% das plantações mundiais de café.

Qualidade da bebida excelente.

Page 57: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Poliploidia

Page 58: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Softwares

CAP3 para montagem dos ESTQualitySNP KaKs_calculatorScripts PERL

Page 59: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

A montagem

95% similaridade por 100bp◦Previnir agrupamento de parálogos

Remover clusters com menos de 4 ESTs

Remover clusters com mais de 500 ESTs◦Evitar contigs mal formados

Page 60: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

QualitySNP Analisar informações do CAP3 (Arquivo ACE) Detecção de SNPs

◦ Filtros◦ Reconstrução de haplótipos

Detecção de polimorfismos sinônimos e não sinônimos com o FASTY

Construir Banco de dados com os dados gerados.

Page 61: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Filtro 1 – Detectar SNPs potenciais Detecta todos os SNPs bi, tri e tetra

alélicos Cada alelo é representado com mais de

uma sequencia. ◦ Excluindo SNPs singlets

Classificação dos SNPs como intra ou inter espécies

Page 62: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Filtro 2 – Reconstrução dos haplótipos Agrupa sequências que representam um

mesmo alelo Tem os mesmos nucleotídeos nos sítios

polimorficos. Utiliza métodos matemáticos para

minimizar falsas reconstruções de haplótipos

Exclui haplótipos formados por apenas uma sequencia

Page 63: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Filtro 3 – Busca SNPs com alto score de confiabildade É calculado de acordo com a ocorrencia do

SNP em cada alelo com relação às regiões de alta e baixa qualidade

O score de confiabilidade é o menor valor Descartados valores abaixo de 2

Page 64: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:
Page 65: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:
Page 66: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Identificação de SNPs não-sinônimos Fasty

◦ Produz menores alinhamentos em sequencias de baixa qualidade

Detecção da ORF Correção de frameshifts Detecção de sSNP/nsSNP e SNPs ou INDELs

em regiões UTR Kaks Calculator

Page 67: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

The database

Page 68: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Identificação dos ancestrais haplótipos Padrões diferentes de expressão dos

homeologos Contribuição de cada ancestral de arabica

no transcriptoma relacionando ao fenótipo Genes com maior pressão seletiva para

mudança Genes com maior pressão seletiva para

estabilização Artigo submetido e em revisão

Resultados

Page 69: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

LGE - BioinformáticaGenômica, Transcriptômica, Biologia Sintética,

Biologia de Sistemashttp://www.lge.ibi.unicamp.br

Page 70: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Projetos

Page 71: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Projetos

Page 72: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Projetos

Page 73: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Projetos

Page 74: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Projetos

Page 75: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Projetos

Page 76: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Projetos

Page 77: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Projetos

Page 78: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Projetos

Page 79: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

Projetos

Page 80: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:

O LGE

Page 81: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador: