FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética...

Preview:

Citation preview

Samuel Samuel MazzinghyMazzinghy AlvarengaAlvarenga

FepagroFepagro emem focofoco

HistóricoHistórico recenterecente dada AgropecuáriaAgropecuária

�� Era científica: a partir de ~ 1.700Era científica: a partir de ~ 1.700

• Rotação de culturas e métodos de cultivo

intensivo

• Drenagem

• Uso do calcário no solo

• Utilização de arado, máquinas semeadoras

e colheitadeiras

• Máquinas a vapor substituindo a força animal

• Desenvolvimento de pesticidas e fertilizantes

• Aperfeiçoamento de máquinas agrícolas

HistóricoHistórico recenterecente dada AgropecuáriaAgropecuária

• Melhoramento vegetal e da pecuária

• Tecnologia do DNA

• Cultura de tecidos

• Desenvolvimento de vacinas animais

�� Era científica: a partir de ~ 1.700Era científica: a partir de ~ 1.700

NovasNovas tecnologiastecnologias

�� A era A era genômicagenômica: novas possibilidades para a agropecuária: novas possibilidades para a agropecuária

Estrutura do DNAEstrutura do DNA

Necessidade de Necessidade de

mais informaçõesmais informações

Sequenciamento Sequenciamento

de DNAde DNA

Dados Dados genômicosgenômicos em larga escalaem larga escala

GENÔMICA GENÔMICA FUNCIONALFUNCIONAL

GENÔMICA GENÔMICA ESTRUTURALESTRUTURAL

GENÔMICA GENÔMICA COMPARATIVACOMPARATIVA

GENÔMICAGENÔMICA

AA ciênciaciência genômicagenômica

�� As áreas da As áreas da genômicagenômica

Genômica: Estudo de todo conteúdo genético de um organismo

DNA

Proteínas

Fenótipo

Resistente Suscetível

�� GenômicaGenômica funcionalfuncional

AA ciênciaciência genômicagenômica

• Funções dos genes

• Padrão de expressão dos genes

- Condições bióticas

- Condições abióticas

- Estágios de desenvolvimento

�� GenômicaGenômica estruturalestrutural

AA ciênciaciência genômicagenômica

• Organização e estrutura dos genes

• Mapeamento genético

• Mapeamento físico

�� GenômicaGenômica comparativacomparativa

AA ciênciaciência genômicagenômica

• Micro, macrossintenia e colinearidade

• Regiões duplicadas

• Evolução

1995: Primeiro genoma completo 1995: Primeiro genoma completo

(organismo vivo)(organismo vivo)

Haemophilus influenzae, Haemophilus influenzae, 1830 Kb 1830 Kb

AA eraera genômicagenômica

Bactéria causadora de doenças como meningite e pneumonia

19971997: : Saccharomyces cerevisiae, Saccharomyces cerevisiae, 12069 Kb. 12069 Kb. NatureNature 387,5387,5--105105 19971997--

0505--29 29

19971997:: EscherichiaEscherichia colicoli, 4639 Kb. , 4639 Kb. ScienceScience 277,1453277,1453--14741474 19971997--0909--05 05

19981998:: Caenorhabditis Caenorhabditis eleganselegans, , 100272 Kb. 100272 Kb. ScienceScience 282,2012282,2012--20182018

19981998--1212--1111

20002000:: DrosophilaDrosophila melanogastermelanogaster, , 137000 Kb. 137000 Kb. ScienceScience 287,2185287,2185--9595 20002000--

0303--2424

20002000:: Arabidopsis Arabidopsis thalianathaliana, , 115428 Kb. 115428 Kb. NatureNature 408,796408,796--815815 20002000--1212--1414

20012001:: Homo sapiens, Homo sapiens, 3200000 Kb. 3200000 Kb. NatureNature 409,860409,860--921921 20012001--0202--1515

AA eraera genômicagenômica

AA eraera genômicagenômica

�� Tecnologias de sequenciamento em massaTecnologias de sequenciamento em massa

Plataforma Metodologia de

Sequenciamento

Geração

(tecnologia)

Throughput por

corrida

Tamanho dos reads

(pb)

3130xL-3730xL - ABI/Life Technologies Sanger, CE Primeira 1-2 Mb 900-1200

Genome Sequencer FLX System -

Roche/454

Pirosequenciamento Segunda 500 Mb 250-500

800 (?)

HiSeq 2000 Illumina/Solexa Síntese Segunda 3 Gb 150

5500xl SOLiD - ABI/SOLiD Ligação Segunda 4 Gb 25-35

HeliScope - Helicos SMS Terceira ~ 25 Gb 25-30

PacBio RS - Pacific Biosciences SMRT Terceira 40 Mb ~ 1000

Pesonal Genome Machine (PGM) - Ion

Torrent/Life Technologies

Síntese Terceira 10 Mb 100-200

In house lab built instrumentation -

Complete Genomics

cPAL Terceira Promessa de 80

genomas por dia

10

gridION - Oxford Nanopore Nanoporos Quarta Não quantificado Não quantificado

�� GenBankGenBank emem 15 de 15 de AgostoAgosto de 2012 (de 2012 (últimaúltima versãoversão))

143 bilhões de bases

156,4 milhõesde sequências

AA eraera genômicagenômica

�� NúmerosNúmeros do do GenBankGenBank

1.738.524.500 bases (2.293.823 sequências) depositadas entre junho

e agosto/2012

AA eraera genômicagenômica

1,00E+00

1,00E+01

1,00E+02

1,00E+03

1,00E+04

1,00E+05

1,00E+06

1,00E+07

1,00E+08

1,00E+09

1,00E+10

1,00E+11

1,00E+12

82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04 05 06 07 08 09 10 11 12

N.

de

se

qu

ên

cia

s e

ba

ses

de

po

sita

da

s

Ano

Depósito de sequências no GenBank

Sequências Pares de Base Exponencial (Sequências) Exponencial (Pares de Base)

�� CrescimentoCrescimento dada quantidadequantidade de dados de dados genômicosgenômicos

AA eraera genômicagenômica

�� Número de genomas publicados atualmenteNúmero de genomas publicados atualmente

Projetos completos: 3.705

Projetos incompletos: 14.551

�� Dados Dados atualizadosatualizados emem 31 de 31 de agostoagosto de 2012 de 2012

AA eraera genômicagenômica

A era A era genômicagenômica trouxe um tipo de dado e uma quantidade de trouxe um tipo de dado e uma quantidade de informação que só é possível ser analisada com o auxílio de informação que só é possível ser analisada com o auxílio de

ferramentas deferramentas de bioinformáticabioinformática

AA BioinformáticaBioinformática nana GenômicaGenômica

AA BioinformáticaBioinformática nana GenômicaGenômica

• Recursos computacionais para realizar análises de dados biológicos

�� Bioinformática: Bioinformática:

QuímicaQuímica

FísicaFísica

GenéticaGenética

EstatísticaEstatística

BiologiaBiologia

InformáticaInformática

BioquímicaBioquímica

Biologia Biologia MolecularMolecular

MatemáticaMatemática

EngenhariaEngenharia

• Envolve o conhecimento de várias áreas

AA BioinformáticaBioinformática nana GenômicaGenômica

�� É preciso MONTAR o genomaÉ preciso MONTAR o genoma

AA BioinformáticaBioinformática nana GenômicaGenômica

�� É preciso ANOTAR o genomaÉ preciso ANOTAR o genoma

“Sopa de letras”: sequências “Sopa de letras”: sequências obtidas pelos projetosobtidas pelos projetos

Bancos de dados: acervo de Bancos de dados: acervo de sequências conhecidassequências conhecidas

SequênciaSequência vinculada a um vinculada a um significado biológicosignificado biológico

�� É preciso ANALISAR o genomaÉ preciso ANALISAR o genoma

• Mapeamento

• Evolução

• Sequenciamento

• Análise Estatística

• Redes Gênicas

• Estrutura de DNA, RNA

AA BioinformáticaBioinformática nana GenômicaGenômica

• Modelagem Molecular• Comparação de Estruturas• Expressão Gênica• Redes Metabólicas• Bancos de Dados• Filogenia• Análise de sequências• Etc...

• Informação evolutiva: genes homólogos, frequências dos alelos, ...

• Informação genômica: localização no cromossomo, introns, regiões reguladoras, ...

• Informação estrutural: estruturas da proteína correspondente, tipos de folds, domínios estruturais, ...

�� Informações relevantesInformações relevantes

• Informação de expressão: expressão específica a um dado tecido, fenótipos, doenças, ...

• Informação funcional: função molecular/enzimática, papel em diferentes rotas, papel em doenças, ...

• Etc...

AA BioinformáticaBioinformática nana GenômicaGenômica

� Clonagem de genes específicos por mapeamento (genômica estrutural)

BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica

� Genômica comparativa entre organismos modelos e espécies de interesse agropecuário

� O melhoramento de culturas importantes pode se beneficiar de informações obtidas a partir de espécies modelo

� Ampliação da base de conhecimento sobre o processo evolutivo da espécie (genômica comparativa)

� Alimentação de bancos de dados genômicos para estudos futuros

BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica

� Desenvolvimento de marcadores moleculares para genes de interesse

� Descoberta/identificação de novos genes de valores agropecuários (genômica funcional)

BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica

� Genômica funcional da relação parasita-hospedeiro

• Seleção de genes candidatos adequados para manipulação para melhorar a resistência e/ou diminuir a suscetibilidade do hospedeiro

• Predição de ganhos genéticos

• Melhor entendimento sobre a rede biológica hospedeiro-parasita

• Novas abordagens para a promoção da resistência do hospedeiro a parasitas agronômicos

• Ampliação do conhecimento a respeito do modo de infecção do parasita

• Desenvolvimento de novas formas de controle de parasitas (pesticidas e vacinas mais específicos, sem “efeitos colaterais” e mais eficientes)

BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica

� Microorganismos

• Identificação de genes envolvidos com promoção do crescimento vegetal

• Desenvolvimento de novos compostos para a agricultura

• Abordagem METAGENÔMICA

Análise em larga escala de genomas de microorganismosno seu habitat natural (solos, rios, ar), uma vez que 99%dos microorganismos são de difícil cultivo (ou impossíveisde serem cultivados) e praticamente desconhecidos

• Expansão da compreensão sobre os processos metabólicos presentes no ambiente

�� Sumarizando... Agropecuária + Sumarizando... Agropecuária + GenômicaGenômica + + BioinfoBioinfo::

• Informação em larga escala (um gene raramente trabalha sozinho...)

• Análise detalhada do genoma (regiões conservadas, mutações, inferências

evolutivas, etc...)

• Sequenciamento de genes/genoma (rapidez, acessibilidade crescente e geração de

dados em grande quantidade)

• Atribuição de função aos genes (bancos de dados cada vez maiores e mais

informativos)

BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica

• Transferência/aproveitamento de informações por comparação (um

organismo se beneficia de informações atribuídas a outros organismos relacionados e vice-versa)

• Ganho de tempo em pesquisas/testes laboratoriais e em campo (aceleração na obtenção de resultados)

PerspectivasPerspectivas

Genoma

Proteoma

Metaboloma

Interactoma

ReactomaOutras “ômicas”

Recommended