28
Samuel Samuel Mazzinghy Mazzinghy Alvarenga Alvarenga Fepagro Fepagro em em foco foco

FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

  • Upload
    buinhi

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

Page 1: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

Samuel Samuel MazzinghyMazzinghy AlvarengaAlvarenga

FepagroFepagro emem focofoco

Page 2: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

HistóricoHistórico recenterecente dada AgropecuáriaAgropecuária

�� Era científica: a partir de ~ 1.700Era científica: a partir de ~ 1.700

• Rotação de culturas e métodos de cultivo

intensivo

• Drenagem

• Uso do calcário no solo

• Utilização de arado, máquinas semeadoras

e colheitadeiras

• Máquinas a vapor substituindo a força animal

• Desenvolvimento de pesticidas e fertilizantes

• Aperfeiçoamento de máquinas agrícolas

Page 3: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

HistóricoHistórico recenterecente dada AgropecuáriaAgropecuária

• Melhoramento vegetal e da pecuária

• Tecnologia do DNA

• Cultura de tecidos

• Desenvolvimento de vacinas animais

�� Era científica: a partir de ~ 1.700Era científica: a partir de ~ 1.700

Page 4: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

NovasNovas tecnologiastecnologias

�� A era A era genômicagenômica: novas possibilidades para a agropecuária: novas possibilidades para a agropecuária

Estrutura do DNAEstrutura do DNA

Necessidade de Necessidade de

mais informaçõesmais informações

Sequenciamento Sequenciamento

de DNAde DNA

Dados Dados genômicosgenômicos em larga escalaem larga escala

Page 5: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

GENÔMICA GENÔMICA FUNCIONALFUNCIONAL

GENÔMICA GENÔMICA ESTRUTURALESTRUTURAL

GENÔMICA GENÔMICA COMPARATIVACOMPARATIVA

GENÔMICAGENÔMICA

AA ciênciaciência genômicagenômica

�� As áreas da As áreas da genômicagenômica

Genômica: Estudo de todo conteúdo genético de um organismo

Page 6: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

DNA

Proteínas

Fenótipo

Resistente Suscetível

�� GenômicaGenômica funcionalfuncional

AA ciênciaciência genômicagenômica

• Funções dos genes

• Padrão de expressão dos genes

- Condições bióticas

- Condições abióticas

- Estágios de desenvolvimento

Page 7: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

�� GenômicaGenômica estruturalestrutural

AA ciênciaciência genômicagenômica

• Organização e estrutura dos genes

• Mapeamento genético

• Mapeamento físico

Page 8: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

�� GenômicaGenômica comparativacomparativa

AA ciênciaciência genômicagenômica

• Micro, macrossintenia e colinearidade

• Regiões duplicadas

• Evolução

Page 9: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

1995: Primeiro genoma completo 1995: Primeiro genoma completo

(organismo vivo)(organismo vivo)

Haemophilus influenzae, Haemophilus influenzae, 1830 Kb 1830 Kb

AA eraera genômicagenômica

Bactéria causadora de doenças como meningite e pneumonia

Page 10: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

19971997: : Saccharomyces cerevisiae, Saccharomyces cerevisiae, 12069 Kb. 12069 Kb. NatureNature 387,5387,5--105105 19971997--

0505--29 29

19971997:: EscherichiaEscherichia colicoli, 4639 Kb. , 4639 Kb. ScienceScience 277,1453277,1453--14741474 19971997--0909--05 05

19981998:: Caenorhabditis Caenorhabditis eleganselegans, , 100272 Kb. 100272 Kb. ScienceScience 282,2012282,2012--20182018

19981998--1212--1111

20002000:: DrosophilaDrosophila melanogastermelanogaster, , 137000 Kb. 137000 Kb. ScienceScience 287,2185287,2185--9595 20002000--

0303--2424

20002000:: Arabidopsis Arabidopsis thalianathaliana, , 115428 Kb. 115428 Kb. NatureNature 408,796408,796--815815 20002000--1212--1414

20012001:: Homo sapiens, Homo sapiens, 3200000 Kb. 3200000 Kb. NatureNature 409,860409,860--921921 20012001--0202--1515

AA eraera genômicagenômica

Page 11: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

AA eraera genômicagenômica

�� Tecnologias de sequenciamento em massaTecnologias de sequenciamento em massa

Plataforma Metodologia de

Sequenciamento

Geração

(tecnologia)

Throughput por

corrida

Tamanho dos reads

(pb)

3130xL-3730xL - ABI/Life Technologies Sanger, CE Primeira 1-2 Mb 900-1200

Genome Sequencer FLX System -

Roche/454

Pirosequenciamento Segunda 500 Mb 250-500

800 (?)

HiSeq 2000 Illumina/Solexa Síntese Segunda 3 Gb 150

5500xl SOLiD - ABI/SOLiD Ligação Segunda 4 Gb 25-35

HeliScope - Helicos SMS Terceira ~ 25 Gb 25-30

PacBio RS - Pacific Biosciences SMRT Terceira 40 Mb ~ 1000

Pesonal Genome Machine (PGM) - Ion

Torrent/Life Technologies

Síntese Terceira 10 Mb 100-200

In house lab built instrumentation -

Complete Genomics

cPAL Terceira Promessa de 80

genomas por dia

10

gridION - Oxford Nanopore Nanoporos Quarta Não quantificado Não quantificado

Page 12: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

�� GenBankGenBank emem 15 de 15 de AgostoAgosto de 2012 (de 2012 (últimaúltima versãoversão))

143 bilhões de bases

156,4 milhõesde sequências

AA eraera genômicagenômica

Page 13: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

�� NúmerosNúmeros do do GenBankGenBank

1.738.524.500 bases (2.293.823 sequências) depositadas entre junho

e agosto/2012

AA eraera genômicagenômica

Page 14: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

1,00E+00

1,00E+01

1,00E+02

1,00E+03

1,00E+04

1,00E+05

1,00E+06

1,00E+07

1,00E+08

1,00E+09

1,00E+10

1,00E+11

1,00E+12

82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04 05 06 07 08 09 10 11 12

N.

de

se

qu

ên

cia

s e

ba

ses

de

po

sita

da

s

Ano

Depósito de sequências no GenBank

Sequências Pares de Base Exponencial (Sequências) Exponencial (Pares de Base)

�� CrescimentoCrescimento dada quantidadequantidade de dados de dados genômicosgenômicos

AA eraera genômicagenômica

Page 15: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

�� Número de genomas publicados atualmenteNúmero de genomas publicados atualmente

Projetos completos: 3.705

Projetos incompletos: 14.551

�� Dados Dados atualizadosatualizados emem 31 de 31 de agostoagosto de 2012 de 2012

AA eraera genômicagenômica

Page 16: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

A era A era genômicagenômica trouxe um tipo de dado e uma quantidade de trouxe um tipo de dado e uma quantidade de informação que só é possível ser analisada com o auxílio de informação que só é possível ser analisada com o auxílio de

ferramentas deferramentas de bioinformáticabioinformática

AA BioinformáticaBioinformática nana GenômicaGenômica

Page 17: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

AA BioinformáticaBioinformática nana GenômicaGenômica

• Recursos computacionais para realizar análises de dados biológicos

�� Bioinformática: Bioinformática:

QuímicaQuímica

FísicaFísica

GenéticaGenética

EstatísticaEstatística

BiologiaBiologia

InformáticaInformática

BioquímicaBioquímica

Biologia Biologia MolecularMolecular

MatemáticaMatemática

EngenhariaEngenharia

• Envolve o conhecimento de várias áreas

Page 18: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

AA BioinformáticaBioinformática nana GenômicaGenômica

�� É preciso MONTAR o genomaÉ preciso MONTAR o genoma

Page 19: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

AA BioinformáticaBioinformática nana GenômicaGenômica

�� É preciso ANOTAR o genomaÉ preciso ANOTAR o genoma

“Sopa de letras”: sequências “Sopa de letras”: sequências obtidas pelos projetosobtidas pelos projetos

Bancos de dados: acervo de Bancos de dados: acervo de sequências conhecidassequências conhecidas

SequênciaSequência vinculada a um vinculada a um significado biológicosignificado biológico

Page 20: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

�� É preciso ANALISAR o genomaÉ preciso ANALISAR o genoma

• Mapeamento

• Evolução

• Sequenciamento

• Análise Estatística

• Redes Gênicas

• Estrutura de DNA, RNA

AA BioinformáticaBioinformática nana GenômicaGenômica

• Modelagem Molecular• Comparação de Estruturas• Expressão Gênica• Redes Metabólicas• Bancos de Dados• Filogenia• Análise de sequências• Etc...

Page 21: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

• Informação evolutiva: genes homólogos, frequências dos alelos, ...

• Informação genômica: localização no cromossomo, introns, regiões reguladoras, ...

• Informação estrutural: estruturas da proteína correspondente, tipos de folds, domínios estruturais, ...

�� Informações relevantesInformações relevantes

• Informação de expressão: expressão específica a um dado tecido, fenótipos, doenças, ...

• Informação funcional: função molecular/enzimática, papel em diferentes rotas, papel em doenças, ...

• Etc...

AA BioinformáticaBioinformática nana GenômicaGenômica

Page 22: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

� Clonagem de genes específicos por mapeamento (genômica estrutural)

BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica

� Genômica comparativa entre organismos modelos e espécies de interesse agropecuário

� O melhoramento de culturas importantes pode se beneficiar de informações obtidas a partir de espécies modelo

� Ampliação da base de conhecimento sobre o processo evolutivo da espécie (genômica comparativa)

Page 23: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

� Alimentação de bancos de dados genômicos para estudos futuros

BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica

� Desenvolvimento de marcadores moleculares para genes de interesse

� Descoberta/identificação de novos genes de valores agropecuários (genômica funcional)

Page 24: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica

� Genômica funcional da relação parasita-hospedeiro

• Seleção de genes candidatos adequados para manipulação para melhorar a resistência e/ou diminuir a suscetibilidade do hospedeiro

• Predição de ganhos genéticos

• Melhor entendimento sobre a rede biológica hospedeiro-parasita

• Novas abordagens para a promoção da resistência do hospedeiro a parasitas agronômicos

• Ampliação do conhecimento a respeito do modo de infecção do parasita

• Desenvolvimento de novas formas de controle de parasitas (pesticidas e vacinas mais específicos, sem “efeitos colaterais” e mais eficientes)

Page 25: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica

� Microorganismos

• Identificação de genes envolvidos com promoção do crescimento vegetal

• Desenvolvimento de novos compostos para a agricultura

• Abordagem METAGENÔMICA

Análise em larga escala de genomas de microorganismosno seu habitat natural (solos, rios, ar), uma vez que 99%dos microorganismos são de difícil cultivo (ou impossíveisde serem cultivados) e praticamente desconhecidos

• Expansão da compreensão sobre os processos metabólicos presentes no ambiente

Page 26: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

�� Sumarizando... Agropecuária + Sumarizando... Agropecuária + GenômicaGenômica + + BioinfoBioinfo::

• Informação em larga escala (um gene raramente trabalha sozinho...)

• Análise detalhada do genoma (regiões conservadas, mutações, inferências

evolutivas, etc...)

• Sequenciamento de genes/genoma (rapidez, acessibilidade crescente e geração de

dados em grande quantidade)

• Atribuição de função aos genes (bancos de dados cada vez maiores e mais

informativos)

BioinformáticaBioinformática ee AgropecuáriaAgropecuária GenômicaGenômica

• Transferência/aproveitamento de informações por comparação (um

organismo se beneficia de informações atribuídas a outros organismos relacionados e vice-versa)

• Ganho de tempo em pesquisas/testes laboratoriais e em campo (aceleração na obtenção de resultados)

Page 27: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática

PerspectivasPerspectivas

Genoma

Proteoma

Metaboloma

Interactoma

ReactomaOutras “ômicas”

Page 28: FepagroFepagro eemm foco foco - fepagro.rs.gov.br - A Bioinformatica na... · Genética Estatística Biologia Informática Bioquímica Biologia Molecular Matemática ... BioinformáticaBioinformática