Avanços e perspectivas em Bioinformática

Preview:

DESCRIPTION

Palestra ministrada na Semana Acadêmica da Computação da Universidade Federal do Ceará (dia 17/08/2012)

Citation preview

Avanços e perspectivasem Bioinformática

Semana Acadêmica da ComputaçãoLeandro Lima – 17/08/2012www.ime.usp.br/~llima

Quem sou eu* Bacharel em Ciência da Computação

Universidade Federal do Ceará (2003-2006)

* Mestre em Ciência da Computação

Universidade de São Paulo (2007-2009)

* Doutorando em Bioinformática

Universidade de São Paulo (2011- ????)

Trabalhos atuais:

* Hospital AC Camargo – Centro Internacional de Pesquisa e Ensino – Laboratório de Bioinformática e Bioestatística

* FMU – Professor do curso de Ciência da Computação

Sumário

- Um pouco de Biologia

- Informação biológica: gerar, armazenar, analisar

- Genômica

- Sequenciamento de DNA

- Aplicações / análises

- Perspectivas / direcionamentos

Uma definição de Bioinformática

“Uso da Computação e Estatística para gerar, armazenar e analisar

dados biológicos”

Um pouco de Biologia (I)

Gregor Mendel

("Ensaios com plantas

híbridas", 1865)

Um pouco de Biologia (II)

Watson e Crick e a estrutura do DNA

(1953)

Imagem: http://pathology.jhu.edu/pc/BasicCauses.php

Um pouco de Biologia (III)

Dogma Central daBiologia Molecular

Geração de informação biológica

Resultado da busca do site do NCBI (National Center for Biotechnology Information)

Geração de informação biológica

PubMed: catálogo dos artigos científicos

Taxonomy: classificação de organismos

Genome: sequências completas de genomas

Gene: informações de genes

GEO Profiles: perfis de expressão gênica

Protein: banco de sequências

SNP: variações genéticas curtas

PubChem: banco de estruturas e interações químicas (drogas)

Exemplos de informações: gene BRCA1 (Homo sapiens)

Localização: 17q21 (41196312..41277500)

Tamanho: 81189 bases

Transcritos: NM_007300.3, NM_007294.3, ...

Interações: ABL1, MSH6, BRCA2, BRIP1, ...

Alterações comuns: rs8176320, rs12516, rs34214126, ...

Vias metabólicas: reparo de DNA, ciclo celular, …

Sequência: GTACCTTGATTTCGTATTCTGAGAGGCTGCTGCTTAG...

Fonte: http://www.ncbi.nlm.nih.gov/gene/672

Mais um pouco de Biologia

Mais um pouco de Biologia

O genoma é toda a informação hereditária de um organismo que

está codificada em seu DNA

Etapas de estudo:

(1) Sequenciamento

(2) Montagem (com ou sem referência)

(3) Anotação

ABCDEFGHIJKLMNOPQRSTUVWXYZ

Sequenciamento

ABCDEFGHIJKLMNOPQRSTUVWXYZ

Montagem

ABCDEFGHIJKLMNOPQRSTUVWXYZ

Anotação

Sequenciamento de DNA

Sequenciamento de DNA

Um pouco de HistóriaProjeto Genoma Humano

iniciado em 1990 – “concluído” em 2003

Hoje (2012): 2 diaspara sequenciarTamanho do genomacompleto: ~3GB

Alguns tamanhos de genomas

- HIV (vírus): 9.7kb

- Haemophilus influenzae (bactéria): 1.8Mb

- Arabidopsis thaliana (planta): 157Mb

- Drosophila melanogaster (mosca): 130Mb

- Mus musculus (rato): 2.7Gb

- Homo sapiens (você): 3.2Gb

- Polychaos dubium (ameba): 670Gb

Alinhamento de sequências

Um exemplo usandoprogramação dinâmica

Alinhar as sequências

G A A T T C A G T T A

G G A T C G A

Resultado

G _ A A T T C A G T T A

| | | | | |

G G _ A _ T C _ G _ _ A

Score = 6

Outros estudos

- Single-nucleotide polymorphism (SNP, do inglês polimorfismo em único nucleotídeo)

Outros estudos (II)

- Copy-number variation

(CNV, do inglês variação

no número de cópias)

Dogma Central daBiologia Molecular

Expressão gênica(mRNA)

Medida de expressão Medida de expressão gênica (ex: microarrays)gênica (ex: microarrays)

Figuras: http://www.chrisdellavedova.com http://www.har.mrc.ac.uk/services/MPC/microarray/

NúmerosNúmeros

gene Am1 Am2 Am3 Am4 Am5 …A 2.5 1.5 5 6.3 3.4 …B 3.2 5.6 4.4 4 7 …C 4.5 10.3 1.2 5.5 5 …D 1.5 3.2 4.5 3.4 4.5 …E 3.5 6.7 2.6 2.5 2.5 …… … … … … … …

Padrões de expressãoPadrões de expressão

Clustering analysis(análise de agrupamento)

Funções biológicasFunções biológicas

Redes biológicasRedes biológicas

Redes biológicasRedes biológicas

Redes droga-alvosRedes droga-alvos(drug-target networks)(drug-target networks)

Diseasome (rede das doenças)Diseasome (rede das doenças)

Exemplo de uma análise usando expressão gênica

1 - Dada uma doença X, coletamos (os biólogos, na verdade) amostras de tecido de 20 pessoas doentes e 20 pessoas sem a doença

Exemplo de uma análise usando expressão gênica

2 – Após verificar que a qualidade dos dados está boa, analisamos o padrão de expressão dos genes nos dois grupos e tentamos identificar quais tiveram uma padrão diferente (chamamos esses genes de diferencialmente expressos)

Exemplo de uma análise usando expressão gênica

Exemplo de uma análise usando expressão gênica

3 – Identificar as funções biológicas relacionadas a esses genes diferencialmente expressos (tanto os super-expressos quanto os sub-expressos)

Exemplo de uma análise usando expressão gênica

Exemplo de uma análise usando expressão gênica

4 – Identificar a rede de genes relacionados a essa lista e identificar os mais importantes usando informações topológicas (exemplos: grau do vértice; centralidade; participação em comunidades; é ponte?)

Exemplo de uma análise usando expressão gênica

O que estudar?Computação

- programação/análise de algoritmos

- mineração de dados/reconhecimento de padrões

- teoria dos grafos

- programação paralela e distribuída

- bancos de dados

Biologia

- Biologia molecular/celular

Estatística

- análise de gráficos

- inferência/teste de hipótese

Linguagens mais usadas

Pós-graduações no Brasil

- Programa Interunidades de Pós-Graduação em Bioinformática-USP

http://www.ime.usp.br/posbioinfo/

- Programa de Pós-Graduação em Bioinformática-UFPR

http://www.bioinfo.ufpr.br

- Programa de Pós-Graduação em Bioinformática-UFMG

http://www.pgbioinfo.icb.ufmg.br/

Onde trabalhar

- Hospitais

- Universidades

- Instituições de pesquisa (agropecuária, biomédica, etc.)

- Farmacêuticas

- Prestadoras de serviços

Outras dicas- Comece a estudar cedo

- Procure um grupo de Bioinformática (Computação, Biologia, Matemática, Farmácia, Medicina)

- Estude inglês

- Use Linux

- Siga blog / perfis do Twitter relacionados a Bioinfo

- Pense sobre passar um tempo fora (do Ceará, do Brasil)

Broad Institute of MIT and Harvard (junho de 2012)

Broad Institute of MIT and Harvard (junho de 2012)

Perguntas?Perguntas?

Recommended