Upload
internet
View
155
Download
0
Embed Size (px)
Citation preview
Bioinformática e Biotecnologia
"Biotecnologia define-se pelo uso de conhecimentos sobre os processos biológicos e sobre as propriedades dos seres vivos, com o fim de resolver problemas e criar produtos de utilidade."
Conceitos básicos
Bioinformática pode ser entendida como uma especialização da Informática aplicada ao estudo de
técnicas computacionais e matemáticas na geração e gerenciamento de informações biológicas
Conceitos básicos
Segundo o NCBI (National Center for Biotechnology
Information),
• Bioinformática é o campo da ciência no qual a biologia, a ciência da computação e a tecnologia da informação se misturam para formar uma única disciplina.
O objetivo final deste campo é permitir a descoberta de novos conceitos biológicos bem como a criação de uma perspectiva
global que permita o discernimento de princípios biológicos gerais.
Aplicações da Bioinformática
Há três importantes sub-disciplinas dentro da Bioinformática:
• desenvolvimento de novos algoritmos e análises estatísticas – inferir relações entre membros de grandes conjuntos de dados;
• a análise e interpretação de dados, – seqüências de nucleotídeos e aminoácidos, domínios em proteínas, e
estruturas protéicas;
• o desenvolvimento e implementação de ferramentas – que permitam acessar e manipular de forma eficiente diferentes tipos
de informação.
O acumulo de informação
Acumulo de informações e surgimento da Biotecnologia
Gregor Johann Mendel (1822 —1884).
Bioinformática e Biotecnologia:Ciências convergentes
Charles Robert Darwin (1809 —1882)
Herman Hollerith (1860-1929)
Ciências convergentes
1953
1946
O ENIAC (Electrical Numerical Integrator and Computer)
James D Watson and Francis Crick
ENIAC30 toneladas160 m2
5.000 cálculos/segundo200 k memória
Marco dos problemas biológicos Primeiros passos da bioinformática
Insulina
1° proteína a ser cristalizada (Abel, 1926),
1° proteína a ser sequenciada (Sanger et al, 1955 ),
1° proteína a ser sintetizada por técnicas químicas ( Du et al;Zahn;Katsoyanis; 1964),
Década de 60
Degradação de Edman (Químico sueco Pehr Edman)
Primeiros passos da bioinformática
“Atlas of Protein Sequences”
1965 Margaret Dayhoff's
Primeira bionformata
• B. Weiss and C.C. Richardson isolaram a DNA ligase (1966), • H.O. Smith, K.W. Wilcox, e T.J. Kelley isolaram a primeira
endonuclease de restrição específica (1968).
Primeiros passos da moderna biotecnologia
BglII
Primeiros passos da bioinformática
Apple Microsoft
1970 – Algoritmo de Needleman-Wunsch – comparação entreSeqüências,1977- Desenvolvimento de programas para a análise de sequências de DNA-(R. Staden)
Década de 70
Jackson, D.A., Symons, R.H. & Berg, P. Biochemical method for inserting new genetic information into DNA of simian virus 40: Circular SV40 DNA molecules containing lambda phage genes and the galactose operon of Escherichia coli.Proc Nat Acad
Sci USA69, 2904-2909 (October 1972).
Em 1980, Paul Berg dividiu o Prêmio Nobel de Química com Walter Gilberte Frederick Sanger, por seus ‘estudos fundamentais sobre a bioquímica de ácidos nucléicos, em particular do DNA recombinante’.
1972- Paul Berg: Primeira molécula recombinante
Primeiros passos da moderna biotecnologia
Surgimento da moderna biotecnologia
1976 – Robert Swanson and Herber Boyer:Primeira empresa de base biotecnológica
1977-Produção da primeira proteína humana (somatostatina) em um hospedeiro microbiano (E.coli);
1978 - Clonagem da insulina humana;
1979 - Clonagem do hormônio de crescimento humano;
1982- Primeira droga recombinante lançada no mercado (insulina humana);
1982- Produção laboratorial do fator de coagulação VIII
O grande salto- O desenvolvimento da tecnologia do
DNA 1980 - Kary Mullis – Reação da polimerase em cadeia.
1987 Mullis and FaloonaSaiki et al. (Science)Primer-Directed Enzymatic Amplification of DNA with a Thermostable DNA Polymerase
1986 -Sequenciador Automático de DNA (Leroy Hood)
1987 -Cientistas da DuPont desenvolvem um sistema de sequenciamento rápido de DNA pelo método de Sanger com fluoróforos marcados.
1987 -Applied Biosystems constrói o primeiro sequenciador automático baseado na tecnologia de Leroy Hood
O desenvolvimento da tecnologia do DNA
Sequenciamento de EST
Adams, M.D., Kelley, J.M., Gocayne, J.D., Dubnick, M., Polymeropoulos, M.H., Xiao, H., Merril, C.R., Wu, A., Olde, B., Moreno, R., Kerlavage, A.R., McCombie, W.R., and Venter, J.C. Complementary DNA sequencing: "expressed sequence tags"and the human genome project. Science252, 1651-1656 (1991).
1991 -J.Craig Venter “Expressed Sequence Tags”
Sequenciamento manual
Sequenciamento automático
Sequenciamento capilar
O desenvolvimento da tecnologia do DNA
E a Bioinformática?
1981 – Desenvolvimento do algoritmo de Smith-Waterman;
1982 – Publicação do Release 3 do GenBank;
1983 – Algoritmo de busca de seqüências em bancos de dados – Wilbur Lipman;
1985 – Comparação rápida de seqüências – FASTAP/FASTAN;
1988 – Criação do National Center for Biotechnology Information (NCBI);
1988 – Rede EMBnet para distribuição de bancos de dados;
1990 –Método mais rápido de comparação de seqüências –BLAST;
1993 – Criação do Sanger Center, Hinxton, UK;
1994 – Criação do EMBL European Bioinformatics Institute
Sequenciamento de Genomas
Maia, L.C.
E agora?
"Nucleotide Sequence Database Colaboração Internacional”
Sequenciamento de Genomas
Maia, L.C.
A era Pós-Genômica
Era “Pós-Genômica”
• GENOMA – DNA – 3,4 bilhões de nt
• TRANSCRIPTOMA – mRNA – 30 mil genes
• PROTEOMA – Proteínas – 0,3-1,2 milhão proteínas
Homo sapiens Modificações pós-traducionais?
Interações entre proteínas?
As Ômicas
• TRANSCRIPTÔMICA:-Differential Display (DD) - Serial Analysis of Gene
Expression (SAGE)- DNA Microarray
• PROTEÔMICA:-Eletroforese bidimensional
(2D)-MudPit
-Espectrometria de massa
Outras ômicas: Metabolômica, farmacogenômica, regulômica, peptidômica, degradômica…….
DNA microarrays:
• 1993- STEPHEN P. A. FODOR
Responsável por desenvolver um processo para gerar arranjos (arrays) de alta densidade, miniaturizados, contendo compostos biológicos. Isso levou ao desenvolvimento do primeiro chip de DNA e das técnicas necessárias para ler e analisar os resultados para estudos genômicos em larga escala.
• 1995- Pat Brown and Ron DavisStanford University –Preparação dos arranjos no Laboratório
Eletroforese 2D e Bioinformática
O´Farrel (1975)
Proteoma Comparativo ou Diferencial
condição condição
Sobreposição permite identificar diferenças nos padrões de bandas
Cromatografia líquida multidimensional-MudPit
Descrita pela primeira vez por WASHBURN et al. (2001),
Espectrometria de massa
Sequenciamento de proteínas
• Proteínas são identificadads inserindo a massa dos peptídeos em um banco de dados de peptídeos como o ProFound.
• Parâmetros de busca são refinados incluindo massa e ponto isoelétrico determinados por 2D PAGE.
•http://www.unb.br/cbsp/paginiciais/profound.htm
Sequenciamento de Proteínas: Busca em bancos de dados
Crescimento do UniProt
Aplicações da bioinformáticaAplicações
Análise de estruturas
Análise de sequências
Análise de funções
Predição de estruturas de proteínas
Classificação da estrutura de proteínas
Comparação da estrutura de proteínas
Predição de estruturas de ácidos nucléicos
Comparação de genomas
Busca em bancos de dados Alinhamento de sequências
Predição de genes e promotores
Filogenia
Modelamento de caminhos metabólicos
Expressão de genes
Predição de interação entre proteínas
Predição da localização subcelular de proteínas
Desenvolvimento de software e criação de bancos de dados
O uso da Bioinformática na prospecção de genes de interesse em Biotecnologia
Bioinformática e Biotecnologia
• A compreensão da estrutura, conformação e função de macromoléculas biológicas está diretamente relacionada à nossa capacidade de desenvolver novos:
– Agentes terapêuticos sintéticos;– Agentes terapêuticos “biológicos” (proteínas, carboidratos e etc);– Produtos biotecnológicos;– Organismos transgênicos;– Vacinas;– Etc.
Bioinformática e Biotecnologia
EST
Vias metabólicas
SAGE
Análise in silico
SN
Ps
GENÔMICA e PROTEÔMICA
BIOTECNOLOGIA
Microarranjos
Sequenciamento genômico Eletroforese 2DEspectrometria de massa
Genes e proteínas alvos
Bancos de dados
Funções biológicas dos genes já identificadas em estudos genéticos
Busca de genes candidatos- O que procurar?
Aonde procurar?Bancos de dados
Sequências de DNA Sequências de ProteínasGenomas
EstruturasVias metabólicas Especializados
Padrões de expressão e Proteômica
–Bibliográficos
dBST
Aonde procurar?
Como procurar?
• Análise de Seqüências de DNA– Alinhamento de seqüências– Busca de Genes– Busca de elementos transcricionais– Busca de padrões, repetições e sítios de
restrição
• Análise de Função de Proteínas– Busca de padrões e motivos protéicos– Análises de vias bioquímicas– Anotação de proteínas
• Processamento pós-traducional– Glicosilação
CLUSTALW
BLAST Basic Local Alignment
Search Tool
NetNGlyc 1.0 Server
Como procurar?
• Análise e montagem de seqüências – Phred, PHRAP, Consed,CAP3
• Busca por genes em seqüências (procura pro ORFs) –GENSCAN, GENMARK, ORF Finder
• Modelagem molecular: MODELLER, CONCORD,COMPOSE
• Estudo de estrutura: STING
• Anotação automática: Blast2go, AutoFACT, GARSA
Bioinformática na Busca de alvos
Bioinformática na Busca de alvos Mineração dos dados
Aplicações biotecnológicas-Desenvolvimento de drogas
Aplicações Biotecnológicas -proteínas recombinantes
Collares et al. Animais transgênicos biorreatores.
Aplicações Biotecnológicas - Animais como biorreatores
Tripsina bovina produzida em trigo
Anticorpos produzidos em banana
Aplicações Biotecnológicas - Plantas como biorreatores
– Identificação do gene de
interesse– Identificação da proteína– Expressão recombinante da
proteína – Cristalização da proteína– Submissão do cristal à linha
de raios-X– Obtenção da estrutura 3D
da proteína– Desenho racional de novos
compostos moduladores da proteína-alvo
Paradigma contemporâneo para o desenvolvimento de novos fármacos:
Desenvolvimento de drogas
Drug Design
1. Isolar 1 alvo => ReceptorAnalisar sua estrutura 3D
2. Selecionar um conjunto decandidatos => LigantesTestar interação com receptor
3. Ligantes com melhor resultadosão experimentalmentesintetizados e testados
4. Baseado nos resultados dosexperimentos: Produzir omedicamento ou retornar ao passo 1
Exemplo do processo de drug design.
Modelagem Molecular no desenvolvimento de novos fármacos
Docking Molecular
“Docagem” molecular:
• Predição da geometria e afinidade de um ligante a uma proteína conhecida.
Base da docagem molecular:
Tamanho, forma, distribuição de cargas, polaridade e potencial para interação hidrofóbica e ligações de hidrogênio
Docagem Molecular
Estudo da interação da 2-trans-Enoil-ACP (CoA) Redutase (InhA) de Mycobacterium tuberculosis (MTB) com o complexo inorgânico Isoniazida-
pentacianoferrato (IPF) por Simulação pela Dinâmica Molecular
André Luciano Pasinato da Costa
Relatórios da Organização Mundial da Saúde (OMS).-2004: 9 milhões de novos casos.-2006: taxa de crescimento 0,6% ao ano.
O regime de tratamento inclui diariamente durante dois meses:o Isoniazida (INH)o Rifampicina (RIF)o Pirazinamida (PZA)o Etambutol (EMB).Seguido por mais quatro meses de INH e RIF, totalizando 6 meses de tratamento.
Docagem molecular
IPF
O IPF ocupa preferencialmente os sítios do pirofosfato e nicotinamida dentro da cavidade de ligação do NADH na enzima InhA..
Representação do sítio de ligação da enzima InhA (PDB 1ENY) (Azul), NADH(Branco) e IPF (Vermelho). Figura gerada com SwissPDB Viewer v3.7b2 (Guex & Peitsch, 1997).
InhA, um alvo da droga antituberculose isoniazida, está envolvido em um sistema de alongamento de ácidos graxos, FAS-II de micobactérias
Empresas de Bioinformática e ou Biotecnologia
• Mais de 130 empresas de bioinformática no mundo todo,
• Mais de 200 empresas de biotecnologia nos USA que utilizam bioinformática
• Celera (USA) - Primeiro rascunho do genoma humano juntamente com o HGP
• Scylla e Allelyx – Brasil
Resumo:Bioinformática e Biotecnologia
Fonte: Benton, D. (1996) Trends Biotechnol., 14, 261-272.
Referências
[1] Machine Learning Approaches to Gene RecognitionMark W. Craven and Jude W. Shavlik IEEE – AI in Molecular Biology (1994)[2] Imitation of Life: How Biology is Inspiring ComputingFORBES, Nancy / MIT Press (2004)[3] Slides da disciplina “Tópicos Especiais em Computação VI:Introdução à Bioinformática” do semestre 2005/1 do Insitutode Informática da UFRGSProf. Dra. Ana Lúcia C. Bazzan (2005)[4] EMBOSS: The European Molecular Biology Open Software SuiteRice,P. Longden,I. and Bleasby,A. -Trends in Genetics 16, (6) pp276277[5] Bioinformatic tools for DNA/protein sequence analysis, functionalassignment of genes and protein classificationRehm, B.H.A . -Applied Microbiology Biotechnology 57, pp579-592 (2001)