Bioinformática e suas aplicações

Preview:

Citation preview

Bioinformática e suas aplicaçõesBioinformática e suas aplicações

Alex Camargoalexcamargoweb@gmail.com

INSTITUTO FEDERAL SUL-RIO-GRANDENSECAMPUS BAGÉ

SEMANA ACADÊMICA DOS CURSOS DE INFORMÁTICA

Bagé/2015

I - Apresentação

Formação acadêmica:

Bacharel em Sistemas de Informação (URCAMP, 2010)

TCC: Web sistema integrado a uma rede social para academias de ginástica

Orientador: Prof. Abner Guedes

Especialista em Sistemas Distribuídos com Ênfase em Banco de Dados (UNIPAMPA, 2013)

TCC: Interligando bases de dados do sistema Controle de Marcas e Sinais utilizando o MySQL Cluster

Orientadores: Prof. Érico Amaral e Prof. Rafael Bastos

Bioinformática e suas aplicações Alex Camargo

I - Apresentação

Formação acadêmica:

Mestrando em Engenharia de Computação (FURG, 2017)

Dissertação: Um estudo sobre ferramentas para a identificação e previsão de mutações em estruturas de proteínas

Orientador: Profa. Karina dos Santos Machado

Bioinformática e suas aplicações Alex Camargo

I - Apresentação

Experiência profissional:

Programador Web e DBA

Local: Prefeitura Municipal de Bagé

Setor: Núcleo de Tecnologia da Informação - NTI

Professor

Local: Capacitar Escola Técnica

Disciplinas: Banco de Dados e Análise de Sistemas

Professor

Local: Universidade Federal do Pampa - UNIPAMPA

Disciplinas: Algoritmos e Programação, Laboratório de Programação I e Laboratório de Programação II

Bioinformática e suas aplicações Alex Camargo

I - Apresentação

Experiência profissional:

Bolsista na modalidade mestrado

Local: Universidade Federal do Rio Grande – FURG

Projeto: Bioinformática Estrutural de Proteínas: modelos, algoritmos e aplicações biotecnológicas

Bioinformática e suas aplicações Alex Camargo

I - Apresentação

Experiência profissional:

Bolsista na modalidade mestrado

Local: Universidade Federal do Rio Grande – FURG

Projeto: Bioinformática Estrutural de Proteínas: modelos, algoritmos e aplicações biotecnológicas

Bioinformática e suas aplicações Alex Camargo

Figura. Biologia Computacional (51/2013) http://www.biocomputacional.dcc.ufmg.br

II. Pré-requisitos

Características esperadas (não obrigatórias):

Conhecimentos gerais em biologia;

Experiência em ambientes Linux (pode ajudar);

Interesse em aprender coisas novas.

"Aprender o que eu já sei não tem graça." - Prof. Gerson Leiria

Bioinformática e suas aplicações Alex Camargo

III. Objetivos

Objetivos desta palestra:

Compreender os desafios enfrentados pela Bioinformática;

Explorar programas utilizados em pesquisas biomédicas;

Motivar novos bioinformatas.

Bioinformática e suas aplicações Alex Camargo

"Two months in the lab can easily save an afternoon on the computer." - Dr. Alan Bleasby

IV. Sumário

1. O que é bioinformática? - 1.1. Introdução - 1.2. Origens - 1.3. Problemas alvo - 1.4. Tendências e desfios

2. Níveis de Informação Biológica - 2.1. Introdução - 2.2. Macromoléculas biológicas - 2.3. Níveis de organização - 2.4. Formas de visualização - 2.5. Exemplo prático: VMD

3. Alinhamentos e Modelos Tridimensionais - 3.1. Introdução

Bioinformática e suas aplicações Alex Camargo

IV. Sumário

- 3.2. Alinhando sequências - 3.3. Estrutura 3D de proteínas - 3.4. Predição da estrutura - 3.5. Exemplo prático: Modeller

4. Dinâmica Molecular - 4.1. Introdução - 4.2. Simulações por DM - 4.3. Limitações atuais da DM - 3.5. Exemplo prático: GROMACS

5. Mutações em proteínas - 5.1. Introdução - 5.2. Predição de estabilidade - 5.3. Exemplo prático: mCSM Bioinformática e suas aplicações Alex Camargo

1. O que é Bioinformática?

Bioinformática e suas aplicações Alex Camargo

1.1. Introdução

Computadores cada vez mais rápidos e mais baratos nos permitem abordar problemas, literalmente, inimagináveis há poucos anos.

Projetos genoma.

Estratégias de planejamento de fármacos.

Emprego de ferramentas computacionais.

Bioinformática e suas aplicações Alex Camargo

1.1. Introdução

Computadores cada vez mais rápidos e mais baratos nos permitem abordar problemas, literalmente, inimagináveis há poucos anos.

Projetos genoma.

Estratégias de planejamento de fármacos.

Emprego de ferramentas computacionais.

Bioinformática e suas aplicações Alex Camargo

Figura. IBM 7090 (NASA Ames Resarch Center, 1961)

1.2. Origens

Podemos traçar como momento chave o início da década de 1950, quando a revista Nature publicou o trabalho sobre a estrutura em hélice da molécula de DNA por Watson e Crick.

Bioinformática tradicional: problemas relacionados a sequências de nucleotídeos e aminoácidos.

Bioinformática estrutural: questões biológicas de um ponto de vista tridimensional.

Bioinformática e suas aplicações Alex Camargo

1.2. Origens

Podemos traçar como momento chave o início da década de 1950, quando a revista Nature publicou o trabalho sobre a estrutura em hélice da molécula de DNA por Watson e Crick.

Bioinformática tradicional: problemas relacionados a sequências de nucleotídeos e aminoácidos.

Bioinformática estrutural: questões biológicas de um ponto de vista tridimensional.

Bioinformática e suas aplicações Alex Camargo

Figura. Watson e Crick em frente a um modelo da hélice de DNA. Universidade de Cambridge, 1953.

1.3. Problemas alvo

Considerando o tipo de informação manipulada, os problemas e questões abordados pela bioinformática podem ser agrupados entre:

Bioinformática e suas aplicações Alex Camargo

1.3. Problemas alvo

Considerando o tipo de informação manipulada, os problemas e questões abordados pela bioinformática podem ser agrupados entre:

Bioinformática e suas aplicações Alex Camargo

Figura. As metodologias que lidam com estruturas tridimensionais estão em laranja, já as metodologias envolvidas sequências estão representadas em verde

1.4. Tendências e desfios

Como uma área em rápido desenvolvimento, a bioinformática exige de seu praticante uma constante atenção a novas abordagens, métodos, requerimentos e tendências.

Programas podem se tornar rapidamente ineficientes comparados a novas ferramentas.

Processamento em CPU e GPU.

Bioinformática e suas aplicações Alex Camargo

1.4. Tendências e desfios

Como uma área em rápido desenvolvimento, a bioinformática exige de seu praticante uma constante atenção a novas abordagens, métodos, requerimentos e tendências.

Programas podem se tornar rapidamente ineficientes comparados a novas ferramentas.

Processamento em CPU e GPU.

Bioinformática e suas aplicações Alex Camargo

Figura. Representação dos núcleos de processamento em CPUs e GPUs

1.4. Tendências e desfios

Como uma área em rápido desenvolvimento, a bioinformática exige de seu praticante uma constante atenção a novas abordagens, métodos, requerimentos e tendências.

Programas podem se tornar rapidamente ineficientes comparados a novas ferramentas.

Processamento em CPU e GPU.

Bioinformática e suas aplicações Alex Camargo

Figura. Comparação de tempo de execução entre CPU e GPU em software para dinâmica molecular

2. Níveis de Informação Biológica

Bioinformática e suas aplicações Alex Camargo

2.1. Introdução

Por mais que possam apresentar enormes diferenças, os seres vivos, desde bactérias, passando por plantas e fungos, são compostos aproximadamente pelos mesmos tipos de moléculas.

Dogma central: DNA, RNA e proteínas.

Bioinformática e suas aplicações Alex Camargo

2.1. Introdução

Por mais que possam apresentar enormes diferenças, os seres vivos, desde bactérias, passando por plantas e fungos, são compostos aproximadamente pelos mesmos tipos de moléculas.

Dogma central: DNA, RNA e proteínas.

Bioinformática e suas aplicações Alex Camargo

Figura. Representação do dogma central da biologia molecular

2.2. Macromoléculas biológicas

As biomoléculas descritas no dogma central da biologia molecular, proteínas, DNA e RNA, são o que chamamos de biopolímeros, isto é, polímeros produzidos pelos seres vivos.

Ácidos nucleicos: polímeros sintetizados a partir de unidades denominadas nucleotídeos. Adenina (A), guanina (G), citosina (C), uracila (U) ou timina (T)

Proteínas: polímeros sintetizados pelas células a partir de aminoácidos.

Carboidratos: ao contrário das proteínas, não estão codificados diretamente no genoma.

Membranas: diferentemente dos ácidos nucleicos, proteínas e carboidratos, membranas não se constituem em polímeros biológicos.

Bioinformática e suas aplicações Alex Camargo

2.2. Macromoléculas biológicas

As biomoléculas descritas no dogma central da biologia molecular, proteínas, DNA e RNA, são o que chamamos de biopolímeros, isto é, polímeros produzidos pelos seres vivos.

Ácidos nucleicos: polímeros sintetizados a partir de unidades denominadas nucleotídeos. Adenina (A), guanina (G), citosina (C), uracila (U) ou timina (T)

Proteínas: polímeros sintetizados pelas células a partir de aminoácidos.

Carboidratos: ao contrário das proteínas, não estão codificados diretamente no genoma.

Membranas: diferentemente dos ácidos nucleicos, proteínas e carboidratos, membranas não se constituem em polímeros

Bioinformática e suas aplicações Alex Camargo

Figura. Representação esquemática de um nucleotídeo e suas variações na base nitrogenada e no carboidrato

2.3. Níveis de organização

A classificação da estrutura de biomacromoléculas envolve, didaticamente, quatro diferentes níveis de complexidade.

Estrutura primária: padrão de letras que representa a composição do biopolímero. Para ácidos nucleicos consiste numa sequência de nucleotídeos.

Bioinformática e suas aplicações Alex Camargo

2.3. Níveis de organização

A classificação da estrutura de biomacromoléculas envolve, didaticamente, quatro diferentes níveis de complexidade.

Estrutura primária: padrão de letras que representa a composição do biopolímero. Para ácidos nucleicos consiste numa sequência de nucleotídeos.

Bioinformática e suas aplicações Alex Camargo

Figura. Representação de estruturas primárias

2.3. Níveis de organização

A classificação da estrutura de biomacromoléculas envolve, didaticamente, quatro diferentes níveis de complexidade.

Estrutura primária: padrão de letras que representa a composição do biopolímero. Para ácidos nucleicos consiste numa sequência de nucleotídeos.

Estrutura secundária: com base nas interações da estrutura primária surgem três grupos de elementos principais chamados alças, hélices e folhas beta.

Bioinformática e suas aplicações Alex Camargo

2.3. Níveis de organização

A classificação da estrutura de biomacromoléculas envolve, didaticamente, quatro diferentes níveis de complexidade.

Estrutura primária: padrão de letras que representa a composição do biopolímero. Para ácidos nucleicos consiste numa sequência de nucleotídeos.

Estrutura secundária: com base nas interações da estrutura primária surgem três grupos de elementos principais chamados alças, hélices e folhas beta.

Bioinformática e suas aplicações Alex Camargo

Figura. Representação de uma estrutura secundária

2.3. Níveis de organização

A classificação da estrutura de biomacromoléculas envolve, didaticamente, quatro diferentes níveis de complexidade.

Estrutura primária: padrão de letras que representa a composição do biopolímero. Para ácidos nucleicos consiste numa sequência de nucleotídeos.

Estrutura secundária: com base nas interações da estrutura primária surgem três grupos de elementos principais chamados alças, hélices e folhas beta.

Estrutura terciária: elementos de estrutura secundária organizados no espaço tridimensional.

Bioinformática e suas aplicações Alex Camargo

2.3. Níveis de organização

A classificação da estrutura de biomacromoléculas envolve, didaticamente, quatro diferentes níveis de complexidade.

Estrutura primária: padrão de letras que representa a composição do biopolímero. Para ácidos nucleicos consiste numa sequência de nucleotídeos.

Estrutura secundária: com base nas interações da estrutura primária surgem três grupos de elementos principais chamados alças, hélices e folhas beta.

Estrutura terciária: elementos de estrutura secundária organizados no espaço tridimensional.

Bioinformática e suas aplicações Alex Camargo

Figura. Representação de estruturas terciárias

2.3. Níveis de organização

A classificação da estrutura de biomacromoléculas envolve, didaticamente, quatro diferentes níveis de complexidade.

Estrutura primária: padrão de letras que representa a composição do biopolímero. Para ácidos nucleicos consiste numa sequência de nucleotídeos.

Estrutura secundária: com base nas interações da estrutura primária surgem três grupos de elementos principais chamados alças, hélices e folhas beta.

Estrutura terciária: elementos de estrutura secundária organizados no espaço tridimensional.

Estrutura quaternária: agregados macromoleculares, principalmente de proteínas.

Bioinformática e suas aplicações Alex Camargo

2.4. Formas de visualização

O desafio de representar graficamente proteínas vem acompanhando os pesquisadores desde o início dos estudos da estrutura destas moléculas.

Bioinformática e suas aplicações Alex Camargo

Figura. Primeiro programa de visualização da estrutura 3D de moléculas. Scientific American, 1966

2.4. Formas de visualização

O desafio de representar graficamente proteínas vem acompanhando os pesquisadores desde o início dos estudos da estrutura destas moléculas.

Bioinformática e suas aplicações Alex Camargo

Figura. Exemplo das formas de visualização mais comumente empregadas na descrição de biomoléculas, aplicadas a uma proteína

2.5. Exemplo prático: VMD

Bioinformática e suas aplicações Alex Camargo

Figura. VMD: tela inicial

2.5. Exemplo prático: VMD

Bioinformática e suas aplicações Alex Camargo

Figura. VMD: arquivo PDB da proteína 3THC

2.5. Exemplo prático: VMD

Bioinformática e suas aplicações Alex Camargo

Figura. VMD: proteína 3THC com destaque para um ponto de mutação Y64F

3. Alinhamentos e Modelos Tridimensionais

Bioinformática e suas aplicações Alex Camargo

3.1. Introdução

Alinhamentos são técnicas de comparação entre duas ou mais sequências biológicas buscando séries de caracteres individuais que se encontram na mesma ordem de representação.

Tarefa complexa e etapa decisiva.

Grande parte dos métodos de bioinformática fazem uso de sequências biológicas.

Bioinformática e suas aplicações Alex Camargo

3.1. Introdução

Alinhamentos são técnicas de comparação entre duas ou mais sequências biológicas buscando séries de caracteres individuais que se encontram na mesma ordem de representação.

Tarefa complexa e etapa decisiva.

Grande parte dos métodos de bioinformática que fazem uso de sequências biológicas.

Bioinformática e suas aplicações Alex Camargo

Figura. Exemplo de alinhamento de múltiplas estruturas proteicas oriundas de diferentes organismos

3.2. Alinhando sequências

O alinhamento de estruturas se refere à determinação de quais aminoácidos seriam equivalentes entre tais estruturas.

Bioinformática e suas aplicações Alex Camargo

3.2. Alinhando sequências

O alinhamento de estruturas se refere à determinação de quais aminoácidos seriam equivalentes entre tais estruturas.

Bioinformática e suas aplicações Alex Camargo

Figura. Aplicações dos métodos de alinhamento de sequências biológicas

3.3. Estrutura 3D de proteínas

A função de uma proteína está associada à sua estrutura 3D. As informações sobre a estrutura de uma proteína estão armazenadas em uma sequência codificada nos genes de um organismo.

Atracamento proteína-ligante.

Desenho racional de fármacos.

Desenho de novas proteínas com funções específicas.

Bioinformática e suas aplicações Alex Camargo

3.3. Estrutura 3D de proteínas

A função de uma proteína está associada à sua estrutura 3D. As informações sobre a estrutura de uma proteína estão armazenadas em uma sequência codificada nos genes de um organismo.

Atracamento proteína-ligante.

Desenho racional de fármacos.

Desenho de novas proteínas com funções específicas.

Bioinformática e suas aplicações Alex Camargo

Figura. Retinol Binding Protein com o retinol no sítio ativo, código PDB: 1RBP

3.4. Predição da estrutura

A predição de estruturas tridimensionais de proteínas se caracteriza por possuir aplicações práticas de grande impacto terapêutico e biotecnológico.

Bioinformática e suas aplicações Alex Camargo

3.4. Predição da estrutura

A predição de estruturas tridimensionais de proteínas se caracteriza por possuir aplicações práticas de grande impacto terapêutico e biotecnológico.

Bioinformática e suas aplicações Alex Camargo

Figura. Fluxograma para a predição da estrutura tridimensional de uma proteína

3.5. Exemplo prático: Modeller

Bioinformática e suas aplicações Alex Camargo

Figura. Modeller: Sequência primária da proteína GLB1 (PDB: 3THC)

3.5. Exemplo prático: Modeller

Bioinformática e suas aplicações Alex Camargo

Figura. Modeller: submissão ao BLAST

3.5. Exemplo prático: Modeller

Bioinformática e suas aplicações Alex Camargo

Figura. Modeller: Sequências com alinhamento significativo no BLAST

3.5. Exemplo prático: Modeller

Bioinformática e suas aplicações Alex Camargo

Figura. Modeller: download da estrutura 3WF2 pelo banco de dados PDB

3.5. Exemplo prático: Modeller

Bioinformática e suas aplicações Alex Camargo

Figura. Modeller: download da estrutura 3WF4 pelo banco de dados PDB

3.5. Exemplo prático: Modeller

Bioinformática e suas aplicações Alex Camargo

Figura. Modeller: download da estrutura 3THC pelo banco de dados PDB

3.5. Exemplo prático: Modeller

Bioinformática e suas aplicações Alex Camargo

Figura. Modeller: comparando estruturas moldes

3.5. Exemplo prático: Modeller

Bioinformática e suas aplicações Alex Camargo

Figura. Modeller: alinhamento de estruturas

3.5. Exemplo prático: Modeller

Bioinformática e suas aplicações Alex Camargo

Figura. Modeller: modelo 3D gerado in-silico. A alça para fora da proteína são provalmente aminoácidos que a ferramenta não conseguiu determinar na estrutura

4. Dinâmica Molecular

Bioinformática e suas aplicações Alex Camargo

4.1. Introdução

Dinâmica molecular (DM) é um procedimento de simulação que consiste na computação do movimento dos átomos em uma molécula de acordo com as leis de Newton.

Variação do comportamento molecular como função do tempo.

Bioinformática e suas aplicações Alex Camargo

Figura. Flexibilidade da enzima trombina evidenciada através de simulação por dinâmica molecular

4.2. Simulações por DM

Além da escolha do campo de força e do modelo de água, o preparo e a análise de uma simulação por DM deve considerar alguns aspectos metodológicos importantes:

Condições periódicas de contorno: quanto maior o número de moléculas incluídas em uma simulação, maior será o tempo necessário para realizar o cálculo;

Equilibração: se refere à estabilização de suas propriedades;

Amostragem: a amostragem de uma simulação deve ser longa o bastante para descrever os fenômenos de interesse.

Bioinformática e suas aplicações Alex Camargo

4.2. Simulações por DM

Além da escolha do campo de força e do modelo de água, o preparo e a análise de uma simulação por DM deve considerar alguns aspectos metodológicos importantes:

Condições periódicas de contorno: quanto maior o número de moléculas incluídas em uma simulação, maior será o tempo necessário para realizar o cálculo.

Equilibração: se refere à estabilização de suas propriedades;

Amostragem: a amostragem de uma simulação deve ser longa o bastante para descrever os fenômenos de interesse.

Bioinformática e suas aplicações Alex Camargo

Figura. Lisozima em uma caixa com água

4.3. Exemplo prático: GROMACS

Bioinformática e suas aplicações Alex Camargo

Figura. GROMACS: tela inicial

4.3. Exemplo prático: GROMACS

Bioinformática e suas aplicações Alex Camargo

Figura. GROMACS: execução da DM (PDB 1AKI)

4.3. Exemplo prático: GROMACS

Bioinformática e suas aplicações Alex Camargo

Animação. GROMACS: resultado da DM (PDB 1AKI)

5. Mutações em Proteínas

Bioinformática e suas aplicações Alex Camargo

5.1. Introdução

Estudos de mutações visam, principalmente, determinar experimentalmente as diferenças de energia livre (ΔΔG) entre a proteína do tipo selvagem e a mutada.

Mutações por efeito na estrutura.

Mutações por herança.

Bioinformática e suas aplicações Alex Camargo

5.2. Predição de estabilidade

As mutações desempenham um papel fundamental no organismo por apresentar vantagens ou desvantagens pelo fato de afetar a estabilidade da proteína.

Mutações maléficas x mutações benéficas.

Bioinformática e suas aplicações Alex Camargo

5.2. Predição de estabilidade

As mutações desempenham um papel fundamental no organismo por apresentar vantagens ou desvantagens pelo fato de afetar a estabilidade da proteína.

Mutações maléficas x mutações benéficas.

Bioinformática e suas aplicações Alex Camargo

Figura. Nomes dos 20 aminoácidos codificadores de proteínas

5.3. Exemplo prático: mCSM

Bioinformática e suas aplicações Alex Camargo

Figura. mCSM: importantes etapas da metodologia e como os principais componentes são calculados

5.3. Exemplo prático: mCSM

Bioinformática e suas aplicações Alex Camargo

Figura. mCSM: tela inicial de sumbissão

5.3. Exemplo prático: mCSM

Bioinformática e suas aplicações Alex Camargo

Figura. mCSM: resultados

V. Agradecimentos

CAPES (Coordenação de Aperfeiçoamento de Pessoal de Nível Superior).

Profa. Karina Machado (FURG)

Prof. Adriano Werhli (FURG)

Profa. Raquel Minardi (UFMG)

Bioinformática e suas aplicações Alex Camargo

VI. Contato

FURG - Campus Carreiros - Av. Itália, KM 8 - Rio Grande/RS

Centro de Ciências Computacionais - Laboratório LAMSA

Grupo de Pesquisa em Biologia Computacionalhttp://www.biologiacomputacional.c3.furg.br/

Bioinformática e suas aplicações Alex Camargo

VII. Referências

PIRES, Douglas EV; ASCHER, David B.; BLUNDELL, Tom L. mCSM: predicting the effects of mutations in proteins using graph-based signatures. Bioinformatics, v. 30, n. 3, p. 335-342, 2014.

VERLI, Hugo et al. Bioinformática da Biologia à flexibilidade molecular. Porto Alegre, Brasil, v. 1, 2014.

Bioinformática e suas aplicações Alex Camargo

VII. ReferênciasPIRES, Douglas EV; ASCHER, David B.; BLUNDELL, Tom L. mCSM: predicting the effects of mutations in proteins using graph-based signatures. Bioinformatics, v. 30, n. 3, p. 335-342, 2014.

VERLI, Hugo et al. Bioinformática da Biologia à flexibilidade molecular. Porto Alegre, Brasil, v. 1, 2014.

Bioinformática e suas aplicações Alex Camargo

Figura. Referência indicada

Bioinformática e suas aplicaçõesBioinformática e suas aplicações

OBRIGADO!

Slideshare: alexcamargoweb

Be ye therefore perfect, even as your Father which is in heaven is perfect. Matthew 5:48

Bagé/2015