I Workshop de Computação de Alto Desempenho
Ilhéus, 28 de novembro de 2008
Centro Federal de Educação Tecnológica da BahiaCentro Federal de Educação Tecnológica da Bahia
CEFET-BA• Instituição Federal com foco em Educação Tecnológica,
Profissionalizante e no Ensino Superior.
• Vinculada ao Ministério da Educação
• Estrutura multi-campi - unidades de ensino em regiões estratégicas do Estado da Bahia.
Salvador *Barreiras *Camaçari *Eunápolis *Porto Seguro *Santo Amaro * Simões Filho Valença *Vitória da Conquista*
Bom Jesus da LapaFeira de Santana IrecêIlhéusJacobinaJequiéSeabraPaulo Afonso
Unidades de Ensino– Salvador (Sede)– Simões Filho (Unidade Avançada)
UNEDs – Unidades Descentralizadas
Barreiras
Eunápolis
Valença
Vitória da Conquista
Principais Atividades
• Ensino– Médio– Profissional– Superior– Pós-Graduação
• Pesquisa e Extensão– Cursos– Consultorias– Convênios e Parcerias– Desenvolvimento de Produtos
Pesquisa e Extensão• Áreas de Competência
– Tecnologia de InformaçãoTecnologia de Informação• Grupo de Pesquisa “Guarda-Chuva” e incipiente:Grupo de Pesquisa “Guarda-Chuva” e incipiente:
– 16 pesquisadores (maioria em capacitação)16 pesquisadores (maioria em capacitação)– 06 alunos de iniciação científica06 alunos de iniciação científica
• Linhas de PesquisaLinhas de Pesquisa– Grid Computing;– Desenvolvimento de sistema computacional para supervisão e diagnóstico da qualidade
de energia;– Banco de Dados;– Gestão de Conhecimento;– TV Digital;– Cooperação com o Laboratório de Biofísica Computacional e com o Grupo de Pesquisa
de Sinais e Sistemas.
Pesquisa e Extensão• Áreas de Competência
– Sinais e SistemasSinais e Sistemas• PesquisadoresPesquisadores
– 02 Doutores02 Doutores
– 03 Mestres03 Mestres
• Linhas de PesquisaLinhas de Pesquisa– Processamento digital de sinais;
– Estudo e diagnóstico da qualidade de energia;
– Protótipo de Nobreak 3KVA Microprocessado;
– Fotônica
– Controle e Automação
Pesquisa e Extensão• Áreas de Competência
– Biofísica ComputacionalBiofísica Computacional• PesquisadorPesquisador
– 1 Doutor1 Doutor
– 2 Doutorandos2 Doutorandos
– Alunos de Iniciação CientíficaAlunos de Iniciação Científica
• Linhas de PesquisaLinhas de Pesquisa– Modelagem, análise e simulação de sistemas biológicos
– Modelagem de macro-moléculas biológicas
Biofísica computacional• Simulação de Fenômenos Biofísicos
– Estudos sobre a dinâmica e estabilidade de biomembranas e de filmes líquidos finos de interesse biológico.
– Modelagem molecular de enzimas envolvidas na produção biogênica de gás sulfídrico por Bactérias Redutoras de Sulfato e de sistemas envolvidos na biossulfetogênse e na recuperação avançada de petróleo (problema da produção de sulfato de enxofre nos campos de petróleo).
Biofísica computacional• Simulação de Fenômenos Biofísicos
– Modelagem molecular da ATP sulfurilase (desintoxicação da torta da mamona).
– Estudo da estrutura da ATPS via dinâmica molecular.
– A modelagem de macromoléculas biológicas tem sido desenvolvida através de técnicas da Dinâmica Molecular Clássica e de cálculos ab initio para parametrização do campo de forças clássico.
Biofísica computacional• Modelagem e Simulação
– Proteínas modeladas por meio de uma base de dados denominada PDB.
– Uso de softwares de modelagem e simulação por meio do GROMACS.
– Tempo médio de simulação de um evento biofísico de 30s em um único nó: 15 dias
Modelagem Molecular e Métodos Computacionais
Descrição e previsão de estruturas moleculares, propriedades e equilíbrio das reações, através da química computacional e técnicas de visualização gráfica, visando fornecer uma representação tridimensional, sob um dado conjunto de circunstâncias.
Métodos
• Minimização de energia das moléculas;• Análise comformacional;• Simulação da dinâmica molecular;
Processo
• Seleção do modelo (Protein Data Bank (PDB), Dundee PRODRG Server);
• Execução de cálculos (Método Ab Initio, Semi-Empírico, Mecânica Molecular);
• Análise dos resultados;
Suporte Computacional
• Tamanho do sistema a ser estudado em termos do número de átomos na molécula (Lei de Amdahl);
• O custo computacional varia de acordo com o hardware disponível para executar os cálculos;
• Uso de softwares de modelagem molecular (Gaussian, Gamess, GROMACS)
Biofísica computacional• Infra-Estrutura
– 6 máquinas Linux em um cluster Beowulf
– Uso de biblioteca MPI
– Necessidade de integrar a grades computacionais para aumentar a capacidade de processamento!
Biofísica computacional• Pesquisa computacional
– Adaptação do formato PDB para XML, já em andamento, 70% terminado
– Criação de uma base de dados XML com as informações sobre as proteínas analisadas no LABIC e processamento da mesma em um cluster/grade de dados
- Desenvolvimento da ferramenta Odara-X para indicação e definição do esquema de fragmentação, já em andamento, 60% terminada
Biofísica computacional• Pesquisa computacional
– Análise de similaridas no formato PDB
– Extração de características por meio de redes neurais, rodando no cluster;
• Estudo de algoritmos de auto-organização de dados;• Estudo da estrutura de representação de dados do PBD
(Protein Data Bank);• Desenvolvimento de algoritmos de rede neural baseado
em auto-organização (Mapa de Kohonen);• Estudo de problemas de homologia de estruturas
associados a projetos do Labic (Laboratório de Bio-física Computacional);
• Determinação de homologias de estruturas protéicas do PDB através dos algoritmos desenvolvidos.
• O PDB (Protein Data Bank) é um portal de informações para estruturas biológicas e fornece uma variedade de ferramentas e recursos para o estudo destas estruturas.
• Dentro do PDB, estão catalogadas estruturas como proteínas, ácidos nucléicos e complexos de proteínas, que representam cerca de 99,9% das estruturas cadastradas.
• As proteínas no PDB possuem códigos que contém um número e três letras e cada macromolécula possui sua seqüência de nucleotídios e aminoácidos em formato fasta .
Exemplo de um arquivo fasta:
2AAI: CADEIA B 2AAI: CADEIA A
advcmdpepivrivgrnglcvdvrdgrfhngnaiqlwpcksntdan ...
ifpkqypiinfttagatvqsytnfiravrgrlttgadvrheipvlpnrvglpi...
• Representação dos dados
.2AAI - CRYSTALLOGRAPHIC REFINEMENT OF RICIN TO 2.5 ANGSTROMS
• Arquivo Fasta
Proteína Proteína UtilizadaUtilizada Como Como PadrãoPadrão
2AAI CADEIA B
advcmdpepivrivgrnglcvdvrdgrfhngnaiqlwpcksntd...
2AAI CADEIA A
Ifpkqypiinfttagatvqsytnfiravrgrlttgadvrheipvlpnrv...
PROTEÍNA ARQUIVO FASTAProteína 1(2AAI) ifpkqypiinfttagatvqsytnfiravrgra…
Proteína 2 myavatwlcfgstsgwsftlednnifpkq…Proteína 3 advcmdpepivrivgrnglcvdvrdgrf…
Proteína 4 advcmdpepivrivgrnglcvdvrdgrf...
Proteína 5 advcmdpepivrivgrnglcvdvrdna...
Proteína 6 fghngnaiqlwpcksntdanqlwtlkrd...
Proteína 7 Ifpkqypiinfttadatvesytnfiravrsh...
Proteína 26 ddgtctpseptvwivglnglcvdvrhgk…
[4 4]
Perspectivas
• Aumento da capacidade de infra-estrutura
• Integração de cluster MPI a outros via grades computacionais
• Contatos:• Allan Santos – [email protected]• Elias Ramos – [email protected]• Pablo Florentino – [email protected]