Upload
leandro-lemos
View
184
Download
9
Embed Size (px)
Citation preview
Analises de sequencias metagenomicas viaMG-RAST
Leandro Nascimento Lemos
Doutorando em Biologia na Agricultura e no AmbienteOrientadora: Profa. Tsai
Novembro/2016
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Big Data
Geracao de dados massivos em Biologia Molecular;
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Big Data
Sequenciamento massivo gera muitos dados!Illumina Hiseq: sequenciamento de ate 2.000 genomasmicrobianos em uma unica corrida.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Bioinformatica
O que e: Aplicacao da Cienciade Dados na resolucao deproblemas biologicos;Desafio: processar umaavalanche de dados gerados porsequenciadores de nova geracao;Solucao: Produzir novasferramentas computacionais.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Bioinformatica
Ferramentas deProcessamento:
Ferramentas deVisualizacao:
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Bioinformatica: Human Microbiome Project
Explorar as relacoes entre doencas humanas e alteracoes namicrobiota;Desenvolvimento de novas ferramentas de Bioinformatica
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Bioinformatica: Human Microbiome Project
Desenvolvimento de novas ferramentas de Bioinformatica(IMG/M)
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Bioinformatica: Computadores de alto desempenho
Alta capacidade deprocessamento,armanezamento e memoria;Illumina Hiseq(18.000.000/reads poramostra);128 processadores e 2 TBde memoria ram.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Linux
Sistema operacional livre.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Estudos de comunidades microbianas (ou de microbiomas)
Tecnicas independentes de cultivo de microrganismosPerfil de 16S rDNA; Metagenomica; Metatranscritomica
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Metagenomica pra que?
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Metagenomica: Informacao Taxonomica e Funcional
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Metagenomica: Pipelines
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
MG-RAST: plataforma online de processamento de dadosmetagenomicos
Acesso: http://metagenomics.anl.gov
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
MG-RAST: plataforma online de processamento de dadosmetagenomicos
Arquivos brutos (raw data) ou contigs (montagem - assembled data);Arquivo de metadados (sample description data);Upload: Interface grafica ou linha de comando.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
MG-RAST
Pipeline (Fluxo de analise de dados).
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Arquivo em formato fastq (10 minutos)
https://lemosbioinfo.wordpress.com/material-aulapratica/Verificar a qualidade das dez primeiras bases da primeira, segunda eterceira sequencia.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Arquivo em formato fastq - Phred score
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Qualidade de sequenciamento/Remocao de sequencias debaixa qualidade
Qualidade do sequenciamentoSoftware: FastQC(http://www.bioinformatics.babraham.ac.uk/projects/fastqc)
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
MG-RAST - Controle de Qualidade
4. Choose pipeline options
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
MG-RAST - Upload
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
MG-RAST - Upload
1. Metadata file: MetaZen tool2. Select project.3. Select sequence files (s)4. Choose pipeline options
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Dereplicacao, DRISEE e Screening
Deplicacao e DRISSE: Removacao de sequencias artificaisgeradas durante o sequenciamento.Screening: Removacao de sequencias nao-microbianas.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
MG-RAST
Pipeline (Fluxo de analise de dados).
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Predicao de Genes
Identificacao de regioes codificadoras.ORFs (Open reading frames).Tamanho medio de um gene microbiano: 950 bp.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Predicao de Genes: Problemas
Fragmentos de sequencias (genes incompletos);Erros de sequenciamento.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Solucao: Aprendizagem de Maquina
Netflix.Ensinar o computador a pensar usando exemplos.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Solucao: Aprendizagem de Maquina
Ensinar o computador a pensar usando exemplos: HMMs (ModelosOcultos de Markov).O que o computador precisa aprender?A) Desvio no uso de codons; B) Modelos de Erros de Sequenciamento; C)Padroes de codon de iniciacao e terminacao.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
MG-RAST
Pipeline (Fluxo de analise de dados).
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Agrupamento de aminoacidos
Agrupamento de sequencias proteıcas (90% de similaridade).Redudacao da complexidade computacional.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
MG-RAST
Pipeline (Fluxo de analise de dados).
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Identificacao de proteınas
Busca por sequencias similares em bancos de dados publicos.GenBank, SEED, IMG, UniProt, KEGG e eggNOGs.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Perfil de Abundancia
Best hit, Representative hit e Menor Ancestral Comum (LCA).
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Analise exploratoria: Atividade em grupo (30 minutos)
1 Clique em AulaPratica2016.2 Clique em Amostra de interesse do grupo.3 Predicted feature (16S rDNA e proteınas); Unknown; failed QC.4 Predicted Features: unknown protein; annotated protein; ribosomal RNA.5 Analysis Statistics: Predicted Protein Features vs. Identified Protein
Features.6 Modificar metadados.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Analise exploratoria: Atividade em grupo (10 minutos)
1 Qual o filo mais abundante?2 Qual a funcao mais abundante?3 Qual e a proporcao de Proteobacteria?4 Qual e a proporcao de Acidobacteria?
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Informacao funcional: o que estao fazendo?
COG, KO, NOG e Subsystems.Abundancia de categorias funcionais.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Informacao taxonomica: Quem esta ali?
RefSeq.Abundancia taxonomica.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Analises Comparativas (10 minutos)
1 Clique em Analysis.2 Aguarde...3 Create a new Analysis.4 Selecionar RefSeq, KEGG, Subsystems e Silva SSU.5 Selecionar as amostras.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Analises Comparativas: selecao de parametros de anotacao
1 Clicar em metadata e metadata2 sample, add (sinal de mais): Nomes e Tratamento.3 Parametros: I) e-value II) Identidade III) length IV) min.abundance.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Analise exploratoria: Atividade em grupo (30 minutos)
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Analise exploratoria: Atividade em grupo (10 minutos)
1 Qual o filo mais abundante?2 Qual a funcao mais abundante?3 A proporcao do filo mais abundante e alterada quando os parametros de
anotacao sao modificados? Por que?4 A proporcao da funcao mais abundante e alterada quando os parametros
de anotacao sao modificados? Por que?5 Qual e a proporcao de Proteobacteria?6 Qual e a proporcao de Acidobacteria?
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
SubSystems
1 Exemplo...2 Carbohydrate (nıvel 1)3 One-carbon Metabolism (nıvel 2)4 Methanogenesis (nıvel 3)
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
STAMP
1 Clique em Analysis2 Export
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
STAMP
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
MetaZoo
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
MetaZoo: Estrutura, Dinamica e Funcoes Metabolicas dacompostagem - Abordagem multi-omica.
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Modelo de degradacao de biomassa vegetal pormicrorganismos na compostagem - Modelo conceitual
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
BMPOS - Ferramentas de Bioinformatica para analises demicrobiomas
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Onde aprender?
Coursera: https://www.coursera.org
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Onde aprender?
Coursera: https://www.coursera.org
Gut Check: Exploring Your Microbiome
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST
Obrigado pela atencao!
Leandro Nascimento Lemos Analises de sequencias metagenomicas via MG-RAST