92
Marcel Caraciolo, CTO [email protected] Como interpretar seu próprio Genoma usando Python e outras tecnologias!

Como interpretar seu próprio genoma com Python

Embed Size (px)

Citation preview

Page 1: Como interpretar seu próprio genoma com Python

Marcel Caraciolo, CTO

[email protected]

Como interpretar seu próprio Genoma usando Python e outras tecnologias!

Page 2: Como interpretar seu próprio genoma com Python

Quem somos ?Um dos laboratórios mais avançados em clínica genética do Brasil e o primeiro localizado na região Norte e Nordeste. !!!!

Portfólio de testes genéticos para diagnóstico e tratamento personalizado de doenças hereditárias, raras, tumores e bem-estar e saúde.

Page 3: Como interpretar seu próprio genoma com Python

Tecnologia e especialistasFusão de especialistas em biologia

molecular e tecnologia de informação

João  Bosco  Oliveira,  CEO  e  Co-­‐Fundador  M.D,    PhD  e  ex-­‐chefe  de  pesquisa  do  serviço    de  imunologia  e  genética  do  Dpto.  de  Medicina  Laboratorial,  Centro  Clínico,  National  Institutes  of  Health  ,  USA.

Page 4: Como interpretar seu próprio genoma com Python

Genética ClínicaMercado mundial em crescimento e

recente no Brasil

Page 5: Como interpretar seu próprio genoma com Python

Usamos seu DNA!

Page 6: Como interpretar seu próprio genoma com Python
Page 7: Como interpretar seu próprio genoma com Python

Aproximadamente 300 - 600 mutações por geração.

http://genetics.thetech.org/ask/ask435

Page 8: Como interpretar seu próprio genoma com Python

Com os dados de genoma humano…

Nós poderíamos correlacionar variantes entre genomas com doenças. !

Poderíamos identificar parentesco e herança genética !Identificar traços de ancestralidade !

Identificar “erros" ou problemas conhecidos

Page 9: Como interpretar seu próprio genoma com Python

Para quem não entendeu lembra do Angelina Joulie effect ?

Page 10: Como interpretar seu próprio genoma com Python

Para quem não entendeu lembra do Angelina Joulie effect ?

Page 11: Como interpretar seu próprio genoma com Python

NextGen Sequencing

Page 12: Como interpretar seu próprio genoma com Python

NextGen Sequencing

Page 13: Como interpretar seu próprio genoma com Python

Tamanho

Page 14: Como interpretar seu próprio genoma com Python

Tamanho

Page 15: Como interpretar seu próprio genoma com Python

Se quisessemos carregar o Genoma na memória ?

Como representaríamos em linguagem de programação ?

char [] humanDNA = char[ 3 200 000 000];

Page 16: Como interpretar seu próprio genoma com Python

Se quisessemos carregar o Genoma na memória ?

Como representaríamos em linguagem de programação ?

char [] humanDNA = char[ 3 200 000 000];

Page 17: Como interpretar seu próprio genoma com Python

Se quisessemos carregar o Genoma na memória ?

Como representaríamos em linguagem de programação ?

char [] humanDNA = char[ 3 200 000 000];

Page 18: Como interpretar seu próprio genoma com Python

Maquinário Humano

Page 19: Como interpretar seu próprio genoma com Python

Genoma em um arquivo

Page 20: Como interpretar seu próprio genoma com Python

NextGen Sequencing

Page 21: Como interpretar seu próprio genoma com Python

Tamanho

Page 22: Como interpretar seu próprio genoma com Python

Genoma em um arquivo

Page 23: Como interpretar seu próprio genoma com Python

Volume

Page 24: Como interpretar seu próprio genoma com Python

Volume

Page 25: Como interpretar seu próprio genoma com Python

Volume

Page 26: Como interpretar seu próprio genoma com Python

Volume

Page 27: Como interpretar seu próprio genoma com Python

Volume

Page 28: Como interpretar seu próprio genoma com Python

Volume

Page 29: Como interpretar seu próprio genoma com Python

Significado

Page 30: Como interpretar seu próprio genoma com Python

Significado

Page 31: Como interpretar seu próprio genoma com Python

Meaning

Page 32: Como interpretar seu próprio genoma com Python

Meaning

Page 33: Como interpretar seu próprio genoma com Python

O que é bioinformática ?

Page 34: Como interpretar seu próprio genoma com Python

Significado

Page 35: Como interpretar seu próprio genoma com Python

Significado

Page 36: Como interpretar seu próprio genoma com Python

Significado

Page 37: Como interpretar seu próprio genoma com Python

Significado

Page 38: Como interpretar seu próprio genoma com Python

Significado

Page 39: Como interpretar seu próprio genoma com Python

Como estruturamos isto ?

Análise de Variantes

Page 40: Como interpretar seu próprio genoma com Python

Análise de Variantes

Page 41: Como interpretar seu próprio genoma com Python

Análise de Variantes

Page 42: Como interpretar seu próprio genoma com Python

E como funciona tudo isso na prática ?

Vamos montar nosso Mini-Pipeline simples educacional para entendermos como podemos

analisar algumas variantes SNVs em nosso genoma.

Sequence Map Call variants Interpret

Page 43: Como interpretar seu próprio genoma com Python

Nosso caso de estudo

Sequências de DNA de uma mulher brasileira, com idade de 30 anos com histórico familiar de câncer de mama.

!

Cerca de 10-15% dos cânceres de mama e ovário

são devidos a mutações genéticas hereditárias

Page 44: Como interpretar seu próprio genoma com Python

Sequenciamento do DNA

Sequence Map Call variants Interpret

Page 45: Como interpretar seu próprio genoma com Python

Sequenciamento do DNA

https://www.youtube.com/watch?v=womKfikWlxM

Page 46: Como interpretar seu próprio genoma com Python

NextGen Sequencing

Page 47: Como interpretar seu próprio genoma com Python

Como representamos as sequências?

Page 48: Como interpretar seu próprio genoma com Python

Sequências FASTA

Page 49: Como interpretar seu próprio genoma com Python

Múltiplas sequências, Multi-FASTA

Page 50: Como interpretar seu próprio genoma com Python

Formato FastQ

Page 51: Como interpretar seu próprio genoma com Python

Formato FastQ

Page 52: Como interpretar seu próprio genoma com Python

Analisando algumas sequências

Vamos analisar de 2 maneiras: !

Vocês: https://usegalaxy.org/ !

Eu: UseGalaxy + Terminal ! https://usegalaxy.org/u/genomika/h/pipeline-workshop

Page 53: Como interpretar seu próprio genoma com Python

Galaxy Platform

Open-source, escrito boa parte em Python

Page 54: Como interpretar seu próprio genoma com Python

Analisando sequências

fastqc, command line

Page 55: Como interpretar seu próprio genoma com Python

Mapeando as sequências no Genoma

Sequence Map Call variants Interpret

Page 56: Como interpretar seu próprio genoma com Python

Fase de Alinhamento

FASTQ =>

FASTQ => => BAM

Page 57: Como interpretar seu próprio genoma com Python

Alinhamentoss

FASTQ =>

Page 58: Como interpretar seu próprio genoma com Python

Formato SAM/BAM

FASTQ =>

Page 59: Como interpretar seu próprio genoma com Python

Formato SAM/BAM

FASTQ =>

Page 60: Como interpretar seu próprio genoma com Python

CIGAR String

FASTQ =>

Page 61: Como interpretar seu próprio genoma com Python

Alinhando na prática

bwa, samtools

Page 62: Como interpretar seu próprio genoma com Python

Visualizando os alinhamentos

http://www.broadinstitute.org/igv/

Page 63: Como interpretar seu próprio genoma com Python

Visualizando os alinhamentos

Page 64: Como interpretar seu próprio genoma com Python

Detectando as variantes !

Sequence Map Call variants Interpret

Page 65: Como interpretar seu próprio genoma com Python

Variant Calling

FASTQ => BAM => => VCF

Page 66: Como interpretar seu próprio genoma com Python

Chamando variantes

FASTQ =>

Page 67: Como interpretar seu próprio genoma com Python

Recapitulando, sempre bom!

FASTQ =>

Page 68: Como interpretar seu próprio genoma com Python

Formato VCF

FASTQ =>

Page 69: Como interpretar seu próprio genoma com Python

Formato VCF

FASTQ =>

Page 70: Como interpretar seu próprio genoma com Python

Formato VCF

FASTQ =>

Page 71: Como interpretar seu próprio genoma com Python

Formato VCF

FASTQ =>

Page 72: Como interpretar seu próprio genoma com Python

Chamando variantes na prática

freebayes

Page 73: Como interpretar seu próprio genoma com Python

Interpretando as variantes!

Sequence Map Call variants Interpret

Page 74: Como interpretar seu próprio genoma com Python

Chamando variantes na prática

Page 75: Como interpretar seu próprio genoma com Python

Anotação de Variantes

FASTQ =>

Variantes anotadas com VEP

Page 76: Como interpretar seu próprio genoma com Python

Anotando variantes

IGV, NCBI, Snpedia, vcflib, bcftools, SnpEff.

Page 77: Como interpretar seu próprio genoma com Python

chr17:41222948 (hg19)

Anotações

Page 78: Como interpretar seu próprio genoma com Python

Anotações

Page 79: Como interpretar seu próprio genoma com Python

chr17:41222948 (hg19) Anotações

http://www.ncbi.nlm.nih.gov/clinvar/variation/37616/#clinical-assertions

Page 80: Como interpretar seu próprio genoma com Python

Curiosidades

Como podemos associar variantes e doenças?

“Genome Wide Association Study (GWAS)”

Genome Wide Association Study (GWAS)

Page 81: Como interpretar seu próprio genoma com Python

Curiosidades

“Genome Wide Association Study (GWAS)”

Deve-se considerar o relacionamento entre a escolha das amostras !Grande quantidade de amostras é necessário !Bom domínio de estatística e lidar com o problema de “múltiplos testes de confiança”. !Bancos de dados variados e heterôgeneos. !Correlação não significa que é a causa! !Efeitos em grandes proporções são raras - geralmente são várias pequenas alterações combinadas.

Page 82: Como interpretar seu próprio genoma com Python

Lembra deste slide ?

Page 83: Como interpretar seu próprio genoma com Python

E se eu quiser sequenciar meu próprio genoma ?

Se você não possuir uma requisição clínica, hoje no Brasil é complicado. !Há possibilidades de realizar o Genoma Completo , mas o valor ainda não acessível - =~ R$ 23k !Fora do Brasil, há empresas como o 23andMe, screen de vários SNP’s por $ 99

Page 84: Como interpretar seu próprio genoma com Python

Como armazenamos isto ?

Page 85: Como interpretar seu próprio genoma com Python

Ciclo de vida de um exame

Page 86: Como interpretar seu próprio genoma com Python

Como posso aprender mais?

Tales of Genome (Udacity)Curso On-line gratuito sobre Genética (bem completo!)

Page 87: Como interpretar seu próprio genoma com Python

RosalindDesafios de Python na área de bioinformática

rosalind.info/

Page 88: Como interpretar seu próprio genoma com Python

Broad workshopsVariant analysis; sequencing pipelines, etc.

https://www.broadinstitute.org/partnerships/education/broade/broad-workshops/

Page 89: Como interpretar seu próprio genoma com Python

CourseraSpecialization on Genomics Data Science

https://www.coursera.org/specialization/genomics/41

Page 90: Como interpretar seu próprio genoma com Python

II Curso de Análise de Dados de NGS

https://github.com/genomika/summercourse

Edições anuais em meados de dezembro e

janeiro!

Page 91: Como interpretar seu próprio genoma com Python

Trabalhe conosco!github.com/genomika/jobs

Page 92: Como interpretar seu próprio genoma com Python

Marcel Caraciolo, CTO

[email protected]

Como interpretar seu próprio Genoma usando Python e outras tecnologias!

“Biology easily has 500 years of exciting problems to work on.”

Donald Knuth, 1993