13
11/05/2012 1 Evolução de genes e genomas Professor Fabrício R Santos [email protected] Departamento de Biologia Geral, UFMG 2012 Projeto Genoma Humano iniciou em 1990 Vários genomas de procariotos e eucariotos foram concluídos antes do genoma humano Organização, função e complexidade genômica Tamanhos de genomas completos Genomas cromossomos (N) tamanho genes Mycoplasma genitalium 0,58 Mpb 521 Escherichia coli 5,4 Mpb 5.416 Saccharomyces cerevisiae 16 12,5 Mpb 5.770 Caenorhabditis elegans 6 ~100 Mpb 19.427 Arabidopsis thaliana 5 ~115 Mpb ~28.000 Drosophila melanogaster 5 ~122 Mpb 13.379 Homo sapiens 24 ~ 3,3 Gpb ~22.500 Monodelphis domestica 10 ~3,5 Gpb ~20.000 Complexidade genômica A organização e as proporções genômicas de regiões codificadoras de proteínas, não codificadoras (com ou sem função) e repetitivas são diferentes entre táxons.

Evolução de genes e genomas - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/aula23-evolgenesgenomas.pdf · Escherichia coli 5,4 Mpb 5.416 ... Slide 38 Retrotransposição

Embed Size (px)

Citation preview

11/05/2012

1

Evolução de genes e genomas

Professor Fabrício R Santos [email protected]

Departamento de Biologia Geral, UFMG 2012

Projeto Genoma Humano iniciou em 1990

Vários genomas de procariotos e eucariotos foram concluídos antes do genoma humano

Organização, função e complexidade genômica

Tamanhos de genomas completos Genomas cromossomos (N) tamanho genes

Mycoplasma genitalium 0,58 Mpb 521

Escherichia coli 5,4 Mpb 5.416

Saccharomyces cerevisiae 16 12,5 Mpb 5.770

Caenorhabditis elegans 6 ~100 Mpb 19.427

Arabidopsis thaliana 5 ~115 Mpb ~28.000

Drosophila melanogaster 5 ~122 Mpb 13.379

Homo sapiens 24 ~ 3,3 Gpb ~22.500

Monodelphis domestica 10 ~3,5 Gpb ~20.000

Complexidade genômica

A organização e as proporções genômicas de regiões codificadoras de proteínas, não codificadoras (com ou sem função) e repetitivas são diferentes entre táxons.

11/05/2012

2

Distribuição de genes no Homo sapiens

Saccone et al. (2001) Chromosome Res.

A densidade de genes varia muito ao longo dos cromossomos humanos

Grande parte dos genes eucarióticos não tem função conhecida (unknown)

Genomas eucarióticos comparados

Sequências codificadoras

e não codificadoras

~70-75%

> 150 MAA

4,2

Gambá

0,4 2,5 3,0 Tamanho (Gpb)

~65% ~80% >99% Conservação em

regiões codificadoras

Sequências codificadoras

Sequências codificadoras e

não codificadoras

Mudanças genômicas e/ou

adaptativas exclusivamente

humanas

Permite identificar:

~450 MAA > 75 MAA ~5-7 MAA Tempo desde a

divergência

Baiacu Camundongo Chimpanzé Homem vs..

Genomas eucarióticos comparados

Usando a teoria evolutiva, os genomas são comparados a fim de caracterizar mudanças que ocorrem nos ancestrais comuns (sinapomorfias) e também mudanças exclusivas (autapomorfias) das espécies.

sinapomorfias

autapomorfias

Sintenia Homem-Baiacu Regiões cromossômicas com extensa homologia e mesmo ordenamento gênico (sintênicas) podem ser mapeadas entre espécies.

Regiões cromossômicas com extensa homologia e mesmo ordenamento gênico (sintênicas) podem ser mapeadas entre espécies.

Cromossomo humano 1 vs. Chimpanzé

12

Genômica Comparativa – Sintenia

Homo sapiens

Divergência 6 MAA

11/05/2012

3

13

Cromossomo humano 1 vs. Camundongo

Genômica Comparativa – Sintenia

Homo sapiens

Divergência >75 MAA

14

Genômica Comparativa – Sintenia

Cromossomo humano 1 vs. Vaca

Homo sapiens

Divergência >95 MAA

15

Genômica Comparativa – Sintenia

Cromossomo humano 1 vs. Gambá

Homo sapiens Divergência >150 MAA

16

Genômica Comparativa – Sintenia

Cromossomo humano 1 vs. Ornitorrinco

Homo sapiens Divergência >180 MAA

17

Genômica Comparativa – Sintenia

Cromossomo humano 1 vs. Galinha

Homo sapiens Divergência >200 MAA

DNA “entulho”

Antes do sequenciamento de vários genomas eucarióticos, grande parte da porção não codificadora era chamada de DNA “entulho” (junk DNA), que por alguns foi traduzida equivocadamente como DNA “lixo”. Atualmente, várias porções deste DNA “entulho” possuem funções estruturais ou regulatórias:

1. RNAs funcionais: miRNA, snRNA, snoRNA, RNA anti-senso etc 2. Regiões conservadas não codificadoras: enhancers, reguladores diversos etc

No entanto, a maior parte do DNA “entulho” corresponde a segmentos repetitivos, principalmente os elementos transponíveis:

1. LINEs (elementos retrotransponíveis ou retroposons – via RNA - longos) 2. SINEs (retroposons curtos) 3. ERV (retrovírus endógenos) 4. Transposons (elementos transponíveis via DNA)

11/05/2012

4

miRNA e RNA anti-senso estão subestimados Obs: outros RNAs não codificadores funcionais raros não estão representados

RNAs funcionais que emergiram da genômica evolutiva

miRNA

Micro RNA (miRNA) Família de pequenos RNAs de 21–25 nucleotídeos que regulam negativamente a expressão gênica no nível pós-transcricional.

O complexo de silenciamento induzido por RNA (RISC) é operado por

miRNA (junto com proteínas argonautas)

Enhancer HACNS1 descoberto por genômica comparada está relacionado ao desenvolvimento

Expresso exclusivamente nos membros anteriores e posteriores durante o desenvolvimento na espécie humana, seus ortólogos de chimpanzé e rhesus não se expressam da mesma forma nos fetos transgênicos de camundongos.

HAR1F: região não codificadora altamente conservada que expressa um RNA funcional

A alta conservação desta sequência transcrita foi detectada por genômica comparada entre inúmeras espécies de vertebrados, indicando que é mantida por seleção purificadora, pois possui uma função importante, embora ainda não seja conhecida.

Elementos transponíveis em eucariotos Retrotransposons e transposons constituem quase metade do genoma humano

Os elementos transponíveis representam várias classes que se multiplicam e se mobilizam nos genomas eucarióticos e procarióticos. Esses elementos não codificam normalmente funções do organismo hospedeiro e podem ser considerados como unidades evolutivas relativamente independentes, algumas vezes vistos como comensais, mas outras vezes são vistos como mutualistas ou parasitas moleculares.

11/05/2012

5

Proporção de elementos transponíveis em genomas eucarióticos

Muitas diferenças de tamanhos dos genomas entre espécies se devem, principalmente, ao acúmulo de elementos transponíveis.

Arabidopsis thaliana Psilotum nudum

~115 Mpb

~ 250 Gpb

Tamanhos de genomas completos

Por que alguns genomas são tão grandes?

Não há uma relação clara entre tamanho de genomas e “complexidade biológica”.

• Valor-C – quantidade total de DNA no genoma haplóide (N)

• Paradoxo do valor-C – falta de relação entre o conteúdo de DNA em um organismo e seu potencial codificador e complexidade.

Valor-C (escala logarítmica)

Elementos repetitivos, geralmente transposons etc

Paisagens genômicas contrastadas

A quantidade de elementos transponíveis está positivamente correlacionada com o tamanho genômico

DNA genômico

Elementos transponíveis

DNA codificador de proteínas

Feschotte e Pritham 2006

09_26_noncoding.jpg Sequências repetitivas e de cópia única no genoma humano

11/05/2012

6

Elementos transponíveis em humanos

Retrotransposon longo

Retrovírus endógeno

Transposon típico

Retrotransposon curto

Transposons versus Retrotransposons (ou retroposons)

Retrotransposons autônomos 1. Retrovírus endógenos: retrotransposons com LTR (long terminal

repeats) (vírus inserido no genoma, sem atividade infectiva)

2. Retrotransposons sem LTR (possuem poli-A)

Retrotransposons eucarióticos autônomos têm a sua própria transcriptase reversa

Retrovírus endógenos (ERV) são similares a retrovírus, apresentando as mesmas estruturas gênicas e ciclo de propagação parecido, mas não formam partículas infectantes

ERVs são retrotransposons com LTRs, repetições típicas de Retrovírus.

Transcriptase Reversa

LINEs e SINEs em metazoários uma longa história coevolutiva

Os LINEs, como o elemento L1 de primatas, são autônomos, i.e., codificam sua própria enzima de replicação (RT), que é utilizada na replicação de SINEs (como ALU de primatas) e pseudogenes processados. A presença de um Poli-A é a marca típica da retrotransposição mediada pelas RTs dos LINEs.

LINE – Sequência repetitiva intercalada longa

SINE – Sequência repetitiva intercalada curta

11/05/2012

7

Retrotransposon do tipo LINE

ORF1: proteína de ligação ao RNA

ORF2: (RT) endonuclease + transcriptase reversa

Estes elementos têm capacidade autônoma de retrotransposição

Slide 38

Retrotransposição mediada por LINEs

Propagação de LINEs e SINEs nos genomas eucarióticos

Geralmente, os LINEs providenciam a enzima transcriptase reversa que é utilizada por eles e pelos SINEs para sua retrotransposição e aumento de cópias no genoma hospedeiro.

Inserção de LINEs e SINEs nos genomas

Evolução dos elementos ALU em Primatas

• Os retroposons ALUs são derivados do RNA ribossômico 7SL.

• Os transcritos de ALU também se ligam a proteínas ribossômicas.

• As ALUs se associam aos ribossomos, próximo ao sítio de síntese.

• Quando um RNAm de L1 (LINE) está sintetizando sua RT com afinidade por caudas poli-A, está se liga à cauda do elemento ALU.

• Este complexo ALU + RT se dirige ao núcleo, onde se dará a retrotransposição que resulta em nova cópia inserida de ALU.

• A RT pode também se ligar eventualmente à poli-A de outros RNAm, dando origem aos pseudogenes processados.

Componentes estruturais e funcionais do genoma humano

11/05/2012

8

Transposons no cromossomo 21 humano

A maior parte das inserções de elementos transponíveis nos genomas é observada em regiões não codificadoras ou sem importância funcional

No genoma humano, a densidade das classes de repetições intercaladas varia como uma função do conteúdo de GC

IHGSC. Nature (2001) 409 860-921

L1s (LINEs) são comuns em regiões pobres em GC, enquanto ALUs (SINEs) são comuns nas GC-ricas

Inferência filogenética com o uso de SINEs e LINEs

A inserção de um elemento transponível é geralmente um evento único de mutação neutra, e vários destes eventos acumulam ao longo das linhagens evolutivas, podendo ser utilizados como caracteres sinapomórficos em cladística.

Inferência filogenética com o uso de SINEs e LINEs

espécie A espécie B espécie C espécie D

Elementos ALU e filogenia de Hominóides

PNAS (2003) 22:12787-91

Expansão dos elementos Alu na linhagem primata

Mark A. Batzer e Prescott L.Deininger

11/05/2012

9

Alterações mediadas por retroelementos

Mutagênese insercional

Recombinação desigual mediada por ALUs

Promotor

Rompe a matriz de

leitura

Danifica o processamento de

íntrons

Não altera Altera expressão do gene

Inserções de elementos transponíveis

Transposons e retrotransposons podem afetar o funcionamento gênico quando inseridos próximos ou dentro dos genes

Inserção de um elemento L1 (LINE humano) interrompeu porção codificadora do éxon 14 do gene do fator VIII é a causa molecular de um tipo de hemofilia A.

Locus Ocorrência Tipo de Alu Doença BRCA2 de novo Y Câncer de mama

Mlvi-2 de novo (somática?) Ya5 Associado com leucemia

NF1 de novo Ya5 Neurofibromatose

APC Familiar Yb8 Doença desmóide hereditária

PROGINS ~ 50% Ya5 Ligada com carcinoma de ovário

Btk Familiar Y X-linked agammaglobulinaemia

IL2RG Familiar Ya5 XSCID

Colinesterase Uma família Japonesa Yb8 Deficiência de colinesterase

CaR Familiar Ya4 Hipercalcemia hipocalciúrica e hiperparatireoidismo neonatal

Inibidor C1 de novo Y Deficiência do complemento

ACE ~ 50% Ya5 Ligada com proteção de doenças cardíacas

Fator IX Um avô Ya5 Hemofilia

2 x FGFR2 de novo Ya5 Síndrome de Apert

GK ? Sx Deficiência de Glicerol Quinase

Alguns raros eventos de inserção, quando inseridos nas porções funcionais do genoma (regiões regulatórias, éxons, íntrons etc) podem levar a efeitos deletérios.

Inserções de ALU e doenças genéticas

Importância evolutiva do DNA “entulho”

Sincitina (Syncytin - poliproteína env de um retrovírus endógeno com função no sinciciotrofoblasto) Blond JL (1999): Molecular characterization and placental expression of HERV-W, a new

human endogenous retrovirus family". J Virol

Regulação da expressão gênica e promoção de diversidade genética Peaston A et al (2004): Retrotransposons Regulate Host Genes in Mouse Oocytes and

Preimplantation Embryos. Developmental Cell

Evolução de novos genes, p.ex., uma proteína anticongelamento de peixes polares DeVries AL e Cheng C-HC (2005): Antifreeze proteins in polar fishes. Fish Physiology

Capacidade de reparo de fitas quebradas mediada por LINE-1. Morrish TA et al (2002): DNA repair mediated by endonuclease-independent LINE-1

retrotransposition. Nature Genetics

Fontes de microRNAs Woolfe A et al (2005): Highly conserved non-coding sequences are associated with vertebrate

development .PLoS Biol

Sincitina e a formação do sinciciotrofoblasto da Placenta

Esta poliproteína (env) de origem viral modificada é essencial para formação da placenta em mamíferos eutérios. De fato, retrovírus endógenos (ERV) são ativos em todas as placentas de eutérios.

Eventos de duplicação genômica detectados

Duplicação de genomas: poliploidização

Van de Peer et al. Nature Reviews Genetics (2009)

11/05/2012

10

Duplicação gênica

A maioria das famílias gênicas geradas por duplicação são pequenas, com exceção daquelas que possuem uma base adaptativa, por exemplo, genes de imunoglobulinas (1000 cópias em humanos), receptores olfatórios (centenas de cópias em mamíferos)

• A maior parte do genoma aparece em pares (não como triplicatas etc) • Além disto, há evidências de que mais de 60–70% das angiospermas possuem um

ancestral poliplóide em algum momento, resultado de duplicação genômica.

Arabidopsis Genome Initiative. Nature 408, 796–815 (2000)

Duplicação de segmentos genômicos em Arabidopsis thaliana

Homólogos: ortólogos e parálogos

Ortólogos: genes em organismos diferentes que divergiram a partir do gene no ancestral comum por causa da especiação a1 – a2 ou b1 – b2 Parálogos: genes que derivados de um gene ancestral via duplicação gênica a1 – b1 ou a1 – b2, etc…

Homólogos: genes que têm um mesmo ancestral...

Recombinação gerando duplicação gênica

Elementos repetidos intercalados funcionam como regiões portáteis de homologia que promovem o crossing-over desigual

(SINEs, LINEs, transposons etc)

59

Retroposons (e transposons) geram diversidade Recombinação promove embaralhamento de éxons

Elementos repetidos intercalados nos íntrons funcionam como regiões portáteis de homologia que promovem o crossing-over desigual que gera duplicação ou novas combinações de éxons.

11/05/2012

11

Diversidade gênica e retrotransposons

Embaralhamento de éxons via mobilização de SINEs

éxon 1 SINE

íntron

éxon 2

Transcrito SINE + éxon SINE éxon 2

A transcrição do SINE (ou LINE) pode se estender além do sinal de parada normal, incluindo um éxon. A inserção do elemento SINE por retrotransposição pode levar o éxon para dentro de outro gene e permitir um novo embaralhamento e produzir um “novo gene”.

éxon 4 SINE éxon 2 éxon 5 éxon 6

Elemento inserido

inserção por retrotransposição

Quimerismo gênico

Genes quiméricos se originam via embaralhamento de éxons e/ou retrotransposição

Na retrotransposição, mRNA é transcrito a cDNA que é então inserido no gene (sem íntrons).

Ambos genes Jingwei e Ymp são expressos em testículos de Drosophila.

No entanto, Retrotransposição frequentemente resulta em pseudogenes que não são funcionais.

Embaralhamento de éxons e novidades evolutivas

Várias novidades evolutivas aparecem no nível genômico por eventos de embaralhamento de éxons e duplicação gênica. Alguns genes apresentam funções novas oriundas da combinação de diferentes éxons.

Família das globulinas Produtos gênicos resultados de duplicação e embaralhamento de éxons

AFGP parece ser derivada (via multiplicação de motivos e perda de éxons) a partir do gene Tripsinogênio. Foi encontrada uma versão quimérica em alguns peixes, uma forma transicional.

Notothenioides

Proteína anticongelante (AFGP) Transposons promovem diversidade genômica

Vários genomas apresentam uma grande diversidade estrutural e flexibilidade recombinacional devido à presença de elementos repetitivos do tipo transposons (via DNA e RNA). Estas características são também úteis no melhoramento genético convencional e na transgenia em cereais, com genomas ricos em transposons.

11/05/2012

12

Genômica comparativa e biotecnologia

Um nova área biotecnológica está emergindo da genômica comparativa:

A genômica sintética 1. conhecer as funções mínimas e essenciais que podem ter um genoma

depende de compreender as relações de ancestralidade entre espécies ou linhagens.

2. genomas artificiais com requisitos funcionais mínimos foram inferidos das comparações filogenéticas.

3. genes também foram comparados filogeneticamente para, em alguns casos, reconhecer funções compartilhadas com ancestrais e também sintetizar genes com funções simplificadas ou consensuais.

4. nestas abordagens, os genomas são vistos como os programas (software) que permitem controlar todas funções.

5. desta forma, funções extras podem ser acopladas ao genoma mínimo artificial.

Genomas Sintéticos

• Mycoplasma laboratorium Organismo parcialmente sintético e derivado da espécie Mycoplasma genitalium – Gibson D, et al. (2008): Complete Chemical Synthesis, Assembly, and Cloning

of a Mycoplasma genitalium Genome. Science.

• Synthia Organismo bacteriano totalmente sintético derivado do genoma de Mycoplasma mycoides que foi transplantado em uma célula de Mycoplasma capricolum – Gibson D, et al. (2010): Creation of a bacterial cell controlled by a chemically

synthesized genome. Science.

Informação no DNA funciona com um software para geração de organismos sintéticos

O genoma humano apresenta uma estrutura típica de vertebrados, sem apresentar qualquer gene exclusivo de nossa linhagem que possa ser considerado como uma novidade evolutiva. Em 2001, 1% dos genes não eram conhecidos em qualquer outro organismo, mas posteriormente foram todos encontrados no chimpanzé e em outros organismos cujos genomas já foram sequenciados.

Dados do Projeto Genoma Humano em 2001

Homologia dos genes humanos Genômica comparada em Primatas

Os genomas de vários primatas estão fase adiantada de andamento e alguns já concluídos

11/05/2012

13

Eventos de duplicação, inversão e translocação de segmentos cromossômicos, incluindo fusões e fissões de cromossomos inteiros, são promovidos por elementos repetitivos tais como transposons e retroposons. A evolução cromossômica está intimamente relacionada a vários eventos de especiação nos primatas e em vários outros grupos taxonômicos.

Genômica comparada e estudos demográficos

Dados genômicos entre espécies são utilizados em cálculos mais precisos dos tamanhos populacionais efetivos das espécies

Genomas extintos

Novas tecnologias estão permitindo recuperar sequências genômicas de organismos extintos

Genomas extintos: Neandertal

A comparação dos genomas utilizando a teoria evolutiva permite a identificação de várias modificações protéicas diferenciais entre as linhagens do homem moderno e do neandertal, as quais podem identificar possíveis adaptações exclusivas de cada espécie.

Genomas extintos: Neandertal

Homens modernos e Neandertais coexistiram na Europa pelo menos 15.000 anos (entre 45 e 30 mil anos atrás), mas não há indícios de fluxo gênico ali. No entanto, algum fluxo gênico (1 a 4%) entre as duas linhagens pode ter ocorrido há ~100.000 anos no Oriente Médio.