86
1

A organização dos genomas, além da sequência de ...biologia.bio.br/curso/2º período Faciplac/Biologia Celular... · Figura: Evolução do cromossomo X humano, segundo Lahn e

Embed Size (px)

Citation preview

1

2

A organização dos genomas, além da sequência de nucleotídeos, possui certas característicasque podem ter sido modificadas durante a evolução dos organismos e que podem servir para ainferência das relações de parentesco evolutivo (filogenia) das espécies que foram consideradasna análise.

3

Os genes e genomas que existem na atualidade resultam de eventos evolutivos ocorridosantigamente e são analisados pela filogenômica. O termo "Filogenômica“ é definido de váriasmaneiras, em geral relacionado com a intersecção dos campos da Genômica e da BiologiaEvolutiva.

4

5

6

7

A inserção do elemento SINE por retrotransposição pode levar o éxon para dentro de outro genee permitir um novo embaralhamento e produzir um “novo gene”

8

9

Figura: Evolução do cromossomo X humano, segundo Lahn e Page (1999). No cromossomo Xatual, apresentado à direita, 19 genes (marcados a-s) distribuem-se em quatro faixas deantiguidade, conforme a quantidade de divergência entre genes equivalentes nos cromossomosX e Y. A recombinação entre os cromossomos sexuais pode ter se extinguido em quatro etapas,por meio de quatro eventos de inversão. Uma inferência feita por meio do relógio molecularresultou nas datas que são apresentadas, para as quatro inversões. As regiões hachuradasmostram onde ocorriam, em cada etapa, as recombinações entre os cromossomos X e Y. Aindaocorrem recombinações entre as extremidades dos dois cromossomos. Nas fêmeas, ocorre livrerecombinação entre os dois cromossomos X. O cromossomo Y não está ilustrado.

10

11

12

13

14

15

Jorge Víctor Crisci é um botânico argentino, editor associado das revistas científicasespecializadas Cladistics, Plant Systematics and Evolution e Taxon. É presidente da "SociedadeArgentina de Botânica".

16

17

18

19

20

21

22

Filogenia: história de parentesco evolutivo

23

24

Um outro tipo de literatura sobre evolução molecular considera o genoma por si só como objetode interesse. Sem referência às características a nível do organismo, podemos perguntar comoas sequências de DNA evoluem e a que taxa.

25

A figura apresenta os percentuais de genes humanos que são compartilhados comoutros táxons. Na árvore, são apresentadas as proporções de genes humanos que seoriginaram em cada ramo e os percentuais totais de similaridade de genes sãoapresentados no topo. Desse modo, 32% dos genes humanos atuais originaram-sedepois que os eucariotos divergiram dos procariotos (mas antes de os animaisdivergirem dos demais eucariotos) e 53% dos genes humanos são compartilhados portodos os eucariotos. O total no topo é aproximadamente igual à soma das porcentagensdos ramos da árvore que levam até ele (por exemplo, os 53% no topo são iguais a 21% +32% na árvore). Muitos genes humanos atuais originaram-se por duplicação de genesancestrais. Assim, dois genes de humanos podem ser iguais a um gene de levedura. Seesse gene está ausente nas bactérias, fica demonstrado que ambos os genes humanos"surgiram" no ramo entre os procariotos e os eucariotos, mesmo que um dosexemplares tenha surgido mais tarde, por duplicação. Genes que não codificamproteínas e DNA não-codificador estão excluídos.

26

27

28

Finalmente podemos perguntar como as variações a nível de DNA acarretam mudanças naspropriedades dos organismos. Em grande parte isso equivale a perguntar como mudanças nasmacromoléculas afetam a sua função, e como tais mudanças funcionais são traduzidas paramudanças evolutivas da fisiologia, desenvolvimento e morfologia.

29

30

31

32

33

A identificação de sinapomorfias sugere a existência de ancestrais comuns exclusivos, oque indica maior relacionamento de parentesco entre os táxons que a compartilham. Ou seja,podemos reconstruir o padrão filogenético de um grupo a partir da identificação de estados decaráter derivados compartilhados (sinapomorfias). Em princípio não se sabe se as apomorfiascompartilhadas surgiram uma única vez (e são sinapomorfias) ou mais de uma vez (e sãohomoplasias).

34

35

Homologia: é o compartilhamento de uma estrutura com origem comum.Como não temos acesso direto à história dos grupos, a proposição de que duas estruturas sãohomólogas baseia-se em evidências indiretas. Há 3 métodos básicos para inferir homologiacomparando indivíduos.1- Considera homólogas estruturas de indivíduos diferentes que, em suas partes componentes eem seu conjunto, são notoriamente semelhantes, ou seja, que têm formas parecidas.2- Considera homólogas estruturas de indivíduos diferentes que têm aproximadamente amesma posição relativa a outras estruturas do corpo.3- Considera homólogas estruturas de indivíduos diferentes que têm a mesma origemontogenética (embrionária), podendo ou não apresentar a mesma função. Ou seja, formam-se apartir de células ou conjuntos celulares que ocupam posição similar em estágios embrionáriosiniciais de uma mesma sequência de modificações, podendo ser iguais ou não. Ao compararmosestruturas homólogas estamos analisando estruturas que tiveram origens na mesma estruturaontogenética, ou seja, são a “mesma” estrutura. A homologia apenas indica que é razoávelproceder a comparação entre determinadas partes que não são iguais em indivíduos distintos.

36

37

38

Ortólogos: genes que divergiram por especiação. Ex.: globinas são conservadas empraticamente todos vertebrados.Parálogos: genes que divergiram por duplicação. Ex.: globinas e em humanos.

39

Genes xenólogos: divergiram por transferência horizontal de genes. São pouco informativos ouaté mesmo desinformativos em análises filogenéticas. Eventos de recombinação na célulareceptora podem ser responsáveis pela aquisição de novas funções (ver aula “Mecanismos deRecombinação Genética”).

40

Figura: Eventos evolutivos que geram cópias de genes, genes parálogos, pseudogenes, genesortólogos e genes xenólogos. (A) Uma simples duplicação de um segmento cromossômico podegerar duas cópias de um mesmo gene; se esse aumento do número de cópias conferir algumavantagem adaptativa, ele poderá ser fixado ao longo da evolução. (B) Após um evento deduplicação, uma das cópias geradas pode manter a função ancestral, ao passo que a outra podedivergir e, eventualmente, assumir outra função relacionada. Os genes gerados por duplicação eposterior divergência são chamados de parálogos; genes duplicados que, ao divergirem, perdemsua funcionalidade, mas não a homologia com seu(s) parálogo(s), são chamados depeseudogenes. (C) Genes com sequências nucleotídicas similares e codificando proteínas comfunções correspondentes em duas espécies diferentes podem ser derivados de um geneoriginalmente presente em um ancestral comum àquelas duas espécies; esses genes,relacionados não por duplicação, mas pela ancestralidade comum, são chamados de ortólogos.(D) Genes adquiridos independentemente por duas espécies por meio de eventos detransferência gênica horizontal envolvendo uma terceira espécie são chamados de xenólogos.Na figura, as barras em vermelho representam sequências ancestrais; as barras em laranjarepresentam sequências que divergiram ao longo da evolução.

41

42

43

45

46

47

48

Tanto o sequenciamento de proteínas como o de nucleotídeos de genes homólogos dediferentes espécies têm indicado que algumas sequências de DNA evoluem em taxasmuito mais elevadas do que outras. As sequências de polipeptídeos não funcionais, ouquase sem função, como o peptídeo C, que é descartado da pré-pro-insulina quandoessa molécula é processada para formar a insulina, evoluem em taxas mais elevadas doque proteínas com restrições funcionais. Modificações sinônimas nos códonsacumulam-se mais rapidamente do que aquelas que causam substituições deaminoácidos.

49

O código genético é mais reduntante na terceira posição e menos redundante na segunda, e ataxa de divergência nessas posições nos códons de sequências traduzidas corresponde a essavariação de redundância. A taxa de divergência de pares de bases é maior em íntrons do que eméxons. Essas observações apoiam o argumento de que a fixação da maioria das substituições denucleotídeos é consequência da deriva genética casual em vez de seleção natural.

50

O código genético é mais reduntante na terceira posição e menos redundante na segunda, e ataxa de divergência nessas posições nos códons de sequências traduzidas corresponde a essavariação de redundância. A taxa de divergência de pares de bases é maior em íntrons do que eméxons. Essas observações apoiam o argumento de que a fixação da maioria das substituições denucleotídeos é consequência da deriva genética casual em vez de seleção natural.

51

As sequências de nucleotídeos distribuídas entre vários genes homólogos parecem tambémdivergir a uma taxa aproximadamente constante em diferentes linhagens. Porém, existemevidências de taxas mais elevadas para organismos com períodos curtos de geração, o quesugere que a taxa de fixação pode ser aproximadamente constante com relação aos números degerações em vez de tempo absoluto.

52

53

54

55

56

57

58

59

Estados de um caráter são valores específicos que um caráter pode assumir num determinado táxon ou em umasequência. Normalmente são representados por 0 e 1, no caso dos caracteres dicotômicos e 0,1,2,... para as séries detransformações.Na análise fenética, se um estado de caráter evolui independentemente em duas linhagens diferentes, ele pareceráindicar ancestralidade comum, quando, de fato, as espécies não são derivadas de um ancestral comum imediato.Métodos baseados em distância:UPGMA (Unweighted Pair Group Method with Arithmetic Mean) ou agrupamento de pares não-ponderados baseadona média aritmética. Utiliza comparações par a par entre distâncias (numero de mutações) das diferentes seqüênciasestudadas para construir uma arvore que reproduza esta distancia de modo mais próximo possível.Evolução Mímima (ME, Minimum Evolution): Estima-se para cada possível árvore alternativa o comprimento de cadabraço a partir das distâncias evolutivas e computa-se a somatória de todos os comprimentos de braços. Árvoreescolhida é a que apresenta o menor valor da somatória dos comprimentos dos braçosAgrupamento de Vizinhos (NJ, Neighbor-joining): Baseado no princípio da evolução mínima (ME). Não examina todasas topologias possíveis, mas procura encontrar sequencialmente vizinhos que minimizem o comprimento total daárvoreMétodos baseados em caracteres:Máxima Parcimônia (MP, Máximum Parsimony): Baseia-se no princípio da homologia. Assume que o critério deparcimônia leva ao maior número total de acertos da árvore verdadeira, quando minimiza o número de passosevolutivos aceitos na árvore. A árvore escolhida é aquela que requer o menor número de mudanças evolutivas aolongo de todas as suas ramificações (busca a arvore que envolva o menor numero de eventos de mutação). Isto éequivalente a minimizar o número de eventos convergentes e reversões. Pode resultar em mais de uma árvoreparcimoniosa: uma árvore de consenso deve ser criada.Método de máxima verossimilhança (ML, Maximum Likelihood): método semelhante a máxima parcimônia, masutiliza modelos evolutivos que computam diferentes chances de mutação, dependendo da base que sofreu mutação.Desenvolvido para a construção de árvores filogenéticas a partir de dados de sequências nucleotídicas. A partir de umconjunto de dados e dado um modelo evolutivo, estima valores para os diferentes parâmetros do modelo, demaneira a maximizar a probabilidade dos dados observados. Avalia a hipótese sobre a história evolutiva em termosda probabilidade de que o modelo proposto e a história hipotética dariam origem ao conjunto de dados observados.O método procura pela árvore com maior probabilidade ou maior verossimilhança.Inferência Bayesiana (BI, Bayesian Inference): semelhante ao método da ML, mas difere no uso de probabilidade.Baseado nas probabilidades a posteriori das árvores filogenéticas (após observações de novos dados ou resultados)Observação importante:Os pressupostos subjacentes a cada um desses dois grupos de algoritmos (Métodos baseados em distância e Métodosbaseados em caracteres) são muito diferentes e, portanto, é necessários ter claro quais são as implicações antes deescolher que algoritmo usar, uma vez que as consequências, em termos de topologias geradas, de modo geral sãomuito relevantes, em termos de compreensão da evolução dos grupos e de suas características.

60

61

62

63

64

65

Outgroup: usa táxons de referência (o “outgroup” ou grupo externo) que sabidamente se situamfora do grupo de interesse (o “ingroup” ou grupo interno); ou seja, que são próximos aos gruposestudados mas ainda assim claramente distinto deles.

Há a necessidade de delimitar um suposto grupo monofilético maior, dentro do qual se pretendeestudar as relações de parentesco.

66

Figura: Mariposas para enraizar uma árvore de borboletas.

67

68

Ponto médio ou distância: na ausência de um grupo externo, o enraizamento pode serposicionado no meio do caminho mais longo entre dois táxons, assumindo-se a mesma taxaevolucionária em todos os ramos (enraiza a árvore no ponto médio entre os dois táxons maisdistantes na árvore, tal como determinado pelo tamanho dos ramos).

OTUs: operational taxonomic units, objetos de comparações.Nós internos: unidades ancestrais, hipoteticamente.Raiz: ancestral comum de todas OTUs do estudo. O caminho entre a raiz e os nós definem ocaminho evolutivo da OTU.Não-enraizada: relações entre OTUs sem representar o caminho evolutivo.Obs: pode ser enraizada na presença de um outgroup (grupo externo o qual acredita-se quetenha sido ramificado anteriormente).Topologia: padrão de enraizamento da árvore.Comprimento do ramo: quantidade de diferenças que ocorrem ao longo do ramo.

69

70

71

72

Apesar das características morfométricas (marcadores morfológicos)apresentarem resultados que possibilitam a análise da diversidade e a vantagemde indicar o valor adaptativo dos genótipos em um determinado ambiente,são em geral altamente influenciadas por fatores ambientais, além desuscetíveis à pleiotropia e controle por vários genes simultaneamente. Emplantas, outro fator limitante desses marcadores é que somente podem seravaliadas após vários anos de seu desenvolvimento em campo.

73

74

Todas as características biológicas podem ser representadas por pares de condições homólogas,em que a mais antiga foi a base a partir da qual a mais recente surgiu. Cada par de espéciesirmãs atuais tem uma espécie ancestral comum exclusiva delas. Essas espécies formam umpequeno grupo monofilético, que podem formar um grupo monofilético maior com a terceiraespécie, tendo, juntas, uma espécie ancestral das três. E assim por diante.Na "árvore filogenética" apresentada temos uma linha de tempo em amarelo, e as espéciesancestrais representadas em azul. No tempo T1 a espécie ancestral x sofreu especiação, dandoorigem às espécies A e y, e se extinguindo ao mesmo tempo. No tempo T2, a espécie y originouas espécies B e z, e da mesma forma, desapareceu neste momento. Finalmente, no tempo T3, aespécie z originou as espécies C e D e desapareceu. Assim, z é a espécie "mãe" de C e D, que sãoconsideradas espécies-irmãs... também, y é a espécie "mãe" de B e z, e assim por diante... se diz,então, que o grupo-irmão de B é o grupo CD (e não z, pois é uma espécie extinta edesconhecida).

75

Em 1969, o zoólogo Robert Whittaker classificou os organismos baseado, principalmente, na suamorfologia (isto é, seu aspecto externo) e dividiu-os em 5 Reinos: Monera, Protista, Fungi,Plantae e Animalia.O reino chromista foi proposto a princípio por Lin & Margulis, em 1971, para representar osseres “coloridos”, mesmo que alguns integrantes não apresentem cor. Este reino engloba todosos seres vivos que possuem plastídeos no lumem do retículo endoplasmático e com clorofila a ec. Os principais filos incorporados a este reino são os Cryptophyta (parasitas), Haptophyta(Cocolitoforídeos), Hyphochytriomycota (pseudofungi), Ochrophyta (pseudofungi),Chrysophycea (algas douradas), Phaeophycea (algas Pardas), Xanthophycea (algas amarelas-esverdeadas) e Oomycota (fungos). Assim, em 1998, Thomas Cavalier-Smith, biólogo inglês eprofessor da Universidade de Oxford, propôs uma mudança na classificação de Whittaker,inserindo o Reino Chromista, de modo que a nova classificação dos seres vivos seria: ReinoBacteria, Reino Protozoa, Reino Chromista, Reino Fungi, Reino Plantae e Reino Animalia.Tendo como base a análise filogenética de sequências de DNA altamente conservadas, osorganismos vivos foram divididos em três domínios principais: Bactéria, Archaea e Eucarya(Woese et al.,1990). Segundo essa proposta, os procariontes são muito diferentes entre si eformam dois domínios distintos. Por outro lado, todos os eucariontes são muito semelhantesentre si e formam um domínio único. Além disso, os Archaea estão mais intimamenterelacionados aos eucariontes do que às bactérias e provavelmente deram origem aoseucariontes. Estes estão representados pelos reinos dos fungos, plantas, animais e vários outrosreinos independentes, que são tratados no sistema de Whittaker no Reino Protista, e no deMargulis e Schwartz no Reino Protoctista. Assim, na proposta de Woese e em outras maisrecentes, os Reinos Monera e Protista não existem, pois não são monofiléticos. Já os ReinosFungi, Plantae e Animalia são monofiléticos. Nesses casos, empregam-se os termos monera eprotista como coletivos, sem valor taxonômico. A definição do Reino Fungi também difere entreos cientistas: alguns consideram nesse reino formas que possuem flagelos em seus ciclos de vida(chamados fungos flagelados), enquanto outros consideram esses organismos num reinodistinto, ou no Reino Protista.

76

77

79

80

81

83

84

85

86