140
UNIVERSIDADE FEDERAL DE MINAS GERAIS INSTITUTO DE CIÊNCIAS BIOLÓGICAS DEPARTAMENTO DE BIOLOGIA GERAL PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA TESE DE DOUTORADO Estudos filogeográficos com uso de marcadores moleculares localizados em uma região de baixa taxa de recombinação do cromossomo X humano ALUNO (A): Simone Silva dos Santos Lopes ORIENTADOR: Prof. Dr. Sérgio Danilo Junho Pena BELO HORIZONTE Dezembro - 2007

TESE DE DOUTORADO - ICB

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: TESE DE DOUTORADO - ICB

UNIVERSIDADE FEDERAL DE MINAS GERAIS

INSTITUTO DE CIÊNCIAS BIOLÓGICAS

DEPARTAMENTO DE BIOLOGIA GERAL

PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA

TESE DE DOUTORADO

Estudos filogeográficos com uso de marcadores

moleculares localizados em uma região de baixa taxa

de recombinação do cromossomo X humano

ALUNO (A): Simone Silva dos Santos Lopes

ORIENTADOR: Prof. Dr. Sérgio Danilo Junho Pena

BELO HORIZONTE

Dezembro - 2007

Page 2: TESE DE DOUTORADO - ICB

II

SIMONE SILVA DOS SANTOS LOPES

Estudos filogeográficos com o uso de marcadores

moleculares localizados em uma região de baixa

taxa de recombinação do cromossomo X humano

Tese apresentada à Pós-Graduação em

Genética do Departamento de Biologia Geral

do Instituto de Ciências Biológicas da

Universidade Federal de Minas Gerais, como

requisito parcial para a obtenção do título de

Doutor em Genética.

Orientador: Prof. Dr. Sérgio Danilo J. Pena

Universidade Federal de Minas Gerais

Instituto de Ciências Biológicas

Departamento de Biologia Geral

Belo Horizonte – MG – Brasil

2007

Page 3: TESE DE DOUTORADO - ICB

III

DEDICATÓRIA

Dedico este trabalho a toda a minha família como forma de recompensa pelos

seis anos de ausência, de modo especial a minha mãe, Marquina, patrocinadora dos

meus sonhos, que mesmo a distância, tem participado e compartilhado dos meus

melhores e piores momentos, meu referencial de trabalho, determinação e alegria,

ensinando-me a ter esperanças e acreditar que a vida sempre pode ser melhor...

Page 4: TESE DE DOUTORADO - ICB

IV

AGRADECIMENTOS

Agradeço a todas as pessoas que, de maneira direta ou indireta, me auxiliaram no

desenvolvimento deste projeto.

Aos meus orientadores

Primeiramente, quero agradecer a quem me orientou durante o desenvolvimento desta

tese, Prof. Dr. Sérgio Danilo Junho Pena, por quem tenho uma imensa admiração

profissional e profundo respeito. Com carinho, agradeço-lhe a oportunidade de, ao

realizar este trabalho, conviver com uma pessoa extremamente brilhante.

Agradeço ao Prof. Fabrício Santos, “meu eterno chefito”, que abriu as portas das

“minas gerais” quando aceitou me orientar durante o Mestrado. E também a sua

esposa Adriana, por quem tenho um carinho especial.

Aos colaboradores deste projeto

Aos colaboradores que forneceram as amostras de DNA utilizadas nesta tese, Dr.

Sérgio Bydlowski e Prof. Eduardo Tarazona-Santos.

Ao Prof. Ian J. Wilson, da Universidade de Newcastle no Reino Unido, pelas análises

com o programa BATWING.

Ao Dr. Rinaldo W. Pereira, pelas informações sobre os marcadores analisados.

E, em especial, às pessoas que doaram as amostras e permitiram a sua utilização em

trabalhos científicos.

Page 5: TESE DE DOUTORADO - ICB

V

Aos Amigos da Pós-Graduação em Genética

Agradeço a todos os professores e funcionários da Pós-Graduação em Genética, em

especial à Profa. Mônica Bucciarelli, a Momo, pela amizade e carinho dedicados a

mim. Agradeço, também às Professoras, Cleusa, Mariza e Bernadete.

Agradeço aos meus colegas de curso pelos momentos agradáveis compartilhados

durante a obtenção dos créditos, tanto no Mestrado quanto no Doutorado. Em

especial, a Luciana Lara, Fred, Juliana, Dulce, Dani Pontes, Sávio Torres, Rodrigo

Redondo e Renata Acácio.

Aos amigos do Laboratório de Biodiversidade e Evolução Molecular (LBEM)

A todos os alunos do LBEM, e em especial, Rodrigo Redondo e Daniela Lacerda, que

mantêm a ordem do laboratório, agradeço a amizade e atenção.

Aos amigos do Laboratório de Genética Bioquímica (LGB)

A todos os alunos do LGB (atuais e antigos): Alessandra Campos, Alessandra Clarizia,

Alice, Bruno, Carlos Eduardo, Carlos Gustavo, Claudiney, Carol Furtado, Daiane,

Danielle, Débora Aline, Debrinha, Érika, Flávia Parra, Chico Lobo, Guilherme, Helder,

Heron, Jane, Jorge Freitas, João Pedro, Luiz Augusto, Magui, Marina, Marcela,

Michael, Matheus, Michelle, Pedro, Priscila, Simone Pires e Thaís, pelos momentos de

descontração e alegria.

E, especialmente, aos alunos que me auxiliaram no começo do meu Doutorado:

Claudinha, Charles e Luciana Werneck que me ensinaram muito, principalmente,

pelas conversas sadias e descontraídas.

Aos alunos do Grupo de Humanos, Claudinha, Raquel, Luciana Bastos, Alessandra

Clarizia, Rodrigo Richard, Vanessa, Ferdi, Clarice e Higgor, com quem compartilhei

Page 6: TESE DE DOUTORADO - ICB

VI

momentos importantes para o desenvolvimento desta tese. Em especial, a Claudinha,

pelos conselhos e orientações, durante o inicio de elaboração desta tese.

Aos professores Carlos Renato, Andréa Macedo e Gloria Franco, pelas importantes

sugestões e comentários nas reuniões de segunda-feira.

Às técnicas do LGB, Neuzinha e Katita, pelo carinho, amizade e ajuda incondicional

durante todo o meu Doutorado.

Aos Amigos

Aos amigos que conheci assim que cheguei a Belo Horizonte: Ricardo Camelo, Beth,

Luciana Werneck, Renata, Gisele, Ferdi, Miguel, que me auxiliaram durante meu

processo de adaptação e que são a minha família mineira.

Aos meus amigos festeiros: Carol, Sávio (Pablito), Ferdi, Chico Tosco, Adriano, Anna

Luiza e o “super” Miguelito, com quem, durante alguns anos, me diverti bastante. Em

especial ao Miguelito, pela ajuda sempre incondicional e ao Sávio, por ser um amigão.

Aos meus amigos da UDV, pela amizade sincera e verdadeira, em especial Carol, Gui,

Paola e Everton, pelo companheirismo. E ao Guilherme e Charles, pelo auxílio durante

as correções desta tese.

Aos meus amigos de Maceió, Juli, Jeane, Rala e Natan, pela capacidade de me

alegrar em todos os momentos que passamos juntos.

Page 7: TESE DE DOUTORADO - ICB

VII

À Família

Em especial a minha família, pessoas fortes, batalhadoras e simples, mas dignas de

respeito, por quem tenho uma grande admiração e carinho.

Agradeço aos meus pais, Marquina, Paulino (Pai) e Domingos (Padrasto), pelo imenso

amor, respeito e confiança dedicados a mim.

Aos meus irmãos, em especial ao Sérgio e Kaline, pelo carinho e amizade. Aos meus

cunhados Marnise, Marcos e Paulinha.

Ao meu tio Paulino e a Geovanna, por representarem toda a minha família em Belo

Horizonte e por acreditarem em mim incondicionalmente.

Aos também familiares Sérgio Kehdy, Regina, Rafael, Ferdi e Léo, pessoas tão

especiais, que me faltam palavras para agradecer tanto carinho e amizade.

Agradeço finalmente, ao meu marido, William, pelo amor, confiança e respeito que

temos um pelo outro e pela relação harmoniosa que estamos construindo juntos.

Principalmente, agradeço pela compreensão e paciência nos momentos de

elaboração e conclusão desta tese, e por ser tão especial e verdadeiro.

Page 8: TESE DE DOUTORADO - ICB

VIII

ÍNDICE

DEDICATÓRIA ............................................................................................................... III

AGRADECIMENTOS........................................................................................................ IV

LISTA DE FIGURAS ..........................................................................................................X

LISTA DE TABELAS......................................................................................................... XI

LISTA DE ABREVIATURAS............................................................................................... XII

PREFÁCIO .................................................................................................................. XIII

RESUMO ................................................................................................................... 14

ABSTRACT ............................................................................................................... 15

1 INTRODUÇÃO........................................................................................................ 16

1.1 ESTUDOS EM EVOLUÇÃO HUMANA .......................................................................... 17

1.2 O POVOAMENTO DAS AMÉRICAS ............................................................................ 18

1.3 A FORMAÇÃO DO POVO BRASILEIRO ....................................................................... 19

1.4 MARCADORES MOLECULARES ................................................................................ 20

1.5 POLIMORFISMOS DE SEQÜÊNCIA............................................................................. 21

1.6 POLIMORFISMOS DE TAMANHO ............................................................................... 23

1.7 MARCADORES DE LINHAGEM .................................................................................. 24

1.8 BLOCOS HAPLOTÍPICOS ......................................................................................... 25

1.9 ANÁLISE DE DESEQUILÍBRIO DE LIGAÇÃO ................................................................. 26

1.10 O CROMOSSOMO X HUMANO ................................................................................ 26

2 OBJETIVOS ........................................................................................................... 30

2.1 OBJETIVO GERAL................................................................................................... 31

2.2 OBJETIVOS ESPECÍFICOS ....................................................................................... 31

3 MATERIAL E MÉTODOS ....................................................................................... 32

3.1 POPULAÇÕES E AMOSTRAGENS.............................................................................. 33

3.2 EXTRAÇÃO DE DNA............................................................................................... 35

3.3 NOMENCLATURA DA INSERÇÃO ALU ........................................................................ 35

3.4 TIPAGEM DA INSERÇÃO ALU (DXS225) ................................................................... 35

Page 9: TESE DE DOUTORADO - ICB

IX

3.5 SELEÇÃO DE NOVOS MARCADORES ........................................................................ 36

3.6 LOCALIZAÇÃO FÍSICA DOS MARCADORES................................................................. 37

3.7 TIPAGEM DOS MICROSSATÉLITES............................................................................ 37

3.8 ANÁLISE ESTATÍSTICA ............................................................................................ 40

4 RESULTADOS ....................................................................................................... 43

4.1 CAPÍTULO 1 - PADRONIZAÇÃO DOS MARCADORES MOLECULARES FORMADORES DO

BLOCO HAPLOTÍPICO .................................................................................................... 44

4.1.1 INTRODUÇÃO...................................................................................................... 44

4.1.2 RESULTADOS ..................................................................................................... 45

4.1.3 DISCUSSÃO........................................................................................................ 67

4.2 CAPÍTULO 2 - FILOGEOGRAFIA DE POPULAÇÕES MUNDIAIS POR MEIO DA ANÁLISE DE UM

BLOCO HAPLOTÍPICO DO CROMOSSOMO X ..................................................................... 71

4.2.1 INTRODUÇÃO...................................................................................................... 71

4.2.2 RESULTADOS ..................................................................................................... 72

4.2.3 DISCUSSÃO........................................................................................................ 92

4.3 CAPÍTULO 3 - ANÁLISE DA DIVERSIDADE E ANCESTRALIDADE GENÉTICAS DA POPULAÇÃO

BRASILEIRA (BRANCOS E PRETOS) DA CIDADE DE SÃO PAULO ........................................ 98

4.3.1 INTRODUÇÃO...................................................................................................... 98

4.3.2 RESULTADOS ................................................................................................... 100

4.3.3 DISCUSSÃO...................................................................................................... 114

5 CONCLUSÃO GERAL.......................................................................................... 118

6 CONSIDERAÇÕES FINAIS.................................................................................. 122

7 REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 126

8 ANEXOS............................................................................................................... 137

Page 10: TESE DE DOUTORADO - ICB

X

LISTA DE FIGURAS

Figura 1. Rotas de migrações do Homo sapiens moderno por meio do DNA mitocondrial....... 18

Figura 2. Mapa das populações analisadas do Painel do HGDP-CEPH. .................................. 34

Figure 3. Ideograma com a localização física dos marcadores analisados. .............................. 48

Figure 4. Resultado do programa Ensembl. ............................................................................... 50

Figura 5. Alinhamento das seqüências do DXS1012 . ............................................................... 52

Figura 6. Gráfico da tipagem dos sete microssatélites............................................................... 52

Figura 7. Resultado da amplificação do DXS225....................................................................... 55

Figura 8. Freqüências da presença da inserção DXS225 nas populações mundiais................ 55

Figura 9. Histograma com valores de D’ encontrados. .............................................................. 62

Figura 10. Curvas das taxas de recombinação. ......................................................................... 63

Figura 11. Mapa de desequilíbrio de ligação para a África. ....................................................... 64

Figura 12. Mapa de desequilíbrio de ligação para a Europa...................................................... 64

Figura 13. Mapa de desequilíbrio de ligação para a China. ....................................................... 65

Figura 14. Mapa de desequilíbrio de ligação para o Japão. ...................................................... 65

Figura 15. Compartilhamento de haplótipos entre as regiões do Painel do HGDP-CEPH........ 74

Figura 16. Rede haplotípica com as cinco regiões do Painel do HGDP-CEPH......................... 77

Figura 17. Rede haplotípica com DXS2250 nas regiões do Painel do HGDP-CEPH. ............... 79

Figura 18. Rede haplotípica com DXS2251 nas regiões do Painel do HGDP-CEPH. ............... 81

Figura 19. Redes haplotípicas com DXS2251 em cada região mundial..................................... 82

Figura 20. Gráfico de PCA com as sete regiões do Painel do HGDP-CEPH.. .......................... 84

Figura 21. Gráfico de PCA com as cinco regiões do Painel do HGDP-CEPH. ......................... 85

Figura 22. Histogramas com as taxas de mutação dos microssatélites. ................................... 88

Figura 23. Distribuição a priori e a posteriori dos parâmetros populacionais............................. 91

Figura 24. Gráfico de PCA dos brasileiros, populações da África e Eurásia do Painel do HGDP-

CEPH.. ...................................................................................................................................... 107

Figura 25. Gráfico de PCA com Pretos brasileiros e as populações da África. ....................... 107

Figura 26. Dendograma da partição do BAPS para os brasileiros........................................... 110

Figura 27. Dendograma do BAPS com os Pretos brasileiros e populações da África ............ 111

Figura 28. Rede haplotípica com os brasileiros ....................................................................... 113

Page 11: TESE DE DOUTORADO - ICB

XI

LISTA DE TABELAS

Tabela 1. Seqüência dos iniciadores dos microssatélites analisados........................................ 39

Tabela 2. Microssatélites encontrados na região Xq21.1-Xq21.3.............................................. 46

Tabela 3. Posição dos marcadores em pares de bases (pb). .................................................... 48

Tabela 4. Freqüências da inserção DXS225 nas populações do Painel HGDP-CEPH............. 56

Tabela 5. AMOVA do marcador DXS225 das populações do Painel HGDP-CEPH.................. 57

Tabela 6. Valores de significância e D’de desequilíbrio de ligação ........................................... 61

Tabela 7. Índices de diversidade de Nei dos marcadores analisados ....................................... 66

Tabela 8. Diversidade haplotípica das cinco principais regiões do CEPH................................. 73

Tabela 9. AMOVA do bloco haplotípico nas populações do Painel HGDP-CEPH. ................... 75

Tabela 10. Distribuição a priori dos parâmetros populacionais.................................................. 90

Tabela 11. Distribuição a posteriori dos parâmetros populacionais........................................... 90

Tabela 12. Diversidade haplotípica dos brasileiros. ................................................................. 101

Tabela 13. AMOVA bloco haplotípico completo para brasileiros, populações da África e

Eurásia...................................................................................................................................... 103

Tabela 14. AMOVA para o bloco haplotípico reduzido para os brasileiros, populações da África

e Eurásia. .................................................................................................................................. 103

Tabela 15. Porcentagem da contribuição genética dos africanos e euroasiáticos para os

Brancos e Pretos de São Paulo com diferentes marcadores genéticos. ................................. 105

Page 12: TESE DE DOUTORADO - ICB

XII

LISTA DE ABREVIATURAS

AIM- Ancestry Informative Marker - Marcador Informativo de Ancestralidade

AMOVA- Analysis of Molecular Variance - Análise de Variância Molecular

CEPH- Centre d’Etude du Polymorphisme Humain - Centro do Polimorfismo Humano

mtDNA- Mitochondrial DNA - DNA mitocondrial

GDB- The human Genome DataBase - Banco de Dados do Genoma Humano

HapMap- Haplotype Map of the Human Genome - Mapa de Haplótipos do Genoma

Humano

HGDP- The Human Genome Diversity Project - Projeto de Diversidade do Genoma

Humano

IBGE- Instituto Brasileiro de Geografia e Estatística

INDELs- Polymorphisms of Insertions/Deletions - Polimórfismos de Inserções e

Deleções

LINEs- Long Interspersed Nuclear Elements - Elementos Intercalares Nucleares

Longos

MCMC- Markov Chain Monte Carlo - Monte Carlo Cadeia de Markov

NCBI- The National Center for Biotechnology Information - Centro Nacional de

Informação Biotecnológica

SNP- Single Nucleotide Polymorphism - Polimorfismo de Nucleotídeo Único

SINEs- Short Interspersed Nuclear Elements - Elementos Intercalares Nucleares

Curtos

UCSC- University of California Santa Cruz - Universidade Santa Cruz da Califórnia

UEP- Unique Event Polymorphism - Polimorfismo de Evento Único

YAP- Y Chromosome Alu Polymorphic Element - Elemento Alu Polimórfico do

Cromossomo Y

XAP- X Chromosome Alu Polymorphic Element - Elemento Alu Polimórfico do

Cromossomo X.

Page 13: TESE DE DOUTORADO - ICB

XIII

PREFÁCIO

O formato desta tese compreende uma Introdução geral, seguida dos

Objetivos, Metodologia utilizada, Resultados, Conclusão, Referências Bibliográficas e

Anexos. Os resultados apresentados vêm em forma de capítulos, com uma breve

introdução do capítulo, resultados obtidos e discussão.

O primeiro capítulo refere-se à padronização do bloco haplotípico estudado; o

segundo capítulo descreve a análise filogeográfica das populações mundiais do Painel

HGDP-CEPH com o bloco haplotípico do cromossomo X, e o terceiro capítulo, a

análise da diversidade e ancestralidade genéticas dos brasileiros a partir de

evidências do cromossomo X.

Em seguida aos resultados, são apresentadas as conclusões gerais obtidas

durante a elaboração desta tese e as considerações finais.

Nos anexos, estão os artigos publicados com os dados dos Capítulos 1 e 2

(Anexos 1 e 2) e em preparação (Anexo 3) com os dados obtidos no Capítulo 3.

Page 14: TESE DE DOUTORADO - ICB

RESUMO

A variabilidade genética das populações humanas tem sido analisada por diferentes

tipos de marcadores moleculares. Nesta tese, o principal objetivo foi utilizar

marcadores moleculares em uma região com baixa taxa de recombinação do

cromossomo X (Xq21.1-Xq21.3) como ferramenta para estudos evolutivos e

populacionais. Utilizamos um bloco haplotípico formado por quatro microssatélites

(DXS1012, DXS1002, DXS1019 e DXS8114) e uma inserção Alu (DXS225), em

completo desequilíbrio de ligação, para investigar a diversidade genética das

populações humanas. No primeiro grupo estudado (HGDP-CEPH), formado por 667

homens distribuídos em 51 populações mundiais, encontramos um total de 187

haplótipos distribuídos nas cinco principais regiões mundiais (África, Leste Asiático,

Eurásia, Oceania e América); desses, 129 são haplótipos região-especifico.

Observamos uma grande redução da diversidade haplotípica logo após a saída da

África (0,992±0,003) para o Leste Asiático (0,967±0,005) e Eurásia (0,953±0,006), e

que alcança os menores valores na Oceania (0,885±0,047) e na América

(0,839±0,038). Análises de coalescência permitiram estimar o tempo do ancestral

comum mais recente (TMRCA) para o bloco haplotípico de 182.000 anos (56.700-

479.000) e o tempo da inserção Alu DXS225 em 94.400 anos (24.300-310.000), fato

que corrobora com a origem africana e recente para o homem moderno (Ex Africa). Na

análise do segundo grupo, 204 indivíduos classificados como Brancos e Pretos, da

cidade de São Paulo, avaliamos a contribuição ancestral da África e da Eurásia para o

povo brasileiro. Encontramos 29% de contribuição africana nos Brancos e 55% nos

Pretos, enquanto que a contribuição euroasiática foi de 71% nos Brancos e 45% nos

Pretos brasileiros. Com os resultados alcançados, concluímos que o bloco haplotípico

utilizado demonstrou ser uma ferramenta eficaz, capaz de fornecer informações

coerentes capaz de corroborar com dados históricos e moleculares, ampliando o

conhecimento sobre os aspectos evolutivos das populações humanas.

Page 15: TESE DE DOUTORADO - ICB

� �

ABSTRACT

The genetic variability of the human populations has been investigated using different

genetic markers. In this thesis our main aim was to utilize molecular markers in a

region with low recombination rates of the X chromosome (Xq21.1-Xq21.3) as a tool for

evolution and population studies. Used an haplotypic block formed by four

microsatellites (DXS1012, DXS1002, DXS1019 and DXS8114) and an Alu insertion

(DXS225) in complete linkage disequilibrium, to investigate the genetic diversity of the

human populations. The first group studied was composed by 667 men distributed in

51 populations from the HGDP-CEPH panel, where we found a total of 187 haplotypes

distributed in the five main regions: Africa, Asian East, Eurasia, Oceania and America;

129 of these were region-specific haplotypes. Visualized a great reduction in the

haplotypic diversity after the out of Africa (0.992±0.003) for the Asian East

(0.967±0.005) and Eurasia (0.953±0.006) that reaches the smaller values in the

Oceania (0.885±0.047) and America (0.839±0.038). Coalescent analysis permitted the

estimation of the time of the most recent common ancestor (TMRCA) for the haplotypic

block of 182,000 years (56,700-479,000) and the time of the Alu insertion DXS225 of

94,400 years (24,300-310,000) that corroborate with the African and recent origin of

the modern man (Ex Africa). In the second group analyzed: 204 males classified as

White and Black of the Sao Paulo city, evaluated the ancestry contribution from Africa

and Eurasia to the Black and White Brazilians. We found 29% in the White and 55% in

the Black Brazilians of African contribution, whereas the Eurasian contribution was

71% for the White and 45% for the Black Brazilians. With the obtained results we

concluded that the haplotypic block used in this work, demonstrated to be an efficient

tool that provide coherent information that corroborate with historical and molecular

data increase the knowledge about the evolution aspects of human populations.

Page 16: TESE DE DOUTORADO - ICB

16

1 INTRODUÇÃO

Page 17: TESE DE DOUTORADO - ICB

17

1.1 ESTUDOS EM EVOLUÇÃO HUMANA

A origem da espécie humana, Homo sapiens, remonta, aproximadamente,

entre 100 a 200 mil anos e tem estimulado uma série de pesquisas científicas em

distintas áreas que visam compreender os processos que ocorreram antes e após a

origem do homem moderno (Cavalli-Sforza e Feldman, 2003). Atualmente a genética

tem contribuído bastante para o estudo da origem do homem moderno, principalmente

pelo fato de que qualquer indivíduo pode ser um objeto de estudo em potencial,

diferentemente das áreas de arqueologia e antropologia, que dependem de dados

mais escassos, como registros fósseis (Kaessmann e Pääbo, 2002). Além da

genética, outros enfoques são utilizados para estudar eventos evolutivos, tais como: o

estudo de línguas nativas, mitos e lendas, nomes de localidades geográficas e outros

relatos da nossa evolução cultural (Santos e Tarazona-Santos, 2002a).

Atualmente, a teoria mais aceita para origem do homem anatomicamente

moderno (Homo sapiens) é a “Ex Africa” , mais conhecida como “Out of Africa”, que

sugere ter o homem moderno uma origem africana recente, por volta de 100 a 200 mil

anos, e que, durante a expansão geográfica pelos diversos continentes, teria

substituído por completo as populações de humanos arcaicos (derivados dos Homo

erectus que migraram da África há 1,5 milhões de anos), que povoavam anteriormente

a Europa e a Ásia (Carvalli-Sforza e Feldman, 2003).

Estudos moleculares, principalmente com os marcadores de linhagens, que

representam segmentos de DNA passados ao longo das gerações sem a influência da

recombinação, como o DNA mitocondrial (Cann et al., 1987, Templeton, 1997) e o

cromossomo Y (Hammer, 1995), corroboram com a origem africana recente (Ex

Africa) para a origem do homem moderno e são utilizados para traçar as prováveis

rotas de migrações do Homo sapiens moderno (Figura 1).

Page 18: TESE DE DOUTORADO - ICB

18

Figura 1. Rotas de migrações do Homo sapiens moderno pela análise do DNA mitocondrial. As

letras representam os haplogrupos mitocondriais encontrados nas populações mundiais. Figura

retirada do sítio: http://upload.wikimedia.org/wikipedia/en/b/b9/human_mtDNA_migration.png.

Na história da nossa espécie, os últimos 12 mil anos foram cruciais para a

formação das populações nativas, isto é, aquelas que se encontravam nos seus

continentes antes das migrações que ocorreram após o século XV. Essas migrações

iniciaram um processo de miscigenação altamente intensificado (Santos e Bonatto,

2004). Atualmente, muitos trabalhos com diferentes marcadores moleculares têm

como objetivo estudar a origem das distintas populações nativas da África, Ásia,

Europa e América (Cavalli-Sforza e Feldman, 2003). Exemplos de trabalhos que

buscavam analisar a origem de populações nativas e miscigenadas, utilizando

marcadores de linhagens como: “O povoamento das Américas” e a “Formação do

Povo Brasileiro”, são detalhados a seguir.

1.2 O povoamento das Américas

O processo de colonização pré-histórica do continente americano vem sendo

estudado através de achados arqueológicos, pela antropologia física, lingüística, e

genética, que evidenciam que os primeiros habitantes do continente americano vieram

da Ásia passando pela Beríngia, uma ponte de terra formada entre 40.000 e 13.000

Page 19: TESE DE DOUTORADO - ICB

19

anos atrás, quando o nível do mar estava mais baixo, durante épocas glaciais, a qual

ligava o Alasca à Sibéria (Santos e Bonatto, 2004). No entanto, existem incertezas

sobre a origem, dentro da Ásia, das populações que migraram para o continente

americano e também quanto à data da primeira migração e o número de ondas

migratórias (Hey, 2005; Santos e Tarazona-Santos, 2002b).

Estudos mais recentes com nativos americanos buscam responder a questões

em um nível geográfico mais específico, como as populações dos Andes (Tarazona-

Santos et al., 2001; Rodriguez-Delfin et al., 2001) e outras populações da América do

Sul e do Norte (Wang et al., 2007; Corella et al., 2007).

1.3 A formação do povo brasileiro

O Brasil é conhecido como uma nação altamente diversa em etnias, com um

nível acentuado de miscigenação, sendo os brasileiros uma das populações mais

heterogêneas do mundo (Pena et al., 2000). A natureza triíbrida do brasileiro é

resultado de cinco séculos de intensa miscigenação entre europeus (os

colonizadores), africanos (os escravos) e ameríndios (os habitantes nativos do Brasil)

(Ribeiro, 1995). O processo de miscigenação iniciou-se com os primeiros

colonizadores e se intensificou devido à necessidade de povoar a colônia e assim

garantir o domínio português frente às constantes ameaças de invasão do território por

outras nações. Os africanos foram introduzidos no século XVI para servirem de mão-

de-obra escrava no cultivo da cana de açúcar, e mais tarde, na mineração e nas

plantações de café. Durante 1808, houve a abertura dos portos brasileiros para as

nações amigas, por meio de uma carta régia promulgada pelo príncipe regente Dom

João (Salzano e Freire-Maia, 1967), e durante os anos de 1820-1975,

aproximadamente 5.686.133 imigrantes chegaram ao Brasil, entre portugueses

(1.204.394), italianos, seguidos por espanhóis, alemães, sírios, libaneses e japoneses

(IBGE, 2000). No entanto, a entrada desses imigrantes se deu de forma heterogênea,

entre as diferentes regiões do Brasil (Pena, 2002).

Page 20: TESE DE DOUTORADO - ICB

20

Diversas pesquisas têm como objetivo reconstituir e compreender, do ponto de

vista genético, o processo que gerou o povo brasileiro, e qual seria a contribuição real

dos três grupos étnicos em sua composição genética. O trabalho inicial foi chamado

de retrato molecular do Brasil (Pena, 2000), que analisou homens auto-classificados

como Brancos, de quatro regiões do Brasil (Norte, Nordeste, Sudeste e Sul), os

resultados desse trabalho revelaram que a linhagem paterna desses indivíduos

brasileiros é quase exclusivamente européia (Carvalho-Silva et al.,2001), enquanto

que a herança materna estava distribuída entre européia (39%), africana (28%) e

nativa americana (33%) (Alves-Silva et al, 2000). Esses dados genéticos corroboraram

com os dados históricos sobre a colonização do Brasil, em que a linhagem paterna

européia, juntamente com a linhagem materna formada por mulheres ameríndias e

africanas, deu origem aos primeiros brasileiros.

Trabalhos mais recentes realizados com indivíduos de diferentes regiões

brasileiras tiveram como objetivo verificar a existência de correlação entre a cor da

pele e a ancestralidade genômica, utilizando marcadores informativos de

ancestralidade (AIMs) (Parra et al., 2003) e microssatélites autossômicos (Pimenta et

al., 2006). Esses trabalhos concluíram que em nível individual, existe pouca correlação

entre cor e ancestralidade genômica em brasileiros.

Outros estudos com brasileiros buscam inferir a origem africana dos escravos

que vieram para as diferentes regiões do Brasil (Bortolini et al., 2004; Abes-Sandes et

al., 2004; Silva et al., 2006; Hünemeier et al., 2007; Gonçalves et al., 2008).

1.4 Marcadores moleculares

Para estudar todas essas questões sobre a origem e evolução do homem

moderno, a genética molecular utiliza a variabilidade genômica para compreender sua

origem e manutenção, usando-a como ferramenta para inferir cenários evolutivos

passados. Essa variabilidade constitui a heterogeneidade do genoma humano, a qual,

utilizada em estudos genéticos, é denominada, coletivamente, como marcadores

Page 21: TESE DE DOUTORADO - ICB

21

genéticos moleculares (Cavalli-Sforza, 1998). Esses marcadores podem ser

classificados em: polimorfismos de seqüência, tais como, os SNPs (Single Nucleotide

Polymorphisms), ou polimorfismos de ponto (Taillon-Miller et al.,1998, Brookes, 1999),

os polimorfismos de inserções e deleções (INDELs) (Weber et al., 2002), os

polimorfismos de inserção Alu (Roy-Engel et al., 2001) e os polimorfismos de tamanho

ou microssatélites (Dib et al., 1996).

Podemos tratar como marcadores moleculares as variações distribuídas nos

cromossomos autossômicos e as variações presentes no DNA mitocondrial e a parte

não-recombinante do cromossomo Y, que chamamos de marcadores de linhagens,

devido à ausência de recombinação tanto para o DNA mitocondrial, como para a

região do cromossomo Y não-homóloga ao cromossomo X. Nesses sistemas os

marcadores são herdados em bloco, e a relação entre os alelos para os locos

estudados constitui um haplótipo (Santos et al., 1995).

1.5 Polimorfismos de seqüência

1.5.1 SNPs

Uma classe de marcadores moleculares é constituída pelos SNPs (Single

Nucleotide Polimorphisms) ou polimorfismos de ponto que se encontram no genoma

humano, em uma densidade muito alta, 1 a cada 1000 bases (Taillon-Miller et al.

1998). Desde 2001, com a publicação do primeiro rascunho do genoma humano, fez-

se o primeiro grande catálogo de SNPs para o genoma humano, o que propiciou a

criação de diversos bancos de dados para armazenamento de novos SNPs, como o

dbSNP (www.ncbi.nlm.nih.gov/SNP). O grande interesse na variabilidade acumulada

no genoma humano deve-se à importância dos SNPs em estudos sobre a evolução

humana e, principalmente, à sua utilidade como marcadores moleculares em estudos

de associação para identificação de variantes associadas à susceptibilidade a

doenças e drogas (Cavalli-Sforza, 2005; Pena, 2007).

Page 22: TESE DE DOUTORADO - ICB

22

1.5.2 INDELs

Outro tipo de marcadores moleculares que vem ganhando destaque são os

INDELs, ou polimorfismo de inserções e deleções no genoma, no qual representam a

segunda variação mais comum (Bennett et al., 2004). Sua utilização aumentou após a

publicação do trabalho de Weber et at., (2002), que descreveu 2.000 Indels

distribuídos pelo genoma humano, que ocorrem como variantes polimórficas

encontradas na população geral. Atualmente, diversos trabalhos estão sendo

publicados em que se utilizam esses marcadores em estudos evolutivos e

populacionais (Bastos-Rodrigues et al., 2006).

1.5.3 Inserções Alu

As inserções Alu são classes de elementos transponíveis bastante abundantes

no genoma humano (International Human Genome Sequencing Consortium, 2001). A

denominação Alu advém da presença de um sítio de restrição para a enzima AluI

dentro da seqüência consenso (Houck et al., 1979). Estruturalmente a seqüência Alu

apresenta homologia com o 7SLRNA, uma molécula citoplasmática extremamente

conservada entre os eucariotos (Labuda e Zietkiewicz, 1994). A primeira seqüência

Alu apareceu nos genomas de primatas há aproximadamente 65 milhões de anos

(Deininger et al., 1992). As inserções Alu são uma classe de SINEs (Short

Interspersed Nuclear Elements) que constituem uma família de mais de 500.000

seqüências, de aproximadamente 300 pares de bases, as quais têm se inserido no

genoma de primatas por meio da transposição mediada por um intermediário de RNA

transcrito pela RNA polimerase III (Schmid, 1996). No entanto, as inserções Alu não

são capazes de se retrotranspor sozinhas e utilizam a maquinaria de retrotransposição

dos LINEs (Long Interspersed Nuclear Elements) (Callinan et al., 2003). As inserções

Alu possuem algumas características, como a estabilidade da inserção, a ausência de

mecanismos que removam completamente um elemento Alu de seu sítio de inserção,

Page 23: TESE DE DOUTORADO - ICB

23

a existência de seqüências Alu específicas que ainda não se fixaram no genoma, o

conhecimento do seu estado ancestral e a possibilidade de analisá-las facilmente

utilizando a PCR (Batzer e Deininger, 1991). Essas características fazem dessas

seqüências excelentes marcadores genéticos que estão sendo bastante utilizados em

diferentes estudos populacionais (Battilana et al., 2006, Athanasiadis et al., 2007).

Atualmente existem diversos banco de dados específicos para seqüências Alu, um

exemplo AluGene (http://Alugene.tau.ac.it) (Dagan et al., 2003)

1.6 Polimorfismos de tamanho

1.6.1 Microssatélites

Um dos marcadores moleculares amplamente utilizados para o mapeamento

de genes e estudos evolutivos são os microssatélites (Dib et al. 1996). Estes são locos

com repetições em tandem, cuja unidade repetitiva possui de 1 a 6 pares de bases. A

variabilidade inter-alélica dos microssatélites é, geralmente, determinada pela

diferença no número de repetições, e a alta variabilidade dos locos de microssatélites

é produto da alta taxa de mutação desse tipo de loco (10-2 - 10-5 mutações por loco por

geração, Brinkmann, et al.,1998, Leopoldino et al., 2003), em comparação a outras

regiões do genoma (10-7-10-9 mutações por nucleotídeo, por geração, Nei et al., 1987;

Brookes, 1999). O tipo mais comum de mutações, em microssatélites, geralmente leva

a um aumento ou diminuição do número de repetições de uma unidade ou mais, e

acredita-se que esse tipo de mutação ocorre à nível molecular, por meio de uma

“derrapagem” da fita de DNA, causando um erro na leitura da DNA polimerase durante

a replicação (Schlotterer e Tautz 1992, Donnell et al., 1994). Devido ao alto nível de

variabilidade que apresentam, os microssatélites são usados para estudos evolutivos

em diversas espécies, inclusive na humana (Jorde et al., 1997).

Page 24: TESE DE DOUTORADO - ICB

24

1.7 Marcadores de linhagem

1.7.1 DNA mitocondrial

O DNA mitocondrial (mtDNA) é o material genético encontrado no interior das

mitocôndrias, organelas produtoras de energia presentes no citoplasma das células. O

mtDNA humano é uma molécula dupla-fita circular, apresenta 16.569 pares de base

(pb), pode ser dividido em duas regiões principais: a região codificadora, que constitui

cerca de 94% da molécula que contém os genes para os diferentes tipos de RNA e

proteínas necessários para a síntese de componentes catalíticos do sistema de

fosforilação oxidativa; e as regiões hipervariáveis I e II. Uma simples célula pode

conter centenas de moléculas que possuem normalmente seqüências idênticas e

comportam-se como um genoma haplóide (Wallace,1995). O mtDNA possui algumas

características especiais que o tornam uma ferramenta útil para o estudo de genética

de populações, como o modo de herança uniparental (quase exclusivamente

materno), a taxa de evolução rápida (até 25 vezes mais rápido que o DNA nuclear) e a

ausência de recombinação (genoma haplóide) (Anderson et al., 1981).

Essas características fazem do DNA mitocondrial uma fonte rica em informações para

estudos filogenéticos, campo de estudo dos princípios e processos que governam a

distribuição geográfica de linhagens genealógicas dentro das espécies, com ênfase

em fatores históricos (Pena, 2000).

1.7.2 Cromossomo Y

O cromossomo Y humano possui aproximadamente 60 megabases (Mb)

representando 2-3% do genoma haplóide, contém aproximadamente 30 genes, a

maioria deles relacionados com a determinação do sexo e características secundárias

masculinas (Lahn et al., 2001). Esse cromossomo possui regiões de homologia com o

cromossomo X denominadas pseudo-autossômicas (PARs), que ficam nas

extremidades do braço curto (Yp) e longo (Yq), PAR1 e PAR2, que possuem 2,6 e

0,34 Mb, respectivamente (Vogt et al., 1997). A natureza não-recombinante, de grande

Page 25: TESE DE DOUTORADO - ICB

25

parte da estrutura do cromossomo Y, presente em única cópia nos homens, e

transmitida clonalmente de pai para filho, oferece importantes possibilidades de

aplicações em estudos de evolução humana. Como os locos estão em completa

ligação, as mutações se acumulam, seqüencialmente, nas linhagens paternas através

das gerações, dando informações a respeito da história biológica das linhagens

paternas humanas (Santos e Tyler-Smith,1996).

1.8 Blocos haplotípicos

Podemos chamar de bloco haplotípico, o conjunto de marcadores em

determinada região que estão em desequilíbrio de ligação, e que, como o

cromossomo Y e o DNA mitocondrial, são transmitidos juntos, ou seja, em bloco, para

seus descendentes (Gabriel et al., 2002). Podemos considerar que o genoma humano

é constituído por um mosaico de blocos haplotípicos (Pääbo, 2003), que podem ser

utilizados em estudos de associação com doenças (The International HapMap

Consortium, 2005, Shriver et al., 2003) e em estudos populacionais (Seldin et al.,

2004; Pereira e Pena, 2006). Outra alternativa de estudo com blocos haplotípicos é a

combinação de marcadores com diferentes taxas de mutação (Tishkoff, et al., 2000).

Por exemplo, a utilização de microssatélites, que possuem uma evolução rápida, faz

com que tenhamos haplótipos idênticos em estado, mas que não possuem a mesma

descendência, diminuindo a capacidade dos haplótipos em resolver as relações entre

diferentes populações. Essa desvantagem dos microssatélites pode ser resolvida

associando-os a marcadores de evolução lenta, como os polimorfismos de

inserção\deleção, polimorfismos de inserção Alu e SNPs. O uso combinado desses

marcadores, em regiões não-recombinantes do genoma, oferece oportunidades

singulares para elucidar a história evolutiva das populações naturais, pois fornece uma

informação evolucionária complementar (Mountain et al., 2002).

Page 26: TESE DE DOUTORADO - ICB

26

1.9 Análise de desequilíbrio de ligação

Os determinantes do desequilíbrio de ligação, ou associação gamética, entre

dois locos vão desde fatores associados estritamente ao genoma (mutação,

recombinação, conversão gênica) a aspectos relacionados à dinâmica das populações

(expansões, diminuições e migrações). Os microssatélites foram os primeiros

marcadores a serem efetivamente utilizados no sentido de estabelecerem padrões de

desequilíbrio de ligação para todo o genoma humano e apontaram para a grande

heterogeneidade desse fenômeno ao longo do genoma (Huttley et al., 1999).

1.10 O cromossomo X humano

1.10.1 Características do cromossomo X

O cromossomo X humano teve seu seqüenciamento finalizado em março de

2005 (Ross et al., 2005), fornecendo informações mais precisas sobre suas

características principais. A sua seqüência completa corresponde a aproximadamente

165 megabases, compreendendo, aproximadamente 5% do genoma humano e possui

uma densidade gênica baixa em comparação com outros cromossomos, contendo

apenas 1.100 genes; no entanto, contém muitos elementos repetitivos, principalmente

LINEs (Long Interspersed Nuclear Elements) da família L1, presentes em 29% da

seqüência do cromossomo X, comparáveis com a média do genoma de 17% (Ross et

al.,2005). O cromossomo X possui um mecanismo de compensação da dosagem

gênica, para compensar o desequilíbrio gênico decorrente da cópia extra presente nas

mulheres (Lyon, 1961). A inativação de um dos cromossomos X ocorre no começo do

desenvolvimento e se inicia a partir do centro de inativação do X (XIC) (Ross et al.,

2005). Porém, após a publicação da seqüência completa do cromossomo X, publicou-

se um trabalho mostrando que, mesmo no cromossomo que é inativado, ocorre a

expressão de alguns genes, tendo as mulheres pelo menos 16% a mais de genes

expressos que os homens (Carrel e Willard, 2005).

Page 27: TESE DE DOUTORADO - ICB

27

Processos evolucionários, provavelmente, modularam a estrutura e o

comportamento do cromossomo X de várias maneiras, influenciando nas

características de conteúdo de repetições, taxa de mutação, conteúdo gênico e

estrutura de haplótipos (Ross et al., 2005).

1.10.2 Uso do cromossomo X em estudos evolutivos

O cromossomo X possui características populacionais e moleculares que são

peculiares e podem ser importantes em estudos populacionais (Schaffner, 2004), tais

como:

1. Alternância entre os sexos

Existem, na população, três cromossomos X para cada quatro cromossomos

autossômicos, já que, no homem, os cromossomos sexuais são representados por um

cromossomo X e um cromossomo Y, e na mulher, por dois cromossomos X. Em um

determinado momento, tem-se 1/3 dos cromossomos X no sexo masculino e 2/3 no

sexo feminino. Na geração seguinte, os cromossomos X da geração masculina

anterior irão constituir metade dos 2/3 de cromossomos X presentes na geração

feminina. No caso do sexo masculino, 1/3 de cromossomos X presentes na próxima

geração serão de origem feminina. Assim, 2/3 dos cromossomos X alternam de sexo a

cada geração. Essa é uma característica bastante importante, pois existem diferenças

no comportamento evolucionário de homens e mulheres, sendo as mulheres, em

algumas populações, mais móveis geograficamente (Hamilton et al., 2005), o que faz

com que os marcadores do cromossomo X tracem uma história evolutiva intermediária

entre os sexos (Schaffner, 2004).

2. Menor número efetivo

Em uma população com tamanho N, temos 2N de autossomos, mas apenas 1,5N de

cromossomos X. Comparando com os autossomos, temos na população 3/4 de

cromossomos X e 1/4 de cromossomo Y e DNA mitocondrial. Assim, o cromossomo X

tem um tamanho efetivo intermediário entre os autossomos e, os marcadores de

Page 28: TESE DE DOUTORADO - ICB

28

linhagem (Y e mtDNA). Essa redução no tamanho efetivo torna os marcadores de

linhagens mais suscetíveis às forças evolutivas, como a deriva genética.

3. Menor taxa de recombinação

A recombinação no cromossomo X ocorre, na maior parte do cromossomo, apenas

nas mulheres, com exceção das regiões pseudo-recombinantes das extremidades do

cromossomo que fazem recombinação com o cromossomo Y. Dessa forma, a sua taxa

de recombinação é aproximadamente 2/3 da autossômica. Além disso, o cromossomo

X apresenta regiões com diminuição da taxa de recombinação, como a região Xq13.3-

Xq21.1, onde a taxa de recombinação é de 0,116 cM/Mb, enquanto que a média do

cromossomo é de 1,3 cM/Mb (Nagaraja et al., 1997).

4. Menor taxa de mutações

Como a taxa de mutações é bem maior nos homens (devido ao alto número de

divisões das células germinativas) do que nas mulheres, e em cada geração, 2/3 dos

cromossomos X estão em mulheres, a taxa de mutação será menor para as

seqüências do cromossomo X (Schaffner, 2004).

5. Estudo de haplótipos

O fato de o cromossomo X estar presente, em cópia única, em homens permite que se

estabeleça a fase de haplótipo, possibilitando a identificação direta da relação entre os

alelos para os vários locos estudados (Schaffner, 2004).

Todas essas características fazem do cromossomo X uma ferramenta robusta

para estudos populacionais e evolutivos. Com os primeiros trabalhos sendo publicados

a partir de 1997, (Hey, 1997), seguido por Harris e Hey (1999), estimaram o tempo de

divergência entre as populações africanas e não-africanas em 200 mil anos, utilizando

a seqüência do gene PDHA1. No mesmo ano, Kaessman et al. publicaram um

trabalho utilizando 10Kb da região Xq13.3, para inferir o tempo do mais recente

ancestral comum (TMRCA) do cromossomo X em 535,000±119,000 anos. Mais

recentemente, foram realizados estudos com diferentes populações, Painel do HGDP-

CEPH usando 20 microssatélites do X (Ramachandran et al.; 2004), populações da

Page 29: TESE DE DOUTORADO - ICB

29

Eurásia (Katoh et al., 2002; Kaessmann et al., 2002; Xiao et al., 2004; Latini et al.,

2004, Laan et al., 2005), populações asiáticas (Garrigan et al., 2005), populações

africanas (Lovell et al., 2005) populações da Mongólia (Katoh et al., 2005) e

populações de brasileiros (Pereira e Pena, 2006).

A publicação desses trabalhos revelaram mais uma importante característica

do cromossomo X; cada região e marcador analisado permite contar diferentes

histórias evolutivas sobre as populações humanas (Schaffner, 2004).

Page 30: TESE DE DOUTORADO - ICB

30

2 OBJETIVOS

Page 31: TESE DE DOUTORADO - ICB

31

2.1 OBJETIVO GERAL

Realizar estudos filogeográficos utilizando marcadores moleculares localizados

em uma região com baixa taxa de recombinação no cromossomo X humano.

2.2 OBJETIVOS ESPECÍFICOS

1. Padronizar um bloco haplotípico do cromossomo X localizado em uma

região de baixa taxa de recombinação do cromossomo X.

2. Analisar a filogeografia das populações mundiais do Painel do HDGP-

CEPH.

3. Estimar o tempo de origem da inserção DXS225.

4. Estimar o tempo do mais recente ancestral comum (TMRCA) para o

bloco haplotípico estudado.

5. Analisar a variabilidade genética e estrutura populacional dos

brasileiros.

Page 32: TESE DE DOUTORADO - ICB

32

3 MATERIAL E MÉTODOS

Page 33: TESE DE DOUTORADO - ICB

33

3.1 POPULAÇÕES E AMOSTRAGENS

3.1.1 Amostras do Painel do HGDP-CEPH

Foram analisados 677 homens não-aparentados, pertencentes a 52 populações

mundiais do Painel do HGDP-CEPH distribuídas em sete regiões mundiais (África

Sub-Sahariana, Oriente Médio, Ásia Central, Leste Asiático, Oceania, Europa e

América) (Rosenberg, 2006) (Figura 2). As amostras foram coletadas pelos

laboratórios que fazem parte do Projeto de Diversidade Genoma Humano (HGDP) e

depositadas na Fundação Jean Dausset (CEPH- Centre d’Etude du Polymorphisme

Humain), em Paris, a qual fornece amostras de DNA para pesquisadores que estudam

a história das populações modernas, com diferentes marcadores moleculares, e que,

posteriormente, depositam seus resultados no banco de dados da fundação (Cann et

al., 2002).

3.1.2 Amostras de indivíduos Brasileiros (Pretos e Brancos de São

Paulo)

Foram analisados 204 indivíduos, sendo 97 deles classificados como Pretos e

107 classificados como Brancos, na cidade de São Paulo (Figura 2). As amostras de

doadores de sangue do hemocentro foram cedidas pelo Dr. Sérgio Bydlowski (USP-

São Paulo). Os indivíduos, seus pais e avós (maternos e paternos) foram auto-

classificados de acordo com a cor da pele e hetero-classificados por um entrevistador,

que os classificou, fenotipicamente, como indivíduos Brancos ou Pretos. Todos os

indivíduos assinaram o termo de consentimento para uso de sua amostra de DNA em

trabalhos científicos. E a utilização das amostras foi aprovada pelo comitê de ética da

USP (Universidade de São Paulo).

Page 34: TESE DE DOUTORADO - ICB

34

Figura 2. Mapa com a localização geográfica das populações analisadas do Painel do HGDP-

CEPH e população da cidade de São Paulo (Pretos e Brancos).

Page 35: TESE DE DOUTORADO - ICB

3.2 Extração de DNA

As amostras de brasileiros estudadas foram cedidas como alíquotas de DNA

extraídas segundo protocolo de extração descrito em Bydlowski, et al., 2003. As

amostras de DNA dos indivíduos Andinos foram extraídas pelo protocolo padrão de

“salt out” descrito em Sambrook et al., 1981. As amostras do Painel do HGDP-CEPH

vieram liofilizadas e foram diluídas no laboratório de Genética Bioquímica da UFMG,

para uma concentração final de 20 ng/µl de DNA estoque que foi diluído 1:1 para uso.

3.3 Nomenclatura da inserção Alu

A inserção Alu estudada recebeu o nome de XAP (X-chromosome Alu

Polymorphic Element) (Pereira et al., 2006), em alusão à inserção Alu do cromossomo

Y, nomeada de YAP (Y-Chromosome Alu Polymorphic Element) (Hammer, 1994). Ao

ser depositada no banco de dados do GDB (The Human Genome database,

www.gdb.org), recebeu a denominação de DXS225, com número de acesso no

GDB:11524531 (www.gdb.org/gdb-bin/genera/accno?accessionNum=GDB:11524531).

3.4 Tipagem da inserção Alu (DXS225)

A tipagem do DXS225 foi feita pela técnica de PCR, utilizando-se os protocolos

de “hot start” e "step down" (Pereira et al., 2006), sendo a seqüência do iniciador direto

DXS225-F: 5’ TCC AGA ATC TGC AAA GAA CT 3’, e do iniciador reverso DXS225-R:

5’ ATG ACC AGT GAT GAA GAG CT 3’. O programa utilizado foi padronizado com

desnaturação a 94oC, durante 5 minutos, adição da Taq polimerase, 24 ciclos de

94oC/30 seg, 64oC/30 seg e 72oC/1 min. Em seguida, cinco baterias de cinco ciclos,

diminuindo-se um grau na temperatura de anelamento a cada bateria. Desta forma, na

última bateria estaríamos trabalhando com a temperatura de anelamento do par de

iniciadores que é de 59oC. À última extensão foram acrescidos 5 min. A reação de

PCR foi feita em um volume final de 12,5�l, contendo 50ng de DNA genômico, 0,6�M

de cada iniciador, 200�M de dNTPs, 0,5 unidades de Taq DNA Polimerase em tampão

Page 36: TESE DE DOUTORADO - ICB

36

contendo Tris-HCl 10 mM, pH 8.5; 1,5mM de MgCl2 (Phoneutria, Belo Horizonte,

Brasil). Os produtos da PCR foram visualizados em gel de agarose 2%, com brometo

de etídeo na concentração final de 0,5�g/ml. As corridas foram realizadas no aparato

Scooter 100 (Biokey American Instruments, USA), que permite correrem até 100

amostras por gel, a 80 volts, e os resultados foram visualizados utilizando-se um

transiluminador com luz ultravioleta, e, em seguida fotografados.

3.5 Seleção de novos marcadores

A procura por novos marcadores foi feita na região dentro do intervalo Xq21.1-

Xq21.3, que possui 130Kb, onde o marcador DXS225 foi encontrado (Pereira et al.,

2006). Essa região foi descrita por Nagaraja et al.,(1997), como possuidora das mais

baixas taxas de recombinação do cromossomo X, na qual são encontrados cinco

microssatélites (DXS995, DXS8076, DXS1002, DXS8114 e DXS1050) (Pereira e

Pena, 2006), que foram utilizados na construção do mapa genético do GÉNÉTHON

(Dib. et al, 1996). Esses microssatélites foram analisados e demonstraram estar em

uma região com depressão de recombinação e distância genética zero, o que significa

ausência de recombinação nas 291 meioses analisadas para a construção do mapa

genético do GÉNÉTHON. A utilização desses microssatélites oferecia a vantagem de

poder associar-se diretamente a posição dos marcadores no mapa físico, já que o

mapa genético, utilizado no trabalho de integração, foi o mapa do GÉNÉTHON

(http://www.cephb.fr/cephdb/dumps.html).

Para procurar por novos marcadores, utilizou-se o programa Tandem Repeats

Finder (http://tandem.bu.edu/trf/trf.html) (Benson, 1999), que identifica regiões

repetitivas em seqüências de DNA. Por meio desse programa, identificamos dois

novos microssatélites que flanqueiam a inserção Alu (DXS225): um pentanucleotídeo

com repetição (ATTTT)5 e um dinucleotídeo (CA)11TA*(CA)7, sendo este um

microssatélite imperfeito.

Page 37: TESE DE DOUTORADO - ICB

37

Esses novos marcadores foram depositados no banco de dados do GDB (The

Human Genome Database, www.gdb.org), recebendo o pentanucleotídeo a

denominação DXS1012, com número de acesso GDB: 11524532 (www.gdb.org/gdb-

bin/genera/accno?accessionNum=GDB:11524532) e o dinucleotideo, a denominação

DXS1019, com número de acesso GDB:11524534 (www.gdb.org/gdb-

bin/genera/accno?accessionNum=GDB:11524534).

3.6 Localização física dos marcadores

Os marcadores analisados pertencem ao “contig” genômico com acesso no

NCBI NT_011651.16, o qual possui 36Mb, construído a partir da versão 35 do genoma

humano do NCBI. Esse “contig” fica localizado na região Xq21.1-Xq21.31. As posições

dos marcadores foram obtidas no banco de dados da Universidade de Santa Cruz da

Califórnia, por meio da página UCSC Genome Browser (http://genome.ucsc.edu/), da

versão de março de 2006.

3.7 Tipagem dos microssatélites

Os microssatélites foram padronizados em reações de PCR multiplex, com um

volume final de 10µl, contendo 50ng de DNA genômico, 0,06-0,08 µM de cada

iniciador direto, 0,6-0,8µl de cada iniciador reverso, 0,6-0,8 µM do iniciador M13 (-40)

marcado com fluoresceína (ver Tabela 1), 200�M de dNTPs, 0,5 unidades de Taq

Platinum (Invitrogen) em tampão contendo Tris-HCl 10mM, pH 8,5; 1,5mM de MgCl2

(Phoneutria, Belo Horizonte, Brasil). Todos os iniciadores foram desenhados com

cauda de M13 (-40). Os iniciadores diretos foram utilizados com 1/10 da concentração

dos iniciadores reverso e os M13. As tipagens dos microssatélites foram feitas com a

utilização do seqüenciador automático capilar de alto desempenho: MegaBace 1000

(GE/ Amershan Pharmacia Biotech). Cerca de 2µl dos produtos da PCR eram

adicionados a 8µl do marcador interno do MegaBace ET550-R (Amershan

Biosciences). No MegaBace, os produtos eram injetados a 3kV, com uma voltagem de

corrida de 10kV, e o tempo de injeção era de 80 segundos e 75 minutos de corrida. Os

Page 38: TESE DE DOUTORADO - ICB

38

resultados foram analisados utilizando-se o programa Fragment Profile versão 1.2

(GE/ Amershan Biosciences).

Page 39: TESE DE DOUTORADO - ICB

39

Tabela 1. Seqüência dos iniciadores dos microssatélites analisados.

DXS995 5’ GTT TTC CCA GTC ACG ACA GGA AAG AGT ACA GAA GGG 3’

5’ AAT GCG TTC CCC AAA TGT 3’

DXS8076 5’ GTT TTC CCA GTC ACG ACA ACT TAG GAT ACC CCA TTA TGT G 3’

5’ AGT GCT ACC TCC ACA AAC AG 3’

DXS1012 5’ GTT TTC CCA GTC ACG ACG TGCCAG GAA CTC TTC TAA CTG CT 3’

5’ TCG GGA GAG TGA GGC ACG AGA 3’

DXS1002 5’ GTT TTC CCA GTC ACG ACC TGC TAC CCT TTA GTT CTC TC 3’

5’TCC ATG TTG CTG CGA A 3’

DXS1019 5’ GTT TTC CCA GTC ACG ACG TTC TGC ACA TGT ATC CCA GAA 3’

5’ TCA ATG CAC AAA AGT CAG CAG GA 3’

DXS8114 5’ GTT TTC CCA GTC ACG ACA CCT GTA AGA AAT TAA AGG CAC 3’

5’ TGT ATA GCC AGT GGA ATG TG 3’

DXS1050 5’ GTT TTC CCA GTC ACG ACC CTA GGG GAT CCT TAT TAA AAA T 3’

5’ CCT AGT TTT AGA AGT TTC AAT AGC A 3’

M13 (-40) 5’ GTT TTC CCA GTC ACG AC 3’

Destaca-se em negrito, o iniciador M13 (-40).

Page 40: TESE DE DOUTORADO - ICB

40

3.8 Análise estatística

3.8.1 Diversidade Haplotípica

A diversidade haplotípica foi calculada para os marcadores analisados

utilizando-se a mesma fórmula para o cálculo da diversidade de Nei: H=1-�pi2.n/(n-1)

(Nei, 1978). Neste caso, pi representa a freqüência do haplótipo ith. A diversidade

haplotípica diz respeito à probabilidade de dois genomas amostrados ao acaso em

uma população possuírem haplótipos diferentes.

A estrutura genética das populações e os parâmetros básicos de diversidade

molecular, como, o número de haplótipos diferentes para cada um dos grupos, bem

como o número de haplótipos compartilhados entre os grupos, a diversidade

haplotípica, a análise de variância molecular e a análise de desequilíbrio de ligação

foram calculados usando-se o pacote de programas de genética de populações

Arlequin 2.0 (Schneider et al., 2000).

3.8.2 Análise de desequilíbrio de ligação

Realizamos a análise de desequilíbrio de ligação com o programa Arlequin 2.0,

que representa uma extensão do teste exato de Fisher, com tabelas de contingências,

e os resultados são apresentados em valores de significância (p) com seu erro padrão

(Schneider et al., 2000).

Com a colaboração do Prof. Ian J. Wilson, da Universidade de Newcastle, do

Reino Unido, foram realizadas análises adicionais para se verificar a ausência de

recombinação na região onde está localizado nosso bloco haplotípico, pela análise da

taxa de recombinação para toda a região e para os marcadores analisados por meio

do modelo de Produto de Aproximação Condicional (PAC - Product of Approximate

conditionals) (Li e Stephens, 2003). Fizeram-se cálculos para os valores de

desequilíbrio D’ (coeficiente normalizado de desequilíbrio de ligação) utilizando uma

extensão multialélica da medida padronizada de desequilíbrio (Hedrick, 1987).

Page 41: TESE DE DOUTORADO - ICB

41

3.8.3 Estrutura populacional

Para averiguar se a informação haplotípica obtida com os locos de

microssatélites é capaz de identificar algum nível de estruturação entre as populações

estudadas, utilizamos dois métodos: o primeiro foi a análise de variância molecular

AMOVA (Excoffier et al.,1992), que permite uma avaliação hierárquica (diferentes

graus de estruturação populacional) e a identificação da distribuição dos componentes

de variância entre: a) indivíduos da mesma população, b) entre populações dentro de

grupos definidos e c) entre grupos (geográficos, lingüísticos etc.).

O segundo método utilizado foi uma análise Bayesiana da diferenciação

genética entre populações, por meio do programa BAPS 2.2 (Bayesian Analysis of

Population Structure), desenvolvido por Corander et al., (2003; 2004). A maior

vantagem desse programa é que o número de populações é tratado como um

parâmetro desconhecido. O que permite que o programa perceba se duas populações

são consideradas geneticamente diferentes, devido a recente fundação ou alto nível

de fluxo gênico, essas populações são consideradas como uma única população

panmítica (Corander et al., 2003). Todos os grupos de combinações são considerados

igualmente prováveis a priori. Então o programa determina a partição mais provável

entre os grupos de população, dentro de um número de agrupamentos empiricamente

plausível (Corander et al., 2004).

3.8.4 Proporção de mistura

Utilizamos um método de maximum likelihood, desenvolvido por Wang (2003),

implementado no programa LEADMIX 1.0 (Likelihood Estimation of ADMIXture) para

estimar a proporção de mistura, com dados de marcadores genéticos das populações

parentais e das populações miscigenadas, considerando-se a deriva genética.

3.8.5 Análises de Componente Principal (PCA)

As análises de componente principal (PCA) foram realizadas com os dados de

freqüências haplotípicas para inferir os componentes da variação genética. Esses

componentes da variação reduzem os dados para um pequeno número de dimensões,

Page 42: TESE DE DOUTORADO - ICB

42

descrevendo-os com o máximo de variação possível. As análises de componente

principal são procedimentos que simplificam dados multivariados sem que se perca a

informação (revisado por Cavalli-Sforza et al., 1994). Nos conjuntos de dados com

diferenças de ancestralidade entre as amostras, os componentes da variação,

freqüentemente, têm uma interpretação geográfica (Price et al., 2006).

3.8.6 Redes haplotípicas

Redes haplotípicas foram construídas pelo cálculo de Median joining utilizando

as freqüências haplotípicas dos marcadores nas populações analisadas por meio do

programa Network 4.1.0.6 (Bandelt et al., 1999).

3.8.7 Análises de Coalescência

As análises de coalescência para os nossos dados do cromossomo X foram

feitas com a utilização do programa BATWING (Bayesian analysis of trees with internal

node generation) (Wilson et al., 1998; 2003), com a colaboração do Prof. Ian J. Wilson,

da Universidade de Newcastle, do Reino Unido, autor do referido programa. O

BATWING utiliza o método de Monte Carlo Cadeia de Markov (MCMC - Markov chain

Monte Carlo) para amostrar genealogias reconstruídas proporcionalmente às

probabilidades do modelo de coalescente em uma análise Bayesiana (Wilson et al.,

2003). As histórias populacionais reconstruídas dependem do modelo de mutação, da

estrutura genealógica e da distribuição a priori dos parâmetros de interesse, o que

permite visualizar os tipos de história populacional e a variação dos parâmetros mais

consistentes com os dados no presente (Wilson et al., 2003). Devido ao numero

restrito de indivíduos foram excluídas das análises de coalescência as populações

Karitiana, da América, e as duas populações da Oceania, Papuan e Nan Melanesian.

Page 43: TESE DE DOUTORADO - ICB

43

4 RESULTADOS

Page 44: TESE DE DOUTORADO - ICB

44

4.1 CAPÍTULO 1. PADRONIZAÇÃO DOS MARCADORES MOLECULARES

FORMADORES DO BLOCO HAPLOTÍPICO

4.1.1 INTRODUÇÃO

O interesse em desenvolver marcadores moleculares mais informativos ou

complementares aos utilizados atualmente, como o DNA mitocondrial e o cromossomo

Y, fez com que pesquisadores voltassem a sua atenção ao cromossomo X humano,

que possui características interessantes para estudos evolutivos e que durante um

bom tempo, foi pouco explorado, já que os primeiros trabalhos utilizando esse

cromossomo foram descritos a partir de 1999, por Harris e Hey, e Kaessman e

colaboradores (1999).

As principais vantagens do cromossomo X, para estudos evolutivos, são:

1. cópia única em homens, o que faz deles hemizigotos para esse

cromossomo;

2. baixa taxa de mutação média, já que 2/3 dos cromossomos estão

presentes em mulheres em que a taxa de mutação é muito menor do

que a encontrada nos homens;

3. tamanho efetivo populacional intermediário entre os cromossomos

autossomos e os marcadores de linhagem (Y e mtDNA);

4. alternância de gerações;

5. presença de regiões com baixas taxas de recombinação, que

possibilitam a utilização de haplótipos como ferramenta em estudos

populacionais, já que a ausência ou os baixos níveis de recombinação

mantêm ou minimizam a interferência na história evolutiva desses

haplótipos.

Devido a essas características, determinamos o objetivo geral desta tese de

doutorado: realizar estudos filogeográficos utilizando marcadores moleculares em uma

região de baixa taxa de recombinação do cromossomo X humano. A região escolhida

Page 45: TESE DE DOUTORADO - ICB

45

tem, aproximadamente, 130 Kb, mapeada na região Xq21.1-Xq21.3, que apresenta as

mais baixas taxas de recombinação para o cromossomo X: 0,16 cM/Mb (Nagaraja et

al., 1997).

O estudo dessa região, no laboratório de Genética Bioquímica da UFMG, foi

iniciado por Rinaldo W. Pereira, durante a elaboração de sua tese de doutorado,

quando caracterizou a inserção Alu, flanqueada por microssatélites, DXS225 (Pereira

et al., 2006).

A partir desses dados, selecionamos dois novos microssatélites dentro dessa

região, para formar um bloco haplotípico com marcadores com diferentes taxas de

mutação (inserção Alu e microssatélites) na região Xq21.1-Xq21.3.

Parte dos resultados obtidos neste capítulo foi publicada por Pereira et al., (2006)

(Anexo 1).

4.1.2 RESULTADOS

4.1.2.1 Identificação e desenvolvimento de novos marcadores

Na busca por novos marcadores na região Xq21.1-Xq21.3, utilizando o

programa Tandem Repeats Finder (Benson, 1999), encontramos dois novos

microssatélites (Tabela 2): um pentanucleotídeo com repetição (ATTTT)5, denominado

DXS1012, com número de acesso GDB:11524532; e um dinucleotídeo com repetição

CA11TA*CA7, denominado de DXS1019, com número de acesso GDB:11524534.

Page 46: TESE DE DOUTORADO - ICB

46

Tabela 2. Microssatélites encontrados na região Xq21.1-Xq21.3, com o programa

Tandem Repeats Finder (Benson, 1999).

Localização Período Repetições Marcador

33617-33678 (ATTTT)5 12 DXS1012

37326-37353 (GT) 2 14 DXS1002

39578-47921 - 21 DXS225

48998-49036 (CA) 11AT*(CA) 7 19 DXS1019

124211-124249 (GT) 2 19 DXS8114

*Microssatélite imperfeito; destacados em negrito os novos microssatélites analisados.

Page 47: TESE DE DOUTORADO - ICB

47

Adicionamos os dois novos microssatélites (DXS1012 e DXS1019) aos cinco

microssatélites (DXS995, DXS8076, DXS1002, DXS8114 e DXS1050) descritos por

Dib et al.,(1996) e Pereira e Pena, (2006).

A localização física desses sete marcadores está representada na Figura 3,

enquanto as posições obtidas no banco de dados da UCSC (Universidade de Santa

Cruz da Califórnia) são apresentadas na Tabela 3.

Page 48: TESE DE DOUTORADO - ICB

48

Figure 3. Ideograma com a localização física dos marcadores analisados.

Tabela 3. Posição dos marcadores em pares de bases (pb).

Início Término

DXS995 82.643.697 82.644.081

DXS8076 82.665.965 82.666.202

DXS1012 85.409.962 85.410.320

DXS1002 85.413.714 85.414.062

DXS225 85.424.344 85.424.694

DXS1019 85.425.383 85.425.527

DXS8114 85.500.625 85.501.030

DXS1050 87.160.603 87.160.886

Page 49: TESE DE DOUTORADO - ICB

49

O intervalo entre os marcadores DXS1002 e DXS8114 está localizado no intron

1 do gene DACH2 (Homo sapiens dachund homolog 2 [Drosophila]), na posição

85.290,281-85.974,243 pares de bases.

O programa Ensembl, da página da Universidade de Santa Cruz da Califórnia

(http://www.ensembl.org/homo_sapiens/contigview?chr=&start=82643697&end=87160

886), foi utilizado para fazer uma busca por genes no contig NT_011651.16. Os

resultados dessa busca pode ser visualizado na Figura 4.

Page 50: TESE DE DOUTORADO - ICB

50

Figura 4. Visualização da região Xq21.1-Xq21.31 por meio do programa Ensembl da página do

UCSC Genome Browser. Destacados na cor rosa os marcadores, e na cor ocre, os genes

encontrados nessa região.

Page 51: TESE DE DOUTORADO - ICB

51

Fizemos o seqüenciamento do produto de PCR dos microssatélites DXS1012 e

DXS1019 para confirmar as suas seqüências e os números de repetições. O

alinhamento das seqüências do marcador DXS1012 (Figura 5) foi feito usando-se o

programa Multialign (http://bioinfo.genopole-toulouse.prd.fr/multalin/multalin.html)

(Corpet, 1988), e a amostra seqüenciada foi utilizada como controle interno para as

tipagens desse marcador. No entanto, não conseguimos obter seqüências confiáveis

para o marcador DXS1019; provavelmente devido ao pequeno tamanho (cerca de 130

pb) e o extenso número de repetições do marcador, com isso, utilizamos o número de

repetições obtidos na seqüência do marcador depositado no banco de dados do NCBI

(GenBank).

Após desenvolvimento dos novos marcadores, padronizamos uma reação de

multiplex para os sete microssatélites: DXS995, DXS8076, DXS1012, DXS1002,

DXS1019, DXS8114 e DXS1050. Na Figura 6, pode ser visto um exemplo do gráfico

produzido pelo programa Fragment Profile versão 1.2 (GE/ Amershan Biosciences),

utilizado para as tipagens dos microssatélites. Os tamanhos dos alelos estão em pares

de bases e são convertidos em número de repetições.

Page 52: TESE DE DOUTORADO - ICB

52

Figura 5. Alinhamento das seqüências do DXS1012 utilizando-se o programa Multalign. Em destaque, estão as repetições [ATTTT]n.

Figura 6. Resultado da tipagem dos sete microssatélites em reação de multiplex no MegaBace

1000 visualizado por meio do programa Fragment Profile 1.2 (GE/ Amershan Biosciences). Os

nomes dos marcadores podem ser vistos no topo da figura, e o tamanho de cada alelo, em

pares de bases, abaixo do gráfico.

Page 53: TESE DE DOUTORADO - ICB

53

4.1.2.2 Tipagem da inserção DXS225

A inserção Alu (DXS225) é um elemento da família AluYa5, a qual está inserida

em seqüências de elementos repetitivos do tipo LINE-1. Para melhor desempenho da

reação de PCR alteramos algumas condições com a finalidade de se aumentar a

especificidade para a seqüência do cromossomo X (Pereira, 2002). Mesmo alterando

as condições, no produto de amplificação do DXS225, é possível visualizar um

fragmento com tamanho compatível à presença da inserção (454 pb) e um fragmento

compatível à ausência de inserção (142 pb) (Figura 7). Esse padrão encontrado pode

ser devido aos iniciadores do DXS225 que, provavelmente, estão amplificando outros

L1 homólogos distribuídos pelo genoma.

4.1.2.3 Análise da inserção DXS225 nas populações do HGDP-CEPH

A inserção DXS225 foi genotipada em 677 indivíduos do Painel do HGDP-

CEPH, que representa 52 populações. Todas as regiões demonstraram a presença da

inserção com freqüências de 21% na África, 43% no Oriente Médio, 35% na Ásia

Central, 25% no Leste Asiático, 19% na Oceania, 36% na Europa e 9,3% na América.

As freqüências da inserção DXS225 nas populações do HGDP-CEPH são

apresentadas na Figura 8 e em detalhes na Tabela 4. A presença da inserção DXS225

em todas regiões mundiais sugere que o alelo com a inserção deve ter-se originado

antes de o homem moderno sair da África.

A presença da inserção em Ameríndios foi observada apenas na população

Karitiana, que é formada por um pequeno grupo com número reduzido de indivíduos, e

possui dados históricos que relatam que tal população teve contato com populações

européias e africanas durante todo o século 20 (Storto e Velden, 2005), fato que

sugere que a presença da inserção se deve à mistura com outras populações.

Page 54: TESE DE DOUTORADO - ICB

54

Para verificar a presença da inserção em outras populações ameríndias,

adicionamos dados de 34 indivíduos das populações de Ticuna (Brasil) e Muskoke

(Estados Unidos), analisadas por Pereira e Pena (2006), nos quais não foi encontrada

a presença da inserção DXS225. A partir desses resultados, concluímos que era

necessário excluir a população Karitiana das próximas análises, para evitar

interferência advinda por mistura.

Page 55: TESE DE DOUTORADO - ICB

55

Figura 7. Gel de agarose 1%, com resultado da amplificação do DXS225. Na canaleta 1, o

marcador de peso molecular 1Kb plus DNA ladder (Invitrogen); nas canaletas 2, 3, 5, 6, 7, 10,

11, 13, 15, 18,19, a banda de 142 pb, que representa a ausência da inserção; na canaleta 4, o

branco da reação; nas canaletas 8, 9, 12, 14, 16 e 17, a presença da inserção 454 pb.

Figura 8. Mapa com a distribuição das 52 populações do Painel do HGDP-CEPH e as

freqüências da presença da inserção DXS225, em cada população.

Page 56: TESE DE DOUTORADO - ICB

56

Tabela 4. Freqüências da inserção DXS225 nas populações do Painel HGDP-CEPH,

com suas respectivas localizações e coordenadas geográficas; entre parênteses, há o

número de indivíduos.

População Localização Coordenadas Geográficas

DXS225+ DXS225-

1- Biaka Pigmeu (30) Republica da África Central 4N,17E 30% (9) 70% (21) 2- Mbuti Pigmeu (13) Democrática Republica do Congo 1N,29E 62% (8) 38% (5) 3-Mandenka (16) Senegal 12N,12W 13% (2) 87% (14) 4-Yoruba (13) Nigéria 8N, 5E NE 100%(13) 5-Bantu NE (11) Quênia 3S,37E 18% (2) 82% (9) 6-San (7) Namíbia 21S,20E NE 100% (7) 7-Bantu SE Pedi (8) África do Sul 24S;24,30E NE 100% (7) 8-Mozabite (20) Algéria (Mzab) 32N;3E 50% (10) 50% (10) 9-Bedouin (28) Israel (Negev) 31N;35E 39% (11) 61% (17) 10-Druze (14) Israel (Carmel) 32N;35E 29% (4) 71% (10) 11-Palestinos (17) Israel (Central) 32N;35E 53% (9) 47% (8) 12-Brahui (25) Paquistão 30,30N;66,30E 20% (5) 80% (20) 13-Balochi (25) Paquistão 30,30N;60,30E 40% (10) 60% (15) 14-Hazara (24) Paquistão 33,30N;70E 42% (10) 58% (14) 15-Makrani (20) Paquistão 26N;64E 50% (10) 50% (10) 16-Sindhi (21) Paquistão 25,30N;69E 19% (4) 81% (17) 17-Pathan (20) Paquistão 33,30N;71,30E 15% (3) 85% (17) 18-Kalash (20) Paquistão 36N;71,30E 60%(12) 40% (8) 19-Burusho (20) Paquistão 36,30N;74E 35% (7) 65% (13) 20-Han (24) China 32,30N;114E 25% (6) 75% (18) 21-Tujia (9) China 29N;109E 33% (3) 67% (6) 22-Yizu (9) China 28N;103E 33% (3) 67% (6) 23-Miaozu (7) China 28N;109E 14% (1) 86% (6) 24-Orogen (7) China 50,30N;126,30N 14% (1) 86% (6) 25-Daur (7) China 48,30N;124E 28% (2) 72% (5) 26-Mongolianos (7) China 48,30N;119E 28% (2) 72% (5) 27-Hezhen (5) China 47,30N;133,30E 20% (1) 80% (4) 28-Xibo (8) China 43,30N;81,30E 12,5% (1) 87,5% (7) 29-Uygur (8) China 44N;81E 37,5% (3) 62,5% (5) 30-Daí (7) China 21N;100E NE 100% (7) 31-Lahu (7) China 22N;100E 42,8% (3) 57,2% (4) 32-She (7) China 27N;119E 28% (2) 72% (5) 33-Naxi (8) China 26N;100E 12,5% (1) 87,5% (7) 34-Tu (7) China 36N;101E 28,5% (2) 71,5% (5) 35-Yakut (18) Sibéria 63N;129,30E 27% (5) 73% (13) 36-Japoneses (22) Japão 38N;138E 32% (7) 68% (15) 37-Cambodianos (6) Cambodia 12N,105E 16% (1) 84% (5) 38-Papuan (13) Nova Guiné 4S;143E NE 100%(13) 39-NAN Melanesianos (8) Bougainville 6S;155E 50% (4) 50% (4) 40-Franceses (12) França 46N;2E 42% (5) 58% (7) 41-Franceses Bascos (16) França 43N;0 31% (5) 69% (11) 42-Sardinianos (16) Itália 40N;9E 50% (8) 50% (8) 43-Italianos do Norte (8) Itália (Bergamo) 46N;10E NE 100% (8) 44-Toscanos (6) Itália 43N;11E 67% (4) 33% (2) 45-Orcadianos (7) Ilhas Orkney 59N;3W 29% (2) 71% (5) 46-Adygei (7) Rússia caucasiana 44N;39E 57% (4) 43% (3) 47-Russos (16) Rússia 61N;40E 25% (4) 75% (12) 48-Pima (14) México 29N;108W NE 100%(14) 49-Maya (3) México 19N;91W NE 100% (3) 50-Colombianos (5) Colômbia 3N;68W NE 100% (5) 51-Karitiana (10) Brasil 10S;63W 40% (4) 60% (6) 52-Surui (11) Brasil 11S;62W NE 100%(11)

Fonte: HGDP-CEPH. Nota: NE- não-encontrado.

Page 57: TESE DE DOUTORADO - ICB

57

4.1.2.4 Análise de Variância Molecular (AMOVA)

A análise de variância molecular, com as freqüências do marcador DXS225 para

as 51 populações do Painel do HGDP-CEPH (excluindo a Karitiana), foi feita por meio

do programa Arlequin 2.0 (Scheneider et al., 2000). Encontramos uma variabilidade de

91,8% entre os indivíduos, dentro das populações; 4,2% de variabilidade encontrada

entre as populações, dentro das regiões e 3,9% entre as sete regiões mundiais

(Tabela 5).

Tabela 5. Análise de variância molecular do marcador DXS225 para as populações do

Painel do HGDP-CEPH.

Amostra Número de regiões

Número de populações

Dentro das populações

Entre populações dentro de regiões

Entre regiões

Mundo 1 51 92,50 7,50 - Mundo 5 51 90,85 3,89 5,26 Mundo 7 51 91,87 4,20 3,9 África 1 7 79,56 20,44 -

Eurásia 1 1 20 96,06 3,94 - Eurásia 3 3 20 96,37 4,58 -0,95a Europa 1 8 94,53 5,47 -

Oriente Médio 1 4 101,08 -1,08a - Ásia Central 1 8 93,58 6,42 -

Leste Asiático 1 18 106,26 -6,26b - Oceania 1 2 47,93 52,07 - Américab 1 4 0,00 0,00 -

a valor não-significativo p<0,05; demais valores significativos para p<0,05; b Amostra da América sem a população Karitiana.

Page 58: TESE DE DOUTORADO - ICB

58

4.1.2.5 Análise de desequilíbrio de ligação

As análises de desequilíbrio de ligação, para os sete microssatélites

encontrados na região Xq21.1-Xq21.3 (DXS995, DXS8076, DXS1012, DXS1002,

DXS1019, DXS8114 e DXS1050) e para a inserção Alu (DXS225), com os dados dos

667 indivíduos do Painel do HGDP-CEPH, foram feitas por meio do programa Arlequin

2.0 (Schneider et al., 2000). O teste de desequilíbrio de ligação desse programa é uma

extensão do teste exato de Fisher, e os resultados são apresentados como valor de

(p) com erro padrão. Com isso, quanto menor o valor de (p) mais alto será o

desequilíbrio de ligação entre os marcadores testados (na diagonal inferior da Tabela

6). Observamos que os marcadores DXS1012, DXS1002, DXS225, DXS1019 e

DXS8114 estão em visível desequilíbrio de ligação, enquanto que os marcadores mais

externos, DXS995, DXS8076 e DXS1050, não apresentaram desequilíbrio de ligação

significante.

Os demais testes adicionais de desequilíbrio de ligação foram realizados com a

colaboração do Prof. Ian Wilson. Os valores de coeficiente de desequilíbrio de ligação

D’ (Hedrick, 1987), calculados para os nossos marcadores, estão apresentados na

parte diagonal superior da Tabela 6. Os maiores valores foram encontrados também

para os marcadores: DXS1012, DXS1002, DXS225, DXS1019 e DXS8114, que

variaram entre 0,94 a 0,39 (diagonal superior da Tabela 6). No entanto, existe a

dificuldade de predizer exatamente qual variação é a esperada para marcadores

altamente variáveis, como os microssatélites em completo desequilíbrio de ligação.

Para avaliar se os valores de D’ encontrados para os nossos marcadores são

consistentes com a ausência de recombinação, foi feito um estudo de simulação em

pequena escala com os quatro microssatélites completamente ligados com as

mesmas taxas de mutação e um UEP (Unique Event Polymorphism). Foram

realizadas simulações de coalescente padrão (Standard Coalescent) com as 667

amostras, utilizando-se o modelo de mutação stepwise mutations para os

microssatélites. Na Figura 9, os histogramas com os valores mínimo, médio e máximo

Page 59: TESE DE DOUTORADO - ICB

59

de D’ vistos em 1000 réplicas, que demonstram que nossos dados são compatíveis

com absoluto desequilíbrio de ligação.

Um teste adicional de desequilíbrio de ligação foi feito para estimar taxa de

recombinação da região contendo os marcadores DXS1012, DXS1002, DXS225,

DXS1019 e DXS8114, utilizando-se o método de PAC (Li e Stephens, 2003). A análise

de PAC (Product of Approximate Condicionals) não mostrou nenhuma evidência de

taxa de recombinação populacional (ρ), com valor diferente de zero para o nosso

bloco haplotípico, enquanto que, para toda a região (Xq21.1-Xq21.3), o valor máximo

de ρ foi de, aproximadamente, 1,5 cM/Mb, quando a taxa de mutação para a

população foi de θ= 40 (Figura 10). Os gráficos gerados nessas análises foram

fornecidos pelo Prof. Ian J. Wilson.

Adicionalmente, fizemos uma análise de busca “in silico” dos SNPs encontrados

na região entre os marcadores DXS1012 e DXS8114 (intervalo 85.409,962-85.501,030

pares de base), utilizando dados do HapMap para verificar se ocorre recombinação

nessa região. Com o programa Haploview (Barrett et al., 2005), visualizamos os

mapas de desequilíbrio dos SNPs encontrados na região Xq21.1-Xq21.3, nos dados

populacionais do HapMap (Figuras 11, 12, 13 e 14). Os mapas de desequilíbrio são

apresentados em valores de D’ (Hedrick, 1987), com os quadrados mais escuros

representando D’ =1, e as linhas indicando os grupos de marcadores que podem

formar blocos de acordo com o coeficiente de LD. De acordo com os mapas

produzidos, na região onde está localizado nosso bloco haplotípico, com os dados de

Africanos (Yoruba) (Figura 11), Europeus (Utah) (Figura 12), Chineses (Han) (Figura

13) e Japoneses (Tóquio) (Figura 14) do HapMap, observamos que a maioria dos

SNPs estão em completo desequilíbrio de ligação em toda a região (aproximadamente

90% de D’=1), com exceção de alguns SNPs que não estão em completo

desequilíbrio, mas que constituem um pequeno grupo de SNPs que podem ter sofrido

conversão gênica. Com os resultados das análises de desequilíbrio de ligação,

podemos concluir que os marcadores DXS1012, DXS1002, DXS225, DXS1019 e

Page 60: TESE DE DOUTORADO - ICB

60

DXS8114 constituem um bloco haplotípico não-recombinante. Com base nesses

resultados, as próximas análises foram feitas apenas com os marcadores ligados

(DXS1012, DXS1002, DXS225, DXS1019 e DXS8114).

Page 61: TESE DE DOUTORADO - ICB

Tabela 6. Valores de significância calculados para o desequilíbrio de ligação entre os pares de marcadores e o erro padrão estão apresentados

na parte inferior da diagonal. Os valores de D’ estão apresentados na parte superior da diagonal. Os marcadores do bloco haplotípico e valores

de desequilíbrio de ligação estão destacados por sombreamento e em negrito os marcadores e os valores em desequilíbrio de ligação.

DXS995 DXS8076 DXS1012 DXS1002 DXS225 DXS1019 DXS8114 DXS1050

DXS995 - 0,11 0,17 0,13 0,03 0,06 0,19 0,07

DXS8076 0,920±0,001 - 0,14 0,13 0,10 0,12 0,14 0,13

DXS1012 0,108±0,001 0,160±0,001 - 0,48 0,56 0,52 0,39 0,10

DXS1002 0,622±0,001 0,000±0,000 0,000±0,000 - 0,68 0,61 0,44 0,14

DXS225 0,912±0,001 0,168±0,001 0,000±0,000 0,000±0,000 - 0,94 0,72 0,13

DXS1019 0,958±0,000 0,006±0,000 0,000±0,000 0,000±0,000 0,000±0,000 - 0,64 0,16

DXS8114 0,001±0,000 0,000±0,000 0,000±0,000 0,000±0,000 0,000±0,000 0,000±0,000 - 0,19

DXS1050 0,009±0,000 0,052±0,000 0,069±0,001 0,107±0,000 0,015±0,000 0,010±0,000 0,000±0,000 -

Page 62: TESE DE DOUTORADO - ICB

Figura 9. Valores de D’ (Hedrick, 1987) mínimo, médio e máximo calculados a partir de 10.000

simulações coalescentes com os 667 indivíduos, para os quatro microssatélites completamente ligados

(com theta= 4, 10, e 30, respectivamente) e um polimorfismo de evento único (UEP). As simulações

são para uma única população panmítica com tamanho constante. Os valores observados estão

destacados pelas setas: valor mínimo 0,39; médio 0,6 e máximo 0,94. Gráficos produzidos pelo Prof.

Ian J. Wilson, do Departamento de Genética Humana da Universidade de Newcastle, no Reino Unido.

Page 63: TESE DE DOUTORADO - ICB

63

Figura 10. Curvas com log-likelihood calculado pelo modelo PAC (Product of Approximate

conditionals) (Li e Stephens, 2003) para toda a região (linhas pretas) e para o bloco haplotípico não-

recombinante (linhas azuis). Observa-se taxas de mutação populacional de θ = 10 (linhas pontilhadas)

e de θ=40 (linhas sólidas). Todas as linhas foram normalizadas para o valor máximo de zero, o que

permite as comparações entre as linhas. Gráfico produzido pelo Prof. Ian J. Wilson, do Departamento

de Genética Humana da Universidade de Newcastle, no Reino Unido.

Page 64: TESE DE DOUTORADO - ICB

64

Figura 11. Mapa de desequilíbrio de ligação formado com os valores de D’ para a população YRI

(África) do HapMap, produzido pelo programa Haploview (Barrett et al., 2005). Os blocos mais escuros

representam D’=1.

Figura 12. Mapa de desequilíbrio de ligação formado com os valores de D’ para a população CEU

(Europa) do HapMap, produzido pelo programa Haploview (Barrett et al., 2005). Os blocos mais

escuros representam D’=1.

Page 65: TESE DE DOUTORADO - ICB

65

Figura 13. Mapa de desequilíbrio de ligação formado com os valores de D’ para a população CHB

(China) do HapMap, produzido pelo programa Haploview (Barrett et al., 2005). Os blocos mais escuros

representam D’=1.

Figura 14. Mapa de desequilíbrio de ligação formado com os valores de D’ para a população JPT

(Japão) do HapMap, produzido pelo programa Haploview (Barrett et al., 2005). Os blocos mais escuros

representam D’=1.

Page 66: TESE DE DOUTORADO - ICB

66

Índice de diversidade de Nei

A diversidade média de cada loco de microssatélite, inserção Alu e bloco haplotípico foi

calculada pelo índice de diversidade de Nei (Nei, 1987), com os dados das freqüências

alélicas dos marcadores das populações do Painel do HGDP-CEPH (Tabela 7). Utilizamos a

fórmula h=n(1-Σpi 2)/(n-1) para dados haplóides, em que n é tamanho efetivo, e pi, a

freqüência alélica para cada loco; no caso do bloco haplotípico, pi representa a freqüência

dos haplótipos. O menor índice de diversidade foi encontrado para o DXS225, o que era

esperado por se tratar de uma inserção Alu com apenas dois alelos. Nos microssatélites, os

menores índices foram observados para o DXS1019 e o DXS1002, respectivamente, que são

os dois microssatélites que flanqueiam a inserção DXS225. Os maiores índices foram vistos

nos marcadores DXS1012 e DXS8114, que estão localizados na extremidade do nosso bloco

haplotípico.

A comparação dos índices de diversidade dos marcadores na África e nas populações

não africanas do Painel do HGDP-CEPH demonstraram que os valores de diversidade

encontrados na África sub-sahariana são maiores que os encontrados nas populações não-

africanas, com exceção dos marcadores DXS1012 e DXS225. No entanto, as diferenças

entre a África sub-sahariana e as demais populações do Painel HGDP-CEPH não foram

significativas para o teste t (teste t =1,325; p<0,05).

Tabela 7. Índices de diversidade de Nei para os marcadores nas populações do Painel do

HGDP-CEPH.

CEPH (n=667) ÁFRICA (n=98)

NÃO-AFRICANAS

(n=569) LOCOS

DXS1012 0,829 0,778 0,828 DXS1002 0,721 0,770 0,694 DXS225 0,415 0,336 0,425 DXS1019 0,560 0,811 0,487 DXS8114 0,798 0,820 0,785 Bloco Haplotípico 0,979 0,996 0,974

Page 67: TESE DE DOUTORADO - ICB

67

4.1.3 DISCUSSÃO

O cromossomo X humano apresenta características que o tornam uma ferramenta

poderosa em estudos populacionais (Schaffner, 2004). Devido a essas características,

propusemos como objetivo desta tese realizar estudos filogeográficos utilizando marcadores

moleculares nesse cromossomo.

Os marcadores foram selecionados na região onde está localizada a inserção Alu

(DXS225), caracterizada por Rinaldo W. Pereira, durante a elaboração de sua tese de

doutorado, em 2002, região essa conhecida por ter uma das menores taxas de recombinação

do cromossomo X (0,16 cM/Mb) comparada com a média do cromossomo (1,3 cM/Mb)

(Nagaraja et al., 1997). Descrevemos dois novos microssatélites flanqueando a inserção Alu

(DXS225): um dinucleotídeo (DXS1019) e pentanucleotídeo (DXS1012), sendo o

microssatélite DXS1019 o marcador mais próximo à inserção, com apenas 7 kb de distância

(Tabela 3). Nessa região, são encontrados cinco microssatélites (DXS995, DXS8076,

DXS1002, DXS8114 e DXS1050), que não apresentaram recombinação em 291 meioses,

testada durante a construção do mapa genético do cromossomo X (Dib et al.,1996), em que

também foram utilizados em estudos filogeográficos com populações brasileiras (Pereira e

Pena, 2006).

Para utilizar um marcador molecular informativo, formado por marcadores com

diferentes taxas de mutação, adicionamos aos cinco microssatélites (Dib et al., 1996) os dois

microssatélites caracterizados neste trabalho (DXS1019 e DXS1012) e a inserção Alu

(DXS225) (Pereira et al., 2006).

Os sete microssatélites foram padronizados em uma reação de multiplex (Figura 6),

enquanto a inserção Alu DXS225 foi genotipada individualmente.

A inserção Alu DXS225 está localizada dentro de um elemento LINE-1, que é

bastante abundante no genoma humano, principalmente no cromossomo X, onde

encontramos 29% desses elementos repetitivos (Ross et al., 2005), o que faz com que a

Page 68: TESE DE DOUTORADO - ICB

68

nossa reação amplifique outros elementos L1 do genoma e que o alelo sem a inserção

apareça em todas as reações (Figura 7).

A presença da inserção DXS225 foi observada em todas as regiões mundiais do

Painel do HGDP-CEPH (Figura 8), com freqüências que variam de 9,3%, na América, a 43%,

no Oriente Médio. Esse padrão de distribuição permite inferir que a inserção DXS225 deve

ter-se originado antes que o homem moderno saísse da África, há, aproximadamente,

100.000-200.000 anos. Na África, encontramos uma freqüência de 21% da presença da

inserção; no entanto, três populações africanas não possuem a inserção (Yoruba, San e

Bantu_SE).

Enquanto que a presença da inserção em Ameríndios foi observada apenas na

população Karitiana, a qual é formada por um pequeno grupo (64 indivíduos em 1970 e,

aproximadamente, 320 indivíduos em 2005) que representa uma simples extensão de uma

família (Storto e Velden, 2005). Além disso, relata-se que os Karitiana tiveram contato com

Europeus e Africanos no início do século 20, o que sugere que o alelo com a presença da

inserção DXS225, nessa população, foi introduzido por miscigenação com populações

Européias e Africanas. Para verificar se a presença da inserção foi encontrada em outras

populações Ameríndias, adicionamos os dados de indivíduos pertencentes às populações de

Ticuna, do Brasil, e de Muskoke, dos Estados Unidos (Pereira e Pena, 2006), que não

apresentaram alelo com a presença da inserção. O fato de encontrarmos apenas o alelo sem

a inserção DXS225 em populações Ameríndias pré-colombianas pode ser explicado por

efeito fundador, seguido de deriva genética que fixou o alelo sem a inserção na população.

De acordo com esses dados, decidimos retirar a população Karitiana das nossas análises

para evitar a interferência da mistura em nossos resultados. Mesmo não observando essa

provável mistura na população Karitiana com os marcadores de linhagem cromossomo Y e

DNA mitocondrial (Wang et al.,2007).

Inicialmente o marcador utilizado foi um bloco haplotípico formado por sete

microssatélites e uma inserção Alu, localizado na região Xq21.1-Xq21.3. No entanto, após as

análises de desequilíbrio de ligação, excluímos três microssatélites (DXS995, DXS8076 e

Page 69: TESE DE DOUTORADO - ICB

69

DXS1050), localizados nas extremidades do nosso bloco haplotípico, que não estavam em

desequilíbrio de ligação, o que pode ser observado tanto para as probabilidades de p

calculadas pelo programa Arlequin 2.0 (Schneider et al., 2000), quanto para os valores de

coeficiente de D’ (Hedrick 1987) (Tabela 6).

Foram utilizadas outras três abordagens para se verificar a existência de

recombinação na região onde o nosso bloco haplotípico está localizado, sendo a primeira e a

segunda realizadas pelo Prof. Ian Wilson em colaboração com nosso trabalho. A primeira,

uma simulação em pequena escala, com 10.000 simulações coalescentes para os valores de

D’ e os histogramas com os valores mínimos (0,39), médios (0,6) e máximo (0,94)

observados, que evidenciam que nossos dados são compatíveis com absoluto desequilíbrio

de ligação (Figura 9). A segunda foi um teste adicional de desequilíbrio de ligação, pelo

método de PAC, para estimar a taxa de recombinação (Li e Stephens, 2003), com a análise

da taxa de recombinação de toda a região Xq21.1-Xq21.3 e da região onde estão localizados

apenas os marcadores (DXS1012, DXS1002, DXS225, DXS1019 e DX8114). Na Figura 10, o

gráfico com as curvas de log-likelihood, comparando as curvas de toda a região e a região do

bloco haplotípico, observamos que não há evidências de taxa de recombinação populacional

(ρ) para o bloco haplotípico com valores não-diferentes de zero, enquanto que, para toda a

região, teve um ρ máximo de 1,5 cM/Mb para θ=40. A terceira, uma análise in silico, utilizou

os dados de SNPs do HapMap para verificar a ausência de recombinação na região entre os

marcadores DXS1012 e DXS8114, e os dados para as quatro populações do HapMap

mostraram aproximadamente, 90% de D’=1 para essa região (Figuras 11, 12, 13 e 14). Todas

as nossas análises de desequilíbrio de ligação demonstraram que os marcadores DXS1012,

DXS1002, DXS225, DXS1019 e DX8114 estão em visível desequilíbrio de ligação, formando,

dessa forma, um bloco haplotípico, que foi utilizado nas análises dos próximos capítulos.

Os índices de diversidade de Nei (Nei, 1987) foram calculados para cada marcador e

para o bloco haplotípico com as freqüências alélicas e haplotípicas das populações do Painel

do HGDP-CEPH (Tabela 7). Os microssatélites DXS1002 e DXS1019, que flanqueiam a

inserção DXS225, apresentaram os menores valores de diversidade (0,721 e 0,560,

Page 70: TESE DE DOUTORADO - ICB

70

respectivamente), enquanto os microssatélites mais externos do bloco haplotípico tiveram os

maiores índices de diversidade:DXS1012 (0,829) e DXS8114 (0,798). O bloco haplotípico

possui um alto índice de diversidade (0,979). Quando analisamos as diversidades dos

marcadores dentro e fora da África, observamos que a maioria deles revelaram maiores

índices de diversidade dentro da África, com exceção do DXS225 e do DXS1012 (Tabela 7).

No entanto, a diferença encontrada entre os marcadores dentro e fora da África, não foi

significativa estatisticamente (teste t=1,325), p>0,05).

A análise de variância molecular (AMOVA) para a inserção DXS225 revelou pouca

estruturação genética, com 92% da variação concentrada entre os indivíduos dentro das

populações, enquanto que a variação encontrada entre as populações dentro das regiões foi

de 4,2% e de 3,9%, entre as sete principais regiões mundiais (Tabela 4), valores compatíveis

aos encontrados em polimorfismos de DNA (Cavalli-Sforza e Feldman, 2003). No entanto, as

populações da Oceania apresentaram alta índice de variação entre as populações, o que

pode ser explicado pelo número restrito de populações, apenas duas e a diferenciação

genética encontrada entre elas.

Nossos resultados permitem concluir que o bloco haplotípico utilizado, que combina

marcadores polimórficos de evolução lenta, como a inserção (DXS225), com marcadores

polimórficos de evolução rápida, como os microssatélites (DXS1012, DXS1002, DXS1019 e

DXS8114), oferece oportunidades singulares para elucidar a história evolutiva de populações

humanas, fornecendo informações evolucionárias complementares aos marcadores

tradicionais de linhagens (cromossomo Y e DNA mitocondrial) utilizados para esse tipo de

abordagem.

Os resultados da caracterização e distribuição da inserção DXS225 nas populações

mundiais do Painel do CEPH foram publicados no manuscrito (Pereira, et al.,2006; Anexo 1).

Page 71: TESE DE DOUTORADO - ICB

71

4.2 CAPÍTULO 2 - FILOGEOGRAFIA DE POPULAÇÕES MUNDIAIS POR MEIO DA

ANÁLISE DE UM BLOCO HAPLOTÍPICO DO CROMOSSOMO X

4.2.1 INTRODUÇÃO

No capítulo anterior, descrevemos e padronizamos um bloco haplotípico constituído

por quatro microssatélites (DXS1012, DXS1002, DXS1019 e DXS8114) e uma inserção Alu

(DXS225), que estão em completo desequilíbrio de ligação. Neste capítulo, utilizaremos esse

bloco haplotípico para fazer uma análise filogeográfica das populações mundiais do Painel do

HGDP-CEPH.

A filogeografia é uma área de estudo dos princípios e processos que estabelecem a

distribuição geográfica de linhagens genealógicas dentro das espécies, com ênfase em

fatores históricos que integram conhecimentos de genética molecular, genética de população,

filogenética, demografia e geografia histórica (Pena, 2002). Nosso bloco haplotípico possui

diversas características interessantes para estudos evolutivos, descritas no primeiro capítulo

desta tese, e a vantagem de fornecer informação sobre os componentes populacionais de

homens e mulheres.

Com base nessas características, propusemos como um dos objetivos desta tese

utilizar nosso bloco haplotípico do cromossomo X para analisar a diversidade genética de

populações mundiais que compõem o Painel do HGDP-CEPH e fornecer conhecimentos

novos e complementares sobre a história populacional humana. Para realizar essa análise,

investigamos 667 homens não-aparentados, representantes de 51 populações distribuídas

entre as cinco principais regiões mundiais (África, Leste Asiático, Oceania, Eurásia e

América) do Painel do HGDP-CEPH (Rosenberg, 2006). Nessa análise, agrupamos as

regiões, Oriente Médio, Ásia Central e Europa, que possuem uma estrutura genética bastante

similar, em uma única região denominada Eurásia (Rosenberg et al., 2002). E com as

evidências encontradas no estudo da inserção DXS225, retiramos a população ameríndia

Karitiana, que demonstrou forte indício de fluxo gênico com populações européias e

Page 72: TESE DE DOUTORADO - ICB

72

africanas, como discutido no Capítulo 1 desta tese. Os resultados obtidos neste capítulo

foram publicados no manuscrito Santos-Lopes et al.,(2007) (Anexo 2).

4.2.2 RESULTADOS

4.2.2.1 Análise haplotípica

Os parâmetros básicos de diversidade molecular, incluindo a análise de variância

molecular (AMOVA) (Excoffier et al., 1992), freqüência haplotípica, diversidade haplotípica e

haplótipos compartilhados, foram calculados por meio do programa Arlequin 2.0 (Schneider et

al., 2000). Entre os 667 indivíduos estudados, encontramos um total de 187 diferentes

haplótipos formados pelos marcadores (DXS1012, DXS1002, DXS225, DXS1019 e

DXS8114) do bloco haplotípico. Do total de haplótipos (187) encontrados, 129 (69%) são

haplótipos região-específico, vistos em apenas uma única região. A grande maioria desses

haplótipos região-específico são encontrados na região da África, que possui apenas 14,6%

do total de indivíduos, mas contém 44% dos haplótipos região-específico encontrados

(Tabela 8). A diversidade haplotípica encontrada para as cinco principais regiões mostrou que

a maior diversidade está na África (0,992±0,002), enquanto que a menor está na Oceania

(0,885±0,047) e na América (0,839±0,038) (Tabela 8).

Observamos a diversidade haplotípica para os haplótipos com a presença da inserção

DXS225 (196 indivíduos) e sem a inserção (471 indivíduos) separadamente. Como esperado,

a diversidade é bem maior para os haplótipos com a ausência da inserção DXS225 que

possui a maioria dos indivíduos (471/667), dos haplótipos (141/187), e que possui um valor

de diversidade de 0,972±0,003, comparado com 0,880±0,017 para os haplótipos com a

presença da inserção. Quando comparamos a diversidade dentro (0,992±0,002) e fora

(0,968±0,002) da África, observamos que a diversidade africana é bem maior que a dos

outros continentes, e que esse perfil se repete mesmo quando comparamos os haplótipos

com a presença da inserção DXS225 na África (0,952±0,027) e nos outros continentes

(0,854±0,020). Com a ausência da inserção, a diversidade africana é de 0,991±0,003,

enquanto que nos outros continentes é de 0,962±0,004.

Page 73: TESE DE DOUTORADO - ICB

73

Tabela 8. Número de indivíduos, haplótipos, haplótipos únicos e diversidade haplotípica das

cinco principais regiões do CEPH.

Região Número de indivíduos

Número de haplótipos

Haplótipos únicos

Diversidade Haplotípica

África 98 71 57 0,992±0,003 Leste Asiático 173 67 31 0,967±0,005 Eurásia 342 87 36 0,953±0,006 Oceania 21 10 4 0,885±0,047 América 33 10 1 0,839±0,037 Mundo CEPH 667 187 129 0,976±0,002

A proporção de haplótipos compartilhados entre as cinco principais regiões do HGDP-

CEPH está representada na Figura 15, onde as regiões estão representadas em quadrados

de cores diferentes com o tamanho proporcional ao número de indivíduos de cada região, e

dentro de cada região, a proporção de haplótipos, a largura das setas são proporcionais ao

número de haplótipos compartilhados. A África possui as menores proporções de haplótipos

compartilhados, enquanto a América apresenta as maiores proporções, principalmente com o

Leste Asiático.

Page 74: TESE DE DOUTORADO - ICB

74

Figura 15. Fluxo de compartilhamento de haplótipos entre as cinco principais regiões mundiais do

Painel do HGDP-CEPH. Os quadrados representam as regiões mundiais com o tamanho proporcional

ao número de indivíduos de cada região, e a largura das setas é proporcional ao número de haplótipos

compartilhados. Entre parênteses, dentro dos quadrados, está a freqüência média de haplótipos de

cada região. Próximas às setas, estão as freqüências de haplótipos compartilhados. Essa figura foi

inspirada em diagrama similar presente em Conrad et al., (2006).

Page 75: TESE DE DOUTORADO - ICB

75

A análise de variância molecular (AMOVA) com os dados do bloco haplotípico revelou

pouca estruturação genética, com a maior variabilidade genética encontrada dentro das

populações (95,2%), em relação às encontradas entre as populações mundiais (1,7%) e entre

as cinco principais regiões (3,1%) (Tabela 9). O mesmo padrão foi encontrado para as

regiões, separadamente, com mais de 95% da variabilidade genética encontrada entre as

populações, com exceção apenas da Oceania e América, que apresentaram valores de

variabilidade genética maiores entre as populações dentro das regiões (14,9% e 15,3%,

respectivamente) (Tabela 9).

Tabela 9. Análise de variância molecular para o bloco haplotípico (DXS1012, DXS1002,

DXS225, DXS1019 e DXS8114) nas populações do Painel HGDP-CEPH.

Amostra Número de regiões

Número de populações

Componente de variação (%)

Dentro das populações

Entre populações dentro de regiões

Entre regiões

Mundo 1 51 96,23 3,77 - Mundo 5 51 95,22 1,69 3,08 África 1 7 98,01 1,99 -

Eurásiab 3 20 98,18 1,06 0,76 Leste Asiático 1 18 100,59 -0,59a -

Oceania 1 2 85,05 14,95 - América 1 4 84,71 15,29 -

a Valor não-significativo para p<0,05, demais valores, significativos para p<0,05. b Eurásia inclui Oriente Médio, Ásia Central e Europa.

Page 76: TESE DE DOUTORADO - ICB

76

4.2.2.2 Redes haplotípicas

Foram construídas redes haplotípicas pelo cálculo de Median Joining por meio do

programa Network 4.2.0.1 (Bandelt et al,1999). Para essa análise, as regiões do Oriente

Médio, Ásia Central e Europa foram agrupadas em uma única região, a Eurásia. A Figura 16

representa a rede haplotípica com as cinco principais regiões mundiais, na qual podemos

observar uma ampla distribuição e o compartilhamento de haplótipos, entre as regiões. A

África apresentou um padrão de distribuição de haplótipos diferente do encontrado nas

demais regiões, com a maioria dos seus haplótipos (coloridos de vermelho) presentes na

região mais periférica da rede haplotípica, apresentando as menores freqüências, o que é

explicado devido à grande concentração de haplótipos únicos nessa região. Percebemos,

também, a presença do efeito fundador, com alguns poucos haplótipos muito freqüentes e

apenas um único haplótipo distribuído entre todas as regiões mundiais.

Page 77: TESE DE DOUTORADO - ICB

77

Figura 16. Rede haplotípica construída com os haplótipos das cinco principais regiões do Painel do

HGDP-CEPH. As diferentes cores representam cada região, o tamanho dos círculos é proporcional ao

número de indivíduos, em cada haplótipo.

Page 78: TESE DE DOUTORADO - ICB

78

Na Figura 17, visualizamos a mesma rede haplotípica da Figura 16, destacando em

cores, os haplótipos que possuem o alelo com a ausência da inserção DXS225 nas cinco

regiões do Painel do HGDP-CEPH, e nas setas, os haplótipos formados pelos marcadores:

DXS1012, DXS1002, DXS225, DXS1019 e DXS8114, respectivamente. Nas setas, podemos

observar o haplótipo formado pelos alelos 9, 15, 0, 27, 21, o qual é o mais freqüente e o único

compartilhado entre todas as regiões. Próximo a ele, encontramos o haplótipo 10, 15, 0, 27,

21, presente em todas as regiões, exceto na Oceania; e o haplótipo 9, 15, 0, 27, 20, presente

no Leste Asiático, na Oceania e América. A ampla distribuição desses três haplótipos sugere

que eles pertencem ao grupo de haplótipos fundadores que saíram da África e se expandiu

para os demais continentes (Figura 17). O haplótipo 13, 16, 0, 27, 20 é o segundo mais

freqüente, visto na Eurásia e no Leste Asiático. Agrupado próximo a ele com diferença de um

e dois passos mutacionais, respectivamente, estão os haplótipos 13,16,0,27,21 e

14,16,0,27,21, ambos encontrados na Eurásia, Leste Asiático e Oceania, que formam um

segundo grupo de haplótipos que devem ter saído da África e se fixado nessas regiões,

devido ao efeito fundador.

Page 79: TESE DE DOUTORADO - ICB

79

Figura 17. Rede haplotípica construída com os haplótipos das regiões do Painel do HGDP-CEPH.

Destacados em cores os haplótipos que possuem o alelo com a ausência da inserção (DXS225). Nas

setas, os prováveis haplótipos fundadores dentro e fora da África, formados pelos marcadores

DXS1012, DXS1002, DXS225, DXS1019 e DXS8114.

Page 80: TESE DE DOUTORADO - ICB

80

Na Figura 18, a mesma rede haplotípica é representada dando destaque, em cores,

aos haplótipos com a presença da inserção DXS225, e as setas, destacam os haplótipos

mais freqüentes. Os haplótipos mais freqüentes com a presença da inserção são o

11,14,1,25,18, encontrado na África, Leste Asiático e Eurásia, e o 10,14,1,25,17, visto no

Leste Asiático e na Eurásia, formados pelos marcadores DXS1012, DXS1002, DXS225,

DXS1019 e DXS8114, respectivamente. O número restrito de haplótipos demonstra a

ocorrência de gargalos populacionais que reduziram o número de haplótipos durante o

período em que o homem saiu da África, seguido por efeitos fundadores que fixaram esses

haplótipos nas demais regiões. O haplótipo 11,14,1,25,18 é o mais freqüente e,

provavelmente, saiu da África levando a inserção DXS225 para as demais regiões mundiais.

Para destacar a distribuição da inserção DXS225 nas principais regiões mundiais do Painel

HGDP-CEPH, a Figura 19 representa, separadamente, a presença da inserção em cada

região.

Page 81: TESE DE DOUTORADO - ICB

81

Figura 18. Rede haplotípica em que se destaca, em cores, a presença da inserção DXS225 nas

principais regiões mundiais (África, Eurásia, Leste asiático e Oceania). As setas destacam os

haplótipos formados pelos marcadores DXS1012, DXS1002, DXS225, DXS1019 e DXS8114.

Page 82: TESE DE DOUTORADO - ICB

82

Figura 19. Redes haplotípicas em que se destaca, em preto, a presença da inserção DXS225 nas

principais regiões mundiais (África, Eurásia, Leste asiático e Oceania).

Page 83: TESE DE DOUTORADO - ICB

83

4.2.2.3 Análise de Componente Principal

A análise de componente principal (revisada por Cavalli-Sforza et al.,1994) foi feita por

meio do programa POPSTR (Harpending, 1994), com os dados das freqüências dos

haplótipos do bloco haplotípico. Na Figura 20, está a representação gráfica do PCA para as

sete regiões do HGDP-CEPH (África, Oriente Médio, Ásia Central, Leste Asiático, Oceania,

Europa e América), onde confirmamos o agrupamento das regiões Oriente Médio, Ásia

Central e Europa que compõem a Eurásia. Na Figura 21, há representação gráfica do

primeiro e segundo componentes, o qual apresentou 63,6% da informação, para as cinco

principais regiões (África, Leste Asiático, Eurásia, Oceania e América), com o primeiro

componente separando a África da Oceania e América, enquanto que o segundo separa a

Eurásia e o Leste Asiático da Oceania e América.

Page 84: TESE DE DOUTORADO - ICB

84

Figura 20. Representação gráfica da análise de componente principal com as freqüências haplotípicas

das sete regiões mundiais do Painel do HGDP-CEPH. O primeiro componente apresentou 28% da

informação e o segundo, 22%.

Page 85: TESE DE DOUTORADO - ICB

85

Figura 21. Representação gráfica da análise de componente principal com as freqüências haplotípicas

das cinco principais regiões mundiais do Painel do HGDP-CEPH. O primeiro componente apresentou

35% da informação e o segundo, 28,6%.

Page 86: TESE DE DOUTORADO - ICB

86

4.2.2.4 Análise de Coalescência

As análises de coalescência foram realizadas por meio do programa BATWING (Wilson

et al., 2003), pelo autor do programa, Prof. Ian Wilson, em colaboração com o nosso trabalho

para que realizássemos uma análise genealógica dos dados do nosso bloco haplotípico.

Esse programa utiliza o método de MCMC (Markov Chain Monte Carlo), baseado na teoria de

coalescência para gerar uma aproximação aleatória das amostras a partir de uma distribuição

posteriori dos parâmetros analisados, como: taxa de mutação, tamanho efetivo populacional,

taxas de crescimento populacional e o tempo de divergência entre populações. As análises

realizadas com o programa BATWING foram feitas com os dados das amostras do Painel do

HGDP-CEPH, em que excluem as populações da Oceania, por ser uma amostra reduzida, e

a população Karitiana (conforme explicação abordada no início do capítulo). Na análise

genealógica utilizou-se o modelo coalescente, com crescimento constante a partir de uma

população com tamanho efetivo constante (Wilson et al., 2003). Esse modelo assume uma

população ancestral pequena (com tamanho populacional N), que cresce com uma taxa de

α% por geração até o seu tamanho Nexp (κ), no presente, o que determina a época em que o

crescimento populacional começou. Para essas análises, é necessária a distribuição a priori

para os parâmetros utilizados: taxa de mutação (µ), taxa de crescimento por geração (α),

tamanho populacional das populações atuais e ancestrais (κ), tamanho populacional

ancestral (N) e, também, os parâmetros que determinam o perfil da história populacional.

Para essa análise, foi utilizado o modelo de mutação stepwise mutation (SMM), que

considera que o número de repetição de um determinado microssatélite pode aumentar ou

diminuir uma repetição a cada evento mutacional, e que tanto o aumento ou a diminuição de

uma repetição são igualmente prováveis para os quatro microssatélites (DXS1012, DXS1002,

DXS1019 e DXS8114). A inserção DXS225 foi considerada, como um polimorfismo de evento

único (UEP), que assume ser um único evento mutacional responsável pelo polimorfismo

observado. Foram utilizadas diferentes taxas de mutação para cada microssatélite, com a

distribuição gamma com parâmetros de 1,35 e 740,4, fornecendo uma taxa de mutação

Page 87: TESE DE DOUTORADO - ICB

87

média de 0,0018±0,0016. Esse parâmetro foi estimado a partir da análise relativa das taxas

de mutação descritas por Xu et al.,(2005). O parâmetro utilizado foi escolhido para fornecer

uma taxa de mutação média de, aproximadamente, 2x10-3 (Mountain et al., 2002). Todos os

conjuntos de dados analisados apresentaram valores similares para as taxas de mutação

relativas para os quatro locos de microssatélites. O microssatélite DXS1019 foi o que

apresentou a menor taxa de mutação, comparada com os demais microssatélites, enquanto

que o DXS1002 apresentou um valor intermediário (Figura 24 e Tabela 10).

Page 88: TESE DE DOUTORADO - ICB

88

Figura 22. Apresentam-se os resultados da análise do BATWING com as amostras das populações da

África, Oriente Médio, Ásia Central, Leste Asiático, Europa e América do Painel do HGDP-CEPH. As

taxas de mutação, por geração, para os quatro microssatélites do bloco haplotípico. As linhas

representam as densidades a priori e, os histogramas a posteriori. Gráficos foram produzidos pelo

Prof. Ian J. Wilson, do Departamento de Genética Humana da Universidade de Newcastle, do Reino

Unido.

Page 89: TESE DE DOUTORADO - ICB

89

Na Tabela 10, temos as médias e os quantiles a priori calculados pelo BATWING com

as populações da África, Oriente Médio, Ásia Central, Leste Asiático, Europa e América, para

os parâmetros populacionais. Os valores encontrados foram utilizados para o cálculo a

posteriori dos mesmos parâmetros (Tabela 11).

Na Tabela 11, estão apresentadas as estimativas calculadas para o tempo do mais

recente ancestral comum (TMRCA), de 182.000 anos (95% - intervalo de confiança- 56.700-

479.000), para os dados do nosso bloco haplotípico com as populações do Painel do HGDP-

CEPH, e a estimativa para o surgimento da inserção Alu (DXS225) de 94.000 anos (95%-

intervalo de confiança- 24.300-310.000).

Todas as análises foram feitas com a utilização de cinco corridas independentes, com

42.000 amostragens, sendo as primeiras 2.000 removidas de cada corrida e com 100 árvores

reorganizadas entre cada alteração do parâmetro populacional, apenas a cada 200.000

amostragens. Isto nos forneceu um tamanho amostral de 200.000 para a construção empírica

da distribuição posterior. Na Figura 25, estão representados a comparação dos valores a

priori e a posteriori de alguns parâmetros populacionais, como tamanho populacional

ancestral (N), taxa de crescimento por geração (α), tempo desde o início do crescimento, e

razão entre tamanho populacional atual e passado (κ), para os dados relativos às populações

do Painel do HGDP-CEPH (excluindo-se a Oceania e a população Karitiana). Todos os

parâmetros apresentaram pouca variação entre a distribuição a priori e a posteriori.

Page 90: TESE DE DOUTORADO - ICB

90

Tabela 10. Médias e quantiles a priori da análise do BATWING para os parâmetros

populacionais.

Parâmetros Populacionais Média 2,5% 50% 97,5% Tamanho Populacional, N (x103) 15 4,88 14 30,7 Taxa de mutação (µ) (x10-3) 1,83 0,11 1,40 5,93 Taxa de crescimento,α (%por geração) 0,5 0,061 0,419 1,395 Tempo desde o crescimento inicial (x103) 51,8 5,58 27,9 220 Tempo de divergência da África (x103) 87,4 2,85 68,9 274 TMRCA (x103) 680 164 558 1910

Tabela 11. Médias e quantiles a posteriori das análises do BATWING para os parâmetros

populacionais.

Parâmetros Populacionais Média 2,5% 50% 97,5% Tamanho populacional, N (x103) 13,9 4,3 12,8 29,7 Taxa de mutação (µ) para DXS1012 (x10-3) 2,71 1,23 2,57 5,00 Taxa de mutação (µ) para DXS1002 (x10-3) 1,04 0,45 0,98 1,95 Taxa de mutação (µ) para DXS1019 (x10-3) 0,34 0,14 0,32 0,67 Taxa de mutação (µ) para DXS8114 (x10-3) 2,93 1,34 2,78 5,38 Taxa de crescimento,α (%por geração) 0,45 0,034 0,247 1,724 Tempo desde o crescimento inicial (x103) 26,2 1,79 12 121 Tempo de divergência da África (x103) 9,95 2,77 9,08 22,5 TMRCA (x103) 182 56,7 153 479 Tempo da inserção DXS225 (x103) 94,4 24,3 70,5 310

Page 91: TESE DE DOUTORADO - ICB

91

Figura 23. Apresentam-se os resultados da análise do BATWING com as amostras das populações da

África, Oriente Médio, Ásia Central, Leste Asiático, Europa e América do Painel do HGDP-CEPH.

Distribuição priori e posteriori dos parâmetros populacionais. As linhas representam as densidades a

priori e histogramas a posteriori. Os gráficos foram produzidos pelo Prof. Ian J. Wilson, do

Departamento de Genética Humana da Universidade de Newcastle, do Reino Unido.

Page 92: TESE DE DOUTORADO - ICB

92

4.2.3 DISCUSSÃO

Neste capítulo, utilizamos um bloco haplotípico do cromossomo X formado por quatro

microssatélites (DXS1012, DXS1002, DXS1019 e DXS8114) e uma inserção Alu (DXS225),

que estão em completo desequilíbrio de ligação, para estudarmos a filogeografia das

populações mundiais do Painel do HGDP-CEPH (Rosenberg, 2006). Foram analisados 667

homens não-aparentados, representando 51 populações distribuídas entre as cinco principais

regiões mundiais (África, Leste Asiático, Eurásia, Oceania e América). Dessas análises, foi

excluída a população Karitiana, devido à sua provável mistura com populações africanas ou

européias, e as regiões Oriente Médio, Ásia Central e Europa foram agrupadas em uma única

região, a Eurásia, por revelarem alta similaridade genética.

Na análise haplotípica dos dados do bloco haplotípico composto de 667 indivíduos,

encontramos um total de 187 haplótipos, dos quais 129 eram haplótipos região-específico, ou

seja, aqueles encontrados apenas em uma única região (Tabela 8), e os 58 haplótipos

restantes foram compartilhados entre as demais regiões. Dos haplótipos compartilhados

entre as regiões, apenas um foi compartilhado entre todas as regiões do Painel HGDP-

CEPH. A diversidade haplotípica encontrada entre os 667 indivíduos foi bastante alta

(0,976±0,002), perfil que se repetiu em cada região, com exceção apenas da Oceania e da

América, que possuem os menores índices de diversidade (0,885±0,047 e 0,839±0,038,

respectivamente) (Tabela 8). A maior diversidade haplotípica foi encontrada na África

(0,992±0,003), que representa apenas 14,6% dos indivíduos, enquanto que contém 38% do

total de haplótipos e 44% dos haplótipos região-específico encontrados. Este padrão de alta

diversidade africana permanecem quando analisamos os haplótipos com a presença da

inserção (0,952±0,027) e na ausência da inserção (0,991±0,003) DXS225, separadamente.

Esse perfil de alta diversidade na África, sugere para o homem moderno uma origem

africana e recente. As demais regiões não-africanas representam apenas um subconjunto da

variabilidade encontrada na África. Então se espera que nas regiões de povoamento mais

Page 93: TESE DE DOUTORADO - ICB

93

recente, ocorra uma diminuição na diversidade, principalmente na região das Américas, onde

efeitos fundadores tiveram grande importância durante o povoamento do continente (Santos

et al., 1999). Visualizamos esse padrão em nosso bloco haplotípico, com uma grande

diminuição da diversidade genética, depois que o homem saiu da África (0,992±0,003) para o

Leste Asiático (0,967±0,005), e em seguida, uma menor redução do Leste Asiático para a

Eurásia (0,953±0,006) e uma brusca redução do Leste Asiático para a Oceania

(0,885±0,047). No entanto, a maior redução da variabilidade ocorre do Leste Asiático para a

América (0,839±0,037), durante o povoamento das Américas, que foi acompanhado de um

significante gargalo populacional, o qual reduziu a diversidade. Acreditamos também que

tenha fixado os alelos mais freqüentes, principalmente os que não possuíam a inserção

DXS225, que não é encontrada nas populações Ameríndias pré-colombianas. Esse padrão

corrobora com a teoria de que a expansão do homem moderno começou na África, seguida

de uma série de efeitos fundadores (Ramachandran et al., 2005). A alta diversidade africana

também é observada em outros marcadores moleculares, como, por exemplo, o DNA

mitocondrial (Cann et al, 1987) e o cromossomo Y (Jorde et al., 2000), sendo esse padrão

utilizado como evidência para a Teoria “Out of Africa” referente à origem do homem moderno.

Nossas análises de compartilhamento de haplótipos estão representadas na Figura

15, onde podem ser observadas as proporções de compartilhamento entre as cinco principais

regiões do Painel do HGDP-CEPH. As menores proporções de compartilhamento foram

encontradas na África, enquanto que as maiores foram vistas na América. Com os resultados

do compartilhamento, podemos inferir uma possível relação genealógica entre as

populações, principalmente quando observamos o Leste Asiático, que contém 50% dos

haplótipos vistos na Oceania e 70% dos encontrados na América, enquanto que a Oceania

possui apenas 7% e a América 10,4% dos encontrados no Leste Asiático, indicando uma

relação genealógica parental do Leste Asiático para a Oceania e América. No caso da

América essa relação é descrita por Santos et al.,(1999), que sugere que tal relação não

deve ter ocorrido há muito tempo, o que também é observado com nossos dados, pois não

houve tempo suficiente para uma diversificação haplotípica por mutação nos Ameríndios. Ao

Page 94: TESE DE DOUTORADO - ICB

94

contrário do que podemos observar na relação parental da África com o Leste Asiático, com

apenas 7% e 7,5% dos haplótipos compartilhados entre essas duas regiões. Por ser uma

relação parental mais antiga, houve tempo para ocorrer uma diversificação, devido a

mutações e outros fatores evolutivos, como o fluxo gênico com outras regiões, que podem ter

contribuído para a diferenciação haplotípica entre as regiões.

A partição da variabilidade genética, medida com a AMOVA para o bloco haplotípico,

revela pouca estruturação genética com os maiores níveis de variabilidade genética

encontrados dentro das populações (95,2%), enquanto se nota apenas 1,7% da variabilidade

presente entre as populações dentro das regiões e 3,1% entre as cinco principais regiões

(Tabela 9). Nossos índices de variabilidade são semelhantes aos encontrados por Rosenberg

et al., (2002), para as mesmas populações, no estudo de 377 microssatélites autossômicos,

com 93,2% da variação dentro das populações; 2,5% entre as populações dentro das

regiões; e 4,3% entre as cinco regiões mundiais. Quando fazemos a AMOVA para cada

região, observamos também um maior componente de variação dentro das populações com

valores maiores que 95%, com exceção das regiões Oceania e América que apresentam

valores de componentes de variação maiores entre as populações (14,95% e 15,29%,

respectivamente). Essa maior variabilidade inter-populacional nas populações da América e

Oceania pode ser explicada pelos altos níveis de deriva genética encontrada, principalmente

nas Américas (Cavalli-Sforza et al., 1994). Além disso, outro fator que pode ter contribuído

para a variabilidade entre as populações da Oceania do Painel do HGDP-CEPH, fato de ser

composta por apenas duas populações (Papuan, da Nova Guiné, e Nan Melanesian, de

Bougainville) que são geneticamente distintas, como vimos na AMOVA apenas com o

marcador DXS225 (Tabela 5). Apesar da pouca estruturação genética vista na AMOVA,

podemos considerar nosso bloco haplotípico como um marcador informativo para estudar a

partição da variabilidade genética das populações humanas.

Nas redes haplotípicas construídas, podemos observar uma ampla distribuição e

compartilhamento dos haplótipos. A África foi a única região que apresentou um padrão de

distribuição de haplótipos distinto das demais regiões, com a presença da maioria dos seus

Page 95: TESE DE DOUTORADO - ICB

95

haplótipos distribuídos na região mais periférica da rede, com freqüências menores

representando os haplótipos únicos encontrados nessa região (Figura 16). No entanto, as

regiões do Leste Asiático, Eurásia, Oceania e América formaram dois grupos compostos

pelos haplótipos com ausência da inserção DXS225, destacado na Figura 17, e apenas um

grupo com os poucos haplótipos que possuem a presença da inserção destacados na Figura

18. Esses agrupamentos formados pelos haplótipos encontrados fora da África, na sua

maioria são pequenos e com poucos haplótipos bastante freqüentes, o que indica a presença

de efeito fundador, fato que pode ser considerado como mais uma evidência para a ausência

de recombinação, pois, com a recombinação esse efeito teria desaparecido ao longo do

tempo.

Utilizamos as redes haplotípicas para fazer inferências sobre os haplótipos ancestrais

encontrados dentro e fora da África. Na Figura 17, destacado por setas, observamos o

haplótipo 9, 15, 0, 27, 21, o mais freqüente e o único compartilhado entre todas as regiões

mundiais. Próximos a ele, estão outros dois haplótipos: o 10, 15, 0, 27, 21, presente em todas

as regiões, exceto na Oceania, e o 9, 15, 0, 27, 20, presente no Leste Asiático, Oceania e

América. A ampla distribuição desses três haplótipos sugere que eles pertencem ao grupo

inicial de haplótipos fundadores que saíram da África e expandiram-se pelos demais

continentes (Figura 17). Outro grupo de haplótipos formado pelo 13, 16, 0, 27, 20, o segundo

mais freqüente, é visto na Eurásia e no Leste Asiático, e próximos a ele, com diferença de um

e dois passos mutacionais, estão os haplótipos 13,16,0,27,21 e 14,16,0,27,21, ambos

encontrados na Eurásia, Leste Asiático e Oceania. Esses haplótipos, provavelmente, formam

o segundo grupo de haplótipos que emergiu da África.

Quando observamos a Figura 18, os haplótipos com a presença da inserção DXS225,

vemos apenas dois haplótipos mais freqüentes: o 11,14,1,25,18, encontrado na África, Leste

Asiático e Eurásia, e o 10,14,1,25,17, visto no Leste Asiático e na Eurásia, os quais formam

um único agrupamento. Esse pequeno número de haplótipos com a presença da inserção

sugere a ocorrência de gargalos populacionais durante o período de saída do homem, da

região da África, reduzindo o número de haplótipos e a diversidade genética fora da África.

Page 96: TESE DE DOUTORADO - ICB

96

Essa forte redução da diversidade genética é revelada pelos índices de diversidade

encontrada dentro da África, com a presença da inserção DXS225 (0,952±0,027), se

compararmos com os índices de diversidade encontrado fora da África, de apenas

0,854±0,020. Assim, a redução é menos acentuada para os haplótipos sem a inserção

DXS225, com índices de 0,991±0,003 na África e de 0,962±0,004 fora da África.

A representação gráfica da análise de componente principal (Figura 20), para as sete

regiões do Painel HGDP-CEPH, confirmam o agrupamento entre as regiões que compõem a

Eurásia (Oriente Médio, Ásia Central e Europa). O gráfico da PCA, para as cinco regiões,

apresentou 63,6% da informação, mostrando que há separação entre a África e demais

regiões (Figura 21).

Com a análise de coalescência, foi possível estimar o tempo do mais recente

ancestral comum (TMRCA) para o nosso bloco haplotípico de 182.000 anos (95% de limites

de confiança 56.700-479.000), verificamos amplos intervalos de confiança com nossos

dados, tal como outros trabalhos que utilizam dados do cromossomo X para estimativa do

TMRCA (Shimaka et al., 2007). No entanto, o TMRCA estimado por meio de nossos dados é

compatível com evidências genéticas (Macaulay et al., 2005) e paleontológicas para a origem

do homem moderno na África há 195.000 anos (McDougall et al., 2005) e confirma o padrão

intermediário do nosso bloco haplotípico, em comparação com os marcadores de linhagem

que possuem um TMRCA de 100.000-200.000 anos (Weiss et al., 1996; Igman et al.,2000) e

os autossomos com 750.000 anos para o gene da � globina no cromossomo 11 (Harding et

al., 1997).

Na Tabela 11, estão os resultados posteriori das análises feitas com o programa

BATWING, que permitiu estimar que o evento de inserção da DXS225 ocorreu há 94.400

anos (95% de limites de confiança 24.300-310.000), corroborando com a origem da inserção

antes de o homem sair da África, já que se pressupõe que a saída da África para a Ásia deve

ter ocorrido há 55.000-65.000 anos (Liu et al.,2006; Mellars, 2006).

Page 97: TESE DE DOUTORADO - ICB

97

A estimativa das taxas de mutação, para cada microssatélite do bloco haplotípico,

demonstrou que o DXS1019 possui a menor taxa de mutação do bloco haplotípico (Tabela

10, Figura 22).

A estimativa do tempo de divergência da África foi de apenas 9.950 anos (95% de

limites de confiança 2.770-22.500), que é uma estimativa bastante baixa em comparação

com outros marcadores, como o DNA mitocondrial (45.000-75.000 anos) (Macaulay et al.,

2005) e com dados paleontológicos (90.000-130.000 anos) (Trinkaus, 2005), o que pode ter

ocorrido devido a migrações adicionais, após a separação das populações, que pode ter

mascarado os sinais de divergência, diminuindo o tempo observado.

Com os resultados observados neste capítulo, podemos concluir que o bloco

haplotípico do cromossomo X analisado é uma ferramenta bastante informativa para estudos

filogeográficos. E que os nossos dados corrobora com a teoria “Out of África” para a saída

do homem moderno da África.

Os referidos resultados foram publicados no artigo de Santos-Lopes et al., 2007

(Anexo 2).

Page 98: TESE DE DOUTORADO - ICB

98

4.3 CAPÍTULO 3 - ANÁLISE DA DIVERSIDADE E ANCESTRALIDADE

GENÉTICAS DA POPULAÇÃO BRASILEIRA (BRANCOS E PRETOS) DA CIDADE

DE SÃO PAULO

4.3.1 INTRODUÇÃO

A matriz triíbrida brasileira envolveu os Ameríndios nativos, Europeus colonizadores e

escravos Africanos (Ribeiro, 1995). Cinco séculos de cruzamentos interétnicos originaram a

ampla heterogeneidade genética brasileira, que pode ser estudada em nível molecular, por

meio de diferentes marcadores genéticos. Atualmente, os marcadores de linhagens, o

cromossomo Y e o DNA mitocondrial, que fornecem informações sobre as linhagens paterna

e materna, respectivamente, são os mais estudados.

Trabalhos iniciais com populações brasileiras foram publicados por nosso grupo

(Laboratório de Genética Bioquímica da UFMG), aos quais foi possível demonstrar que a

maioria das patrilinhagens dos indivíduos auto-classificados como brancos brasileiros é de

origem européia (Carvalho-Silva et al., 2001), enquanto que 60% das matrilinhagens são de

origem ameríndia ou africana (Alves-Silva et al., 2000). Esses resultados corrobora com

dados históricos que descrevem o processo de miscigenação entre os homens imigrantes

(principalmente portugueses), e as mulheres indígenas e africanas (Ribeiro, 1995).

Outra questão investigada pelo nosso grupo foi a existência de uma correlação entre a

cor da pele e a ancestralidade genômica, inicialmente por meio de marcadores informativos

de ancestralidades (AIMs) (Parra et al., 2003), e mais recentemente, com microssatélites

autossômicos (Pimenta et al., 2006), demonstrando que, em nível individual, existe pouca

correlação entre cor e ancestralidade genômica.

Atualmente, os estudos com populações brasileiras têm procurado investigar a origem

dos escravos africanos que vieram para o Brasil (Silva et al., 2006; Hünemeier et al., 2007;

Gonçalves et al., 2008), pois, diferentemente das migrações para as colônias européias nas

Américas, a migração para o Brasil envolveu africanos vindos de todas as principais regiões,

Page 99: TESE DE DOUTORADO - ICB

99

principalmente das regiões do Ocidente, Oriente, Sudoeste e Sudeste (Moçambique)

africanas (Klein, 2002).

Neste capítulo, vamos utilizar o bloco haplotípicos para analisar a diversidade genética

e a ancestralidade de brasileiros. Para isso, foram analisados 97 indivíduos classificados

como Pretos e 107 indivíduos classificados como Brancos, da cidade de São Paulo. Os

indivíduos foram classificados por critérios fenotípicos e genealógicos, conjuntamente.

Primeiramente, perguntava-se aos indivíduos a qual grupo de cor pertenciam, segundo a

definição do IBGE (Brancos, Pardos e Pretos), e após a sua inclusão em um grupo de cor, os

indivíduos classificavam os seus pais e todos seus avós. A análise fenotípica foi realizada por

um entrevistador, que observou as características faciais e a pigmentação da axila, região do

corpo não-exposta ao sol, de cada indivíduo. Assim, os indivíduos foram classificados como

Brancos, Pardos ou Pretos, mas analisamos, apenas os grupos de Pretos e Brancos. Os

indivíduos eram classificados como Pretos quando as características fenotípicas estavam

presentes, e seus pais e todos os seus avós eram definidos como Pretos. Todos os estudos

foram anônimos, com o consentimento dos participantes, e aprovados pelo comitê de ética da

USP. As amostras utilizadas nesses estudos foram cedidas pelo Professor Sérgio Bydlowski,

da Faculdade de Medicina da Universidade de São Paulo.

Os dados das populações parentais da África sub-sahariana e Eurásia foram obtidos

por meio de amostras do Painel do HGDP-CEPH, estudadas no Capítulo 2 desta tese.

Para as análises realizadas neste capítulo, reduzimos o bloco haplotípico para os dois

microssatélites (DXS1002 e DXS1019) e a inserção Alu (DXS225). Selecionamos os

microssatélites que possuem as taxas de mutação mais baixas do bloco haplotípico: a taxa

de mutação do DXS1002 é de 1,04x10-3, e a do DXS1019 é de 0,34 x 10-3 (Tabela 11 e

Figura 23). Fizemos a redução do bloco haplotípico para três marcadores, visando ampliar o

compartilhamento de haplótipos entre os grupos de brasileiros (Brancos e Pretos) e as

populações ancestrais (África sub-sahariana e Eurásia), pois, com a análise do bloco

completo, o compartilhamento encontrado foi baixo.

Page 100: TESE DE DOUTORADO - ICB

100

Os resultados obtidos neste capítulo foram reunidos em manuscrito em fase de

preparação (Anexo 3).

4.3.2 RESULTADOS

4.3.2.1 Diversidade haplotípica

Na análise inicial dos dois grupos de brasileiros, classificados como Pretos e Brancos

de São Paulo, com o bloco haplotípico completo (DXS1012, DXS1002, DXS225, DXS1019 e

DXS8114), observamos 119 haplótipos nos 204 indivíduos, sendo 58 nos Brancos e 79 nos

Pretos. A diversidade haplotípica, para os brasileiros, foi de 0,987±0,002, e a encontrada nos

Brancos de 0,972±0,006, e nos Pretos de 0,994±0,002.

Já com bloco haplotípico reduzido, formado pelos marcadores DXS1002, DXS225 e

DXS1019, encontramos um total de 42 haplótipos entre os 204 indivíduos brasileiros

classificados como Pretos e Brancos de São Paulo. Desses haplótipos, um total de 32 foi

encontrado nos Pretos brasileiros e apenas 18 entre os Brancos brasileiros. Nas populações

parentais, encontramos 23 haplótipos nas populações da África e 24 nas populações da

Eurásia. A diversidade haplotípica, para os brasileiros (Brancos e Pretos), foi de 0,869±0,014,

e esse índice difere bastante quando observamos os grupos de brasileiros separadamente.

Nos indivíduos Pretos brasileiros, encontramos uma diversidade haplotípica (0,905±0,018)

bem maior que a dos Brancos brasileiros (0,826±0,022). No entanto, esses valores foram

intermediários aos encontrados na África (0,947±0,006) e na Eurásia (0,754±0,015) (Tabela

12).

Page 101: TESE DE DOUTORADO - ICB

101

Tabela 12. Número de indivíduos, haplótipos e diversidade haplotípica para a população

brasileira e as populações parentais do HGDP-CEPH.

Bloco haplotípico completo Amostras Número de

indivíduos Número de haplótipos

Diversidade Haplotípica

Brancos Brasileiros 107 58 0,972±0,006 Pretos Brasileiros 97 79 0,994±0,002 Eurásia 342 87 0,953±0,006 África 98 71 0,992±0,003 Brasil* 204 119 0,987±0,002

Bloco haplotípico reduzido Brancos Brasileiros 107 18 0,826±0,022 Pretos Brasileiros 97 32 0,905±0,018 Eurásia 342 24 0,754±0,015 África 98 23 0,947±0,006 Brasil* 204 42 0,869±0,014 *Brasil compreende indivíduos Brancos e Pretos.

Page 102: TESE DE DOUTORADO - ICB

102

4.3.2.2 Compartilhamento de haplótipos

No compartilhamento de haplótipos com os dados do bloco haplotípico completo,

verificamos a proporção de haplótipos compartilhados entre os brasileiros e as populações

parentais (África e Eurásia). A partir dessa análise, observamos uma alta proporção de

compartilhamento entre os Brancos brasileiros com 50% (29/58) dos seus haplótipos

compartilhados com a Eurásia, 24% (14/58) com os africanos e 31% (18/58) com os Pretos

brasileiros, enquanto que a proporção de compartilhamento entre os Pretos brasileiros tem

valores intermediários entre as populações parentais e Brancos brasileiros, com 24% (19/79)

de haplótipos compartilhados com a Eurásia, 20% (16/79) com os africanos e 23% (18/79)

com os Brancos brasileiros.

Na análise com o bloco haplotípico reduzido, os indivíduos Brancos brasileiros

também apresentaram uma maior proporção de haplótipos compartilhados, com 77,7%

(14/18) dos seus haplótipos compartilhados com os Pretos, 77,7% (14/18) com a África e

72,2% (13/18) com a Eurásia. E os indivíduos Pretos brasileiros apresentaram o mesmo perfil

intermediário de compartilhamento, com 43,7% (14/32) com os Brancos, 59,3% (19/32) com a

África e 56,2% (18/32) com a Eurásia. No entanto, a proporção de haplótipos compartilhados

com as populações parentais aumentou.

4.3.2.3 Análise de Variância Molecular (AMOVA)

A análise de variância molecular (AMOVA) foi realizada usando-se as freqüências

haplotípicas dos Pretos e Brancos brasileiros, e as populações da África e Eurásia. Quando

fazemos a AMOVA com indivíduos Pretos e Brancos brasileiros, observamos uma

similaridade genética, com a maior parte da variação encontrada dentro das populações, com

99,1% para o bloco haplotípico completo, 98,6% para o bloco reduzido, apenas 0,99% para

bloco completo e 1,3% para o bloco reduzido entre os Brancos e Pretos brasileiros (Tabelas

13 e 14). Na AMOVA com as 28 populações, incluindo Brasileiros (Pretos e Brancos), África e

Eurásia, encontramos os componentes de variação dentro das populações de 97,6% e

Page 103: TESE DE DOUTORADO - ICB

103

93,2%; entre as populações com 1,4% e 2,9%; e entre os grupos, de 0,97% e 3,8%, para o

bloco haplotípico completo e o reduzido, respectivamente (Tabelas 13 e 14).

Tabela 13. Análise de variância molecular para o bloco haplotípico completo (DXS1012,

DXS1002, DXS225, DXS1019 e DXS8114 ) para os Brasileiros, África e Eurásia.

Amostra Número de regiões

Número de populações

Componentes de variação (%)

Dentro das populações

Entre populações dentro de regiões

Entre regiões

Brasileiros* 1 2 99,10 0,99 - Brasileiros,

África e Eurásia 3 28 97,60 1,4 0,97

Todos os valores foram significativos para p<0,005. *Brasileiros- indivíduos Brancos e Pretos. Tabela 14. Análise de variância molecular para o bloco haplotípico (DXS1002, DXS225 e

DXS1019 ) para os Brasileiros, África e Eurásia.

Amostra Número de regiões

Número de populações

Componentes de variação (%)

Dentro das populações

Entre populações dentro de regiões

Entre regiões

Brasileiros* 1 2 98,62 1,3 - Brasileiros,

África e Eurásia 3 28 93,24 2,94 3,83

Todos os valores foram significativos para p<0,005. *Brasileiros- indivíduos Brancos e Pretos.

Page 104: TESE DE DOUTORADO - ICB

104

Após a análise do compartilhamento de haplótipos e AMOVA, verificamos uma maior

proporção de haplótipos compartilhados entre os brasileiros com as populações parentais, e

uma maior diferenciação genética nos dados do bloco haplotípico reduzido. Devido a isso,

realizamos as demais análises apenas com o bloco haplotípico formado pelos três

marcadores (DXS1002, DXS225 e DXS1019 ).

4.3.2.4 Ancestralidade dos haplótipos do cromossomo X

Para estimar a contribuição ancestral relativa das populações parentais (África e

Eurásia) para indivíduos Pretos e Brancos brasileiros, utilizamos o programa LEADMIX 1.0,

que utiliza um método de maximum likelihood, desenvolvido por Wang (2003), com os dados

apenas do bloco haplotípico reduzido (DXS1002, DXS225 e DXS1019 ). As análises foram

realizadas usando-se 500 integrações no cálculo de Likelihood.

O LEADMIX calculou, para os Pretos brasileiros, uma ancestralidade africana de 0,54

(com 95% de intervalo de confiança 0,254-1,314) e uma ancestralidade Euroasiática de 0,45

(95% CI- 0,314-0,745). Os valores de ancestralidade, africana para os indivíduos Brancos

brasileiros, foram de apenas 0,29 (95% CI-0,007-0,683), e 0,71 (95% CI-0,361- 0,992) de

ancestralidade Euroasiática. A alta proporção de ancestralidade Euroasiática nos Brancos

(71%) e Pretos (45%) brasileiros se deve à reprodução preferencial, ocorrida durante o inicio

do processo de povoamento das Américas, com a reprodução sendo feita entre o colonizador

Europeu (na maioria, Portugueses) e as mulheres nativas e africanas. Na Tabela 15,

podemos comparar as porcentagens da contribuição genética de africanos e euroasiáticos e

os Brancos e Pretos de São Paulo com diferentes marcadores genéticos.

Nessas análises não utilizamos dados da população parental Ameríndia, pela mesma

apresentar um alto compartilhamento com populações da Eurásia, o que não permitiu a

separação em três grupos populacionais parentais (África, Eurásia e América).

Page 105: TESE DE DOUTORADO - ICB

105

Tabela 15. Porcentagem da contribuição genética dos africanos e euroasiáticos para os

Brancos e Pretos de São Paulo com diferentes marcadores genéticos.

Brancos de São Paulo Marcador Contribuição

africana Contribuição euroasiática

Referência

mtDNA 27% 73% Gonçalves-Dornelas et al. (artigo em preparação)

Cromossomo Y 0-4% >95% Carvalho-Silva et al. 2001 Indels autossômicos 11% 89% Bastos-Rodrigues et al.

(artigo em preparação) Cromossomo X 29% 71% Santos-Lopes et al. (artigo

em preparação) Pretos de São Paulo

mtDNA 85% 2,5% Gonçalves et al. 2008 Cromossomo Y 48% 50% Gonçalves et al. 2008

Indels autossômicos 56% 44% Bastos-Rodrigues et al. (artigo em preparação)

Cromossomo X 55% 45% Santos-Lopes et al. (artigo em preparação)

Page 106: TESE DE DOUTORADO - ICB

106

4.3.2.5 Análise de componente principal (PCA)

A análise de componente principal (PCA) foi feita utilizando-se as freqüências

haplotípicas, para os Pretos e Brancos brasileiros, populações da África e Eurásia (Figura

24), que apresentou 91% da informação nos dois componentes. O primeiro componente, com

59,3% da informação, separou a África dos Pretos brasileiros, e o segundo componente

separou a África e os Pretos da Eurásia e dos Brancos brasileiros.

Os Pretos brasileiros e a África não apresentaram proximidade no gráfico de PCA,

devido a esse perfil decidimos investigar a relação entre os Pretos brasileiros e os africanos

do Painel do HGDP-CEPH. Com isso fizemos uma análise de componente principal apenas

com as sete populações africanas e com os Pretos brasileiros (Figura 25), nela podemos

observar que os Pretos Brasileiros formaram um pequeno agrupamento com as populações:

Bantu_NE (Quênia), Mandenka (Senegal) e Yoruba (Nigéria) do Painel do HGDP-CEPH. Isso

significa que a separação que visualizamos, entre Pretos brasileiros e África (Figura 24), se

deve à grande diferenciação genética entre as populações africanas do Painel; e também

pela contribuição ancestral africana, específica de algumas regiões, para os Pretos

brasileiros.

Page 107: TESE DE DOUTORADO - ICB

107

Figura 24. Representação gráfica da análise de componente principal com as freqüências haplotípicas

dos Pretos e Brancos brasileiros, e as populações da África e Eurásia do Painel do HGDP-CEPH. O

primeiro componente apresentou 56,9% da informação e o segundo, 35,3%.

Figura 25. Representação gráfica da análise de componente principal com as freqüências haplotípicas

dos Pretos brasileiros e as populações da África do Painel do HGDP-CEPH. O primeiro componente

apresentou 29% da informação e o segundo, 25%.

Page 108: TESE DE DOUTORADO - ICB

108

4.3.2.6 Estrutura Populacional

A análise Bayesiana da diferenciação genética entre as populações foi realizada por

meio do programa BAPS 2.2 (Bayesian Analysis of Population Structure), desenvolvido por

Corander et al.,( 2003), e que possui a vantagem de tratar os números de diferentes

populações como um parâmetro desconhecido, o que significa que, se o programa percebe

que duas populações, devido ao alto grau de fluxo gênico ou uma recente fundação, podem

ser consideradas apenas uma única população panmítica, ele agrupa as populações. Todos

os grupos de combinações são considerados, a priori, igualmente possíveis, e o programa

fornece a partição mais provável entre os grupos populações que pode ser representado em

dendograma (Corander et al., 2004). No BAPS, utilizamos as freqüências haplotípicas do

bloco haplotípico reduzido dos Pretos e Brancos brasileiros, o que comprovou a ausência de

estrutura genética vista na AMOVA (Tabela 14). O BAPS agrupou os Pretos e Brancos

brasileiros formando um único grupo com a probabilidade posteriori igual a 1, mostrando a

similaridade genética entre esses dois grupos de brasileiros, classificados de acordo com cor

da pele.

Utilizamos a análise do BAPS com os Pretos e Brancos brasileiros, e com as

populações parentais África e Eurásia. O programa identificou, com a probabilidade posteriori

de 0,977, três agrupamentos: o primeiro, formado pelos Brancos brasileiros e a Eurásia; o

segundo, com os Pretos brasileiros; e o terceiro, formado pela África (Figura 26). Os valores

de Fst, para diferenciação dos agrupamentos, foram de 0,148±0,027 para Brancos brasileiros

e Eurásia versus Pretos brasileiros; de 0,086±0,024 para Brancos brasileiros e Eurásia

versus África; e de 0,067±0,015 para Pretos brasileiros e África. Esses agrupamentos são

formados de acordo com as freqüências similares encontradas nas populações, fornecendo

resultados semelhantes aos encontrados no gráfico de PCA (Figura 24), com o agrupamento

dos Brancos e a Eurásia, e os Pretos na localização intermediária entre a Eurásia e a África,

de acordo com as freqüência dos haplótipos.

Page 109: TESE DE DOUTORADO - ICB

109

Da mesma forma que na análise do PCA (Figura 24), fizemos a análise no BAPS

apenas com as populações africanas do Painel e os Pretos brasileiros. Dessa forma, o

programa identificou quatro agrupamentos com probabilidade posteriori de 0,565: o grupo 1,

formado pelas populações Pigmeus Biaka; o grupo 2, formado por Pretos brasileiros,

Mandenka, Yoruba e Bantu_NE; o grupo 3, por San e Bantu_SE; e o grupo 4, por Pigmeu

Mbuti. Essa partição está representada no dendograma da Figura 28. Novamente

visualizamos o agrupamento dos Pretos brasileiros com as populações do oeste africano

(Mandenka e Yoruba), cuja região é descrita por dados históricos e dados do DNA

mitocondrial como uma das regiões que mais enviou escravos africanos para o Brasil

(Gonçalves et al., 2008; Hünemeier et al., 2007). Também observamos a população de

Bantu_NE (Quênia), do leste-central africano, que também participou, mas com menores

freqüências, do tráfico de escravos para o Brasil (Silva et al., 2006).

Todas as análises foram realizadas utilizando-se uma estimativa de 100.000 passos

para MCMC e 5.000 passos de burn-in.

Page 110: TESE DE DOUTORADO - ICB

110

Figura 26. Dendograma com a representação da melhor partição identificada pelo programa BAPS,

para os Pretos e Brancos brasileiros e as populações da África e Eurásia do Painel do HGDP-CEPH.

Page 111: TESE DE DOUTORADO - ICB

111

Figura 27. Dendograma com a representação da melhor partição identificada pelo programa BAPS

para os Pretos brasileiros e as populações da África do Painel do HGDP-CEPH.

Page 112: TESE DE DOUTORADO - ICB

112

4.3.2.7 Redes haplotípicas

Redes haplotípicas foram construídas pelo cálculo de median joining, com dados das

freqüências haplotípicas do bloco haplotípico reduzido dos brasileiros e populações da África

e Eurásia, utilizando-se o programa Network 4.1.0.6 (Bandelt et al., 1999). Na Figura 28,

podemos observar, na rede haplotípica, a presença de efeito fundador que resultou na

predominância de apenas cinco haplótipos principais, amplamente distribuídos e bastante

freqüentes entre as populações.

Verificamos a proporção de indivíduos distribuídos nos cinco haplótipos principais, ou

seja, o número de indivíduos de cada população encontrado em cada um desses cinco

haplótipos (1-5 da Figura 28). Essa análise revelou uma distribuição bastante interessante, na

qual os Pretos brasileiros têm 55% dos seus indivíduos distribuídos entre os cinco haplótipos

principais, enquanto que os Brancos brasileiros correspondem a 85% dos indivíduos,

novamente observamos valores intermediários aos encontrados na África, com 42%, e na

Eurásia, com 92% dos indivíduos distribuídos nos cinco haplótipos.

Utilizamos a mesma abordagem do Capítulo 2 desta tese para inferir os prováveis

haplótipos fundadores a partir da rede haplotípica gerada no programa Network 4.1.0.6

(Bandelt et al., 1999). O haplótipo número 2, formado pelo alelo 16,0,27 dos marcadores:

DXS1002, DXS225 e DXS1019, respectivamente, é o haplótipo mais comum entre os cinco

principais. Próximos a esse haplótipo, com a diferença de apenas um passo mutacional,

estão os haplótipos: 3 (15,0,27) e 1 (17,0,27), que, provavelmente, formavam um grupo de

haplótipos que saiu da África para povoar os outros continentes. Esse número limitado de

haplótipos com inserção evidencia, mais uma vez, a presença do efeito fundador após a

saída do homem moderno da África para os demais continentes.

Page 113: TESE DE DOUTORADO - ICB

113

Figura 28. Rede haplotípica em que as cores representam os haplótipos encontrados nos Pretos e

Brancos brasileiros e as populações da África e da Eurásia do Painel do HGDP-CEPH. Os haplótipos

mais freqüentes estão numerados de 1-5, e as setas destacam os haplótipos formados pelos

marcadores DXS1002, DXS225 e DXS1019.

Page 114: TESE DE DOUTORADO - ICB

114

4.3.3 DISCUSSÃO

A matriz triíbrida do povo brasileiro tem sido investigada por diversos pesquisadores,

com o intuito de obter informações sobre a diversidade e ancestralidade encontradas na atual

população brasileira, contribuindo com o entendimento da história molecular da formação do

povo brasileiro. Neste capítulo, buscamos fornecer informações sobre o processo de

formação do povo brasileiro utilizando uma nova ferramenta molecular, um bloco haplotípico

no cromossomo X, que possui características interessantes, e que tem-se mostrado bastante

informativo para estudos evolutivos.

Nesta análise, reduzimos o nosso bloco haplotípico para dois microssatélites

(DXS1002 e DXS1019) e a inserção DXS225. Os dois microssatélites foram escolhidos por

possuírem as menores taxas de mutação (1,04 e 0,34 x10-3, respectivamente) dentro do

bloco haplotípico original (Capítulo 1 desta tese). Reduzimos o número de marcadores para

ampliar o número de compartilhamentos entre os grupos de brasileiros (Pretos e Brancos) e

as populações parentais (África e Eurásia). Para evidenciar, de forma mais clara, esse fato,

comparamos os resultados de diversidade haplotípica, compartilhamento de haplótipos e

análise de variância molecular entre os blocos haplotípico completo (DXS1012, DXS1002,

DXS225, DXS1019 e DXS8114) e o reduzido (DXS1002, DXS225 e DXS1019), quando

verificamos, para o bloco haplotípico reduzido, uma maior proporção de haplótipos

compartilhados entre os brasileiros e as populações parentais e, na AMOVA, uma

variabilidade genética um pouco maior (Tabelas 12 e 14). Com isso, realizamos as demais

análises deste capítulo utilizando apenas os dados do bloco haplotípico reduzido.

Utilizamos o bloco haplotípico para estudar dois grupos de brasileiros da cidade de

São Paulo, um deles formado por 107 indivíduos classificados como Brancos, e outro, por 97

indivíduos classificados como Pretos. Entre os 204 brasileiros encontramos, no bloco

haplotípico completo um total de 119 haplótipos, e 42 haplótipos no bloco haplotípico

reduzido. A diversidade haplotípica do bloco completo foi maior (0,994±0,002) que a

observada no bloco reduzido (0,987±0,002), o que é esperado devido à redução no número

Page 115: TESE DE DOUTORADO - ICB

115

de marcadores analisados. Enquanto que a diversidade encontrada entre os grupos de

brasileiros tanto com o bloco haplotípico completo quanto com o bloco reduzido revelou uma

maior diversidade nos Pretos brasileiros (0,994±0,002-0,905±0,018, bloco completo e

reduzido, respectivamente), comparada com a encontrada entre os Brancos brasileiros

(0,972±006-0,826±0,022, bloco completo e reduzido, respectivamente), sendo esses índices

de diversidade intermediários aos encontrados nas populações da África (0,992±0,003-

0,947±0,006) e da Eurásia (0,953±0,006-0,754±0,015), demonstrando uma similaridade entre

os grupos de brasileiros e as populações parentais (África e Eurásia) (Tabela 12).

Apesar dos grupos de brasileiros serem distintos fenotipicamente, utilizando os

diferentes sistemas de classificação, observamos uma similaridade genética entre os Pretos

e os Brancos da cidade de São Paulo na AMOVA, com 99,1-98,6% da variabilidade genética

encontrada dentro das populações, ou seja, entre os indivíduos e apenas 0,9-1,3% entre os

Pretos e os Brancos brasileiros para os blocos completo e reduzido, respectivamente

(Tabelas 13 e 14).

Essa similaridade genética foi confirmada pela análise Bayesiana de estrutura

populacional utilizando o programa BAPS 2.2 (Corander et al., 2004), para os dados do bloco

reduzido, que demonstrou que os indivíduos classificados como Pretos e Brancos de São

Paulo, formaram um único agrupamento. O que corrobora com estudos prévios utilizando

marcadores informativos de ancestralidade (AIMs)(Parra et al., 2003), e microssatélites do

cromossomo Y (Pimenta et al., 2006), que encontraram pouca correlação entre

ancestralidade genômica e cor da pele em indivíduos brasileiros.

Entretanto, a contribuição ancestral para esses dois grupos de brasileiros é bastante

distinta, mas visualizamos uma introgressão da contribuição européia nos brasileiros.

Encontramos nos indivíduos classificados como Pretos 55% de ancestralidade africana e

45% de ancestralidade euroasiática, enquanto que os indivíduos classificados como Brancos

têm 71% de ancestralidade euroasiática e 29%, de africana. Elevados valores de contribuição

européia, variando entre 42% a 64%, em Pretos brasileiros, também foram visualizados com

outros marcadores moleculares, como DNA mitocondrial (Gonçalves et al., 2008, Hünemeier

Page 116: TESE DE DOUTORADO - ICB

116

et al., 2007), cromossomo Y e autossomos (Suarez-Kurtz et al., 2007), com os maiores

índices encontrados em populações de Porto Alegre (Marrero et al., 2005) . Na Tabela 15

podemos comparar os dados de contribuição genética para diferentes marcadores.

Esses altos valores de contribuição ancestral européia também retratam o padrão de

reprodução preferencial envolvendo os homens (europeus colonizadores) e as mulheres

(ameríndias nativas e escravas africanas), o qual iniciou o processo de povoamento e

continuou, de maneira mais discreta, durante muitos anos. Tal padrão foi observado com

marcadores de linhagens: Y com maior contribuição européia (Carvalho-Silva et al., 2001), e

DNA mitocondrial com 60% das linhagens africanas e ameríndias (Alves-Silva et al., 2000).

Esse padrão também foi observado em outros paises da América Latina (Bedoya et al.,

2006), o que demonstra que essa é uma característica dos colonizadores ibéricos.

Gonçalves et al.,(2007) propõem que os altos índices de contribuição européia

masculina encontrada nos brasileiros estão também associados à categorização “racial”, que,

no Brasil, corresponde à cor da pele, e à categorização social, das crianças originadas dessa

relação. Com as crianças que possuem características européias, por exemplo cor da pele

mais clara, são consideradas brancas e categorização social mais elevada, enquanto as

crianças com cor da pele mais escura são classificadas como africanas e categorização

social mais baixa, sendo que a contribuição genética é a mesma para as duas crianças, o

que pode aumentar o número de pretos com ancestralidade européia.

A contribuição africana encontrada com os dados do bloco haplotípico do

cromossomo X para os Brancos brasileiros foi bastante alta (21%), se comparada com os

dados do cromossomo Y, em que a contribuição africana varia de 0-4% (Carvalho-Silva et al.,

2001; Gonçalves et al., 2008, Hünemeier et al., 2007) e nos polimorfismos de inserção e

deleção (Indels) autossômicos em 11% (Suarez-Kurtz et al., 2007) (Tabela 15). Essa alta

freqüência de contribuição africana confirma o caráter intermediário dos marcadores do

cromossomo X, em que podemos observar a contribuição paterna e materna no mesmo

marcador.

Page 117: TESE DE DOUTORADO - ICB

117

As análises de componente principal e a análise bayesiana de estrutura populacional,

com os Pretos e Brancos brasileiros e as populações da África e Eurásia, revelaram um

agrupamento entre os Brancos brasileiros e as populações da Eurásia. No entanto, o mesmo

não foi visto para os Pretos brasileiros e as populações da África (Figuras 24 e 26), o que

pode ocorrer devido à grande variabilidade encontrada entre as populações africanas e ao

perfil regional de contribuição africana para os Pretos brasileiros.

Dessa forma, quando analisamos apenas as populações africanas e os Pretos

brasileiros, visualizamos um agrupamento dos Pretos com as populações do oeste e leste-

central africanos (Figuras 25 e 27). Essas regiões da África já foram descritas por dados

históricos e de DNA mitocondrial, como fonte de escravos africanos para o Brasil, vindos

principalmente da costa oeste da África para São Paulo (Bortolini et al., 2004; Gonçalves et

al., 2008; Klein, 2002).

Esses resultados demonstram a eficiência do bloco haplotípico em estudos evolutivos,

o qual é capaz de fornecer informações coerentes sobre as rotas ancestrais dos escravos

africanos para a cidade de São Paulo, já que isso não foi possível para os marcadores do

cromossomo Y, pois as mesmas rotas não foram visualizadas devido à ausência de

estratificação significante nas freqüências haplotípicas entre as regiões do oeste e centro-

oeste africanos (Gonçalves et al., 2008).

Na rede haplotípica, verificamos a presença do efeito fundador, que reduziu o número

de haplótipos para cinco haplótipos principais (Figura 28), em que está distribuída a maioria

dos indivíduos; no entanto, quando calculamos a proporção de indivíduos nos cinco

haplótipos, novamente observamos um padrão intermediário entre os Pretos (55%) e Brancos

(85%) brasileiros e as populações parentais da África (42%) e Eurásia (92%). A rede

haplotípica foi utilizada para inferir os prováveis haplótipos fundadores, de acordo com a sua

distribuição e freqüência. Com a ausência da inserção DXS225, o haplótipo 2 pode ser

considerado o provável haplótipo ancestral da Eurásia, que pertenceu ao grupo inicial que

saiu da África. Enquanto que, com a presença da inserção, os haplótipos 5 e 4 pertencem,

provavelmente ao segundo grupo que saiu da África carregando a inserção DXS225.

Page 118: TESE DE DOUTORADO - ICB

118

5 CONCLUSÃO GERAL

Page 119: TESE DE DOUTORADO - ICB

119

A partir dos estudos filogeográficos realizados com populações mundiais e brasileiras, com a

utilização de marcadores moleculares em uma região com baixa taxa de recombinação do

cromossomo X, podemos concluir:

• O bloco haplotípico, na região Xq21.1-Xq21.3, que apresenta as menores taxas de

recombinação do cromossomo X, é formado por quatro microssatélites (DXS1012,

DXS1002, DXS1019 e DXS8114), e uma inserção Alu (DXS225) está em completo

desequilíbrio de ligação, observado por meio de diferentes análises.

• Esse bloco haplotípico fornece informações complementares aos marcadores

moleculares tradicionais (autossomos, cromossomo Y e DNA mitocondrial). Primeiro,

devido às características do cromossomo X, que são bastante interessantes para

estudos evolutivos, como: tamanho efetivo intermediário, alternância entre os sexos, e

hemizigosidade em homens. E segundo, que qualquer marcador, formado por

marcadores com diferentes taxas de mutação, poderá fornecer histórias evolutivas

diferentes, tornando-se um marcador mais informativo.

• A ampla distribuição da inserção DXS225 nas regiões mundiais e a análise de

coalescência sugerem a origem dessa inserção antes do homem moderno sair da

África, há aproximadamente 94.400 anos (CI 24.300-310.000).

• A análise de variância molecular (AMOVA) demonstrou pouca estrutura populacional,

com altos níveis de variabilidade (92% a 99%) dentro das populações, ou seja, entre

os indivíduos. Com exceção apenas da América e Oceania, que possuem alta

variabilidade genética entre as populações.

• Os índices de diversidade de Nei, para os marcadores e para o bloco haplotípicos,

foram altos: DXS1012 (0,829), DXS1002 (0,721), DXS225 (0,415), DXS1019 (0,560) e

DXS8114 (0,798) e (0,979) para o bloco haplotípico.

• Os maiores índices de diversidade haplotípica são encontrados na África. Tais índices

sofreram uma grande redução logo após o homem sair da África, até chegar aos

Page 120: TESE DE DOUTORADO - ICB

120

menores valores de diversidade na América. Essa diminuição na diversidade segue o

padrão de expansão do homem moderno, seguindo da África para o Leste Asiático,

depois para a Eurásia, Oceania e, por último, para as Américas.

• As regiões Oriente Médio, Ásia Central e Europa do Painel HGDP-CEPH possuem

grande similaridade genética, o que permite agrupá-las em uma única região, a

Eurásia.

• O tempo do mais recente ancestral comum (TMRCA), estimado para o nosso bloco

haplotípico, foi de 182.000 anos (CI 56.700-479.000), com valores aproximados ao

TMRCA encontrado por meio de marcadores moleculares e os dados paleontológicos.

• O compartilhamento de haplótipos revelou uma genealogia parental do Leste Asiático

com a Oceania e a América, demonstrando que o bloco haplotípico é uma ferramenta

interessante para se estudar em questões sobre o povoamento das Américas.

• As redes haplotípicas revelaram que, durante o processo de expansão da África,

ocorreu uma serie de efeitos fundadores e gargalos populacionais, reduzindo o

número de haplótipos.

• A elevada contribuição ancestral euroasiática para os Pretos e Brancos de São Paulo

corrobora com os dados históricos e moleculares relativos ao padrão de povoamento

que ocorreu nas Américas, com a contribuição paterna quase exclusiva dos

colonizadores europeus, e a materna vinda das nativas ameríndias e das escravas

africanas.

• Com as análises de componente principal e bayesiana da estrutura populacional,

verificamos uma similaridade genética entre os indivíduos classificados como Pretos

brasileiros e as populações do oeste e leste-central africanos, do Painel do HGDP-

CEPH, o que corrobora, mais uma vez, com os dados históricos e os do DNA

mitocondrial, referentes à origem dos escravos africanos que vieram para o Brasil.

• O bloco haplotípico, na forma reduzida, foi capaz de fornecer informações sobre a

diversidade e ancestralidade brasileiras, confirmando dados históricos e de outros

Page 121: TESE DE DOUTORADO - ICB

121

marcadores moleculares e que colabora para o entendimento do processo de

formação do povo brasileiro.

• O bloco haplotípico do cromossomo X permitiu fazer inferências evolutivas a respeito

das populações humanas encontradas no Painel do HGDP-CEPH e das populações

brasileiras, demonstrando ser um marcador robusto para estudos filogeográficos.

• Em nossos estudos, os resultados encontrados corroboram com a origem africana e

recente entre 100.000-200.000 anos, para o homem anatomicamente moderno.

Page 122: TESE DE DOUTORADO - ICB

122

6 CONSIDERAÇÕES FINAIS

Page 123: TESE DE DOUTORADO - ICB

123

A utilização de diferentes marcadores moleculares, para revelar aspectos sobre a

história evolutiva das populações humanas, tem sido o enfoque de diversos estudos há vários

anos. Os marcadores moleculares mais utilizados nesse tipo de estudo são os marcadores

de linhagens: cromossomo Y e DNA mitocondrial, que revelam aspectos relacionados à

linhagem paterna e materna, respectivamente, demonstrando a necessidade de se ter uma

visão mais ampla desses aspectos evolutivos, o que torna necessário o estudo de outras

regiões do genoma, tanto nos cromossomos autossômicos quanto em regiões do

cromossomo X.

Com o intuito de utilizar um marcador molecular que possuísse características que o

tornassem mais informativo ou complementar aos marcadores tradicionalmente utilizados,

surgiu o objetivo desta tese de Doutorado, que realiza estudos filogeográficos utilizando

marcadores no cromossomo X, devido às características que esse cromossomo possui, como

as descritas a seguir. A alternância entre os sexos, em um determinado momento, tem-se 1/3

dos cromossomos X no sexo masculino e 2/3 no sexo feminino. Na geração seguinte, os

cromossomos X da geração masculina anterior irão constituir metade dos 2/3 de

cromossomos X presentes na geração feminina. No caso do sexo masculino, o 1/3 de

cromossomos X presentes na próxima geração serão de origem feminina. Essa característica

imprime ao cromossomo X um efeito equalizador quanto aos fenômenos demográficos

sofridos tanto pelo sexo feminino quanto pelo masculino. Outra característica importante é o

fato de o cromossomo X estar presente, em cópia única, em homens, o que permite

estabelecer a fase dos haplótipos, fornecendo a identificação direta da relação entre os alelos

para os locos estudados.

Utilizamos marcadores localizados em uma região de 130 Kb, no intervalo Xq21.1-

Xq21.3, que apresenta as taxas de recombinação mais baixas do cromossomo X, apenas

0,16 cM/Mb em comparação com a média do cromossomo 1,3 cM/Mb. Essa região foi

delimitada por Rinaldo W. Pereira, durante o seu Doutorado no laboratório de Genética

Bioquímica da UFMG, o qual caracterizou uma inserção Alu flanqueada por alguns

Page 124: TESE DE DOUTORADO - ICB

124

microssatélites (Pereira et al., 2006). Na busca por novos marcadores nessa região,

descrevemos dois novos microssatélites (DXS1012 e DXS1019) próximos a inserção Alu.

Com isso, inicialmente padronizamos um bloco formado por sete microssatélites e a inserção

Alu, agora denominada DXS225, e depositada junto com os novos microssatélites no

Genome Database (GDB).

Após diferentes análises para verificar se os marcadores que compõem o bloco

haplotípico estavam em desequilíbrio de ligação, excluímos três microssatélites (DXS995,

DXS8076 e DXS1050), por não estarem em completo desequilíbrio de ligação. Com isso, o

bloco haplotípico ficou formado por quatro microssatélites (DXS1012, DXS1002, DXS1019 e

DXS8114) e a inserção Alu (DXS225) em completo desequilíbrio de ligação.

Após a padronização do bloco haplotípico do cromossomo X (Capítulo 1), passamos

a ter como objetivo utilizar esse novo marcador em estudos evolutivos: o primeiro foi realizar

análises filogeográficas com as populações mundiais que compõem o Painel do HGDP-

CEPH (Capítulo 2), e o segundo foi estudar a diversidade e a ancestralidade genéticas

encontradas nos brasileiros (Capítulo 3).

Nesses estudos nosso marcador demonstrou ser bastante útil e informativo, capaz

de fornecer informações complementares a respeito dos aspectos evolutivos das populações

humanas, permitindo estimar o tempo do mais recente ancestral comum (TMRCA), para o

bloco haplotípico, em 182.000 anos e o tempo da inserção DXS225 em 94.000 anos,

demonstrando a origem recente e africana do homem moderno.

Nosso bloco haplotípico também possibilitou estimar a contribuição ancestral dos

africanos e dos euroasiáticos para os grupos de brasileiros classificados como Brancos e

Pretos da cidade de São Paulo.

Conclui-se que os resultados dos três capítulos desenvolvidos nesta tese mostram

que padronizamos um bloco haplotípico no cromossomo X, formado por marcadores com

diferentes taxas de mutação, em completo desequilíbrio de ligação, o qual pode ser utilizado

como ferramenta de investigação em estudos populacionais e evolutivos. Os capítulos

Page 125: TESE DE DOUTORADO - ICB

125

descritos nesta tese deram origem a dois artigos publicados (Anexos 1 e 2) e a outro em fase

de preparação (Anexo 3).

Como perspectiva desta tese, temos o uso do nosso marcador em estudos

filogeográficos com diferentes populações. Como também, a busca e caracterização de

novos marcadores moleculares em diferentes regiões do genoma humano.

Um exemplo do uso do bloco haplotípico, seria para analisar questões relativas ao

povoamento do continente americano, como o número de ondas migratórias e as prováveis

populações ancestrais que deram origem aos nativos americanos. Utilizando-se da

característica intermediária do nosso marcador, para obter informações dos componentes

genéticos femininos e masculinos das populações ameríndias, fornecendo informações

complementares aos dados obtidos por meio da análise de marcadores do cromossomo Y,

do DNA mitocondrial e dados craniométricos das populações ameríndias.

Page 126: TESE DE DOUTORADO - ICB

126

7 REFERÊNCIAS BIBLIOGRÁFICAS

Page 127: TESE DE DOUTORADO - ICB

127

Abe-Sandes K, Silva WA, Zago MA (2004) Heterogeneity of the Y chromosome in Afro-

Brazilian Populations. Hum Biol 76(1)77-86.

Alves-Silva J, da Silva Santos M, Guimarães PE, Ferreira AC, Bandelt HJ, Pena SDJ, Prado VF. (2000). The ancestry of Brazilian mtDNA lineages. Am J Hum Genet. 67:444-461.

Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, Drouin J,Eperon IC, Nierlich

DP, Roe BA, Sanger F, Schreier PH, Smith AJ, Staden R, Young IG. (1981). Sequence and organization of the human mitochondrial genome. Nature. 290:457-465.

Athanasiadis G, Esteban E, Via M, Dugoujon JM, Moschonas N, Chaabani H, Moral P.

(2007). The X chromosome Alu insertions as a tool for human population genetics: data from European and African human groups. Eur J Hum Genet. 15(5):578-583.

Bandelt HJ, Forster P, Rohl A (1999) Median-joining networks for inferring intraspecific

phylogenies. Mol Biol Evol 16:37-48. Barrett JC, Fry B, Maller J, Daly MJ. (2005) Haploview: analysis and visualization of LD and

haplotype maps. Bioinformatics. 21(2):263-265. Bastos-Rodrigues L, Pimenta JR, Pena SDJ. (2006) The genetic structure of human

populations studied through short insertion-deletion polymorphisms. Ann hum Genet.70:1-8.

Battilana J, Fagundes NJ, Heller AH, Goldani A, Freitas LB, Tarazona-Santos E, Munkhbat B,

Munkhtuvshin N, Krylov M, Benevolenskaia L, Arnett FC, Batzer MA, Deininger PL, Salzano FM, Bonatto SL.(2006) Alu insertion polymorphisms in Native Americans and related Asian populations. Ann Hum Biol. 33(2):142-160.

Batzer MA e Deininger PL. (1991) A human-specific subfamily of Alu sequences. Genomics

9:481-487.

Bedoya G, Montoya P, Garcia J, Soto I, Bourgeois S, Carvajal L, Labuda D, Alvarez V, Ospina J, Hedrick PW, Ruiz-Linares A (2006) Admixture dynamics in Hispanics: a shift in the nuclear genetic ancestry of a South American population isolate. Proc Natl Acad Sci USA 103:7234-7239.

Benson G. (1999). Tandem repeats finder: a program to analyze DNA sequences. Nucleic Acids Res . 27(2):573-580.

Bennett EA, Coleman LE, Tsui C, Pittard WS, Devine SE. (2004) Natural genetic variation

caused by transposable elements in humans. Genetics.168:933-951.

Bortolini MC, Silva WA, Zago MA, Elion J, Krishnamoorthy R, Gonçalves VF, Pena SD (2004) The phylogeography of mitochondrial DNA haplogroup L3g in Africa and the Atlantic slave trade. Am J Hum Genet 75:522-524.

Brinkmann B, Klintschar M, Neuhuber F, Huhne J, Rolf B. (1998) Mutation rate in human microsatellites: influence of the structure and length of the tandem repeat. Am J Hum Genet. 62(6):1408-1415.

Brookes AJ. (1999) The essence of SNPs. Gene. 234(2)177-186. Bydlowski SP, de Moura-Neto RS, Soares RP, Silva R, Debes-Bravo AA, Morganti L. (2003)

Genetic data on 12 STR (F13A01, F13B, FESFPS, LPL, CSF1PO, TPOX, TH01, vWA,

Page 128: TESE DE DOUTORADO - ICB

128

D16S539, D13S317, D5S818) from four ethnic groups of São Paulo, Brazil. For Sci Int. 135(1):67-71.

Callinan PA, Hedges DJ, Salem AH, Xing J, Walker JA, Garber RK, Watkins WS, Bamshad

MJ, Jorde LB, Batzer MA. (2003) Comprehensive analysis of Alu-associated diversity on the human sex chromosomes. Gene. 317(1-2):103-110.

Cann RL, Stoneking M, Wilson AC. (1987) Mitochondrial DNA and Human evolution.

Nature.325(1):31-36. Cann HM, de Toma C, Cazes L, Legrand MF, Morel V, Piouffre L, Bodmer J, Bodmer WF,

Bonne-Tamir B, Cambon-Thomsen A, Chen Z, Chu J, Carcassi C, Contu L, Du R, Excoffier L, Ferrara GB, Friedlaender JS, Groot H, Gurwitz D, Jenkins T, Herrera RJ, Huang X, Kidd J, Kidd KK, Langaney A, Lin AA, Mehdi SQ, Parham P, Piazza A, Pistillo MP, Qian Y, Shu Q, Xu J, Zhu S, Weber JL, Greely HT, Feldman MW, Thomas G, Dausset J, Cavalli-Sforza LL. (2002) A human genome diversity cell line panel. Science. 296(5566):261-262.

Carrel L, Willard HF. (2005) X-inativation profile reveals extensive variability in X-linked gene

expression in females. Nature.434:400-404. Cavalli-Sforza LL., Menozzi P, Piazza A. (1994) The History and Geography of Human

Genes. Princeton University Press, Princenton. Cavalli-Sforza LL. (1998). The DNA revolution in population genetics. Trends Genet 14(2):60-

65. Cavalli-Sforza LL, Feldman MW. (2003) The application of molecular genetic approaches to

the study of human evolution. Nat Genet.33:266-275. Cavalli-Sforza LL. (2005) The human genome diversity project: past, present and future.

Science. 296:261-262.

Carvalho-Silva DR, Santos FR, Rocha J, Pena SD (2001) The phylogeography of Brazilian Y-chromosome lineages. Am J Hum Genet. 68:281-286.

Conrad DF, Jakobsson M, Coop G, Wen X, Wall JD, et al. (2006) A worldwide survey of haplotype variation and linkage disequilibrium in the human genome. Nat Genet 38:1251-1260.

Corander J, Waldmann P, Sillanpaa MJ (2003) Bayesian analysis of genetic differentiation between populations. Genetics 163:367-374.

Corander J, Waldmann P, Marttinen P, Sillanpaa MJ (2004) BAPS 2: enhanced possibilities for the analysis of genetic population structure. Bioinformatics 20:2363-2369.

Corella A, Bert F, Pérez-Pérez A, Gené M, Turbón D. (2007) Mitochondrial DNA diversity of the Amerindian populations living in the Andean Piedmont of Bolivia: Chimane, Moseten, Aymara and Quechua. Ann Hum Biol. 34(1):34-55.

Corpet F. (1988) Multiple sequence alignment with hierarchical clustering. Nucl Acids

Res16(22)10881-10890. Dagan T, Sorek R, Sharon E, Ast G, Graur D. (2004) AluGene: a database of Alu elements

incorporated within protein-coding genes. Nucl Acids Res. 32(Database)D489-D492.

Page 129: TESE DE DOUTORADO - ICB

129

Deininger PL, Batzer MA, Hutchison CA, Edgell MH. (1992) Master genes in mammalian

repetitive DNA amplification. Trends Genet 8:307-311. Dib C, Fauré S, Fizames C, Samson D, Drouot N, Vignal A, Millasseau P, Marc S, Hazan J,

Seboun E, Lathrop M, Gyapay G, Morissette J, Weissenbach J. (1996) A comprehensive genetic map of the human genome based on 5,264 microsatellites. Nature.380:152-154.

Donnelly A, Kozman AK, Gedeon S, Webb S, Lynch M, Sutherland GR, Richards RI, Mulley

AC. (1994) A linkage map of microsatellite markers on the human X chromosome. Genomics. 20:363-370.

Excoffier L, Smouse PE, Quattro JM. (1992) Analysis of molecular variance inferred from

metric distances among DNA haplotypes: application to human mitochondrial DNA restriction data. Genetics. 131:479-491.

Fuselli S, Tarazona-Santos E, Dupanloup I, Soto A, Luiselli D, Pettener D. (2003) Mitochondrial DNA diversity in South América and the Genetic history of Andean Highlanders. Mol Biol Evol. 20(10):1682-1691.

Gabriel SB, Schaffner SF, Nguyen H, Moore JM, Roy J, Blumenstiel B, Higgins J, DeFelice M, Lochner A, Faggart M, Liu-Cordero SN, Rotimi C, Adeyemo A, Cooper R, Ward R, Lander ES, Daly MJ, Altshuler D. (2002) The structure of haplotype blocks in the human genome. Science.296:2225-2229.

Garrigan D, Mobasher Z, Severson T, Wilder JA, Hammer MF. (2005) Evidence for Archaic Asian ancestry on the human X chromosome. Mol Biol Evol. 22(2)189-192.

Gonçalves VF, Prosdocimi F, Santos LS, Ortega JM, Pena SD (2007) Sex-biased gene flow in African Americans but not in American Causasians. Genet Mol Res. 6(2)156-161

Gonçalves VF, Carvalho CMB, Bortolini MC, Bydlowski SP, Pena SD (2008) The phylogeography of African Brazilians. Hum Hered 65:23-32.

Hamilton G, Stoneking M, Excoffier L. (2005) Molecular analysis reveals tighter social regulation of immigration in patrilocal populations than in matrilocal populations. Proc Natl Acad Sci USA. 102(21)7476-7480.

Hammer MF. (1994) A recent insertion of an Alu element on the Y chromosome is a useful marker for human population studies. Mol Biol Evol 11:749-761.

Hammer MF. (1995) A recent common ancestry for human Y chromosomes. Nature. 378:376-378.

Harding RM, Fullerton SM, Griffiths RC. (1997) Archaic African and Asian lineages in the

genetic ancestry of modern humans. Am J Hum Genet. 60:772-789. Harpending H (1994) Gene frequencies, DNA sequence, and Human origins. Perspect Biol

Med 37(3):384-394. Harris EE, Hey J. (1999) X chromosome evidence for ancient human histories. Proc Natl Acad

Sci U S A 96:3320-3324. Hedrick WP. (1987) Gametic disequilibrium measures: proceed with caution. Genetics.

117:331-341.

Page 130: TESE DE DOUTORADO - ICB

130

Hey J. (1997) Mitochondrial and nuclear genes present conflicting portraits of humain origins. Mol Biol Evol. 14(2):166-172.

Hey J (2007) On the Number of New World Founders: A population Genetic Portrait of the

Peopling of the Americas. PLoS Biol. 3(6)e193. Holtkemper U, Rolf B, Hohoff C, Forster P, Brinkmann B. (2001) Mutation rates at two human

Y-chromosomal microsatellite loci using small pool PCR techniques. Hum Mol Genet. 10(6):629-633.

Houck CM, Rinehart FP, Schmid CW. (1979) A ubiquitous family of repeated DNA sequences

in the human genome. J Mol Biol 132:289-306.

Hünemeier T, Carvalho CMB, Marrero AR, Salzano FM, Pena SD, Bortolini MC (2007) Niger-Congo Speaking Populations and the Formation of the Brazilian Gene Pool: mtDNA and Y-Chromosome Data. Am J Phys Anthropol 113:854-867.

Huttley GA, Smith MW, Carrington M, O'Brien SJ. (1999) A scan for linkage disequilibrium across the human genome. Genetics 152:1711-22.

IBGE- Instituto Brasileiro de Geografia Estatística (2000) Brasil: 500 Anos de Povoamento. Rio de Janeiro. IBGE pp 219.

Igmann M, Kaessmann H, Pääbo S, Gyllensten U. (2000) Mitochondrial genome variation and the origin of modern humans. Nature. 408:708-713.

International Human Genome Sequencing Consortium. (2001) Initial sequencing and analysis

of the human genome. Nature 409:860-921. Jeffreys AJ, Kauppi L, Neumann R. (2001) Intensely punctuate meiotic recombination in the

class II region of the major histocompatibility complex. Nat Genet 29:217-222. Jorde LB, Rogers AR, Bamshad M, Watkins WS, Krakowiak P, Sung S, Kere J, Harpending

HC. (1997) Microsatellite diversity and the demographic history of modern humans. Proc Natl Acad Sci U S A 94:3100-3103.

Jorde LB, Watkins WS, Bamshad MJ, Dixon ME, Ricker CE, Seielstad MT, Batzer MA. (2000)

The distribution of human genetic diversity: a comparison of mitochondrial, autosomal, and Y-chromosome data. Am J Hum Genet. 66(3):979-88.

Kaessmann H, Heibig F, Haeseler AV, Pääbo S. (1999) DNA sequence variation in a non-

coding region of low recombination on the human X chromosome. Nat Genet 22:78-81. Kaessmann H, e Pääbo S. (2002). The genetical history of human and great apes. J Inter

Med. 251:1-18. Kaessmann H, Zöllner S, Gustafsson AC, Wiebe V, Laan M, Lundeberg J, Uhlén M, Pääbo S.

(2002) Extensive linkage disequilibrium in small human populations in Eurasia. Am J Hum Genet.70:673-685.

Katoh T, Mano S, Ikuta T, Munkhbat B, Tounai K, Ando H, Munkhtuvshin N, Imanishi T, Inoko

H, Tamiya G. (2002) Genetic isolates in East Asia: a study of linkage disequilibrium in the X chromosome. Am J Hum Genet. 71(2):395-400.

Page 131: TESE DE DOUTORADO - ICB

131

Katoh T, Mano S, Munkhbat B, Tounai K, Oyungerel G, Chae GT, Han H, Jia GJ, Tokanaga K, Munkhutuvshin N, Tamiya G, Inoko H. (2005) Genetic features of Khoton Mongolians revealed by SNP analysis of the X chromosome. Gene. 378:1-8.

Klein HS (2002) As origens dos escravos brasileiros. In: Pena SDJ (eds) Homo brasilis. Aspectos genéticos, lingüisticos, históricos e socioantropológico da formação do povo brasileiro. Ribeirão Preto:FUNPEC Editora. pp 93-112.

Laan M, Wiebe V, Khusnutdinova E, Remm M, Pääbo S. (2005) X-chromosome as a marker for population history: linkage disequilibrium and haplotype study in Eurasian populations. Eur J hum Genet.13:452-462.

Labuda D, Zietkiewicz E. (1994) Evolution of secondary structure in the family of 7SL-like

RNAs. J Mol Evol 39:506-518. Lahn BT, Pearson NM, Jegalian K. (2001) The human Y chromosome, in the light of evolution.

Nat Rev Genet. 2(3):207-216. Latini V, Sole G, Doratiotto S, Poddie D, Memmi M, Varesi L, Vona G, Cao A, Ristaldi MS.

(2004) Genetic isolates in Corsica (France): linkage disequilibrium extension analysis on the Xq13 region. Eur J hum Genet.12:613-619.

Leopoldino AM, Pena SD. (2003) The mutational spectrum of human autosomal

tetranucleotide microsatellites. Hum Mutat. 21(1):71-79. Lewin R. 1999. Evolução Humana. 1ª ed. Atheneu Ed. São Paulo. pp526. Li N, e Stephens M. (2003) Modeling linkage disequilibrium and identifying recombination

hotspots using single-nucleotide polymorphism data. Genetics.165:2213-2233. Liu H, Prugnolle F, Manica A, Balloux F (2006) A geographically explicit genetic model of

worldwise human-settlement history. Am J Hum Genet. 79:230-237. Lovelli A, Moreau C, Yotova V, Xiao F, Bourgeois S, Gehl D, Bertranpetit J, Schurr E, Labuda

D. (2005) Ethiopia: between Sub-Saharan African and Western Eurasia. Ann hum Genet. 69:275-287.

Lucotte G, Ngo NY. (1985) p49f, A highly polymorphic probe, that detects Taq1 RFLPs on the

human Y chromosome. Nucleic Acids Res 13:8285. Lyon MF. (1961) Gene action in the X-chromosome of the mouse. Nature 190:372-373. Macaulay V, Hill C, Achilli A, Rengo C, Clarke D, Meehan W, Blackburn J, Semino O,

Scozzari R, Cruciani F. (2005) Single, rapid coastal settlement of Asia revealed by analysis of complete mitochondrial genomes. Science. 308:1034-1036.

Mellars P (2006) Going East: new genetic and archaeological perspectives on the modern

human colonization of Eurasia. Science. 313:796-800. McDougall I, Fleagle JG.(2005) Stratigraphic placement and age of modern human from

Kibish, Ethiopia. Nature. 433:733-736. Mountain JL, Knight A, Jobin M, Gignoux C, Miller A, Lin AA, Underhill PA. (2002) SNPSTRs:

empirically derived, rapidly typed, autosomal haplotypes for inference of population history and mutational processes. Genome Res. 12(11):1766-72.

Page 132: TESE DE DOUTORADO - ICB

132

Myers S, Bottolo L, Freeman C, McVean G, Donnelly P. (2005) A fine-scale map of

recombination rates and hotspots across the human genome. Science.310:321-324. Nagaraja R, MacMillan S, Kere J, Jones C, Griffin S, Schmatz M, Terrell J, Shomaker M,

Jermak C, Hott C, Masisi M, Mumm S, Srivastava A, Pilia G, Featherstone T, Mazzarella R, Kesterson S, McCauley B, Railey B, Burough F, Nowotny V, D'Urso M, States D, Brownstein B, Schlessinger D. (1997) X chromosome map at 75-kb STS resolution, revealing extremes of recombination and GC content. Genome Res. 7(3):210-22.

Nei M. (1978) Estimation of average heterozygosity and genetic distance from a small number

of individuals. Genetics.89:583-590. Nei M. (1987) Molecular Evolutionary Genetics. Columbia University Press, New York. Pääbo S. (2003) The mosaic that is our genome. Nature. 421:409-412.

Parra FC, Amada RC, Lambertucci JR, Rocha J, Antunes CM, Pena SDJ (2003) Color and genomic ancestry in Brazilians. Proc Natl Acad Sci USA 100:177-182.

Pena SDJ, Carvalho-Silva DR, Alves-Silva J, Prado VF, Santos FR. (2000). Retrato molecular do Brasil. Ciência Hoje. 27:16-25.

Pena SDJ. (2002) Retrato molecular do Brasil, Versão 2001. In: “Homo brasilis : Aspectos

Genéticos, Linguísticos, Históricos e Culturais da Formação do Povo Brasileiro” (Editor: Sérgio D.J. Pena, Editora FUNPEC).

Pena SDJ. (2007) The evolution and Structure of human Genetic Diversity. In Pharmacogenomics in Admixed Populations. Suarez-Kurtz G (eds). Austin, Landes Bioscience. Available: http://www.eurekah.com/chapter/3190In press.

Pereira WR. (2002) Caracterização e Utilização de Microssatélites, Inserção Alu e SNPs em uma Região com Depressão de Recombinação no Cromossomo X Humano.Tese apresentada para obtenção do titulo de doutor ao departamento de Bioquímica e Imunologia,UFMG. Belo Horizonte.

Pereira WR; Pena, SDJ (2006) Phylogeography of haplotypes of five microsatellites located in

a low-recombination region of the X chromosome: studies worldwide and in Brazilian populations. Genetica. 126(1-2):243-250.

Pereira WR, Santos SS, Pena SDJ. (2006) A novel polymorphic Alu insertion embedded in a

LINE 1 retrotransposon in the human X chromosome (DXS225): identification and worldwide population study. Genet Mol Res.5(1):63-71.

Pimenta JR, Zuccherato LW, Debes AA, Maselli L, Soares RP, Moura-Neto RS, Rocha J, Bydlowski SP, Pena SDJ (2006) Color and Genomic Ancestry in Brazilians: A study with Forensic Microsatellites. Hum Hered 62:190-195.

Price AL, Patterson NJ, Plenge RM, Weinblatt ME, Shadick NA, Reich D. (2006) Principal components analysis corrects for stratification in genome-wide association studies. Nat Genet. 38(8):904-909.

Ramachandran S, Rosenberg NA, Zhivotovsky LA, Feldman MW. (2004) Robustness of the inference of human population structure: a comparison of X-chromosomal and autosomal microsatellites. Hum Genome. 1(2):87-97.

Page 133: TESE DE DOUTORADO - ICB

133

Ramachandran S, Deshpande O, Roseman CC, Rosenberg NA, Feldman MW, et al. (2005)

Support from the relationship of genetic and geographic distance in human populations for a serial founder effect originating in Africa. Proc Natl Acad Sci U S A 102:15942-15947.

Ramakrishnan U, e Mountain JL. (2004) Precision and Accuracy of Divergence Time

Estimates from STR and SNPSTR Variation. Mol Biol Evol. 2(10):1960-1971. Reynolds J, Weir BS, Cockerham CC. (1983) Estimation for the coancestry coefficient: basis

for short-term genetic distance. Genetics.105:767-779.

Ribeiro D, (1995) O Povo Brasileiro: Formação e Sentido do Brasil. São Paulo, Companhia das letras.

Rodriguez-Delfin LA, Rubin-de-Celis V, Zago MA. (2001) Genetic Diversity in an Andean Population from Peru and Regional Migration Patterns of Amerindians in South America: Data from Y Chromosome and Mitochondrial DNA. Hum Hered. 51:97-106.

Rosenberg NA, Pritchard KJ, Weber JL, Cann MH, Kidd KK, Zhivotovsky LA, Feldman MW.

(2002) Genetic Structure of Human Populations. Science. 298:2381-2385.

Rosenberg NA (2006) Standardized subsets of the HGDP-CEPH Human Genome Diversity Cell Line Panel, accounting for atypical and duplicated samples and pairs of close relatives. Ann Hum Genet . 70:841-847.

Ross MT, et al (2005) The DNA sequence of the human X chromosome. Nature.434:325-336. Roux KH, e Hecker KH. (1997) One-step optimization using touchdown and stepdown PCR.

Methods Mol Biol 67:39-45. Roy-Engel AM, Carroll ML, Vogel E, Garber RK, Nguyen SV, Salem AH, Batzer MA,

Deininger PL. (2001) Alu insertion polymorphisms for the study of human genomic diversity. Genetics 159(1):279-290.

Salzano FM, Freire-Maia N (1967) Populações brasileiras, aspectos demográficos, genéticos

e antropológicos. Companhia Editora Nacional, São Paulo. Sambrook, J., Fritsch, E.F., Maniats, T. (1981) Molecular Clonig: A laboratory Manual. 2 ed.

New York: Cold Spring Harbor Press. Santos FR, Hurtz MH, Coimbra CEA, Santos RV, Salzano FM, Pena SDJ. (1995) Further

evidence for existence of major founder Y chromosome haplotype in Amerindians. Braz J Genet.18:669-672.

Santos FR, e Tyler-Smith C. (1996) Reading the human Y chromosome: the emerging DNA

markers and human genetic history. Braz. J. Genet. 19:665-670. Santos FR, Pandya A, Tyler-Smith C, Pena SDJ, Schanfield M, Leonard WR, Osipova L,

Crawford MH, Mitchell RJ. (1999) The central Siberian orgin for native American Y chromosomes. Am J Hum Genet. 64:619-628.

Santos ,F.R. e Tarazona-Santos,E. (2002a) A história do povoamento pré-colombiano das

Américas e o cromossomo Y humano. In: “Homo brasilis : Aspectos Genéticos, Linguísticos, Históricos e Culturais da Formação do Povo Brasileiro” (Editor: Sérgio D.J. Pena, Editora FUNPEC).

Page 134: TESE DE DOUTORADO - ICB

134

Santos, F.R. e Tarazona-santos, E. (2002b) The peopling of the Americas: A second major

migration? Am. J. Hum. Genet. 70:1377-1380. Santos FR, e Bonatto SL. (2004) Genética de Populações Humanas. In: “Genômica”

(Organizador: Luís Mir, Editora Atheneu). Santos SS. (2004) Análise da variabilidade genética de populações dos Andes. Dissertação

de mestrado apresentada para obtenção do titulo de mestre ao departamento de Biologia Geral/Pós-graduação em genética,UFMG. Belo Horizonte.

Schaffner SF. (2004) The X chromosome in population genetics. Nat Rev Genet.5(1):43-51. Schlotterer C, e Tautz D. (1992) Slippage synthesis of simple sequence DNA. Nucleic Acids

Res 20:211-215. Schmid CW. (1996) Alu: structure, origin, evolution, significance and function of one- tenth of

human DNA. Prog Nucleic Acid Res Mol Biol 53:283-319. Schneider S, Roessli D, Excoffier L. (2000) Arlequin version. 2000: a software for population

genetics data analysis. Genetics and biometry laboratory, University of geneva, Switzerland.

Seldin MF, Morii T, Collins-Schramm HE, Chima B, Kittles R, Criswell LA, Li H.(2004) Putative

ancestral origins of chromosomal segments in individual African American: implications for admixture mapping. Genome Res.14:1076-1084.

Shriver MD, Parra EJ, Dios S, Bonilla C, Norton H, Jovel C, Pfaff C, Jones C, Massac A,

Cameron N, Baron A, Jackson T, Argyropoulos G, Jin L, Hoggart CJ, Mckeigue PM, Kittles R A. (2003) Skin pigmentation, biogeographical ancestry and admixture mapping. Hum Genet. 112:387-399.

Silva WA, Bortolini MC, Schneider MPC, Marrrero A, Elion J, Krishnamoorthy R, Zago MA (2006) mtDNA Haplogroup Analysis of Black Brazilian and Sub-Saharan Populations: Implications for the Atlantic Slave Trade. Hum Biol 78(1):29-41.

Storto L, e Velden FFV. (2005) Povos Indígenas no Brasil - Karitiana. Available:http://www.socioambiental.org/pib/epi/karitiana/karitiana.shtm, Accessed 15 March 2007.

Suarez-Kurtz G, Vargens DD, Struchiner CJ, Bastos-Rodrigues L, Pena SD (2007) Self-

reported skin color, genomic ancestry and the distribution of GST polymorphisms. Fharmacogenetics and Genomics. 17:765-771.

Taillon-Miller P, Gu Z, Li Q, Hillier L, Kwok PY. (1998) Overlapping genomic sequences: a

treasure trove of single-nucleotide polymorphisms. Genome Res 8:748-754. Tarazona-Santos ,E., Carvalho-Silva, D.R., Pettener, D.,Luiselli, D., Stefano, G.F., Labarga,

C.M., Rickards,O., Tyler-Smith,C., Pena, S.D.J., Santos,F.R. (2001) Genetic differentiation in south Amerindians is related to environmental and cultural diversity: Evidence from the Y chromosome. Am J Hum Genet. 68:1485-1496.

Tarazona-Santos E, (2002) Variabilidade molecular do cromossomo Y em populações nativas americanas. Tese apresentada para obtenção de titulo de Doutor ao Departamento de Bioquímica e Imunologia, UFMG, Belo Horizonte.

Page 135: TESE DE DOUTORADO - ICB

135

Templeton, A. (1997) Out of Africa? What do genes tell us? Curr Opin Genet Dev. 7:841-847. The International HapMap Consortium. (2005) A haplotype map of the human genome.

Nature. 437:1299-1319. Tishkoff SA, Pakstis AJ, Stoneking M, Kidd JR, Destro-Bisol G, Sanjantila A, Lu RB, Deinard

AS, Sirugo G, Jenkins T, Kidd KK, Clark AG. (2000) Short tandem-repeat polymorphism/Alu haplotype variation at the PLAT locus: implications for modern human origins. Am J Hum Genet. 67(4):901-25.

Trinkaus E. (2005) Early modern humans. Ann Rev Anthropol. 34:207-230. Vogt PH, Affara N, Davey P, Hammer M, Jobling MA, Lau YF, Mitchell M, Schempp W, Tyler-

Smith C, Williams G, Yen P, Rappold GA. (1997) Report of the third international workshop on Y chromosome mapping. Cytogenet Cell Genet 79:1-20.

Wang, J. (2003) Maximum-Likelihood Estimation of Admixture Proportions From Genetic

Data. Genetics.164:747-765. Wang S, Lewis CM, Jakobsson M, Ramachandran S, Ray N, Bedoya G, Rojas W, Parra MV,

Molina JA, Gallo C, Mazzotti G, Poletti G, Hill K, Hurtado AM, Labuda D, Klitz W, Barrantes R, Bortolini MC, Salzano FM, Petzl-Erler ML, Tsuneto LT, Llop E, Rothhammer F, Excoffier L, Feldman MW, Rosenberg NA, Ruiz-Linares A. (2007) Genetic variation and population structure in native Americans. PLoS Genet. 3(11):e185.

Wallace DC. (1995) Mitochondrial DNA variation in human evolution, degenerative disease,

and aging. Am J Hum Genet. 57:201-223. Weber JL, David D, Heil J, Fan Y, Zhao C, Marth G. (2002) Human diallelic insertion/deletion

polymorphisms. Am J Hum Genet. 71:854-862. Weir B S. (2003) Uses of DNA and genetic markers for forensics and population studies.

Theor Pop Biol . 63:171–172. Weiss G, von Haeseler A. (1996) Estimating the age of the common ancestor of men from the

ZFY intron. Science. 272:1359-1360. Wilson IJ, Balding DG (1998) Genealogical inference from microsatellite data. Genetics

150:499-510. Wilson IJ, Weale ME and Balding DJ (2003) Inferences from DNA data: population histories,

evolutionary processes and forensic match probabilities. J R Stat Soc Ser A 166:155-201. Xiao FX, Yotova V, Zietkiewicz E, Lovell A, Gehl D, Bourgeois S, Moreau C, Spanaki C,

Plaitakis A, Moisan JP, Labuda D. (2004) Human X-chromosomal lineages in Europe reveal Middle Eastern and Asiatic contacts. Eur J hum Genet. 12:301-311.

Xu H, Chakraborty R and Fu Y-X (2005) Mutation Rate Variation at Human Dinucleotide

Microsatellites. Genetics 170:305-312. Yu N, Zhao Z, Fu YX, Sambuughin N, Ramsay M, Jenkins T, Leskinen E, Patthy L, Jorde LB,

Kuromori T, Li WH. (2001) Global patterns of human DNA sequence variation in a 10-kb region on chromosome 1. Mol Biol Evol 18:214-222.

Page 136: TESE DE DOUTORADO - ICB

136

Zegura LS, Karafet TM, Zhivotovisky LA, Hammer MF (2004) High-resolution SNPs and microsatellite haplotypes point to a single recenty entry of Native American Y chromosomes into the Americas. Mol Biol Evol. 21(1):164-175.

Zhivotvsky LA. (2001) Estimation divergence Time with the use of microsatellite genetic

distances:Impacts of Population Grouwth and Gene Flow. Mol Biol Evol. 18(5):700-709.

Page 137: TESE DE DOUTORADO - ICB

137

8 ANEXOS

Page 138: TESE DE DOUTORADO - ICB

138

ANEXO 1

Artigo publicado - Rinaldo Wellerson Pereira, Simone Silva dos Santos, Sérgio Danilo Junho Pena (2006). A novel polymorphic Alu insertion embedded in a LINE 1 retrotransposon in the human X chromosome (DXS225): identification and worldwide population study. Genetics and Molecular Research.5(1):63-71.

Page 139: TESE DE DOUTORADO - ICB

139

ANEXO 2

Artigo publicado – Simone S. Santos-Lopes, Rinaldo W. Pereira, Ian J. Wilson, Sérgio D. J. Pena (2007). A Worldwide Phylogeography for the Human X Chromosome. PLoS ONE.2(6):e557.

Page 140: TESE DE DOUTORADO - ICB

140

ANEXO 3

Artigo em preparação – Simone S. Santos-Lopes, Sérgio P. Bydlowski, Sérgio D. J. Pena (2007). The Diversity and Ancestry in Brazilians: evidence from the X chromosome.