Upload
truonghuong
View
226
Download
0
Embed Size (px)
Citation preview
PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA UUNNIIVVEERRSSIIDDAADDEE FFEEDDEERRAALL DDEE PPEERRNNAAMMBBUUCCOO
CCEENNTTRROO DDEE CCIIÊÊNNCCIIAASS BBIIOOLLÓÓGGIICCAASS DDEEPPAARRTTAAMMEENNTTOO DDEE GGEENNÉÉTTIICCAA
AANNÁÁLLIISSEE GGEENNÉÉTTIICCOO--HHIISSTTÓÓRRIICCAA
DDEE HHAAPPLLÓÓTTIIPPOOSS EE
HHAAPPLLOOGGRRUUPPOOSS DDOO
CCRROOMMOOSSSSOOMMOO YY HHUUMMAANNOO
NNOO NNOORRDDEESSTTEE BBRRAASSIILLEEIIRROO
AALLEEXXAANNDDRREE MMAAGGAALLHHÃÃEESS MMAARRTTIINNSS
Recife, PE Março, 2007
AALLEEXXAANNDDRREE MMAAGGAALLHHÃÃEESS MMAARRTTIINNSS
AANNÁÁLLIISSEE GGEENNÉÉTTIICCOO--HHIISSTTÓÓRRIICCAA
DDEE HHAAPPLLÓÓTTIIPPOOSS DDOO
CCRROOMMOOSSSSOOMMOO YY HHUUMMAANNOO
NNOO NNOORRDDEESSTTEE BBRRAASSIILLEEIIRROO,,
Dissertação apresentada ao Programa de
Pós-Graduação em Genética da
Universidade Federal de Pernambuco,
como parte dos requisitos necessários para a
obtenção do grau de Mestre em Genética.
Orientador: Prof. Dr. Luiz Maurício da
Silva, Depto. de Genética, Centro de
Ciências Biológicas, UFPE.
Recife, PE Março, 2007
Martins, Alexandre Magalhães
Análise genético-histórica de haplótipos e haplogrupos do cromossomo Y humano no nordeste brasileiro / Alexandre Magalhães Martins. – Recife: O Autor, 2007. 187 folhas : il., fig., tab., graf.
Dissertação (mestrado) – Universidade Federal de Pernambuco. CCB. Genética, 2007.
Inclui bibliografia e anexo.
1. Genética de populações 2. Polimorfismo do cromossomo Y – Nordeste brasileiro 3. Freqüência de Haplótipos – Análise de mutação I. Título. 575.17 CDU (2.ed.) UFPE 576.58 CDD (22.ed.) CCB – 2007-087
Aos meus pais
ADALGUACY e EDNA
e aos meus filhos
THIAGO, ISAAC, MATHEUS e SARA,
dedico.
AAGGRRAADDEECCIIMMEENNTTOOSS
Ao professor Dr. Luiz Mauricio pela orientação, companheirismo e
pelo constante estímulo à busca do conhecimento;
Ao professor Dr. Valdir de Queiroz Balbino, pelo inestimável apoio, e
pela amizade;
À professora Dr(a). Rosilda Silva, sempre disponível, me apoiando
nos momentos de necessidade;
Aos colegas do Laboratório de Genética Molecular Humana da
UFPE pela amizade e apoio.
Aos docentes do Programa de Pós-graduação em Genética da UFPE
que contribuiram para a minha formação;
De maneira especial aos colegas Mestres Jemima Eline Xavier da
Silva Barros e Dalmo Almeida de Azevedo que disponibilizaram as
informações para que este trabalho pudesse ser realizado.
A Deus...
Muito Obrigado!
4
SSUUMMÁÁRRIIOO 11 -- IINNTTRROODDUUÇÇÃÃOO ..................................................................................................................... 16 22 -- RREEVVIISSÃÃOO BBIIBBLLIIOOGGRRÁÁFFIICCAA ................................................................................................. 19
2.1 Estudos Genéticos nas Populações do Nordeste do Brasil..................... 19 2.2 Perfil da População do Estado de Pernambuco .......................................... 22
2.2.1 O Estado de Pernambuco............................................................................ 22 2.2.2 A mistura genética entre povos ............................................................... 23 2.2.3 As origens da população de Pernambuco............................................. 25
2.2.3.1 – Os Ameríndios ..................................................................................... 25 2.2.3.2 – Os Europeus ......................................................................................... 28 2.2.3.3 – Os Africanos ......................................................................................... 30
2.3 Organização do Genoma Humano............................................................... 33 2.3.1 - DNA Singular ou de Cópia Única ...................................................... 34 2.3.2 - DNA repetitivo disperso ....................................................................... 34 2.3.3 - DNA altamente repetitivo ou Satélite............................................ 35 2.3.4 - Famílias de DNA repetitivo e marcadores genéticos ................ 35
2.3.5 – A heranca uniparental do cromossomo Y e das mitocôndrias . 38 2.3.6 - O Cromossomo Y ........................................................................................ 40 2.3.7 Mutação em microssatélites ...................................................................... 43
2.4 Haplogrupos e Haplótipos do cromossomo Y.............................................. 46 2.4.1 Características determinantes .................................................................. 46 2.4.2 Relações entre Haplótipos e Haplogrupos............................................ 56
2.4.2.1 - Agrupamento de haplótipos ........................................................... 56 2.4.2.2 - Haplótipo modal .................................................................................. 57 2.4.2.3 Haplogrupos, Povos e Línguas.......................................................... 57 2.4.2.4 Prognóstico de Haplogrupo a partir de Haplótipos ................... 60 2.4.2.5 Os principais haplogrupos .................................................................. 62
2.5 Estimativas de origem e TMRCA dos haplótipos........................................ 66 2.5.1 Coalescência .................................................................................................... 66 2.5.2 Árvores de genes e a coalescência ......................................................... 67 2.5.3 Modelos de coalescência com mutação................................................. 70 2.5.4 Tempo para o mais recente ancestral comum (TMRCA)................ 71 2.5.5 Árvores filogenéticas baseadas em Y-STR........................................... 72
2.6 Considerações Finais ............................................................................................ 77 33 –– RREEFFEERRÊÊNNCCIIAASS BBIIBBLLIIOOGGRRÁÁFFIICCAASS ..................................................................................... 79 4 - Artigo ............................................................................................................................... 94 5 – Conclusões.................................................................................................................. 130 6 - Abstract ........................................................................................................................ 131 7 - Anexos .......................................................................................................................... 132
7.1. Anexo 1 Informações Complemenares ...................................................... 133 7.3. Anexo 2 Instruções para elaboração do manuscrito ............................ 177
5
LLIISSTTAA DDEE FFIIGGUURRAASS
Figura Página
Figura 1.Estado de Pernambuco e as suas cinco mesorregiões econômico-sociais.
23
Figura 2. Rota migratória dos ameríndios caracterizados pela mutação M3, que os classifica como pertencentes ao haplogrupo Q3
27
Figura 3. Rota migratória das populações que ocupavam a Europa cerca de 10.000 anos atrás. Em destaque a rota dos homens portadores pela mutação M343 de 30.000 anos, que os classifica como pertencentes ao haplogrupo R1b, o haplótipo mais comum na Europa e no Brasil
29
Figura 4: Região de origem do pequeno grupo de homens dos quais se originaram todas as linhagens existentes hoje, pertencentes ao haplogrupo A. Em destaque a mutação M60 do haplogrupo B de cerca de 60.000 anos
32
Figura 5: Região de origem de um marcador muito discriminante de origem africana chamado YAP que é uma inserção ALU (DYS287). Deste grupo originou-se a linhagem E, que possui a mutação M96 ocorrida entre 30.000 e 40.000 anos e da qual se originaram as linhagens E3a e E3b, usadas como referência para caracterizar os Africanos
33
Figura 6: Estrutura de um microssatélite com 11 repetições [TAGA]. A sequência acima corresponde ao alelo 11 (11 repetições).
38
Figura 7: Esquema da distribuição dos marcadores do haplótipo mínimo mais os locos DYS447, DYS458 e DYS464 ao longo do cromossomo Y. (Modificado de Short Tandem Repeat DNA Internet Database).
42
Figura 8: Esquema do deslizamento da polimerase. a) Pareamento normal do filamento novo com o filamento molde. b) Deslizamento do filamento novo para trás dando origem à
44
6
inserção. c) Deslizamento do filamento novo para frente causando a deleção
Figura 9: A diáspora do homem moderno a partir da África para Ásia, Europa e Oceania e posteriormente para as Américas. Os números correspondem à estimativa em anos.
48
Figura 10: As rotas de dispersão da população africana inicial, definidas pelas mutações binárias identificadas na NRY e respectivas haplogrupos
48
Figura 11: Árvore simplificada dos haplogrupos do cromossomo Y definidas pela YCC (2002).
49
Figura 12: Árvore completa dos Haplótipos do cromossomo Y com as respectivas mutações determinantes de cada haplogrupo definidas pelo YCC (2002).
51
Figura 13: Distribuição global dos haplogrupos de Y 54
Figura 14: O mais recente ancestral comum (seta) 17 gerações anteriores a atual, indicando o evento coalescente que caracteriza a ancestralidade comum.
68
Figura 15: Matriz simétrica geradora (a) e árvore ultramétrica gerada (b) pela matriz. A matriz é construída baseada nas distãncias genéticas calculadas entre os elementos doís a dois
75
Figura 16: Duas árvores filogenéticas (networks) construídas a partir de 256 cromossomos Y de arborígenes da África, Ásia, Europa e Austrália para os locos DYS19, DXYS156Y, DYS389, DYS390, DYS392, e DYS393 (esquerda); e usando UEP’s (direita).
75
Figura 17: Árvore filogenética (network) construída a partir de haplótipos com seis marcadores de Y-STR para ameríndios com a mutação P-M45, mostrando o posicionamento dos haplótipos dos índios nativos da América e dos mongóis na Ásia. As distâncias foram calculadas a partir das freqüências alélicas. (Bortolini et al. 2003)
76
7
Manuscrito
Figura 1: Mapa do brasil mostrando a região Nordeste e o Estado de Pernambuco onde as amostras foram coletadas.
121
Figura 2 – Árvore Median-joining das STR’s dos 30 haplótipos mínimos mais comuns e os respectivos haplogrupos prognosticados, representando 94 indivíduos da amostra de Pernambuco. (A) Ponderação baseada na média das taxas de mutação por loco. (B) baseada na variância dos locos. As cores indicam os grupos étnicos prognosticados
122
Anexo 1: Informações Complementares
Figura 1: Interface de cadastro de haplótipos do cromossomo Y na qual calcula-se e informam-se as freqüências relativas e absolutas, número de registros do banco de dados, número de haplótipos, diversidade haplotípica de poder de discriminação.
140
Figura 2: Interface de seleção de haplótipos do cromossomo Y do banco de dados para posterior análise, através da qual é possível verificar os parâmetros básicos da amostra selecionada:freqüências relativas e absolutas, número de registros do banco, número de haplótipos, diversidade haplotípica, poder de discriminação e probabilidade de coincidência.
141
Figura 3: Interface de análise dos haplótipos do cromossomo Y a partir da amostra selecionada através da qual pode se calcular as distâncias genéticas para o haplótipo modal da amostra, fazer prognóstico de haplogrupo por diferentes métodos de cálculo, verificar o anti-modal (alelos menos freqüentes por loco), freqüências relativas e absolutas e impressão das freqüências alélicas.
141
8
Figura 4: Interface de rastreamento de haplótipos do cromossomo Y em outros bancos de dados em função das menores distâncias genéticas, a partir da amostra selecionada.
142
Figura 5: Distribuição das freqüências alélicas de 11 locos de Y-STR, dos 247 indivíduos da amostra de Pernambuco. Para cada loco, a designação do alelo (em número de repetições) indicado no eixo das abcissas , e a freqüência observada (em %) no eixo das ordenadas.
149
Figura 6: Interface de dados das freqüências modais dos haplótipos de referência e fontes bibliográficas .
155
Figura 7: Árvore filogenética segundo o algoritmo Median-joining das STR’s dos 30 haplótipos mínimos mais comuns e o haplogrupo prognosticado representando 94 indivíduos da amostra de Pernambuco.
162
Gráfico 1: Representação da freqüência acumulada do haplótipo de referência e distância genética em Pernambuco estimada pelo SMM (Kimura e Ohta 1978). Os números no eixo X representam as distâncias genéticas e no eixo Y representam as freqüências haplotípicas.
155
Gráfico 2: Número de haplótipos e respectivas distâncias para o modal, usado para ordenar a distância média de mudança de haplogrupo. Para os pontos de pico no gráfico (2, 4 e 8) foram verificadas as mudanças de haplogrupo em média a cada 4 SMM.
157
Gráfico 3: Correlação de Pearson entre os escores encontrados segundo método de Athey (2005) e o algoritmo do programa Y-STRCALC. O índice de correlação entre os dois cálculos foi de 0.
159
9
LLIISSTTAA DDEE TTAABBEELLAASS
Tabela Página
Revisão da Literatura
Tabela 1. Trabalhos de genética de populações realizados com populações do Estado de Pernambuco.
24
Tabela 2. Microssatélites do cromossomo Y mais utilizados na prática forense. O alelo de referência corresponde ao número de repetições em tandem da seqüência depositada no GenBank, que em alguns casos é considerada como reversa e complementar para que haja concordância com motivos usados anteriormente.
41
Tabela 3: Taxas de mutação para marcadores do cromossomo Y e respectivos números de meioses de cada estudo
46
Tabela 4: Haplótipos modais para os haplogrupos mais comuns no banco de dados do FTDNA .
53
Tabela 5: Origens Étnico-Geográficas e afiliação lingüística das linhagens definidas pelo YCC.
58
Manuscrito
Tabela 1: Haplótipos mais freqüente nas populações de referência e respectivas freqüências na população de Pernambuco, Brasil.
117
Tabela 2: Freqüência acumulada do haplótipo de referência e distância genética em Pernambuco estimada pelo SMM
118
Tabela 3: Haplótipos não únicos na população de Pernambuco, comparação com dados do Ybase, Freqüências, escore e prognóstico segundo Athey (2005) e este estudo (Y-STRCALC).
119
Tabela 4: Composição da população de Pernambuco prognosticada pelo programa Y-STRCALC a partir dos haplótipos mínimo e estendido da população total e dos haplótipos apresentados
120
10
na Tabela 3.
Anexo 1: Informações Complementares
Tabela 1: Lista dos 224 haplótipos do cromossomo Y dos 247 homens de Pernambuco, freqüências absolutas e relativas.
143
Tabela 2: Haplótipos mínimos modais nas regiões do Brasil, indicando os locos e os alelos em número de repetições e as freqüências dos alelos, que apresentaram diferenças entre regiões do Brasil
151
Tabela 3: Alelos mais freqüentes de cada loco dos haplótipos mínimos de Y nas populações de Pernambuco, Europa, Brasil, Ameríndios, África, Portugal em duas regiões (Central e Açores). As freqüências aparecem entre parênteses, e os alelos em número de repetições. Os quadros nos quais aparecem duas freqüências são aqueles que definem modalidade do loco, mas não podem ser considerados diferenciadores em razão da semelhança entre as freqüências.
152
Tabela 4: Haplótipos mais freqüente nas populações de referência e respectivas freqüências na população de Pernambuco, Brasil.
152
Tabela 5: Haplótipos mais freqüentes e o modal no Brasi e Holanda/Strasburgo, e respectivas freqüências em Pernambuco, Portugal Central, Portugal Sul, Europa e no mundo.
153
Tabela 6: Freqüência acumulada do haplótipo de referência e distância genética em Pernambuco estimada pelo SMM (Kimura e Ohta 1978) .
153
Tabela 7: Haplótipos modais nas populações de Pernambuco ,Portugal Central, Portugal Sul e Europa.
155
Tabela 8: Haplótipos modais nas populações de Pernambuco ,Portugal Central, Portugal Sul e Europa.
156
11
Tabela 9: Taxas médias de mutação usadas no cálculo dos prognósticos dos haplogrupos.
157
Tabela 10: Haplótipos não únicos na população de Pernambuco e comparação com resultados do Ybase, freqüências, escore e prognóstico segundo Athey (2005) e este estudo (Y-STRCALC).
158
Tabela 11: Composição da população de Pernambuco prognosticada pelo programa Y-STRCALC, a partir dos haplótipos mínimo e estendido da população total e dos haplótipos apresentados na Tabela 3.
159
Tabela 12: Variâncias das freqüências alélicas calculadas, usando o Software Microsoft Excel, para cada loco do haplótipo mínimo da amostra da população de Pernambuco.
160
Tabela 13: Resultados computados para a amostra selecionada de Alagoas
162
Tabela 14: Freqüência acumulada do haplótipo de referência e distância genética em Alagoas estimada pelo SMM (Kimura e Ohta 1978).
162
Tabela 15: Composição da população de Alagoas prognosticada pelo programa Y-STRCALC a partir dos haplótipos mínimo e estendido da população.
163
Tabela 16: Marcadores de polimorfismo do cromossomo Y publicados e respectivos primes
167
Tabela 17: Tempo estimado de expansão e origens das linhagens das Y-STR no Norte da África
171
12
LLIISSTTAA DDEE AABBRREEVVIIAATTUURRAASS
AMOVA Analysis of Molecular Variance Análise Molecular de Variância
AMH Atlantic Modal Haplotype Haplótipo Modal do Atlântico
bp base pair Pares de Bases
CNPq Conselho Nacional de Desenvolvimento Científico e Tecnológico D Diversidade DAZ Deleted in Azoospermia
Deletado na Azoospermia DH Diversidade Haplotípica DHPLC Denaturing High Performance Liquid Cromatography
Cromatografia de Desnaturação Liquida de Alta Performace DNA Deoxiribonucleic Acid
Ácido Desoxirribonucléico dNTP Dinucleotideo Trifosfato
FTDNA Family Tree DNA Sitío de serviços de análise de haplótipos do Cromossomo Y
GD Gene Diversity Diversidade Gênica
H Haplótipo HD Haplotype Diversity
Diversidade Haplotípica HVR Hipervariable Region
Região Hipervariável IBGE Instituto Brasileiro de Geografia e Estatística IC Intervalo de Confiança ISFG International Society of Forensic Genetics
Sociedade Internacional de Genética Forense LGMH Laboratório de Genética Molecular Humana LINE Long INnterpersed Elements
Elementos Longos Intercalados μl Microlitro mM Milimolar mtDNA Mitocondrial Deoxiribonucleic Acid
Ácido desoxirribonucleico mitocondrial MSY Male-specific region of the Y chromosome
Região do cromossomo Y Específica do Macho MVR-PCR Minisatellite Variant Repeat Amplified by PCR
Repetição Variável de Minissatélite Amplificada por PCR ng nanograma NRY Nonrecombining Region of the Human Y Chromosome
Região não recombinante do cromossomo Y Humano PAR1 Pseudoautosomal Region 1
Região Pseudoautossômica 1 PAR2 Pseudoautosomal Region 2
Região Pseudoautossômica 2 PCR Polymerase Chain Reaction
Reação em Cadeia da Polimerase PD Poder de Discriminação
13
RFLP Restricted Fragment Length Polymorphisms Polimorfismo de comprimento de fragmentos de restrição
SINE Short INterpersed Elements Elementos curtos Intercalados
SMM Stpwise Mutation Model Modelo de Mutação Passo a Passo
SNP Single Nucleotyde Polymorphism Polimorfismo de Único Nucleotídeo
SRY Sex Determining region of the Y chromosome Região determinante do sexo no cromossomo Y
STRs Short Tandem Repeats Repetições Curtas em Tandem
Taq Thermophylus aquaticus TMRCA Time to Most Recent Common Ancestor
Tempo para o Mais Recente Ancestral Comum U Unidade UAZ Universidasde do Arizona UEP Unique Event of Polymorphism
Evento Único de Polimorfirmo UFPE Universidade Federal de Pernambuco V Variância VNTRs Variable Number of Tandem Repeats
Repetições em Tandem de Número Variável YAP Y chromosome Alu polymorphism YCC Y-Chromosome Consortium YHRD Y Haplotype Reference Database
Base de Dados de Referência de Haplótipo do Y Y-STRCALC Software desenvolvido para cálculo e prognóstco de haplogrupo do
cromossomo Y
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
14
RREESSUUMMOO
Neste trabalho foi feita a análise dos polimorfismos de 15
microssatélites do cromossomo Y (haplótipo mínimo mais locos DYS447,
DYS458, DYS464) em uma amostra da população de Pernambuco,
constituída por 247 indivíduos não aparentados e um banco de dados
construídos apartir de haplótipos das diversas populações que
historicamente participaram na composição étnica da população deste
Estado. A abordagem estatística foi feita com base nas freqüências
haplotípicas assumindo o modelo de mutação passo a passo (Stepwise
Mutation Model - SMM). Foi possível estabelecer um modelo que se
mostrou útil na determinação da contribuição genética das três principais
etnias formadoras da população de Pernambuco, e também inferir o
haplogrupo ao qual cada haplótipo pertence. Foi desenvolvido um método
de trabalho para estabelecer relações entre as freqüências alélicas dos
haplótipos e os haplogrupos com o propósito de verificar a provável
origem étnica de cada indivíduo. Também possibilitou quantificar e inferir
os haplogrupos a partir de haplótipos modais de referência, levando em
conta as taxas de mutação por loco como fator de ponderação do
prognóstico. Para isto, foi gerado um banco de dados que incorporou as
informações e foram desenvolvidos algoritmos para os cálculos e
interfaces de manipulação dos dados. Foram observados 247 indivíduos
diferentes e identificados 183 haplótipos mínimos distintos (153 únicos).
Foram estimados uma diversidade haplotípica igual a 0,9951 e um poder
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
15
de diferenciação igual a 0,7409. O haplótipo mínimo mais comum ocorreu
15 vezes. Este haplótipo apresentou em Pernambuco uma freqüência
superior àquelas encontradas na Europa, Portugal e das outras regiões do
Brasil. O haplótipo da população africana apresentou em Pernambuco,
uma freqüência maior do que o haplótipo ameríndio. O método de
prognóstico se mostrou eficiente e compatível com os existentes na
literatura. Como conseqüência, foi possível quantificar a contribuição de
cada etnia masculina para a composição populacional de Pernambuco. A
construção filogenética de árvores utilizando o algoritmo Median-Joining,
ponderadas pelas taxas de mutação das pequenas repetições em tandem
(STR), se mostrou bastante similar àquelas feitas utilizando as variâncias
das frequencias alélicas dos locos e apresentou coerência na distribuição
dos haplótipos, de acordo com os haplogrupos prognosticados.
PPAALLAAVVRRAASS--CCHHAAVVEE:: genética histórica, haplogrupo, microssatélites do
cromossomo Y, haplótipo mínimo, DYS447, DYS458, DYS464,
Pernambuco, Brasil.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
16
1 - Introdução
Diversos marcadores polimórficos de DNA se encontram distribuídos
por todo o genoma. Estes marcadores deram uma nova dimensão aos
estudos moleculares da variabilidade genética vêm sendo amplamente
utilizados em diversas áreas, incluindo identificação individual,
mapeamento de genes e estudos populacionais.
Uma maneira de se estudar as populações atuais é através da
representação geográfica dos dados. Para este propósito, consideram-se
primordialmente as freqüências alélicas. É bem estabelecido que a
proporção de alelos varia de um lugar para outro, mas geralmente a
diferença é pequena entre populações vizinhas, de forma que as maiores
diferenças são observadas entre populações distantes. Neste sentido, é
possível realizar estudos que mostrem a distribuição das freqüências dos
alelos ao longo do planeta, caracterizando as populações em função
destas freqüências .
Os haplótipos do cromossomo Y têm sido freqüentemente usados
em estudos de evolução humana, auxiliando na identificação da origem
étnico-geográfica e da afiliação lingüística de um indivíduo. Estes estudos
sempre assumem que os haplótipos da região não recombinante do
cromossomo Y (NRY) devem ter se originado a partir de haplótipos
característicos dos primeiros ancestrais humanos (Pena et al. 2000).
Considerando que as linhagens haplotípicas apresentam diferentes
variações nas pequenas repetições em tandem do cromossomo Y (STR-Y)
em razão de suas histórias evolutivas distintas, é possível correlacionar
um indivíduo a um dado haplogrupo e, por conseguinte, estimar sua
origem étnica. Para tanto, usam-se as freqüências alélicas que
potencialmente conferem a cada sublinhagem haplotípica um padrão
característico de polimorfismo (Tarazona-Santos et al. 2001).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
17
A família patriarcal, base da sociedade da região canavieira,
contribuiu para a perpetuação da patrilinhagem européia no nordeste do
Brasil, uma vez que o modelo familiar adotado previa um número elevado
de filhos e a submissão da mulher. Este último fator colaborou para a
mestiçagem, principalmente com as mulheres negras escravas, pois estas
estavam mais estreitamente relacionadas com o ambiente doméstico.
Neste contexto, definiu-se o perfil genético da população de Pernambuco,
sendo Portugal a principal referência genética masculina desta região
(Carvalho-Silva et al. 2001). Adicionalmente, deve-se ressaltar a presença
holandesa durante um quarto de século (1630-1654), cuja influência
ainda se faz notar em aspectos culturais, econômicos, urbanísticos e,
certamente na composição genética da população.
Assim, a utilização de haplótipos do cromossomo Y constituídos por
marcadores de microssatélites, é uma alternativa interessante para
estudos populacionais. Existe um grande interesse em prognosticar o
haplogrupo a partir de um conjunto de marcadores de STR (Athey 2005).
O estudo das populações miscigenadas, usando estes marcadores,
beneficia-se diretamente dos bancos de dados existentes para a
construção dos perfis haplotípicos, determinados pelo fluxo gênico
masculino ao longo das gerações.
O presente trabalho tem como objetivos:
Geral:
Estabelecer a relação entre os períodos de coalescência
dos haplótipos de Y pernambucanos e os haplogrupos e,
se possível, seus locais de origem baseado nos modelos
de coalescência.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
18
Específicos:
Relacionar, a partir da análise das freqüências dos
haplótipos do cromossomo Y, como amostragem da
população pernambucana, as freqüências e a origem
desses haplótipos.
Rastrear os haplótipos do cromossomo Y até sua
provável origem.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
19
22--RREEVVIISSÃÃOO BBIIBBLLIIOOGGRRÁÁFFIICCAA
2.1 Estudos Genéticos nas Populações do Nordeste do Brasil
Embora não exista fundamento biológico para o termo “raça
humana”, os estudos estratificados que utilizam esta terminologia para
enquadramento são muito freqüentes e polêmicos. Os parâmetros que
possam caracterizar as raças estão voltados para alguns padrões
fenotípicos, tais como cor da pele, formato do nariz, entre outros. O
gradiente de distribuição destes fenótipos não corresponde à distribuição
dos grupos por eles representados, ou seja, o padrão de distribuição
genética que poderia estar associado, não se enquadra ao padrão de
distribuição fenotípico das populações. Estudos realizados pelo IBGE em
1991 indicando por auto classificação a distribuição das cores ou “raças”
no Nordeste brasileiro, revelaram que aproximadamente 26,6% da
população se denomina branca, 5,6% negra, 67% parda e 0,13%
indígena. Estes percentuais variam muito entre regiões do país, chegando
a 83% de auto denominados brancos na Região Sul. O exame de
polimorfismo de nucleotídeo único (SNP) da região não recombinante do
cromossomo Y (NRY), realizado em 200 brasileiros auto definidos como
brancos de várias regiões geográficas, demonstrou que a grande maioria
dos cromossomos Y (97,5 %) é de origem européia, 2,5 % são de origem
africana e nenhum de origem ameríndia (Carvalho-Silva et al. 2001). Os
estudos comparativos demonstraram que a variação haplotípica de STR’s
do cromossomo Y (Y-STR) entre as populações das cinco regiões
geopolíticas do Brasil não é significativa (Santos et al. 2003; Grattapaglia
et al. 2004). Em razão disto, os estudos genéticos das populações não
devem basear-se em aspectos morfológicos, mas sim em relações
genealógicas, culturais, históricas e sociais, envolvendo a ancestralidade
comum entre os grupos de indivíduos, aproximando-os segundo a sua
ancestralidade.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
20
Trabalhos realizados com marcadores de DNA mitocondrial para
matrilinhagens em caucasóides caracterizam a Região Nordeste do Brasil
como sendo constituída por: 44% de indivíduos de origem africana, 34%
de origem européia e 22% de origem ameríndia ou asiática.
Diferentemente do que acontece com marcadores do cromossomo Y que
apontam um percentual de 12,3% de origem africana e nenhum de
origem ameríndia (Alves-Silva et al. 2000). De acordo com Santos et al.
(2003), a diversidade de haplótipos de microssatélites do cromossomo Y
da população da Bahia é semelhante à de Portugal e significativamente
maior que a de populações do noroeste da África, região de origem de
grande parte dos africanos transportados para a região Nordeste do Brasil.
Isto sugere que a diversidade das linhagens deve-se à predominância de
haplótipos europeus, uma vez que esta diversidade tenderia a diminuir
caso as linhagens predominantes fossem africanas.
Os haplótipos do cromossomo Y no Nordeste do Brasil, a exemplo do
resto do mundo, estão sendo estudados nos últimos anos principalmente
em razão da sua aplicação forense e/ou antropológica. Apesar disto, a
disponibilidade dos dados ainda é pequena devido à falta de padronização
dos marcadores e de construção de bancos de dados unificados no Brasil.
O conjunto de marcadores genéticos tem como principal finalidade, a
determinação da diversidade dos haplótipos e de um perfil com alto poder
de discriminação para testes de paternidade. Neste sentido estuda-se em
maior detalhe os microssatélites. O principal haplótipo estudado é o
“haplótipo mínimo” assim denominado pelo Consórcio do Cromosossomo Y
(The Y-Chromosome Consortium 2002). Um estudo realizado com 198
indivíduos do sexo masculino, sendo 42 do Nordeste brasileiro, apresentou
uma diversidade haplotípica igual a 0,955 para a região Nordeste
(Grattapaglia et al. 2004). Neste estudo, as regiões do Brasil não diferem
estatisticamente entre si (FST= 0.00031). Aquele primeiro evidenciou o
haplótipo característico dos europeus no Nordeste: o “haplótipo modal do
atlântico” – AMH (Wilson et al. 2001), o mais freqüente no Brasil.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
21
Outros estudos realizados com cromossomos autossômicos apontam
para a estreita relação de características genéticas entre as populações
européias e nordestinas. Algumas pessoas têm uma pequena falha nas
cópias de um gene que codifica um receptor particular na superfície da
célula, chamado de receptor 5 da beta-quimiocina (CCR5). Esses
indivíduos não produzem receptores CCR5 na superfície de suas células. A
maioria dos tipos de HIV-1, o vírus que causa a Síndrome da
Imunodeficiência Adquirida (AIDS), liga-se ao CCR5 para entrar nas
células e, portanto, as pessoas que carecem dos receptores CCR5 são
resistentes à infecção pelo HIV-1 (Samson et al. 1996). Este polimorfismo
do gene receptor CCR5 é encontrado no norte europeu, chegando a 14%
nos países escandinavos, enquanto na Península Ibérica o percentual é
mais baixo – aproximadamente 6%. Pesquisa realizada nas nove capitais
do Nordeste revela que cerca de 8% da população mostra alguma
resistência ao HIV-1, graças à presença do gene CCR5 defeituoso.
Esta amostra de estudos genéticos realizados com populações do
Nordeste do Brasil, permite uma avaliação da variedade de abordagens
que são feitas. Em algumas delas evidencia as semelhanças, em outras,
as diferenças existentes em relação a outras regiões. Espera-se, que ao
refinar os estudos, com amostras mais representativas e estratificadas,
obter uma diferenciação genética cada vez maior, não somente entre
Regiões, mas entre estados, já que muitos destes, inclusive o Estado de
Pernambuco, possuem características próprias na formação da sua
população.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
22
2.2 Perfil da População do Estado de Pernambuco
2.2.1 O Estado de Pernambuco
Pernambuco é uma das 27 unidades federativas do Brasil. Está
localizada no centro-leste da região Nordeste e tem como limites os
estados da Paraíba e Ceará (NO), oceano Atlântico (L), Alagoas e Bahia
(S), e Piauí (O) e ocupa uma área de 98.937,8 km². Sua capital é a cidade
de Recife. Segundo o IBGE (2005), o Estado de Pernambuco tem
aproximadamente 8.413.593 de habitantes, sendo 47% homens, e 53%
mulheres, classificados em três “etnias”: negros (4%), brancos (37%) e
pardos (58%). Possui 185 municípios e é dividido em cinco mesorregiões
econômico-sociais: a do São Francisco Pernambucano, a Zona da Mata, o
Agreste, o Sertão e a região metropolitana de Recife (Figura 1).
Pernambuco é um dos menores estados do país. Apesar disto, possui
paisagens variadas: serras, montanhas, planaltos, brejos e desertos no
interior e costa. O Estado tem altitude crescente do litoral ao sertão - a
planície litorânea, e os planaltos e montanhas do interior ultrapassam os
1000m de altitude. O clima de Pernambuco é diversificado, variando do
tropical - quente e úmido, com fortes chuvas de inverno ao semi-árido -
quente e extremamente seco. Exceções são algumas cidades com
microclima de altitude, com temperaturas que podem chegar a 8°C
durante o inverno considerados Brejos de Altitude. Outra exceção é a
mesoregião do São Francisco, mais úmida que as circundantes por conta
do Rio São Francisco e da irrigação proveniente dele. Esta diversidade
geográfica é determinante na definição do estilo de vida e na
caracterização das populações. (http://pt.wikipedia.org/wiki/Pernambuco)
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
23
Figura 1: Estado de Pernambuco e as suas cinco mesorregiões econômico-sociais: a do São Francisco Pernambucano (1); o Sertão (2); o Agreste (3) a Zona da Mata (4); e a região metropolitana de Recife (5).
2.2.2 A mistura genética entre povos
Milhares de anos após a dispersão do grupo africano inicial de
humanos, povos oriundos da Ásia (ameríndios), da Europa (principalmente
portugueses) e da África (escravos da África Ocidental e Central)
reencontraram-se no Brasil. A partir dessa confluência, iniciou-se um
processo de mistura gênica resultando no brasileiro atual (Pena et al.
2000). Sendo assim, os brasileiros compõem uma das mais heterogêneas
populações do mundo, resultado de cinco séculos de cruzamento
interétnicos entre povos de três continentes: os colonizadores Europeus,
representados principalmente por portugueses; escravos africanos e
índios (Freyre 1933). Esta mistura predomina na região Nordeste do
Brasil. Pernambuco, um dos locais mais representativos estados desta
região em razão de ter prosperado e ser um dos primeiros a ser
colonizado, tem um cenário determinado por um padrão de colonização
bem definido, no qual a estrutura social influenciou o comportamento
sexual e, e como conseqüência determinou a distribuição dos genes para
composição da população atual.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
24
Algumas publicações têm abordado a genética de populações do
Estado de Pernambuco, sendo grande parte voltada para as questões
forenses e antropológicas (Tabela 1).
Tabela 1: Trabalhos de genética de populações realizados com populações do Estado de Pernambuco
AUTOR TÍTULO DA PUBLICAÇÃO MARCADORES RESULTADOS (RESUMO)
Dellalibera et
al. (2004)
Genetic analysis of 13 STR
loci in the population from
the State of Pernambuco,
northeast Brazil.
13
microssatélites
autossômicos de
546 idivíduos
Constatação do equilíbrio de Hardy-
Weinberg Marcadores úteis para uso
forense.
Nigam et al.
(2004)
Polymorphism of HLA class I
genes in the Brazilian
population from the
Northeastern State of
Pernambuco corroborates
anthropological evidence of
its origin
Distribuição
alélica de
antígenos de
genes de
leucócitos
humanos (HLA)
classe I (HLA-A,
HLA-B, and HLA-
Cw)
A heterozigosidade para os loci
observados foi 79.21% para HLA-A,
87.13% para HLA-B, e 77.23% para
HLA-Cw. Os dados corroboram com
as evidências antropológicas a
respeito da origem da população de
Pernambuco.
Mauricio-da-
Silva et al.
(2000)
Population genetics of
HPRTB, F13B, and LPL in
Pernambuco, Northeast
Brazil
HPRTB, F13B,
(STRs) de 134
indivíduos.
Hardy-Weinberg proportions. Alelos
mais freqüentes H PRTB*13,
F13B*10, LPL*10. A
probabilidade combinada de
paternidade e o poder de
discriminação foram altos permitindo
a utilização com propósitos forenses
Barros et al.
(2005)
*submetido
Y – Chromosome Human
STR Haplotype diversity and
population data in
Pernambuco, Northeast
Brazil
Marcadores de
microssatélite
do cromossomo
Y – STR de 247
indivíduos
Os alelos mais freqüentes em
Pernambuco foram comparados aos
das populações ancestrais,
demonstrando a estreita relação com
os caucasianos. A combinação do
haplótipo mínimo com os locos
DYS447, DYS458 e DYS464
aumentou significativamente o poder
de discriminação.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
25
2.2.3 As origens da população de Pernambuco
O modelo sócio-econômico predominante no período colonial
garantiu a prosperidade econômica para Pernambuco e foi determinante
na composição étnica da população e na sua mestiçagem. Os
portugueses, habituados ao contato com outros povos, uniram-se a
mulheres índias e negras desde o início do período colonial (Ferreira
1987). A família patriarcal, base da sociedade da região canavieira,
contribuiu para a perpetuação da patrilinhagem européia, uma vez que o
modelo familiar adotado previa um número elevado de filhos e a
submissão da mulher. Este último fator colaborou para a mestiçagem,
principalmente com as mulheres negras escravas, pois estas estavam
estreitamente relacionadas com o ambiente doméstico, sob domínio do
senhor do engenho (Ribeiro 1995). Neste contexto, desenhou-se o perfil
genético da população de Pernambuco, sendo Portugal a principal
referência genética masculina desta região (Carvalho-Silva et al. 2001).
Adicionalmente, deve-se ressaltar a presença holandesa durante um
quarto de século (1630-1654), cuja influência ainda se faz notar em
aspectos culturais, econômicos, urbanísticos e, certamente, na
composição genética da população. Pernambuco tem em sua história uma
valiosa contribuição para a determinação de sua composição étnico-
populacional. Por esta razão, pode-se definir a população pernambucana,
a exemplo do restante do Nordeste Brasileiro, como sendo basicamente,
européia, africana e ameríndia.
2.2.3.1 – Os Ameríndios
A maioria dos indígenas das Américas descende de populações da
área central da Sibéria, na Ásia (Pena et al. 2000). Há uma concordância
geral de que a principal rota dos ancestrais de ameríndios no continente
ocorreu através do Estreito de Bering. Quando os primeiros europeus
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
26
chegaram ao território brasileiro, no início do século XVI, vários grupos
indígenas ocupavam a região Nordeste. Aquela primeira colonização das
américas parece ter ocorrido a cerca de 32.000 anos, como estimado por
Cavalli-Sforza et al. (1994), que usaram dados provenientes de
cromossomos autossômicos para esta datação. Por outro lado, estudos
baseados em DNA mitocondrial datam a primeira colonização há 20.000
anos (Stone e Stoneking 1998). A conclusão tanto dos estudos com
mtDNA como com cromossomo Y estão de acordo com a teoria de uma
única entrada migratória para as américas através do estreito de Bering
entre 21.000 e 25.000 anos atrás (figura 2). Este tempo baseia-se nas
estimativas de cálculo de coalescência cujo princípio básico é traçar uma
linha dos indivíduos de hoje em uma população, até seus ancestrais
comuns. Através desta linha é possível estimar o tempo de separação
entre duas populações usando-se as taxas de mutação para determinados
tipos de marcadores moleculares binários (SNP) e inserções Alu, definidos
como UEP (evento único de polimorfismo), para mutações mais raras, e
também microssatélites (Repetições pequenas em tandem - STR) com
mutações mais freqüentes. Os trabalhos de Bortolini et al.(2003) e Zegura
et al. (2004), usando marcadores binários para o cromossomo Y,
esclareceram que a linhagem ameríndia americana do sul, em sua maior
parte, descende de um único ancestral comum que possuía a mutação M3
definida para o haplogrupo Q, sendo assim considerado o mais
característico para a definição do pool gênico autóctone. Esta mutação é
atribuída a linhagem de um Americano nativo fundador caracterizada por
uma transição de bases C→T, determinando o marcador M3 na linhagem
ancestral P-M45.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
27
Figura 2: Rota migratória dos ameríndios caracterizados pela mutação M3 que os classifica como pertencentes ao haplogrupo Q3. Estes homens que adentraram as Américas pelo estreito de Bering entre 21.000 e 25.000 anos atrás são os ancestrais mais comuns dos nativos da América do sul (incluindo o Brasil). Observe o começo da linha destacada (alto esquerda) que indica a região na qual a mutação (SNP) ocorreu. (Modificado de https://www3.nationalgeographic.com/genographic/atlas.html). Por outro lado, observou-se que o padrão de variabilidade das curtas
repetições em tandem do cromossomo Y (Y-STR) das populações
ameríndias modifica-se dentro e entre as populações, sugerindo que
fatores como a deriva genética são determinantes para estas variações
(Tarazona-Santos et al. 2001). Os dados convergem para uma data de
colonização da América do sul em torno de 12.000 anos, sendo este
tempo, insuficiente para descaracterizar o padrão de freqüências alélicas
do haplótipo mínimo, que é o grupo de marcadores mais utilizados
principalmente na área forense, para os locos de Y-STR mais conservados
neste haplogrupo. Apesar da deriva genética e das altas taxas de mutação
nestes locos, a neutralidade e o isolamento em relação a outras
populações em quase a totalidade deste período, garantiu a manuntenção
dos alelos mais freqüentes ao longo do tempo. Observa-se um conjunto
de alelos que compõem o haplótipo mínimo: DYS19 = 13, DYS391 = 10 e
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
28
DYS393 = 13, característicos para a maior parte das populações ameríndias
(Bortolini et al. 2003).
Geneticamente o grupo ameríndio está bem distante (> 20.000
anos) dos grupos que compõem as linhagens européias, e ainda mais
distante dos antepassados comum a ambas; os africanos. De maneira
análoga ao estudo do cromossomo Y, usando mtDNA, também foi possível
determinar os haplogrupos (A,B,C e D) que compõem as matrilinhagens
sul americanas nativas (Alves-Silva et al. 2000).
2.2.3.2 – Os Europeus
A costa nordestina foi a primeira área do país a ser ocupada pelos
portugueses em 1500. A população ibérica, na qual se inserem os
portugueses, no momento em que começou sua expansão, já possuía uma
grande variabilidade genética em razão do intenso processo de invasões
sucessivas ocorridas naquela região, realizadas principalmente pelos
romanos, bárbaros e mouros. Estas invasões aumentaram a variabilidade
genética, e misturou as populações o bastante para torná-las menos
diferenciáveis entre si, conforme se observa usando o grande número de
informações de Y-STR disponibilizadas por bancos de dados como o Y-
chromosomal Haplotypes Reference Database (YHRD) e pelo YBASE
(Genealogy by numbers). Estes bancos têm sido instrumentos relevantes
para pesquisas forenses e antropológicas (Roewer et al. 2001). Análises
filogenéticas de Y-STR mostraram-se até certo ponto, eficientes na
quantificação da diferenciação genética entre populações e, em geral,
concordam com os estudos feitos usando marcadores binários (Foster et
al. 2000).
O levantamento de dados filogeográficos de 25 marcadores binários e
15 Y-STR’s na população portuguesa, revelou não haver diferenças
significativas entre as regiões daquele país. A divisão tradicional das
regiões Norte, Centro e Sul, geralmente feitas nos estudos genéticos não
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
29
se estabeleceu usando o haplótipo mínimo. Somente a região do Alentejo
mostrou uma pequena diferenciação (Beleza et al. 2006). Estudos através
dos quais podem se estabelecer padrões entre marcadores de
microssatélites e marcadores binários (haplótipos de STR e haplogrupos)
na mesma amostra, têm se tornado mais intensos. Este último mostrou
que a população portuguesa é composta por aproximadamente 13% de
indivíduos das linhagens do haplogrupo E, 5% haplogrupo G, 10% I e J,
1% R1a e cerca de 56% R1b (Beleza et al. 2006). Este último haplogrupo
é o mais representativo da população européia. A maioria dos europeus,
dos portugueses e dos brasileiros pertence a este haplogrupo (figura 3).
Este haplogrupo é caracterizado pela mutação M343 que se expandiu pela
Europa à cerca de 30.000 anos pelo homem de Cro-Magnon (YCC 2002).
Figura 3: Rota migratória das populações que ocupavam a Europa a cerca de 10.000 anos. Em destaque a rota dos homens caracterizados pela mutação M343 de 30.000 anos, que os classifica como pertencentes ao haplogrupo R1b, o haplótipo mais comum na Europa e no Brasil.(ref.: https://www3.nationalgeographic.com/genographic/atlas.html). Ao comparar as populações brasileira e portuguesa usando
marcadores binários no cromossomo Y de 200 indivíduos brasileiros e 93
portugueses, Carvalho-Silva et al. (2001) observaram que, apesar de
vários anos de misturas genéticas que ocorreram em ambos os países,
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
30
existe uma grande similaridade entre as freqüências dos haplogrupos.
Referem-se ainda à provável influência genética dos holandeses, em razão
do sensível incremento na região nordeste, da freqüência do haplogrupo
mais freqüênte na Holanda. Os números desta análise do cromossomo Y
no Brasil mostraram que 57% das linhagens paternas vêm da Europa. A
grande proporção deste haplogrupo comum na Holanda, sobretudo no Sul
(28%) e Nordeste (19%) , está ligada à imigração de outros europeus
além dos portugueses e à invasão holandesa, respectivamente.
2.2.3.3 – Os Africanos
As evidências obtidas a partir da análise dos cromossomos Y são
inequívocas. Desprezando a incerteza a respeito da determinação do
tempo para o ancestral comum mais recente, nenhum ancestral de mais
de 200.000 anos atrás, de linhagem do cromossomo Y, foi achado no
mundo. A raiz desta árvore filogenética é africana com dois braços (A e B)
ambos evidenciando uma ampla distribuição, mas geralmente presente
em freqüências moderadas. Por exemplo, o haplogrupo A definido pela
mutação M91 é característico das etnias Khoisan (36%) e Khwe (12%)
desde o sul da África (na região do deserto de Kalahara), Malianos (2%) e
desde oeste, Sudaneses (45%) e Etíopes do leste (14%), mas fora da
Áfica somente na Sardenha (5% - 1 indivíduo), que foi interpretado como
resultado de um evento recente (Knight et al. 2003). O Haplogrupo B,
definido pela mutação M60 ocorrida entre 50.000 e 60.000 anos, foi
achado em grande parte das mesmas populações e também em outras
sub-saharianas incluindo a Baka (pigmeus habitantes do sudoeste das
florestas tropicais africanas, em Camarões e Congo) (35%) e Pgmeus
Mbut (catadores coletores do Congo) (33%), Bamileke (República de
Camarões) (4%) e Fali (Norte da República de Camarões) (18%).
Surpreendentemente, este haplótipo foi também achado em
Paquistaneses (2%), isto pode representar uma migração, pré-histórica ou
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
31
recente. Os cálculos para TMRCA, restritos às linhagens divergentes da
África e a evidência de uma expansão para fora da África em conjunto,
mostram que a diversidade de Y emergiu da África recentemente e
substituiu os cromossomos Y em todos os lugares (Figura 4). Isto não
significa dizer que outros locos devem apresentar o mesmo padrão, mas o
cromossomo Y nos dá evidências de não haver contribuição das espécies
Homo ancestrais e poucos sinais disso foram detectados usando outros
locos (Jobling e Tyler-Smith 2003). As linhagens definidas pelos
marcadores binários refletem variações das STR-Y e conseqüentemente
possuem histórias evolutivas distintas. Desta forma é possível
correlacionar um indivíduo a um dado haplogrupo e prever sua etnia
usando as freqüências alélicas, que potencialmente conferem a cada
sublinhagem um padrão característico de polimorfismo. O homem que deu
origem à linhagem E, caracterizada pela mutação M96, provavelmente
nasceu na África entre 30.000 e 40.000 anos e seus descendentes
migraram para a África Sub-sahariana, norte e oeste da África dando
origem ás sublinhagens E3a e E3b (figura 5). É atualmente postulado que
a dispersão do haplogrupo E3b se deu em torno de 3.000 anos, pela
expansão das populações Bantu (Pereira et al. 2002). Esta linhagem é a
mais comum entre os Afro-Americanos. Hoje, a maior parte dos sub-
saharianos compartilham estas linhagens. Em razão da sua predominância
na África Oriental, muitos afro-americanos traçam sua história genética a
partir desta linhagem. De acordo com os estudos de Thomas et al. (2000)
que descreveram um forte “efeito do fundador” para Y-STR nos africanos
do sul de origem Bantu, estas observações são consistentes com a
hipótese de que um haplótipo considerado fundador é também o mais
freqüente em outras populações que estiveram no caminho da migração
Bantu (Pereira et al. 2002). Moçambique desde 1493 estabeleceu relações
mercantis com Portugal e foi uma colônia portuguesa de 1752 a 1975 e. O
colonialismo português foi caracterizado pela migração de um baixo
número de pessoas (exceção do Brasil), predominantemente homens que
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
32
intercruzaram com as mulheres locais (Russell-Wood 1998). O haplótipo
fundador hipotético compreende sete STR’s, das quais cinco pertencem
ao haplótipo mínimo (DYS19=15, DYS390=21, DYS391=10, DYS392=11
e DYS393=13). É o mais freqüente em Angola (28%), São Tomé e
Príncipe (10%) enquanto em Moçambique ele possui a mesma freqüência
(10%) do haplótipo vizinho (15,21,10,11,14), possui diferença de apenas
1 repetição no loco DYS393 segundo Pereira et al. (2002). A grande
diversidade de haplogrupos africanos é compatível com o fato de que os
escravos foram trazidos para o Brasil de diversas áreas diferentes,
principalmente povos da etinia Banto e Sudanêsa, do oeste africano, mas
também de Moçambique, no leste (Pena et al. 2000).
Figura 4: Região de origem do pequeno grupo de homens dos quais se originaram todas as linhagens existentes hoje pertencentes ao haplogrupo A. Em destaque mutação M60 do haplogrupo B de cerca de 60.000 anos (ref.: https://www3.nationalgeographic.com/genographic/atlas.html).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
33
Figura 5: Região de origem de um marcador muito discriminante de origem africana chamado YAP que é uma inserção ALU (DYS287). Deste grupo originou-se a linhagem E (em destaque) que possui a mutação M96 ocorrida entre 30.000 e 40.000 anos e da qual se originaram as linhagens E3a e E3b usadas como referência para os Africanos. (ref.: https://www3.nationalgeographic.com/genographic/atlas.html
2.3 Organização do Genoma Humano
Pelas estimativas atuais, o genoma humano contém cerca de 30.000
genes (os quais codificam cerca de 100.000 proteínas) que controlam
todos os aspectos da embriogênese, do desenvolvimento, do crescimento,
da reprodução e do metabolismo - essencialmente todos os aspectos do
que faz do ser humano um organismo funcional. As seqüências que
codificam as proteínas são compostas principalmente por nucleotídeos que
compõem os genes. As seqüências codificantes constituem a menor
porção do DNA total de nosso genoma. Além dos genes, o DNA é formado
na sua maior parte por material genético aparentemente inativo (97%), o
qual parece não possuir qualquer utilidade. Estudos recentes mostram que
este material não pode ser desprezado e coloca-se a hipótese dele
desempenhar funções de coordenação, de conservação e de regulação
gênicas (Watterson et al. 1999)
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
34
As regiões do genoma, similares em organização, replicação ou
expressão dos genes, não são dispostas aleatoriamente. Existe uma
tendência de agrupamento destas regiões relacionando-as com a
organização estrutural, como se verifica através do bandeamento dos
cromossomos metafásicos. O resultado disto é que os cromossomos
podem ser separados por regiões do genoma e classificados quanto ao
tipo de DNA existente nelas.
2.3.1 - DNA Singular ou de Cópia Única.
As seqüências que codificam proteínas (a porção codificadora dos
genes) compreendem apenas uma pequena proporção do DNA de cópia
única. A maior parte deste DNA encontra-se em extensões curtas
entremeadas com diversas famílias de DNA repetitivo e corresponde a
75% do genoma (Schmid e Jelinek 1982).
2.3.2 - DNA Repetitivo Disperso
Este grupo consiste em seqüências relacionadas que se espalham por
todo o genoma. Os elementos repetidos dispersos mais estudados
pertencem à família Alu e a família L1 (Schmid e Jelinek 1982).
Família Alu
Esta família tem essa denominação porque a maioria dos seus
membros é clivada por uma endonuclease de restrição bacteriana
denominada Alu I, instrumento importante da tecnologia do DNA
recombinante. Os membros dessa família têm um comprimento de cerca
de 300 pares de bases e são relacionados uns aos outros, mas não
exibem uma seqüência idêntica entre eles. No total existem cerca de
500.000 membros da família Alu no genoma, estimando-se que
constituam 3% do DNA humano (Schmid e Jelinek 1982).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
35
Família L1
Constituem seqüências repetidas, longas, encontradas em
cerca de 10.000 cópias por genoma. Assim, embora existam muito
menos cópias nessa família do que na Alu, seus membros são bem
mais longos e a contribuição para a constituição do genoma pode
chegar a 30% (Boissinot e Furano 2005).
2.3.3 - DNA altamente repetitivo ouDNA satélite
Envolve seqüências repetidas em tandem, agrupadas em um ou mais
locais, intercaladas com seqüências de cópia única, ao longo do
cromossomo. As famílias de DNA satélite variam quanto à localização no
genoma, comprimento total da série em tandem e no comprimento das
unidades repetidas que constituem a série (Boissinot e Furano 2005).
2.3.4 – As Famílias de DNA repetitivo e os marcadores genéticos
Existem várias categorias diferentes de DNA repetitivo. As
seqüências repetitivas intercaladas com seqüências únicas correspondem
de 10 a 15% do genoma e são formadas por curtas seqüências de
nucleotídeos dispostas em tandem. Estes diferentes tipos são também
denominados coletivamente de DNA satélite porque muitas famílias de
repetições podem ser purificadas por densidade de centrifugação do resto
do genoma como frações “satélites” do DNA. Estas famílias variam no DNA
de acordo com a localização, o tamanho da seqüência em seqüência
(tandem) e o comprimento das unidades repetidas. Outro tipo de
seqüência diferente do DNA satélite ocorre ao longo do genoma e, em
alguns casos, constitui uma parte significativa estando associada a
algumas doenças (Floridia et al. 2000)
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
36
A ocorrência de variação genética em uma população, para um ou
mais locos, cujo alelo mais comum não tem freqüência superior a a 0,99
são denominadas polimorfismos de DNA. Cada variante destes
polimorfismos recebe o nome de alelo (Kendrew 1994). Existem diferentes
tipos de marcadores genéticos que são utilizados para estudos de
identificação, aplicação forense, mapeamento e estudos de populações.
Alguns são formados pela alteração de um único nucleotídeo, inserção,
deleção ou substituição de bases chamadas SNP (Single Nucleotide
Polymorphisms), e podem ser identificados por digestão de enzimas de
restrição RFLP (Restricted Fragment Length Polymorphisms),
sequenciamento ou por DHPLC (Denaturing High Performance Liquid
Cromatography) (Underhill et al. 1996). Outro tipo de polimorfismo é a
inserção de elementos transponíveis LINE (Long Interspersed Elements) e
SINE (Short Interpersed Elements). Como exemplo de SINE temos a
família Alu, mecionada anteriormente que é composta de seqüências
monoméricas de aproximadamente 300 nucleotídeos, ligadas a regiões
ricas em adenina. A presença ou ausência de seqüências Alu ou de LINE,
em determinado local configuram dois alelos (Alu+ ou Alu-). O último tipo
de polimorfismo citado são as VNTR’s (Número Variável de Repetições em
Seqüência), caracterizado pela variação no número de repetições em
tandem que determinará o alelo do marcador (Schlötterer 1998). Nesta
categoria se enquadram os minissatélites e os microssatélites (Figura 6),
cuja diferença está no número de nucleotideos das unidades de
repetições, variando de uma a seis bases nos microssatélites e de 15 a
500 bases nos minissatélites. Nos humanos, são encontrados tanto nos
autossomos como nos cromossomos sexuais e estima-se compor cerca de
20% do genoma. Podem se localizar em regiões intergênicas, em íntrons
ou em regiões flanquedoras. Os microssatélites têm diversas aplicações
em biologia molecular, em genética funcional e biologia populacional. Isso
se deve a sua hipervariabilidade, ampla distribuição por todo o genoma,
por fornecerem informação genealógica e por poderem ser amplificados
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
37
por PCR (Polimerase Chain Reaction). Esta variabilidade tornou os
microssatélites aplicáveis na identificação individual em casos forenses,
predominantemente utilizados a partir da década de 1990 (Goldstein e
Schlötterer 1999; Schoske 2003).
A ampla utilização de microssatélites pelos cientistas forenses tornou
necessária a criação de normas que orientassem e padronizassem o
emprego destes marcadores. Em 1998 a International Society for Forensic
Genetics (ISFG) publicou diretrizes e recomendações sobre a
nomenclatura de sistemas de microssatélites que são seguidas de forma
generalizada por cientistas forenses (Olaissen et al. 1998).
Uma importante característica desses marcadores genéticos é a
possibilidade de estimativas de tempos de ancestralidade baseados nas
taxas de mutação (Walsh 2001). Os marcadores SNP possuem baixa taxa
de mutação, tornando-se desta forma, um marcador de evolução lenta,
cujas freqüências se encontram na escala de grandeza de 10-7 a 10-9. Os
minissatélites que possuem mais de 14 bases por repetição são
marcadores de evolução rápida e a sua freqüência de mutação é, em
média, cerca 2 x 10-3 por geração (Dupuy et al. 2004).
Em 2002 o Projeto Genoma Humano relatou a caracterização de 2000
polimorfismos bialélicos de inserção-deleção (indels) no genoma humano.
Esta bateria de indels constitui uma poderosa ferramenta diagnóstica para
estudos. Um dos critérios de seleção dos indels foi o nível de variação das
freqüências alélicas entre europeus, ameríndios e africanos, já que estas
são as populações ancestrais que levaram à formação do povo brasileiro.
Um escalonamento multidimensional mostrou que havia uma significativa
distância entre estes grupos, indicando que o conjunto de indels era
realmente muito sensível à origem etnogeográfica. Quando se fez o
estudo separadamente de europeus, africanos e ameríndios com os indels,
foi obtida uma excelente discriminação indicando que este conjunto de
marcadores representa uma valiosa ferramenta para estudos de
ancestralidade etnogeográfica em brasileiros. Para estes estudos foi
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
38
utilizado um software estatístico que calcula as proporções de mistura
biogeográfica do genoma de um indivíduo, relacionando-o com as
populações de referência (Bastos-Rodrigues et al. 2006).
1 2 3 4 5 6 7 8 9 10 11
GTTGTTAGATAGATAGATAGATAGATAGATAGATAGATAGATAGATAGATCTG
11 repetições = alelo 11
Figura 6: Estrutura de um microssatélite com 11 repetições [TAGA].
2.3.5 – A heranca uniparental do cromossomo Y e das mitocôndrias
O genoma de um indivíduo e herdado de ambos genitores. Cada parte
é estabelecida por uma combinação do DNA transferido a cada um de nós
pelos nossos ancestrais. O processo de recombinação dos genes
autossomos a cada geração torna difícil o estudo das linhagens ancestrais,
pois cria uma mistura genética de todos os nossos antepassados.
Felizmente para os estudos genéticos antropológicos, existem partes do
genoma que são passados quase intactos de pais para filhos. Nestes
segmentos o DNA varia somente através de mutações ocasionais. Quando
estas mutações passam através das gerações elas tornam-se marcas de
descendência (Pena et al. 2000).
Esta situação é observada no segmento exclusivo do cromossomo Y
e no DNA mitocondrial, que apresentam propriedades em comum.
Primeiro, eles são herdados de apenas um dos pais: o cromossomo Y é
transmitido através do espermatozóide apenas para filhos homens e o
DNA mitocondrial é transmitido através do óvulo para filhos e filhas.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
39
Segundo, não trocam genes com outros segmentos genômicos (não se
recombinam), sendo transmitidos às gerações seguintes em blocos
denominados haplótipos. Esses blocos permanecem inalterados em
patrilinhagens ou matrilinhagens até que ocorra uma mutação. As
mutações ocorridas durante a evolução humana geraram variações dos
haplótipos que servem como marcadores de linhagem. Além disso, o
cromossomo Y e o DNA mitocondrial fornecem informações
complementares, permitindo traçar patrilinhagens e matrilinhagens que
alcançam várias gerações no passado, podendo, desta forma, reconstruir
parte significante da história genética de uma população (Jobling e Tyler-
Smith 2003).
Em razão do cromossomo Y não ter homologia em toda sua
extensão, grande parte, a região (NRY), escapa do processo de
recombinação. Isto confere ao cromossomo Y a propriedade de ser
passado quase intacto para a geração seguinte, sendo a parte não
recombinante, alterada apenas pelas mutações ocasionais.
Se o cromossomo Y traça a linhagem masculina, o genoma
mitocondrial (mtDNA) pode ser considerado a contrapartida feminina ao
longo da história . Dois segmentos importantes do mtDNA são as regiões
hipervariáveis (HVR I e II), nas quais as taxas de mutação são 100 vezes
maiores que no genoma nuclear. Devido ao seu pequeno comprimento em
centenas de pares de bases, as HVR’s podem ser rapidamente mapeadas
para revelar os eventos mutacionais bastante informativos que foram
passados pela linhagem materna (Yaoa et al. 2004). A forma exata da
árvore filogenética gerada é afetada por outras forças evolutivas como
seleção natural, deriva genética e migração. Estudos realizados em
populações de vários países permitiram estabelecer a origem geográfica
da vasta maioria dessas linhagens genealógicas Torroni et al. (1998).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
40
2.3.6 - O Cromossomo Y
O cromossomo Y humano apresenta nas extremidades de seus dois
braços a homologia com o cromossomo X. Aí podem existir recombinações
e estas partes são denominadas regiões pseudoautossômicas. Exclusivas
do sexo masculino, estas duas regiões, PAR1 (região pseudoautossômica
1) e PAR2 (região pseudoautossômica 2), correspondem a
aproximadamente 5% da seqüência total do cromossomo Y, tendo 2,6 e
0,34 milhões de pares de bases (Mb) nos braços curto e longo
respectivamente. A maior parte do cromossomo Y não recombina com
nenhum outro cromossomo sendo denominada região não recombinante
do cromossomo Y (NRY) ou região masculino-específica do cromossomo Y
(MSY). Com cerca de 60 Mb a NRY humana é constituída por seqüências
altamente repetitivas (Lahn et al. 2001) e é esta a região de interesse
para estudos de patrilinhagens.
O primeiro marcador polimórfico do cromossomo Y foi descoberto por
Casanova et al. (1985) denominado p122f2, enquanto o primeiro
microssatélite do cromossomo Y descrito foi o 27H39LR, atualmente
denominado DYS19, e foi utilizado para excluir um suspeito em um caso
de estupro. Vários marcadores têm sido estudados desde então, inclusive
uma inserção da família Alu denominadas YAP (Y chromosome Alu
Polymorphism) característico de populações africanas. Vários marcadores
polimórficos estão associados a determinadas populações e especificam
padrões de ancestralidade nas patrilinhagens e, no caso do marcador
DYS19, as freqüências dos alelos são amplamente conhecidas nas
populações do mundo (Roewer et al. 1992). No início de 2002 haviam
apenas 30 microssatélites descritos no cromossomo Y disponíveis para os
pesquisadores (Butler et al. 2003) mas em 2003 Jobling e Tyler Smith
citaram um número entre 100 e 200 novos microssatélites na NRY, dos
quais 30 eram marcadores polimórficos, com repetições de três, quatro e
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
41
cinco nucleotídeos. Como resultado de um minucioso rastreamento da
seqüência do cromossomo Y, foi possível identificar 166 novos
marcadores, o que eleva para mais de 300 o número atual de
microssatélites já descritos (Kayser et al. 2004). A Tabela 2 apresenta os
microssatélites mais utilizados até hoje.
Tabela 2: Microssatélites do cromossomo Y mais utilizados na prática forense. O alelo de referência corresponde ao número de repetições em tandem da seqüência depositada no GenBank que em alguns casos é considerada como reversa e complementar para que haja concordância com motivos usados anteriormente.
Nome do marcador
Intervalo de alelos
Motivo Número de Acesso ao GenBank
Alelo de referência
DYS19 10-19 TAGA AC017019 (r&c) 15 DYS385 a/b 7-28 GAAA AC022486 (r&c) 11 DYS389I 9-17 (TCTG)(TAGA) AC004617 (r&c) 12 DYS389II 24-34 (TCTG)(TAGA) 29 DYS390 17-28 (TAGA)(TCTG) AC011289 24 DYS391 6-14 TAGA AC011302 11 DYS392 6-17 TAT AC011745 (r&c) 13 DYS393 9-17 AGAT AC006152 12 YCAII a/b 11-25 CA AC015978 23 Modificado de Butler et al. 2003
Os microssatélites do cromossomo Y podem ser usados para várias
aplicações em identificação humana como análise forense de evidências
de estupro, testes de paternidade com pai falecido, investigações de
pessoas desaparecidas e estudos antropológicos e populacionais (Schultes
et al. 1999; Butler et al. 2003; Jobling e Tyler-Smith 2003). Em casos
complexos de teste de parentesco, a eficiência da análise feita com
marcadores autossômicos pode ser aumentada com a utilização de
marcadores do cromossomo Y (Szibor et al. 2003). Na identificação de
pessoas desaparecidas parentes da mesma patrilinhagem, os marcadores
de microssatélites do cromossomo Y, podem também ser usado como
referência (Butler et al. 2003).
Foram estabelecidos na Europa pelo Y Chromosome Haplotype
Reference Database (YHRD) um “haplótipo mínimo” e um “haplótipo
estendido” com a finalidade de padronização das informações geradas e
de normatização dos dados. O haplótipo mínimo é composto pelos
marcadores DYS19, DYS385, DYS389I, DYS389II, DYS390, DYS391,
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
42
DYS392 e DYS393. O haplótipo estendido é composto pelos marcadores
do haplótipo mínimo mais o marcador YCAII. Apesar de aumentar
consideravelmente o poder de discriminação do haplótipo, o marcador
YCAII não é ideal para o estudo de misturas de amostras masculinas, pois
apresenta um alto número de bandas inespecíficas (bandas de repetição
ou stutter). (Roewer et al. 2001; Schoske et al. 2004).
Na figura 7 está representada esquematicamente a distribuição ao
longo do cromossomo Y dos marcadores do haplótipo mínimo mais os
marcadores DYS447, DYS458 e DYS464.
Tendo em vista a grande diversidade de locos de microssatélites do
cromossomo Y, é evidente a necessidade de que sejam envidados esforços
para a obtenção de bancos de dados confiáveis para que estes
marcadores possam ser utilizados. Para propósitos forenses é essencial à
identificação de locos polimorficos que possibilitem a discriminação de
indivíduos entre a maioria das linhagens não relacionadas de uma dada
população e o estabelecimento de um banco de dados representativo da
distribuição geográfica e étnica das populações de interesse, cujo
tamanho possibilite estimar as freqüências de haplótipos raros (Roewer et
al. 2001).
PAR 1 PAR 2Heterocromatina
Marcadores do Haplótipo Mínimo
Figura 7: Esquema da distribuição dos marcadores do haplótipo mínimo mais DYS447, DYS458 e DYS464 ao longo do cromossomo Y. (Modificado de Short Tandem Repeat DNA Internet Database).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
43
2.3.7 Mutação em microssatélites
A grande diversidade observada nos locos de microssatélite pode ser
explicada por elevadas taxas de mutação que se acumulam ao longo das
gerações e da variação em diferentes populações. Estima-se uma taxa
mutacional loco-específica entre 0 e 8,58 x 10-3, e uma taxa mutacional
média de 2,80 x 10-3 por geração para o haplótipo mínimo, tendo em
conta as diferentes taxas observadas nos trabalhos de Carvalho-Silva et
al. (1999); Goldstein e Schlötterer (1999); Kayser et al. (2000); Kayser e
Sajantila (2001) e Gusmão et al. (2005).
O deslizamento (slippage) da polimerase é tido como o mecanismo
originador de mutações em microssatélites. Este deslizamento ocorre
quando a polimerase se dissocia do DNA durante uma pausa na
replicação. O filamento em síntese se separa do filamento molde e volta a
parear com outra repetição para frente ou para trás da posição correta
(erro de pareamento). A replicação é então retomada completando o
processo no qual o comprimento do filamento recém sintetizado pode ser
maior ou menor do que o do filamento molde (figura 8) (Viguera, Canceill
e Erlich 2001). Este pareamento é uma propriedade das seqüências de
microssatélites e ocorre com frequências elevadas (Schlötterer 1998),
sendo o mecanismo responsável pela grande variabilidade observada
(Klintschar e Wiegand 2003).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
44
Figura 8: Esquema do deslizamento da polimerase. a) Pareamento normal do filamento novo com o filamento molde. b) Deslizamento do filamento novo para trás dando origem à inserção. c) Deslizamento do filamento novo para frente causando deleção. Este também é o mecanismo primário de formação de bandas de repetição ou stutter. (Modificado de Butler 2003).
As regiões continuamente repetitivas mais longas, com 10 ou mais
repetições, estariam mais sujeitas à mutação do que regiões repetitivas
mais curtas ou descontínuas (Kayser et al. 2000; Holtkemper et al. 2001).
A relação entre a estrutura do microssatélite e a taxa de mutação tem se
apoiado em estudos que mostraram a existência de uma variação
substancial da taxa de mutação entre os locos de microssatélites (Di
Rienzo et al. 1998; Dupuy et al. 2004), podendo esta diferença, ser maior
que 80 % (Zhivotovsky et al. 2004).
Em casos de paternidade com pai falecido, nos quais o
reconhecimento de paternidade é requerido para um indivíduo do sexo
masculino, a tipagem com microssatélites do cromossomo Y é muito útil,
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
45
pois homens da mesma linhagem possuem o mesmo perfil. Verifica-se,
porém, que em alguns casos pessoas aparentadas podem apresentar uma
diferença nos haplótipos em vários locos devido à mutação. Por esse
motivo é necessário o conhecimento da taxa de mutação de cada loco
analisado para avaliar a possibilidade de uma possível falsa exclusão (Rolf
et al. 2001).
Algumas abordagens utilizadas para determinar a taxa de mutação
de microssatélites são: a análise de trios, mãe, pai e filho ou duplas pai e
filho, o monitoramento de genealogias, a estimativa teórica da taxa de
mutação através do estudo de diferentes populações e a tipagem do DNA
de células espermáticas (Holtkemper et al. 2001). Utilizando a tipagem de
células espermáticas, Holtkemper et al. (2001) registraram taxas de
mutação iguais a 1,8 x 10-3 e 2,1 x 10-3 para os marcadores DYS390 e
DYS19, respectivamente, que estão muito próximas das que foram
observadas por Heyer et al. (1997).
O método mais utilizado para a estimativa de taxas de mutação de
microssatélites do cromossomo Y é a análise direta de pares, pai e filho
com paternidade confirmada através de marcadores autossômicos e com
índice de paternidade maior que 10.000 (probabilidade de paternidade
maior que 99,99). Este método foi utilizado por Kayser et al. (1997) que
observaram uma taxa de mutação de 3,2 x 10-3 para o microssatélite
DYS19 em uma amostra de 626 pares, pai e filho. Num estudo mais
amplo, compreendendo 4.999 meioses de pares pai e filho com
paternidade confirmada (probabilidade ≥ 99,9 %), foi observada uma taxa
de mutação média de 2,80 x 10-3 para 15 microssatélites (haplótipo
mínimo mais YCAIa/b, YCAIIa/b e DYS413a/b) (Kayser et al. 2000), que
é muito semelhante à observada por Heyer et al. (1997). Outros estudos
utilizando este mesmo método foram realizados por Ballard et al. (2005) e
Dupuy et al. (2004) cujos resultados são apresentados na tabela 3
juntamente com os de outros estudos feitos de 1997 a 2005.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
46
Tabela 3: Taxas de mutação para marcadores do cromossomo Y e respectivos números de meioses de cada estudo
Estudo
Marcador
Ballard et al.
(2005)
Dupuy et al.
(2004)
Kayser et al.
(2000)
Heyer et al.
(1997)
DYS390 - (1766)
4,5×10-3
(466)
8,6×10-3
-
DYS391 (248)
8,1×10-3
(1766)
4,5×10-3
(415)
4,8×10-3
-
DYS385 (472)
1,7×10-2
(3532)
4,0×10-3
(952)
2,1×10-3
(426)
4,7×10-3
DYS389II (246)
8,1×10-3
(1766)
2,3×10-3
(425)
4,7×10-3
(-)
9,3×10-3
DYS389I (247)
4,0×10-3
(1766)
2,3×10-3
(425)
2,4×10-3
-
DYS19 (245)
4,1×10-3
(1766)
1,7×10-3
(996)
2,0×10-3
-
DYS393 0 (1766)
5,7×10-4
- -
DYS392 0 - - (213)
4,7×10-3
DYS439 (249)
4,0×10-3
- - -
Os números entre parêntesis correspondem ao tamanho da amostra analisada
2.4 Haplogrupos e Haplótipos do cromossomo Y
2.4.1 Características determinantes das linhagens humanas
O termo haplogrupo tem várias definições na literatura que se
complementam. Pode-se usar a terminologia atribuída a de Knijff (2000)
na qual haplogrupo refere-se à linhagem definida por polimorfismos
binários. Pode ser também definido como mutações localizadas no
cromossomo Y ou no mtDNA, que ligam os indivíduos que as possuem ao
seu ancestral comum, no qual esta marca se originou (FTDNA-
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
47
http://www.familytreedna.com). Esta marca ancestral define os braços da
árvore filogenética que separa o novo haplogrupo de seu antecessor.
Pode-se dizer que haplogrupo é um grupo de haplótipos relacionados.
Chamamos haplótipo a um conjunto de alelos de locos diferentes
herdados como um bloco. O termo haplótipo é reservado para todas as
sublinhagens dos haplogrupos que são definidos por variações nas STR’s
na NRY, ou seja, um haplótipo é um subgrupo mais específico de um
haplogrupo (Jobling e Tyler-Smith 2003).
À medida que os homens migraram para novas regiões geográficas
do globo, mutações foram ocorrendo e estabelecendo-se novos
haplogrupos, cada um deles passando a se comportar como uma linhagem
evolutiva independente. Essa diáspora foi acompanhada de diversos
fatores e condições climáticas e ambientais das diferentes regiões do
mundo. Geralmente, quanto mais antigo for o haplogrupo, maior a sua
distribuição geográfica (Figura 9). Uma parte dos haplogrupos ainda tem
uma distribuição geográfica relativamente restrita a algumas partes do
globo, o que permite a suposição da sua origem geográfica ou étnica.
Quando os homens migraram para diferentes regiões continentais, há
aproximadamente 60.000 anos atrás, eles deixaram a suas marcas
genéticas possíveis de serem vistas ainda hoje através do gradiente da
distribuição das freqüências alélicas. Com o estudo filogeográfico,
incluindo o mapeamento das freqüências dos marcadores genéticos no
homem moderno, pôde ser criado um quadro que determina por onde e
quando os ancestrais se deslocaram (figura 10). Estes grandes fluxos
migratórios finalmente deixaram descendentes de um pequeno grupo de
africanos para ocupar os mais longínquos pontos do globo (Pena et al.
2000).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
48
Figura 9: O mundo e as migrações históricas. A diáspora do homem moderno a partir da África para Ásia, Europa e Oceania e depois para as Américas. Os números correspondem à estimativa em anos determinados principalmente por fósseis encontrados em diferentes lugares. Fonte Cavalli-Sforza (2001)
Figura 10: As rotas de dispersão da população africana inicial, definidas pelas mutações binárias (SNP) identificados na NRY e respectivos haplogrupos (entre parêntesis). Fonte: .: https://www3.nationalgeographic.com/genographic/atlas.html
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
49
Um dos eventos mais precoces na evolução do cromossomo Y foi
uma mutação de A para G na posição 10831 do gene SRY (Sex-
determining Region of the Y chromossome). Isto modificou o haplogrupo
ancestral, denominado haplogrupo A, e criou um novo haplogrupo B, que
se distribuiu por todos os continentes a partir da região onde hoje é a
Ethiópia e o Sudão. Quando é feita a análise molecular dos cromossomos
humanos, podem ser estudadas hierarquicamente as mutações que
determinam os haplogrupos e suas freqüências nas populações e
estabelecer uma relação filogenética de descendência (figura 11).
Figura 11: Árvore filogenética simplificada, baseada nos principais eventos mutacionais
(nós) que caracterizam cada um dos haplogrupos (de A a R1b) definidos para o
cromossomo Y pelo YCC (2002). Cada braço da árvore representa uma linhagem que
carrega a mutação (UEP). À esquerda os haplogrupos (mutações) mais antigos para os
mais recentes à direita. Fonte: Mc Donald Group
http://www.scs.uiuc.edu/~mcdonald/WorldHaplogroupsMaps.pdf
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
50
Mutações definidas com prefixo “M” (Mutation) e com prefixo “P”
(Polymorphism) foram publicadas por Underhill et al. (2001), de acordo
com as freqüências dos haplogrupos e com a ordem de ocorrência dos
eventos mutacionais. A disponibilidade de seqüências do cromossomo Y
permite que existam mais de 200 mutações de SNP bem caracterizadas e
entre 100 e 200 microssatélites potencialmente úteis. Uma filogenia
bastante robusta foi desenvolvida com base nestas mutações, e um
sistema de nomenclatura unificado que permite a integração entre os
diferentes dados dos grupos de pesquisa (figura 12). Apesar disto, ainda
são apontadas várias teorias diferentes para tentar explicar os
mecanismos e o padrão de varição das freqüências dos polimorfismos
encontrados nas populações dispersas pelo mundo, o que não invalida a
filogenia já estabelecida.
A teoria policêntrica de Weindereich (Hawks et al. 2003) reconhece a
existência de diferentes mecanismos responsáveis pelo estabelecimento
os padrões iniciais de variação global e pela manutenção desses padrões
na evolução humana subseqüente. Segundo esta teoria, a formação do
homem atual aconteceu em vários territórios independentes. Em sua base
está o fato de que, segundo esta teoria, existem semelhanças entre os
representantes dos vários grupos humanos atuais e os representantes de
grupos que existiram no passado, dos quais existem fósseis. A hipótese da
origem única (monocêntrica) e mais aceita atualmente, com uma explosão
populacional global ao longo dos últimos séculos explicaria, de algum
modo, porque as freqüências dos alelos parecem ter alguma
especificidade geográfica.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
51
Figura 12: Árvore completa dos Haplogrupos do cromossomo Y com as respectivas mutações que os caracterizam definidas pelo YCC (2002). As letras (brancas) correspondem aos haplogrupos e nos braços (em vermelho) as mutações. Fonte: (Jobling e Tyler-Smith 2003).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
52
Estas variações de freqüência provavelmente se devem a mutações
que apareceram recentemente e não tiveram tempo suficiente para se
difundir ao longo da população global. Interpretações alternativas afirmam
que, sob a teoria de neutralidade, a heterozigosidade para uma região do
DNA seria decorrente de diferenças no tamanho efetivo da população que,
por sua vez, explicariam a diversidade gênica observada (Laguardia
2005). Para Chakravarti (1999), a baixa diversidade gênica humana é o
resultado de uma espécie relativamente jovem com uma pequena
população fundadora, exigindo que se disponha de um grande volume de
dados para discriminar, com relativa confiança, a mais adequada dentre
as diferentes histórias da origem humana. No que se refere à
diferenciação genética, as mudanças na freqüência dos alelos nas
populações devem-se à seleção natural, resultante da variação
populacional entre genótipos individuais nas suas probabilidades de
sobrevivência e/ou reprodução, à mutação, à deriva genética e à migração
(Cavalli-Sforza et al. 2003).
Os agrupamentos humanos são geralmente influenciados pelo
comportamento dos homens. Aproximadamente 70% das sociedades
modernas praticam o patriarcado significando que, se um homem ou uma
mulher se casam e não são do mesmo local, mais freqüentemente é a
mulher que muda para o local de origem do homem. Como conseqüência,
mais homens vivem próximos ao seu local de nascimento do que
mulheres, aumentando a possibilidade de determinação do local de
origem dos cromossomos Y. Em contraste, o mtDNA, que é transmitido
apenas pelas mulheres, esta diferenciação de local de origem
presumivelmente será menor. Estudos realizados com populações
européias e asiáticas que praticam o patriarcado e o matriarcado
evidenciaram este contraste (Jobling e Tyler-Smith 2003). Os estudos de
polimorfismos binários do cromossomo Y permitiram determinar a
distribuição geográfica das freqüências dos haplogrupos em diversas
populações (Figura 13).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
53
A manutenção de um padrão filogenético e a nomenclatura para
marcadores binários e haplogrupos são fundamentais. Também é
necessário que existam bancos de dados com as informações sobre as
freqüências alélicas das populações.
A importância dos haplótipos para os geneticistas, em especial os
genealogistas, reside no fato de que vários marcadores do mesmo
haplogrupo são comuns e outros não. A tabela 4 mostra os haplótipos de
STR, compostos pelos alelos mais freqüentes (haplótipo modal) para
alguns haplogrupos comuns na Europa. Metade dos homens do
haplogrupo R1b por exemplo, possui vários alelos de STR dentre os mais
freqüentes encontrados neste haplogrupo. Com as diferenças espalhadas
ao longo dos marcadores de STR, é possível ter variações suficientes para
obter-se a assinatura do cromossomo Y para cada linhagem masculina do
haplogrupo.
Tabela 4: Haplótipos modais para os haplogrupos mais comuns no banco de dados do FTDNA
DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS Haplogrupo 19 385ª 385b 389I 389II 390 391 392 393 437 458 464a 464b 464c 464d
R1b 14 11 14 13 29 24 11 13 13 15 17 15 15 17 17
I1a 14 13 14 12 28 22 10 11 13 16 15 12 14 15 16
R1a1 16 11 14 13 30 25 10 11 13 14 15 12 15 15 16
Os números no corpo da tabela expressos pelo número de unidades repetidas do microssatélite
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
54
Figura 13: Distribuição global dos Haplogrupos do cromossomo Y. Cada círculo representa uma amostra os 18 haplogrupos principais (uma simplificação dos haplogrupos definido pelo YCC). Notar as similaridades entre as populações vizinhas. Os dados são de trabalhos publicados que foram escolhidos com o propósito de cobrir todo o globo. Em alguns casos os marcadores não foram suficientes para caracterizar os haplogrupos, então bancos de dados e dados não publicados foram consultados para complementar as informações. Fonte: Mc Donald Group.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
55
Os principais usuários dos microssatélites do cromossomo Y são os
cientistas forenses, que elegeram um padrão de sete marcadores
denominado “haplótipo mínimo” e estabeleceram bancos de dados de
freqüências haplotípicas, para Europa, Estados Unidos e Ásia. O número
de microssatélites pode ser incrementado dando a vantagem de aumentar
o grau de discriminação entre indivíduos. Estudos da possibilidade de
incorporar marcadores binários, que possam ser amplificados por DNA
altamente degradado, para a prática forense, e o prognóstico de
haplogrupos binários a partir dos dados de microssatélites (por
antropólogos que querem usar os dados forenses) merecem grande
atenção, em razão da grande utilidade na prática da genética populacional
e antropológica (Jobling e Tyler-Smith 2003).
Genealogistas então interessados em obter relações entre famílias
em escalas seculares, e as taxas de mutação nas STR’s são uma boa
opção para este tipo de trabalho, enquanto que os geneticistas de
populações estão interessados em rastrear os movimentos de grupos de
humanos em escalas de tempo na ordem de milhares de anos.
Haplogrupos são definidos por padrões verificados nos valores destes
marcadores de mutação lenta. A identificação do haplogrupo pode
fornecer uma sinalização que aponte para a ancestralidade paterna.
Algumas questões residem no estabelecimento de uma relação entre os
haplogrupos estabelecidos por UEP (evento único de polimorfismo) e o
padrão de variabilidade de Y-STR. A análise dos polimorfismos bialélicos
revela a existência de haplogrupos de STR com uma subestrutura de
haplótipos (Cinnioglu et al. 2003).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
56
2.4.2 Relações entre Haplótipos e Haplogrupos
2.4.2.1 - Agrupamento de haplótipos
Além da notável contribuição do estudo dos haplótipos de STR-Y
para a atividade forense, muitos estudos de genética de populações têm
sido feitos com grande sucesso. Grande parte destes estudos emprega o
modelo mutacional denominado Modelo de mutação em Degraus
(Stepwise Mutation Model – SMM) proposto por Kimura e Ohta em 1978,
que é o modelo mais comumente aceito como sendo o que melhor
representa a geração de diversidade nos locos de STR-Y em razão da
grande maioria de mutações ocorrerem com perda ou ganho de uma
unidade de repetição. Desta forma, entende-se que as menores distâncias
genéticas representarão haplótipos relacionados. Ou seja, ao agrupar
haplótipos com distâncias pequenas, estabelece-se uma relação de
proximidade, através da qual podemos distinguir grupos haplotípicos por
suposto parentesco. Este processo é usualmente chamado de
agrupamento. Os critérios de agrupamento obedecem basicamente à
proximidade por distâncias genéticas adotadas de acordo com o estudo
em questão. Em um de seus estudos, Gusmão et al. (2003)
demonstraram que o agrupamento de haplótipos vizinhos (distância de 1
SMM) em torno de dois haplótipos mais freqüentes escolhidos, evidencia
um padrão de distribuição geográfica. Bosch et al. (1999) mostraram que
a variação alélica de cada loco de STR-Y é claramente diferenciável em
cada haplogrupo definido por SNP’s. Variações nos marcadores de STR’s
com altas taxas de mutação têm sido usadas tanto em estimativas de
TMRCA (tempo para o mais recente ancestral comum), com também para
verificar se estas diferenciações entre os haplogrupos servem como
orientação filogenética. A análise molecular da variabilidade como base
para o estudo genético, tanto para determinação de haplogrupos quanto
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
57
para estudos de populações, podem indicar uma variabilidade de STR’s
mais propriamente estruturada por haplogrupos do que pelas populações.
2.4.2.2 - Haplótipo modal
O haplótipo modal é composto pelos alelos mais freqüentes de cada
loco e representa a expressão única do conjunto mais representativo de
alelos do haplótipo da população. Como conseqüência, o haplótipo modal
não somente deve existir na população como também pode ser o mais
freqüente nesta. Além disto, é a referência para alelos característicos da
assinatura genética do grupo mais comum de haplótipos, quando houver
(Thomas et al. 2000).
Espera-se que ao verificar os haplótipos mais freqüentes e o modal
nas populações encontrem-se pequenas variações, dado que o primeiro
refere-se às freqüências haplotípicas e o segundo, refere-se às freqüências
alélicas. Enquanto as freqüências dos haplótipos servem como referência
para a composição da população o segundo prestar-se-á como referência
do haplogrupo. Para isto o haplótipo modal deve ser identificado na
tentativa de se estabelecer relações entre eles, os mais freqüentes, e as
suas prováveis origens. Um típico haplótipo modal muito referenciado é o
Haplótipo Modal do Atlântico (AMH), o qual se refere ao conjunto de alelos
de Y-STR (haplótipo mínimo) mais freqüentes para o haplogrupo R1b
(DYS19=14, DYS385a=11, DYS385b=14, DYS389I=13, DYS389II=29,
DYS390=24, DYS391=11, DYS392=13, DYS393=13) (Wilson et al. 2001).
2.4.2.3 Haplogrupos, Povos e Línguas.
Como demonstrado nos detalhados trabalhos em várias regiões como
na Micronésia (Cavalli-Sforza e Wang 1986) e em maior escala, na
América do Norte (Spuhler 1979), Europa (Barbujani e Sokal 1990), o
padrão de variação lingüística tem similaridade com a variação genética
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
58
ou geográfica. Existem de fato, razões para que os conjuntos genéticos e
culturais tenham similaridades: contatos culturais e genéticos tomam as
mesmas rotas; respondem às mesmas barreiras geográficas e culturais;
uma pode influenciar a outra. Em geral, a constituição de um pool
genético é determinada por fatores geográficos, distância sócio-econômica
e pela variedade de fatores culturais (religião, língua, etc.). Importantes
correlações foram observadas entre conjuntos genéticos por um lado e
sócio-culturais de outro. Não existem fatores limitantes à concorrência
paralela entre a evolução liguística e a genética. As línguas expandem-se
mais rapidamente que os genes; duas línguas podem vir a se tornar
inteligíveis em um milhar de anos ou menos, em razão da diferenciação
progressiva. Isto é similar a origem de duas espécies diferentes em
biologia. Especiação envolve a perda da interfertilidade. Em outra escala,
seria como a perda da comunicação na lingüística. A especiação em geral
leva milhões de anos. Além disto, uma língua pode ser substituída
completamente em algumas gerações decorrente de imposição de
populações invasoras (Cavalli-Sforza et al. 1993). Apesar disto, é possível
verificar a relação entre as rotas genéticas e o padrão lingüístico das
populações. A tabela 5 mostra a correlação estabelecida entre algumas
populações bem caracterizadas, o haplogrupo predominante com a
mutação que o determina, e também, a origem geográfica e lingüística
destas populações, estabelecendo assim, uma relação indireta entre a
etnia e o haplogrupo predominante em cada população.
Tabela 5: Origens Étnico-Geográficas e afiliações lingüísticas das linhagens definidas pelo Y Chromosome Consortion.
YCC# Origem étnico-geográfica Linguagem Linhagem Mutação 2 América do Norte/Ameríndio Ameríndia Q* Q-P36* 3 América do Norte/Ameríndio Ameríndia Q* Q-P36* 4 América do Norte/Ameríndio Ameríndia Q* Q-P36* 5 Namíbia/Tsumkwe San !Kung A2* A-M6* 6 Banandu, CAR/Biaka Aka B2b4b B-MSY2a 7 Banandu, CAR/Biaka Aka B2b4b B-MSY2a 8 Ituri, Zaire/Mbuti Niger/Kordofanian E2b E-M54
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
59
9 Ituri, Zaire/Mbuti Niger/Kordofanian B2b* B-50f2(P)* 10 Ilhas Salomão/Melanésia Nasioi K1 K-SRY9138 11 Ilhas Salomão/Melanésia Nasioi M2* M-P22* 12 Rondônia, Brasil/Karitiana Tupi Q3* Q-M3* 13 Rondônia, Brasil/Karitiana Tupi Q3* Q-M3* 14 Rondônia, Brasil/Surui Tupi Q3c Q-M199 15 Rondônia, Brasil/Surui Tupi Q3* Q-M3* 16 Rondônia, Brasil/Surui Tupi Q3* Q-M3* 17 Campeche, Yucatan/Maya Yucatec Q3* Q-M3* 18 Campeche, Yucatan/Maya Yucatec Q3* Q-M3* 19 Namíbia/Tsumkwe San !Kung A3b1 A-M51 21 Namíbia/Tsumkwe San !Kung B2b1 B-P6 22 Namíbia/Tsumkwe San !Kung A2* A-M6* 23 Arizona, US/Navajo Navajo C3b C-P39 24 US/Ashkenazi Judeus English G2a1 G-P18 25 Arizona, US/Tohono O'odham Pima Q* Q-P36* 26 UK/Inglês Inglês R1b* R-P25* 27 S. Carolina, US/Porch Creek Porch Creek R1b* R-P25* 28 Namíbia/Tsumkwe San !Kung B2b1 B-P6 29 Namíbia/Tsumkwe San !Kung B2b4a B-P8 30 Namíbia/Tsumkwe San !Kung B2b4a B-P8 31 Africa do Sul/Herero W. Bantu E3a1 E-M58 32 Africa do Sul/Sotho E. Bantu E3* E-P2* 33 Africa do Sul/Pedi E. Bantu E3a* E-M2* 34 Namíbia/Tsumkwe San !Kung A2* A-M6* 35 Namíbia/Tsumkwe San !Kung A2b A-P28 36 Africa do Sul/Tswana E. Bantu E3a* E-M2* 37 Africa do Sul/Ovambo W. Bantu E2b E-M54 38 Namíbia/Tsumkwe San !Kung A3b1 A-M51 39 Namíbia/Tsumkwe San !Kung B2b1 B-P6 40 Africa do Sul/Herero W. Bantu E3a* E-M2* 42 Africa do Sul/Zulu E. Bantu B2a1 B-P32 43 Africa do Sul/Tswana E. Bantu E3a* E-M2* 44 Africa do Sul/Herero W. Bantu E3a1 E-M58 45 Africa do Sul/Herero W. Bantu E3a* E-M2* 47 Siberia/Yakut Turkic N3a* N-M178* 48 Siberia/Yakut Turkic N3a* N-M178* 49 Siberia/Yakut Turkic N3a1 N-P21 50 Siberia/Yakut Turkic N3a1 N-P21 51 Siberia/Yakut Turkic N3a* N-M178* 52 Krasnador/Adygean N. Caucasiano G2* G-P15* 53 Krasnador/Adygean N. Caucasiano G2* G-P15* 55 Krasnador/Adygean N. Caucasiano G2* G-P15*
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
60
56 Krasnador/Adygean N. Caucasiano J2* J-M172* 57 Kashmira/Pakistão Urdu O3e* O-M134* 58 Lahore/Pakistão Punjabi H1* H-M82* 59 US/Ashkenazi Judeus Inglês J* J-12f2a* 60 Multan/Pakistão Punjabi J2* J-M172* 61 Alemanha/Alemão Alemão I1* I-P38* 62 Alemanha/Alemão Alemão R1b* R-P25* 63 Alemanha/Alemão Alemão I1a1 I-P40 64 Alemanha/Alemão Alemão R1b* R-P25* 65 Ituri, Zaire/Mbuti Niger/Kordofanian E3a* E-M2* 66 China/Han Sino-Tibetano O1* O-M119* 67 China/Han Sino-Tibetano O1* O-M119* 68 China/Han Sino-Tibetano O3c O-LINE1 69 Cambodia/Khmer Mon-Khmer O2a* O-M95* 70 Russia/Russo Russo R1a1* R-M17* 71 Russia/Russo Russo R1b* R-P25* 72 Russia/Russo Russo I1b* I-P37b* 74 Russia/Russo Russo I1* I-P38* 76 Japão/Japonês Japonês D2a D-P42 77 Noto Peninsula/Japonês Japonês N1 N-M128 78 Gifu/Japão Japonês O3e* O-M134* 79 Turquia/Turco Turkic G1 G-P20 80 US/Ashkenazi Judeus Inglês G2a* G-P16* 81 US/Ashkenazi Judeus Inglês R1a1* R-M17*
“*” indica um nó interno na árvore filogenética do haplogrupos definidos pelo YCC
2.4.2.4 Prognóstico de Haplogrupo a partir de Haplótipos
Muitos pesquisadores têm se beneficiado do baixo custo e da
disponibilidade dos dados para desenvolver trabalhos com o cromossomo
Y a partir das STR’s. O conjunto de marcadores do cromossomo Y usados
para estes trabalhos é denominado haplótipo. Existe também um grande
interesse em determinar o haplogrupo que define linhagem do
cromossomo, a partir de um padrão definido por polimorfismo de um
nucleotídeo (SNP), que pode também ser testado e determinado
diretamente a partir de exames de DNA. Entretanto, o processo de
determinação do haplogrupo pelo teste direto dos SNP’s pode ser, em
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
61
alguns casos, um processo demorado. Para isto existe um considerável
interesse no prognóstico do haplogrupo a partir de um conjunto de
marcadores de STR, com o propósito de estabelecer uma relação entre um
indivíduo e sua ancestralidade (Athey 2005).
Uma das maiores empresas de teste de DNA, a Family Tree DNA
(FTDNA-http://www.familytreedna.com), em cooperação com a
Universidade do Arizona (UAZ), utiliza um algoritmo próprio para o
prognóstico dos haplogrupos de pessoas que têm os seus testes feitos
com o uso de Y-STR’s naquela empresa. O algoritmo não foi publicado,
mas parece basear-se na distância genética de 1 Stepwise Mutation Model
(SMM) do haplótipo em análise, em comparação com os haplótipos
depositados no banco de dados da Universidade do Arizona. Nesta
pesquisa, se um haplótipo cujo haplogrupo é conhecido existe no banco de
dados a uma distância genética limite (provavelmente 2 para 12
marcadores), então o haplogrupo ao qual pertence o haplótipo em questão
é prognosticado dentro de uma estimativa para aquele ahaplogrupo. Se
não existir no banco de dados um haplogrupo confirmado para o haplótipo
pesquisado para uma distância até 2 SMM, nenhuma estimativa é feita. O
prognóstico feito pelo FTDNA/UAZ tem obtido um razoável sucesso e
provavelmente 80% dos usuários tem um haplogrupo prognosticado
(FTDNA-http://www.familytreedna.com). A desvantagem deste tipo de
aproximação é quando não existe a possibilidade de ser feito o
prognóstico e o usuário fica sem informação ou quando vários haplogrupos
podem ser prognosticados (Athey, 2005)..
Outro método é baseado nas freqüências alélicas para cada
haplogrupo e como o teste empregado se aproxima do padrão de cada
loco para cada um deles. Neste processo por aproximação, apresentado
por Athey (2005), utilizam-se freqüências alélicas de cada loco para cada
haplogrupo. É realizado o cálculo da média geométrica (raiz n-ésima do
produto de n fatores) da razão entre a freqüência alélica do marcador de
cada loco testado e a freqüência máxima deste loco. Todas as freqüências
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
62
pesquisadas são pré-determinadas para cada alelo de cada loco de cada
haplogrupo. Isto é apontado como uma dificuldade no emprego do
método, já que é necessário determinar as freqüências para todos os
alelos de todos os locos de todos os haplogrupos. A média geométrica
calculada no final determina o escore para cada haplogrupo testado. A
obtenção das informações requer uma boa mineração de dados e um
conjunto consistente de amostras tão variado quanto forem o número de
populações que se diferenciem no padrão de distribuição das freqüências.
Diante da necessidade de contornar este problema existem propostas de
modelos que possam ser relativamente consistentes e menos dependentes
do tamanho e variedade da amostra.
2.4.2.5 Os principais haplogrupos
Dentre os haplogrupos determinados pelo YCC (2002), alguns
devem ser destacados em razão da importância na composição da
população brasileira, mais especificamente a do Nordeste. Estes
haplogrupos são os que devem ser preferencialmente escolhidos como
referência para estabelecer os critérios de determinação da origem étnica
dos indivíduos desta população.
Haplogrupo R1b
Este haplogrupo é definido por uma mutação SNP que ocorreu a
cerca de 35.000 anos e é o mais representativo na população européia.
Mais da metade dos homens europeus pertence a este haplogrupo. Foi
encontrada em todos os homens europeus R1b uma mutação adicional
chamada M269. Assim a versão 2003 do YCC (2002) nomeou o grupo
definido pela M269 com R1b3. Entretanto, este grupo continua sendo
referenciado como R1b para evitar confusões entre a nomenclatura de
2002 e 2003. Acredita-se que esse haplogrupo se expandiu pela Europa e
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
63
são descendentes dos primeiros humanos modernos que lá adentraram
entre 35.000 e 40.000 anos (Wells 2002; Cavalli-Sforza 2003). O AMH faz
parte do Haplogrupo R1b.
Haplogrupo E
Pouco ainda se sabe a respeito da origem da linhagem caracterizada
pela mutação chamada M96 que define este haplogrupo. O que se sabe é
que existiram dois grandes processos migratórios desde a África. O
primeiro a cerca de 60.000 anos formado por pequenos grupos que
migraram ao longo da costa e devem ter chegado até a Austrália. O
segundo fluxo há 50.000 anos aproximadamente rumo ao norte. Um
grupo destes viajantes é descendente de um homem com a mutação M89
chamado de Clã do Meio-Oeste. De 90 a 95% dos não africanos são
descendentes deste clã. Os grupos de homens descendentes do mutante
M96 deram origem a duas linhagens tipicamente africanas: a E3a e E3b
(YCC 2002) .
Haplogrupo E3a
O haplogrupo E3a, definido pela mutação chamada M2, também é
uma linhagen africana. A hipótese atual é que este haplogrupo se
dispersou do norte para o sul da África nos últimos 3.000 anos na
expansão agrícola da população Bantu. É restrito geograficamente, e o
mais comum aos povos descendentes dos africanos sub-saarianos. Este
haplogrupo é comum também nos povos Mbenzele e Biaka, pigmeus da
África central (Coia et al. 2003; Cruciani et al. 2004).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
64
Haplogrupo E3b
O homem no qual surgiu a mutação M35 nasceu próximo ao Oriente
Médio há cerca de 20.000 anos. Seus descendentes estiveram entre os
primeiros agricultores do oriente médio e ajudaram a disseminar a
agricultura ao longo do Mar Mediterrâneo. No final da última glaciação
(mais ou menos 10.000 anos), a atividade agrícola foi estimulada em
razão das condições existentes o que ajudou o homem mediterrâneo a se
fixar e, mais tarde (8.000 anos), encorajando a expansão desta população
ao longo do litoral Mediterrâneo. Estes fazendeiros ancestrais ajudaram a
trazer a revolução neolítica para aquela região. Esta mutação é
compartilhada pelos africanos do sul e do leste (Cruciani et al. 2004).
Homens do haplogrupo E3b são encontrados também na Ásia e na Europa
em menor proporção chegando a 4% em Portugal 16% na Etiópia e 30%
no sul da África.
Haplogrupo G
Estudos comparativos dos haplótipos modais (Cinnioglu et al. 2004;
Behar et al. 2004) remetem para a origem oeste da Europa do haplogrupo
G. Uma análise mais detalhada nas áreas do sul da Rússia e Kazaquistão
provê mais pistas para a determinação remota do haplogrupos G. A maior
2003 freqüência para o haplogrupo G é encontra na região do Cáucaso na
qual 30% dos homens pertencem ao haplogrupo G. A análise dos
haplótipos modais evidenciou que a distinção entre os subgrupos G2 e G
está nos locos DYS390 e DYS393.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
65
Haplgrupo J
O estudo realizado por Semino et al. (2004) é um dos mais
informativos sobre o haplogrupo J. Em geral os indivíduos J são mais
comuns no sul e leste da Europa, com concentração máxima na costa do
mediterrâneo, com as freqüências de 22% na Grécia, 20 a 30% na Itália,
7,3% na Ucrânia e inexistente na Alemanha. De acordo com Al-Zahery et
al.(2003), os subgrupos do haplogrupo J se expandiram há cerca de 7.000
a 9.000 anos. Verificou-se que as STR’s para vários destes subgrupos do
haplogrupo J com resultados combinados que o haplótipo mínimo modal
para o hapogrupo J é: DYS19=14, DYS389I=13, DYS389II=29 ou 30,
DYS390=23, DYS391=10 ou 11, DYS392=11 e DYS393=12.
Haplogrupo Q3
Logo após os primeiros exploradores adentrarem o continente
Americano uma nova mutação denominada M3 surgiu. Este ancestral
nascido na América do Norte é o patriarca da linhagem mais disseminada
nas Américas com tempo estimado entre 10 e 15 mil anos atrás. Enquanto
os descendentes do clã de siberianos da primeira leva de homens a
explorar a América do Norte são encontrados na Ásia a na América, estes
primeiros são encontrados nas três Américas, levando os geneticistas a
acreditar que a mutação surgiu após a entrada do homem na América do
Norte. A deteminação do haplótipo modal característico para os
ameríndios teve como base a combinação de locos pesquisados nos
ameríndios (Bortolini et al. 2003; Rodriguez-Delfin, 1997; Zegura et al.
2004) e os dados disponibilizados no Ybase
(http://www.ybase.org/shaplo.asp). Este haplótipo foi definido
considerando o grupo parental (Q-M3) que foi detectado em todas as
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
66
populações ameríndias do sul aonde é marcadamente predominante, com
a freqüência média de 77%. O haplótipo mais freqüente (0,265)
encontrado no haplogrupo Q usando quatro locos do haplótipo mínimo foi
referenciado nos dados obtidos por Lell et al. (2002). Três locos (DYS19,
DYS390, e DYS391) foram empregados neste trabalho e mostraram que o
haplótipo característico correspondendo aos alelos para os três locos
(13,24,10), têm uma ampla distribuição entre os nativos na América do
Norte e da América Central, indicando que pode definir esta característica
como de um haplótipo ancestral da linhagem Q-M3 da América do Sul
(Bortolini et al. 2003).
2.5 Estimativas de origem e de TMRCA dos haplótipos
2.5.1 Coalescência
O processo de coalescência é uma poderosa ferramenta de
modelagem para genética de populações. Os estados alélicos de todos os
genes homólogos na população são determinados pela história
genealógica e mutacional dessas cópias. A aproximação coalescente é
baseada na observação que a genealogia é facilmente modelável para trás
no tempo, e a mutações neutras podem se perpetuar. Um grande campo
de fenômenos biológicos pode ser modelado usando estas aproximações.
Enquanto a genética clássica aborda o futuro de uma população, dado um
ponto de partida, a coalescência considera o presente levando em conta o
passado (Kingman 1982a).
O coalescente, de um modo geral, se refere a todos os aspectos da
linhagem ancestral de uma população. Dois aspectos importantes são o
tempo de coalescência até um ancestral e a forma da árvore. A árvore se
reduzirá até que restem apenas dois indivíduos no tempo de coalescência.
Espera-se que o efeito da seleção seja maior quando a taxa de mutação
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
67
for alta e, quando a taxa de mutação for baixa predomine o efeito da
deriva genética aleatória (Nordborg 2000). Considerando a ausência de
recombinação e da expressão gênica e que os haplótipos do cromossomo
Y humano possuem alta taxa de mutação por loco, o modelo de
coalescente a ser aplicado, deverá primeiramente, se apoiar na teoria
neutralista como ponto de partida (Barton et al. 2002).
2.5.2 Árvores de genes e a coalescência
Uma amostra de genes de uma população representa mais do que
uma quantidade de alelos. Cada gene da amostra tem uma história datada
de centenas ou milhares de gerações atrás. É possível que um par de
alelos em uma amostra atual venha de cópias idênticas do mesmo alelo
produzido por um indivíduo há várias gerações atrás, tendo sido
reproduzidos por descendência ao longo delas de um único ancestral
comum (Kingman 1982a). O termo coalescência se refere a isto, olhar
para o tempo em gerações que se passaram e verificar que dois alelos se
juntam a um ancestral comum (figura 14). Ao longo deste processo de
transferência de genes por descendência, um deles vai de uma amostra k
na população atual para k-1 ancestrais após a primeira coalescência, k-2
ancestrais após a segunda coalescência, até existir dois ancestrais para
toda a amostra no caso de organismos diplóides ou um ancestral apenas
no caso de herança uniparental. A idéia de coalescência considera a
história ancestral de genes, em uma amostra, desenvolvendo um modelo
matemático para determinar o tempo decorrido até um ancestral comum
conhecido com tempo para o mais recente ancestral comum (TMCRA)
(Walsh 2001).
A coalescência se caracteriza pela observação que a população atual
é o efeito de eventos na população anterior k-1 proposta pelo modelo de
Wright-Fisher. Neste modelo, são considerados a princípio que o tamanho
da população (N) é constante ao longo do tempo, as gerações são
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
68
formadas aleatóriamente por um conjunto gamético grande e que as
freqüências genéticas são originadas somente a partir da deriva. Na
ausência de mutação o alelo se tornará fixo na população, contudo, por
causa da mutação que pode ocorrer ao longo do processo, os alelos não
serão idênticos na seqüência nucleotídica, mesmo sendo de um ancestral
comum (Kingman 1982a). Tipicamente o que se tem é um instantâneo
representado por uma pequena amostra de alelos retirados no tempo
presente. Quando se retrocede ao longo das gerações observa-se que o
número de alelos ancestrais tende a se manter ou a diminuir. Quando este
último ocorre, a cada redução no número de alelos ancestrais denomina-
se evento coalescente (Hein et al. 2004).
Present
Tempo
Mais recente ancestral comum(MRCA)
TCGAGGTATTAACTCTAGGTATTAACTCGAGGCATTAACTCTAGGTGTTAACTCGAGGTATTAGCTCTAGGTATCAAC* ** * *
Presente
Figura 14: Mais recente ancestral comum (seta), 17 gerações anteriores a geração atual indicando o evento coalescente que caracteriza a ancestralidade comum. Observar que as mutações (asteriscos) se perpetuam e definem sublinhagens (cores) do ancestral comum e os eventos coalescentes destas sublinhagens
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
69
Considerando dois alelos, a probabilidade de que venham de um mesmo
alelo da geração anterior é dada por 1/2N (população diplóide de tamanho
N), logo a chance de que venham de alelos distintos é dada por 1 – 1/2N.
A probabilidade de vários alelos (k1, K2, K3..Ki) ter k alelos parentais
distintos de uma geração anterior é
A probabilidade de que 2 alelos tenham ancestral comum em t gerações
atrás é:
1/2N [1-(1/2n)]t ≈ 1/2N е-t/(2N)
que é o produto da probabilidade de não coalescer em t gerações (1-
1/2N)t multiplicado pela chance de coalescerem em qualquer geração
1/2N.
A exponencial é uma aproximação muito boa quando 1/2N é
pequena. Esta distribuição tem uma média de 2N gerações e uma
variância de (4N)2.
O processo de coalescência pode ser representado pela árvore
genealógica. A cada geração, se existem k alelos presentes, o tempo
passado esperado desde a ultima coalescência é
2N/ ⎟⎟⎠
⎞⎜⎜⎝
⎛2k
A distribuição de cada intervalo de tempo é exponencial, com as
médias sempre crescendo quando voltamos no tempo. O tempo de
coalescência de todos os alelos k é:
t = 4N (1-1/k)
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
70
com variância
V= 4N2 2
2
2
1
⎟⎟⎠
⎞⎜⎜⎝
⎛Π= i
k
i
(Kingman 1982a; Tajima 1983).
Para o cálculo para populações haplóides, mtDNA e NRY, reduzir-se-á os
coeficientes de N à metade.
2.5.3 Modelos de coalescência com mutação
O que deve ser acrescido ao modelo é a mutação. Obedecendo ao
modelo de infinitos sítios e a neutralidade da mutação, pode-se proceder
do seguinte modo:
• Determinar o tamanho da amostra k e o parâmetro Θ = 4Neμ para
a região gênica de interesse onde Ne é o número efetivo da
população e μ é a taxa de mutação para o sítio. O parâmetro Θ
corresponde à heterozigozidade média calculada pela probabilidade
de ocorrência de uma mutação em qualquer geração dividida pela
probabilidade da ocorrência de uma mutação ou coalescente.
• Retirar os números aleatórios com distribuiçao exponencial
apropriadas para construir uma genealogia gênica, tal que tempos
de coalescência possam ser calculados para k alelos em tempos t e
t-1;
• Em cada ramo da árvore distribuir mutações de acordo com a
distribuição de Poisson, tal que o número da média de mutações em
cada ramo seja dado por 2Nμt, onde t é comprimento do ramo.
Este procedimento tem sido usado em séries de dados gerados sob
a hipótese neutralista para comparar conjuntos de dados observados. A
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
71
aproximação coalescente pode ser usada para derivar muitos princípios
fundamentais em genética de populações. Métodos de coalescência não
são limitados à consideração do modelo de Wright-Fisher. Pode-se
desenvolver uma equação recursiva para probabilidades de recombinação,
migração ou outros fenômenos em uma árvore de gene, a partir daí,
geralmente inferências poderosas podem ser derivadas de aproximações
coalescentes. É suficiente dizer que o método pode gerar resultados,
geralmente com muito menos dificuldade e a aproximação de coalescência
é especialmente boa para testar hipóteses sobre amostras populacionais
(Donnelly e Tavaré 1995; Kingman 1982a; Kingman 1982b).
2.5.4 Tempo para o mais recente ancestral comum (TMRCA)
Uma boa aproximação para a estimativa do tempo para o mais
recente ancestral comum (TMRCA), aplicado a um conjunto de
cromossomos Y de origens próximas, é o uso da variação de
microssatélites nos cromossomos e das taxas de mutação que são
originadas por análise de famílias ou outros estudos. A base para esta
aproximação é intuitivamente óbvia: um haplogrupo de Y é originado a
partir da ocorrência de uma mutação gerando um marcador binário (SNP
ou Alu). Isto acontece em um único cromossomo, sem necessariamente
estar associado a uma variação no microssatélite, alterando as STR’s. Se a
linhagem originada se espalha, mutações nos microssatélites irão ocorrer:
quanto maior o tempo, maior a variação acumulada. Na prática, vários
fatores podem influenciar a estimativa. Primeiro, a taxa de mutação não é
precisamente definida e os resultados dos trabalhos variam muito. As
taxas de mutação também diferem entre microssatélites e entre alelos.
Segundo, o tempo entre gerações, que compreende uma faixa entre 20 e
35 anos na espécie humana, deve ser escolhido para converter o tempo
medido em gerações para anos. Terceiro, e provavelmente mais
importante, a variação não é acumulada a uma taxa constante, mas
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
72
variações são algumas vezes perdidas por deriva genética aleatória. Em
decorrência, a estrutura demográfica e populacional tem grande influência
e, em gera,l é mal conhecida. O efeito destas complicações é a existência
de um certo grau de incerteza nas medidas (Jobling e Tyler-Smith 2003).
Um programa de computador (MRCA) foi desenvolvido de acordo
com o estudo realizado por Bruce Walsh (2001) no qual é possível, usando
os parâmetros de taxa de mutação e número de marcadores, estimar o
tempo em gerações para o MRCA. Para dois indivíduos dados que
combinam em k marcadores de microssatélites de n marcadores totais, a
distribuição do tempo t ao MRCA é a medida mais natural de relação para
tais regiões não recombinantes. Um número modesto (20) de marcadores
de microsatélites é suficiente para obter estimativas razoavelmente
precisas de tempo t para os indivíduos separados por 200 ou menos
gerações. Assumindo que um número n de marcadores de dois indivíduos
são examinados e são classificados como iguais ou não, baseado na
semelhança entre os alelos do mesmo loco, usa-se então um método de
aproximanção para o cálculo da distribuição para o tempo t em gerações,
em função do número de marcadores de alelos correspondentes, da taxa
de mutação e um hiperparâmetro que corresponde à estimativa do
tamanho populacional.
(http//lists.rootsweb.com/index/other/miscelanious/genealogy-DNA.html).
2.5.5 Árvores filogenéticas baseadas em Y-STR
A diferenciação entre indivíduos, estimada pela distância genética,
pode ser utilizada para elaboração de árvores evolucionárias de
populações. Uma alternativa popular de estimativa de TMRCA é o uso da
análise do Median-Joining Network (MJN) (Bandelt et al. 1999). Nesta
análise, a genealogia de n indivíduos é considerada como uma árvore
ultramétrica (figura 15) na qual o comprimento dos braços de ligação
corresponde ao tempo em escala e cada nó entre as ligações corresponde
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
73
a um evento coalescente, sempre representado por uma mutação. Se
existem k ligações (≤ 2n – 2) de comprimentos t1, t2 .... tk em unidades
de tempo em gerações, e se cada clado for definido pela i-ésima ligação
que possui ni indivíduos (i = 1, 2,...k) então o tempo de coalescência t
pode ser expresso por:
t = (n1t1 + n2t2 + ...+ nktk)/n
Se μ denota a taxa de mutação, expressa como a expectativa do número
de mutações em um seguimento por unidade de tempo em gerações,
então é possível associar a i-ésima ligação a uma variável X da
distribuição de Poisson, com parâmetro μi = tiμ. A variável X tem valor
esperado:
E(X) = [(n1t1 + n2t2 + ...+ nktk)/n]μ = tμ
E variância:
V(X) = [(n12t1 + n2
2t2 + ...+ nk2tk)/n2]μ
Dada uma amostra de n seqüências com mutações observadas,
simplesmente é escolhida uma árvore (a mais parcimoniosa) com uma
raiz especificada e m ligações, como estimativa da genealogia
desconhecida e é tomado o número li de mutações observadas ao longo da
i-ésima ligação como estimativa de tiμ. Se mais de uma árvore plausível
existir, o cálculo abaixo deve ser realizado para cada árvore candidata.
Partindo da hipótese de que a árvore considerada é a correta:
ρ= (n1l1 + n2l2 + ...+ nmlm)/n)
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
74
é uma estimativa não tendenciosa para a idade da raiz especificada. Note
que ρ é a distância média para a raiz, como empregada por exemplo por
Morral et al. (1994). Além disto, pode-se perceber que
σ2 = (n12l1 + n2
2l2 + ...+ nm2lm)/n2
serve como estimativa para variância. Observe que σ2 ≥ ρ/n onde a
equação determina exatamente quando atinge o “star index” como
definido por Torroni et al. (1998), com valor limite máximo de 1 para os
casos de filogenias definidas como “perfect star” (quando o mais freqüente
elemento é o centro da árvore filogenética), ou seja, quando a estimativa
de definição correta da árvore é a mais alta possível. Define-se star-index
(índice estrela) de uma amostra de seqüências, relativo a uma árvore
enraizada, como a freqüência relativa dos pares de seqüências na amostra
que coalescem na raiz da árvore ou que estão conectados por um trajeto
que passa através da raiz. Um grupo mais próximo ao formato estrela na
árvore estará mais próximo de 1. Em geral ρ/σ2 arredondado para o
inteiro mais próximo deverá indicar o tamanho de uma “perfect star” com
aproximadamente os mesmos valores para ρ e σ2. Quanto mais a razão
ρ/σ2 se aproxima de 1, mais próximo de “perfect star” ela se encontra.
Em decorrência, define-se a razão ρ/σ2, como “effective star size” e a
razão ρ/nσ2 a eficiência (para definição do tempo de coalescência) da
amostra.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
75
Figura 15: Matriz simétrica geradora (a) e a árvore ultramétrica gerada (b) pela matriz.
Esta matriz é construída baseada nas distãncias genéticas calculadas entre os elementos
dois a dois.Note que a maior distância serve como referência de ramificação
Vários trabalhos foram publicados estabelecendo comparação entre
árvores filogenéticas construídas com base em polimorfismos binários
(SNP e Alu) e microssatélites (STR). Foster et al. (2000), mostraram que
o uso adequado de metodologias permite a construção de duas árvores
filogenéticas para diferentes populações baseadas nos dois tipos de
marcadores e aponta a similadridade entre elas (Figura 16).
Figura 16: Duas árvores filogenéticas (networks) construídas a partir de 256
cromossomos Y de arborigenes da África, Ásia, Europa e Austrália. À esquerda, com
base em microssatélites formado pelos locos DYS19, DXYS156Y, DYS389, DYS390,
DYS392, e DYS393; e à direita usando marcadores de polimorfismos binários (UEP),
evidenciando a similaridade entre elas. O tamanho dos círculos correspondem ao número
de indivíduos, o tamanho dos braços são proporcionais a distância genética. Fonte:
Foster et al. (2000)
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
76
Um dos trabalhos que reforça a tese de diferentes linhagens, ou
incursões migratórias para o continente americano, das quais se
originaram os ameríndios, é mais um exemplo da aplicação das STR’s do
cromossomo Y para construção de árvores filogenéticas como ferramenta
científica (Bortolini et al. 2003). Neste caso, a árvore permite verificar a
distribuição dos haplótipos referentes aos americanos nativos e mongóis,
nos diferentes braços da árvore filogenética, evidenciando o ponto
coalescente das duas linhagens haplotípicas (Figura 17).
Figura 17: Árvore de network construída a partir de haplótipos formados
por seis marcadores de Y-STR de populações ameríndias com a mutação
P-M45, mostrando o posicionamento dos haplótipos dos índios nativos da
América e dos mongóis na Ásia. As distâncias foram calculadas a partir
das freqüências alélicas. Notar a divisão dos braços (estrela).
Fonte:(Bortolini et al. 2003).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
77
2.6 Considerações Finais
Os estudos dos microssatélites do cromossomo Y e do mtDNA
permitem a construção da história humana, através de uma visão
genética, estabelecendo relações entre a genética populacional, o
ambiente e o comportamento.
Segundo o geneticista norte-americano John Avise, a filogeografia pode
ser definida como o campo de estudo dos princípios e processos que
governam a distribuição geográfica de linhagens genealógicas dentro das
espécies, com ênfase em fatores históricos (Avise 2000). Desta forma, a
filogeografia ajuda a contar a história da humanidade desde sua gênese,
reconstruindo teoricamente os processos evolutivos que a originou, até os
mais recentes processos de colonização. Os modelos evolucionários
propostos buscam apontar quais os possíveis mecanismos que teriam
determinado os grupos populacionais e os padrões de variação que são
observados nas populações modernas, por serem estes, reflexos desta
história demográfica. Como conseqüência, diversos trabalhos apresentam
a composição da população Pernambucana como sendo uma mistura de
ameríndios, europeus e africanos. Alguns tomam como base as
freqüências alélicas e haplotípicas de STR, outros utilizam os marcadores
característicos de algumas populações como os SNP, Indels, CCR5 entre
outros (Bastos-Rodrigues et al. 2006).
O estudo dos hapótipos humanos tem, invariavelmente,
transformado, não só a área forense, como tem causado avanços em
serviços relacionados à ancestralidade e genealogia. Alguns projetos
incorporam várias gerações e famílias com o propósito de determinar a
linhagem ancestral e graus de parentesco entre pessoas. Vários sitios na
Internet disponibilizam uma grande diversidade de serviços que podem
ser oferecidos, que compreendem a análise de haplótipos. Como exemplo
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
78
podemos citar o Family Tree DNA, que oferece uma gama de serviços de
análise de Y-STR com até 37 marcadores e análise de genealogia, com
consulta on-line; a página de Charles F. Kerchner Jr.:
(http://www.kerchner.com/haplogroups-ydna.htm),
através da qual participa-se de grupos de discussão e pode-se
adquirir adereços com alusão aos haplogrupos do cromossomo Y e de
mtDNA; e o YBASE (http://www.ybase.org/shaplo.asp), uma página na
qual pode-se verificar os haplótipos existentes no banco de dados, origem
geográfica e haplogrupos já identificados; o Etno Ancestry
(http://www.ethnoancestry.com), no qual emite-se a certificação do
indivíduo pertencente ao haplogrupo após submeter-se ao exame de
diversos marcadores binários; e ainda o GENE
(http://laboratoriogene.info/Genealogia_por_DNA/index.htm), um grupo
de pesquisa brasileiro, que entre outros serviços, oferece o diagnóstico da
ancestralidade genômica utilizando os marcadores autossômicos (indels)
para prognosticar as contribuições genômicas (européia, africana e
ameríndia) de um indivíduo. Deve-se observar que quanto mais
informação existir sobre a genealogia, composição haplotípica e relação
genética entre os indivíduos, maior será a acurácia dos modelos propostos
nos estudos filogeográficos e de genética de populações. Estes modelos
ajudarão a propor os mecanismos que orientam a distribuição das
freqüências gênicas, e como conseqüência, resolver os problemas futuros
de natureza populacional, auxiliando inclusive nas políticas públicas de
saúde, uma vez estabelecidas relações entre os marcadores genéticos e
determinadas doenças.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
79
33–– RREEFFEERRÊÊNNCCIIAASS BBIIBBLLIIOOGGRRÁÁFFIICCAASS
Al-Zahery (2003) Y-chromosome and mtDNA polymorphisms in Iraq, a
crossroad of the early human dispersal and of post-Neolithic
migrations. Mol Phyl Evol 28:458-472
Alves-Silva J, Santos MS, Guimarães PEM, Ferreira ACS, Bandelt H-J, Pena
SDJ, Prado VF (2000) The Ancestry of Brazilian mtDNA lineages.
Am. J. Hum. Genet. 67:444–461
Athey TW (2005) Haplogroup Prediction from Y-STR Values Using an
Allele-Frequency Approach. Journal of Genetic Genealogy 1:1-7
Avise JC 2000. Phylogeography: The History and Formation of Species.
Harvard University Press, Cambridge, MA. (447 pp.).
Azevedo DA, Silva LAF, Barbosa ABG, Mauricio-da-Silva L (2005) Diversity
and Mutation Analysis of Minimal Haplotype Y-Microsatellites Loci Plus
DYS447, DYS458 and DYS464 in Alagoas, Northeastern Brazil
Ballard DJ, Phillips C, Wright G, Thacker CR, Robson C, Revoir AP, Court
DS (2005) A study of mutation rates and the characterisation of
intermediate, null and duplicated alleles for 13 Y chromosome STRs.
Forensic Sci Int 155(1):65-70
Bandelt H-J, Forster P, Röhl A (1999) Median-joining networks for inferring
intraspecific phylogenies. Mol Biol Evol 16:37-48
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
80
Barbujani, G. and R.R. Sokal. 1990. Zones of sharp genetic change in
Europe are also linguistic boundaries. Proceedings of the National
Academy of Sciences USA 87:1816-1819.
Barros JEXS, Maciel EMBB, Gomes AV,Martins AM, Silva RS, Maurício-da-
Silva L (2006) Human Y-chromosome STR haplotype diversity in
Pernambuco, Northeast Brazil (submitted to forensic science
international)
Barton NH, Depaulis, Etheridge FAM (2002) Neutral evolution in spatially
continuous populations. Theor Popul Biol. 61:31-48
Bastos-Rodrigues L, Pimenta JR, Pena SDJ (2006) The Genetic Structure
of Human Populations Studied Through Short Insertion-Deletion
Polymorphisms. Annals of Human Genetics 70: 658
Behar DM, Garrigan D, Kaplan ME, Mobasher Z, Rosengarten D, Karafet
TM, Quintana-Murci, Ostrer H, Skorecki K, Hammer MF (2004)
Contrasting patterns of Y chromosome variation in Ashkenazi Jewish
and host non-Jewish European populations. Hum Genet 114:354-
365
Beleza S, Gusmão L, Lopes A, Alves C, Gomes I, G Maria, Calafell,
Carracedo A, Amorim A (2006) Micro-Phylogeographic and
Demographic History of Portuguese Male Lineages Annals of Human
Genetics 70: 181-194
Boissinot S and Furano AV (2005) The recent Evolution of human
retrotransposons. Cytogenetic and Genome Research 110:402-406
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
81
Bortolini MC, Salzano FM, Thomas MG, Stuart S, Nasanen SPK , Bau CHD,
Hutz MH, Layrisse Z, Petzl-Erler ML, Tsuneto LT, Hill K, Hurtado AM,
Castro-de-Guerra D, Torres MM, Groot H ,Michalski R, Nymadawa P,
Bedoya G, Bradman N, Labuda D , Ruiz-Linares A (2003), Y-
Chromosome Evidence for Differing Ancient Demographic Histories in
the Americas Am. J. Hum. Genet. 73:524–539
Bosch E, Calafell F, Santos FR, Perez-Lezaun A, Comas D, Benchemsi N,
Tyler-Smith C, Bertranpetit J (1999) Variation in Short Tandem
Repeats Is Deeply Structured by Genetic Background on the Human Y
Chromosome Am. J. Hum. Genet. 65:1623–1638, 1999
Butler JM, Schoske R and Vallone PM (2003) Highly multiplexed assays for
measuring polymorphisms on the Y-chromosome. Int Congress series
1239: 301-305.
Carvalho-Silva DR, Santos FR, Hutz MH, Salzano FM and Pena SDJ (1999)
Divergent human Y-chromosome microsatellite evolution rates. J Mol
Evol: 49: 204-214.
Carvalho-Silva DR, Santos FR, Rocha J and Pena SDJ (2001) The
phylogeography of brazilian Ychromosome lineages. Am J Hum Genet
68: 281286.
Casanova M, Leroy P, Boucekkine C, Fellous M, Purrello M, Fiori G,
Siniscalco M (1985) A human Y-linked DNA polymorphism and its
potential for estimating genetic and evolutionary distance. Science,
230, 1403–1406.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
82
Cavalli-Sforza LL, Wang WSY (1986) Spatial distance and lexical
replacement. Language 62:38-55
Cavalli-Sforza LL (1993) Genes, povos e línguas. Tradução de Carlos
Afonso Malferrari. São Paulo: Companhia das Letras, 2003. 294 p.
Cavalli-Sforza L L., Menozzi P, Piazza A (1994) The history and geography
of human genes.Princeton, Princeton University Press.
Cavalli-Sforza L.L., Feldman MW (2003) The application of molecular
genetic approaches to the study of human evolution. Nature
Genetics, 33, 266-75.
Chakravarti A, (1999) Population genetics – making sense out of
sequence. Nature genetics,24,56-60.
Cinnioglu C, King R, Kivisild T, Kalfoglu E, Atasoy S, Cavalleri GL, Lillie AS,
Roseman CC, Lin AA, Prince K, Oefner PJ, Shen P, Semino O,
Cavalli-Sforza LL, Underhill PA (2004) Excavating Y-chromosome
haplotype strata in Anatolia. Hum Genet 114:127–148.
Coia V, Caglià A, Arredi B, Donati F, Santos FR, Pandya A, Taglioli L, Paoli
G, Pascali V, Destro-Bisol G, Tyler-Smith C (2003) Binary and
microsatellite polymorphisms of the Y-chromosome in the Mbenzele
pygmies from the Central African Republic. American Journal of
Human Biology 16: 1 , 57 – 67
de Knijff P (2000) Messages through bottlenecks: on the combined use of
slow and fast evolving polymorphic markers on the human Y-
chromosome. Am J Hum Genet 67: 1055-1061
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
83
Dellalibera E, Havro MLB, Souza M, Kajihara K, Mauricio-da-Silva L,Silva R
S (2004) Genetic analysis of 13 STR loci in the population from the
State of Pernambuco, Northeast Brazil. Forensic Scic Int.
Di Rienzo A, Donelly P, Toomajian CH, Sisk B, hill A, Petzl-Erler ML, Haines
GK and Barch DH (1998) Heterogeneity of microsatellite mutations
within and between loci, and implications for human demographic
histories. Genetics 148: 1269-1281.
Donnelly P and Tavaré S (1995) Coalescents and genealogical structure
under neutrality. Anna. Rev. Genet. 1995. 29:401-21
Dupuy BM, Stenersen M, Egeland T, Olaisen B (2004) Y-chromosomal
microsatellite mutation rates: differences in mutation rate between
and within loci. Hum Mutat 23(2):117-24
Ferreira OL (1987) História do Brasil, 12th edn. Ática, São Paulo Brazil
Floridia G, Gimelli G, Zuffardi O, Earnshaw WC, Warburton PE, Tyler-
Smith C (2000) A neocentromere in the DAZregion of the human Y
chromosome. Chromosoma (2000) 109:318–327
Forster P, Rohl A, Lunnemann P, Brinkmann C, Zerjal T, Tyler-Smith C,
Brinkmann B (2000) A Short Tandem Repeat–Based Phylogeny for
the Human Y Chromosome. Am. J. Hum. Genet. 67:182–196.
Freyre G (1933) Casa Grande e Senzala. São Paulo, Círculo do Livro S.A
Garcia C (1986) O que é o Nordeste Brasileiro, 2nd edn. Brasiliense, São
Paulo Brasil
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
84
Goldstein DB and Schlötterer C (1999) Micosatellites evolution and
applications. Oxford University Press, New York. 352 pp.
Grattapaglia D, Kalupniek S, Guimarães CS, Ribeiro MA, Diener PS and
Soares CN (2004) Ychromosome STR haplotype diversity in brazilian
populations. Forensic Sci Int 149: 99-107.
Gusmão L, Sanchez-Diz P, Alves C, Beleza S, Lopes A, Carracedo A,
Amorim A (2003) Grouping of Y-STR haplotypes discloses European
geographic clines. Forensic Science International 134 :172–179
Gusmão L, Sánchez-Diz P, Calafell F, Martín P, Alonso CA, Álvarez-
Fernández F, Alves C, Borjas-Fajardo L, Bozzo WR, Bravo ML, Builes
JJ, Capilla J, Carvalho M, Castillo C, Catanesi CI, Corach D, Di Lonardo
AM, Espinheira R, Fagundes de Carvalho E, Farfán MJ, Figueiredo HP,
Gomes I, Lojo MM, Marino M, Pinheiro MF, Pontes ML, Prieto V,
Ramos-Luis E, Riancho JA, Souza Góes AC, Santapa OA, Sumita DR,
Vallejo G, Vidal Rioja L, Vide MC, Vieira da Silva CI, Whittle MR,
Zabala W, Zarrabeitia MT, Alonso A, Carracedo A, Amorim A (2005)
Mutation rates at Y chromosome specific microsatellites. Human
Mutation 26(6): 520-528.
Hawks J, Wolpoff MH (2003) Sixty years of modern human origins in the
American Anthropological Association. American Anthropologist, 105,
89-100.
Hein J, Schierup MH, Wiuf C (2004) Gene Genealogies, Variation and
Evolution-A Primer in Coalescent Theory. Oxford University Press UK
Heyer E, Puymirat J, Dieltjes P, Bakker E and knijff P (1997) Estimating Y
chromosome specific microsatellite mutation frequencies using deep
rooting pedigrees. Hum Mol Gen 6: 799-803.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
85
Holtkemper U, Rolf B, Hohoff C, Forster P and Brinkmann B (2001)
Mutation rates at two human Y-chrosomal microsatellite loci using
small pool PCR techniques. Hum Mol Gen 10: 629-633.
Hopkinson DA; Harris H.(1966) Rare phosphoglucomutase phenotypes.
Ann. Hum. Genet. 30: 167-181, 1966.
IBGE-Instituto Brasileiro de Geografia e Estatística (2000;2001) Brasil:
500 anos de povoamento. IBGE, Rio de Janeiro.
Jobling MA and Tyler-Smith C (2003) The Human Y Chromosome:an
evolutionary marker comes age. Nature Reviews. 4.
Kayser M, Caglià V, Corach D, Fretwell N, Gehrig C, Graziosi G, Heidorn F,
Herrmann S, Herzog B, Hidding M, Honda K, Jobling M, Krawczak M,
Leim K, Meuser S, Meyer E, Oesterreich W, Pandya A, Parson W,
Penacino G, Perez-Lezaun A, Piccinini A, Prinz M, Schmitt C, Schneider
PM, Szibor R, Teifel-Greding J, ·Weichhold G, de Knijff P, Roewer L
(1997) Evaluation of Y-chromosomal STRs: a multicenter study. Int J
Legal Med (1997) 110 : 125–133
Kayser M, Roewer L, Hedman M, Henke L, Henke J, Brauer S, Krüger C,
Krawczak M, Nagy M, Dobosz T, Szibor R, de Knijff P, Stoneking M,
Sajantila A (2000) Characteristics and frequency of germline
mutations at microsatellite loci from the human Y chromosome, as
revealed by direct observation in father/son pairs. Am J Hum Genet
66(5):1580-8
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
86
Kayser M and Sajantila A (2001) Mutations at Y-STR loci: implications
forpaternity testing and forensic analysis. Forensic Sci Int 118: 116-
121.
Kayser M, Kittler R, Erler A, Hedman M, Lee AC, Mohyuddin A, Mehdi SQ,
Rosser Z, Stoneking M, Jobling MA, Sajantila A and Tyler-Smith
(2004) A comprehensive survey of human Y-chromosomal
microsatellites. Am J Hum Genet 74: 1183-1197.
Kendrew J. (1994) The Encyclopedia of Molecular Biology. Blackwell
Science Ltd 262-64
Kingman, J.F.C. (1982a). The coalescent, Stochastic Processes and their
Applications 13, 235–248.
Kingman, J.F.C. (1982b). On the genealogy of large populations. Journal
of Applied Probability 19A, 27–43.
Klintschar M and Wiegand P (2003) Polymerase slippage in relation to the
uniformity of tetrameric repeat stretches. Forensic Sci Int 135:163-
166.
Knight A, Underhill PA, Mortensen HM, Zhivotovsky LA, Lin AA, Henn BM,
Louis D, Ruhlen M, Mountain JL (2003) African Y Chromosome and
mtDNA Divergence Provides Insight into the History of Click
Languages. Current Biology 13: 464–473
Laguardia, J (2005) Raça, evolução humana e as (in)certezas da genética.
Antropo, 9: 13-27.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
87
Lahn BT, Pearson NM, Jegalian K (2001) The human Ychromosome, in the
light of evolution. Nat. Rev. Genet. 2: 207–216.
Lell JT, Sukernik RI, Starikovskaya YB, Su B, Jin L, Schurr TG, Underhill
PA, Wallace DC (2002) The dual origin and Siberian affinities of Native
American Y chromosomes. Am J Hum Genet 70:192–206
Lewontin RC and Hubby JL (1966) A molecular approach to the study of
genic hetero-zygosity in natural populations. 11 Amount of variation
and degree of heterozygosity in natural populations of Drosophila
pseudoobscura. Genetics 54 : 595-609
Mauricio-da-Silva L, SILVA RS, DELLALIBERA E, DONADI E A (2000)
Population Genetics of HPRTB, F13B and LPL in Pernambuco,
Northeast of Brazil. Journal Of Forensic Sciences 45:684 – 686.
Medeiros T (1980) O negro na etnia do Rio Grande do Norte. Revista do
Instituto Histórico e Geográfico do Rio Grande do Norte 7:1909
Morral N, Bertranpetit J, Estivill X, Nunes V, Casals T, Gimenez J, Reis A,
Varon-Mateeva R, Macek Jr. M, KalaydjievaL, Angelicheva D,
Dancheva R, Romeo G, Russo MP,Garnerone S, Restagno G, Ferrari
M, Magnani C, Claustres M, Desgeorges M, Schwartz M, Schwarz M,
Dallapiccola B, Novelli G, Ferec C, et al (1994) The origin of the
major cystic fibrosis mutation (�F508) in European populations. Nat
Genet 7:169–175
Nigam P, Dellalibera E, Mauricio-Da-Silva L., Donadi EA, Silva R. S (2004)
Polymorphism of HLA class I genes in the Brazilian population from
the Northeastern State of Pernambuco corroborates anthropological
evidence of its origin. Tissue Antigens 64: 204-209
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
88
Nordborg M (2000) Coalescent theory In Statistical Genetics, ed. D.J.
Balding, M. Bishop and C. Cannings, Wiley and Sons. New York. 179-
212
Olaissen B, Bär W, Brinkmann B, Budowle B, Carracedo A, Gill P, Lincoln
P, Mayr WR and Rand S (1998) DNA recommendations 1997 of the
International Society for Forensic Genetics. Vox Sang 74: 61-63.
Parra FC, Amado RC, Lambertucci JR, Rocha J, Antunes C, Pena SDJ
(2003) Color and genomic ancestry in Brazilians. PNAS 100:177-182.
Pena SDJ, Carvalho-Silva DR, Alves-Silva J, Prado VF (2000) Retrato
Molecular do Brasil. Ciência Hoje 27: 16-25
Pereira L, Gusmão L, Alves C, Amorim A, Prata MJ (2002) Bantu and
European Y-lineages in Sub-Saharan Africa. Ann. Hum. Genet: 66,
369±378
Ribeiro D – O Povo Brasileiro (Edição integral). São Paulo, Círculo do Livro
S.A, 1995
Rodrigues-Delfin L, Santos SEB, Zago MA (1997) Diversity of the human Y
chromosome of South American Amerindians: a comparison with
Blacks, hites, and Japanese from Brazil. Ann. Hum. Genet.:61,
439±448
Roewer L, Krawczak M, Willuweit S, Nagy M, Alves C, Amorim A, Anslinger
K, Augustin C , Betz A, Bosh E, Caglia A, Carracedo A, Corach D,
Dekairelle AF, Dobosz T, Dupuy BM, Furedi S, Gehring C, Gusmao L,
Henke J, Henke L, Hidding M, Hohoff C, Hoste B, Jobling MA, Kargel
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
89
HJ, de Knijff P, Lessig R, Liebeherr E, Lorente M, Martinez-Jarreta B,
Nievas P, Nowak M, Parson W, Pascali VL, Penacino G, Ploski R, Rolf
B, Sala A, Schmidt U, Schmitt C, Schneider PM., Szibor R, Teifel-
Greding J., Kayser M (2001) Online reference database of European
Y-chromosomal short tandem repeat (STR) haplotypes. Forensic Sci.
Int. 118: 106-113.
Roewer L, Arnemann J, Spurr NK, Grzeschik KH and Epplen JT (1992)
Simple repeat sequence on the human Y chromosome are equally
polymorphic as their autosomal counterparts. Hum Genet 89: 389-
394.
Roewer L, Krawczak M, Willuweit S, Nagy M, Alves C, Amorim A, Anslinger
K, Augustin C , Betz A, Bosh E, Caglia A, Carracedo A, Corach D,
Dekairelle AF, Dobosz T, Dupuy BM, Furedi S, Gehring C, Gusmao L,
Henke J, Henke L, Hidding M, Hohoff C, Hoste B, Jobling MA, Kargel
HJ, de Knijff P, Lessig R, Liebeherr E, Lorente M, Martinez-Jarreta B,
Nievas P, Nowak M, Parson W, Pascali VL, Penacino G, Ploski R, Rolf
B, Sala A, Schmidt U, Schmitt C, Schneider PM., Szibor R, Teifel-
Greding J., Kayser M (2001) Online reference database of European
Y-chromosomal short tandem repeat (STR) haplotypes. Forensic Sci.
Int. 118 :106-113.
Rolf B, Keil W, Brinkman B and Rower L (2001) Paternity testing using Y-
STR haplotypes: assigning a probability for paternity in cases of
mutations.
Russell-Wood, A. J. (1998) A sociedade portuguesa no ultramar em
Francisco Bethencourt e Kirti Chaudhuri (orgs.), História da Expansão
Portuguesa: I,266-281
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
90
Samson M, Libert F, Doranz B, Rucker J, Liesnard C, Farber CM, Saragosti
S, Lapoumeroulie Cognaux J, Forceille C, Muyldermans G,
Verhofstede C, Burtonboy G, Georges M, Imai T, Rana S, Yi Y, Smith
R, Collman R, Doms R, Vassart G & Parmentier M (1996). Resistance
to HIV-1 infection in Caucasian individuals bearing mutant alleles of
the CCR-5 chemokine receptor gene. Nature, 382: 722-725.
Santos MV, Carvalho M, Anjos MJ, Andrade L, Lopes V, Corte-Real F, Vieira
DN and Vide MC (2003) Y-chromosome DNA haplotypes in human
samples from Bahia, Brazil. Int Congr Ser 1239: 443– 448
Semino O, Magri C, Benuzzi G, Lin AA, Al-Zahery N, Battaglia V, Maccioni
L, Triantaphyllidis C, Shen P, Oefner PJ, Zhivotovsky LA , King R,
Torroni A, Cavalli-Sforza LL, Underhill PA, Santachiara-Benerecetti AS
(2004) Origin, Diffusion, and Differentiation of Y-Chromosome
Haplogroups E and J: Inferences on the Neolithization of Europe and
Later Migratory Events in the Mediterranean Area. Am. J. Hum.
Genet. 74:1023–1034, 2004
Schlötterer C (1998) Genome evolution: are microsatellites really simple
sequences? Curr. Biol. 8: 132-134.
Schoske R (2003) The design, optimization and testing of Y chromosome
short tandem repeat megaplexes. PhD Thesis, American University,
Washington D. C.
Schoske R, Vallone PM, Kline MC, Redman JW and Butler JM (2004) High-
throughput Y-STR typing of U. S. populations with 27 regions of the Y
chromosome using two multiplex PCR assays. Forensic Sci Int 139:
107-121.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
91
Schultes T, Hummel S and Herrmann B (1999) Amplification of
Ychromosomal STR’s from ancient skeletal material. Hum Genet
104:164-166.
Schmid CW and Jelinek WR (1982) The Alu family of dispersed repetitive
sequences. Science 216: 1065–1070.
Spuhler JN (1979) Genetic Distances, Trees, and Maps of North American
Indians. In The First Americans: Origins, Affinities, and Adaptations,
ed. W. S. Laughlin and A. B. Harper, pp. 135-83. New York: G.
Fischer.
Stone AC and Stoneking M (1998) mtDNA analysis of a prehistoric
Oneonta population: implications for the peopling of the New World.
Am. J. Hum. Genet. 62:1153– 1170.
Szibor R, Krawczak M, Hering S, Edelmann J, Kuhlisch E and Krause D
(2003) Use of X-linked markers for forensic purposes. Int J Legal Med
117: 67-74.
Tajima F (1983) Evolutionary relationship of DNA sequences infinite
populations. Genetics 105: 437–460.
Tarazona-Santos E, Carvalho-Silva DR, Pettener D, Luiselli D, De Stefano
GF, Labarga CM, Rickards O,Tyler-Smith C, Pena SDJ, Santos FR
(2001) Genetic Differentiation in South Amerindians Is Related to
Environmental and Cultural Diversity: Evidence from the Y
Chromosome. Am. J. Hum. Genet. 68:1485–1496
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
92
The Y-chromosome consortium, a nomenclature system for the tree of
human Y-Chromosomal binary haplogroups, Genome Res. 12 (2002)
339–348.
Thomas MG, Parfitt T, Weiss DA, Skorecki K, Wilson JF, le Roux M,
Bradman N, Goldstein DB (2000) Y chromosomes traveling south: the
Cohen modal haplotype and the origins of the Lemba—the “Black
Jews of Southern Africa.” Am J Hum Genet 66:674–686
Torroni A, Bandelt H-J, D’Urbano L, Lahermo P, Moral P, Sellitto D, Rengo
C, Forster P, Savontaus M-L, Bonne´-Tamir B, Scozzari R (1998)
mtDNA analysis reveals a major late paleolithic population expansion
from southwestern to northeastern Europe. Am J Hum Genet
62:1137–1152
Yaoa Y, Bravib CM, Bandelt HC (2004) A call for mtDNA data quality
control in forensic science. Forensic Science International 141: 1–6
Walsh B (2001) Estimating the Time to the Most Recent Common Ancestor
for the Y chromosome or Mitochondrial DNA for a Pair of Individuals.
Genetics 158: 897–912
Watterson DM, Schavocky JP, Guo L, Weiss C, Chlenski A, Shirinsky VP,
Eldik LJV, Haiech J (1999) Analysis of the kinase-related protein gene
found at human chromosome 3q21 in a multi-gene cluster:
Organization, expression, alternative splicing, and polymorphic
marker. Journal of Cell. Bioch. 75: 481-491
Wells S (2002) The Journey of Man: A Genetic Odyssey. Ed.. Princeton
University Press UK
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
93
Wilson JF, Weiss DA, Richards M, Thomas MG, Bradman N, Goldstein DB
(2001) Genetic evidence for different male and female roles during
cultural transitions in the British Isles. Proc Natl Acad Sci USA
98:5078–5083
Underhill PA, Jin L, Zemans R, Oefner PJ and Cavalli-Sforza LL (1996) A
pre-Columbian Y chromosomespecific transition and its implications
for human evolutionary history. Proc. Natl. Acad. Sci. USA 93:196–
200.
Underhill PA, Passarino G, Lin AA, Shen P, Lahrs MMN, Foley RA, Oefner
PJ, Cavalli-Sforza LL (2001) The phylogeography of Y chromosome
binary haplotypes and the origins of modern human populations Ann.
Hum. Genet. (2001), 65, 43±62
Viguera E, Canceill D and Erlich SD (2001) Replication slippage involves
DNA polymerase pausing and dissociation. The EMBO J 20:2587-
2595.
Zegura SL, Karafet TM, Zhivotovsky LA, Hammer MF (2004) High-
Resolution SNPs and Microsatellite Haplotypes Point to a Single
Recent Entry of Native American Y Chromosomes into the Americas.
Mol. Biol. Evol. 21(1):164–175.
Zhivotovsky LA, Underhill PA, Cinnioglu C, Kayser M, Morar B, Kivisild T,
Scozzari R, Cruciani F, Destro-Bisol G, Spedini G, Chambers GK,
Herrera RJ,Yong KK, Gresham D, Tournev I, Feldman MW, Kalaydjieva
L (2004) The Effective Mutation Rate at Y Chromosome Short Tandem
Repeats with Application to Human Population-Divergence Time. Am.
J. Hum. Genet. 74:000–000
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
94
4. Artigo
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
95
HHAAPPLLÓÓTTIIPPOOSS EE HHAAPPLLOOGGRRUUPPOOSS DDOO
CCRROOMMOOSSSSOOMMOO YY DDOO EESSTTAADDOO DDEE
PPEERRNNAAMMBBUUCCOO,, BBRRAASSIILL::
AA CCOONNTTRRIIBBUUIIÇÇÃÃOO DDEE TTRRÊÊSS EETTNNIIAASS
Manuscrito a ser encaminhado à revista
JJoouurrnnaall ooff FFoorreennssiicc SScciieenncceess
ISSN 0022-1198 PA, U.S.A.
HHAAPPLLÓÓTTIIPPOOSS EE HHAAPPLLOOGGRRUUPPOOSS DDOO CCRROOMMOOSSSSOOMMOO YY DDOO EESSTTAADDOO DDEE
PPEERRNNAAMMBBUUCCOO,, BBRRAASSIILL::
AA CCOONNTTRRIIBBUUIIÇÇÃÃOO DDEE TTRRÊÊSS EETTNNIIAASS
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
96
Alexandre M. Martins,1 M.Sc.; Valdir de Q. Balbino,1 Ph.D.; Jemima E.X.S Barros.1 M.Sc.; and Luiz Mauricio-da-Silva,1 Ph.D. 1 Departamento de Genética, Centro de Ciências Biológicas, Universidade
Federal de Pernambuco.
Corresponding author:
Luiz Mauricio da Silva
Dept. de Genética – CCB
Universidade Federal de Pernambuco – Cidade Universitária
50.000-000 Recife, PE, Brazil
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
97
HAPLÓTIPOS E HAPLOGRUPOS DO CROMOSSOMO Y NO
ESTADO DE PERNAMBUCO, BRASIL: a contribuição de três
etnias
Introdução
Os haplótipos do cromossomo Y têm sido freqüentemente usados em
estudos de evolução humana auxiliando na identificação da origem étnico-
geográfica e da afiliação lingüística dos indivíduos. Estes estudos levam
em conta que os haplótipos da região não recombinante do cromossomo Y
(NRY) devem ter se originado a partir de haplótipos característicos dos
primeiros ancestrais humanos. À medida que estes indivíduos migraram
para novas regiões, o conjunto inicial de genes foi sendo alterado por
mutações que resultaram em novos haplótipos e passaram a se comportar
como uma nova linhagem evolutiva independente (Pena et al. 2000).
O agrupamento dos indivíduos em haplogrupos tem base na
classificação cladística do polimorfismo binário encontrado na NRY (Jobling
e Tyler-Smith 2003). Considerando que as linhagens haplotípicas
apresentam diferentes variações nas curtas repetições em tandem do
cromossomo Y (STR-Y) em razão de suas histórias evolutivas distintas, é
possível correlacionar um indivíduo a um dado haplogrupo e, por
conseguinte, estimar sua origem étnica. Para tanto, usam-se as
freqüências alélicas que potencialmente conferem a cada sublinhagem
haplotípica um padrão característico de polimorfismo (Tarazona-Santos et
al. 2001).
A diversidade haplotípica existente é, sob o ponto de vista forense,
um ótimo identificador de patrilinhagens apesar de não o ser para
identificação individual em razão de que o haplótipo é herdado
inteiramente pelos descendentes masculinos. Estes dados podem ser
também úteis para verificação das relações genealógicas entre populações
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
98
e grupos étnicos. Por este motivo, existe um considerável interesse na
determinação dos haplogrupos, que em geral é feita através da
identificação dos marcadores binários que os caracterizam. Entretanto, o
processo de determinação do haplogrupo através da análise de SNP
(Nucleotídeo de Polimorfismo Único) algumas vezes pode ser um processo
demorado. Assim, existe interesse em se prognosticar o haplogrupo a
partir de um conjunto de marcadores de STR (Athey 2005). O estudo das
populações miscigenadas usando as STR-Y beneficia-se diretamente dos
bancos de dados existentes para a construção dos perfis haplotípicos das
populações, determinado pelo fluxo gênico masculino ao longo planeta.
A população brasileira resultou de um processo contínuo de
miscigenação, cuja intensidade deve ter variado ao longo do tempo em
decorrência da heterogeneidade dos grupos étnicos parentais e da taxa de
miscigenação (Parra et al. 2003). O Nordeste, uma das cinco regiões
geográficas do Brasil (Figura 1), foi a primeira área a ser ocupada pelos
portugueses ainda no século XVI (Garcia 1986), quando já era habitada
por populações nativas (Medeiros 1980). Entre 1532 e 1538 foram
introduzidas as primeiras levas de negros escravos africanos da cultura
Banto, provenientes de Angola, Congo e Moçambique. Em 1534, os
portugueses chegaram a Pernambuco, um dos estados da região, e a
partir de 1537 deram início a sua colonização. A sociedade pernambucana,
assim como toda a sociedade nordestina do período colonial, tinha como
principais características: o latifúndio (baseado na cultura da cana-de-
açúcar); o escravismo; e o patriarcado, na figura do senhor de engenho,
detentor absoluto da autoridade em seus domínios. O modelo sócio-
econômico adotado no período colonial garantiu a prosperidade econômica
para Pernambuco e foi determinante na composição étnica da população e
na sua mestiçagem. Os portugueses habituados ao contato com outros
povos, uniram-se às mulheres índias e negras desde o início do período
colonial (Ferreira 1987).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
99
A família patriarcal, base da sociedade da região canavieira,
contribuiu para a perpetuação da patrilinhagem européia, uma vez que o
modelo familiar adotado previa um número elevado de filhos e a
submissão da mulher. Este último fator colaborou para a mestiçagem,
principalmente com as mulheres negras escravas, pois estas estavam
mais estreitamente relacionadas com o ambiente doméstico. Neste
contexto, definiu-se o perfil genético da população de Pernambuco, sendo
Portugal a principal referência genética masculina desta região (Carvalho-
Silva et al. 2001). Adicionalmente, deve-se ressaltar a presença holandesa
durante um quarto de século (1630-1654), cuja influência ainda se faz
notar em aspectos culturais, econômicos, urbanísticos e, presumidamente,
na composição genética da população (Ferreira 1987).
Este trabalho consistiu na análise dos polimorfismos dos locos de
microssatélites DYS19, DYS385a, DYD385b, DYS389I, DYS389II, DYS390,
DYS391, DYS392, DYS393, DYS437, DYS458 e DYS464a, DYS464b,
DYS464c e DYS464d, de 247 indivíduos não relacionados da população de
Pernambuco. Usou-se como base os haplótipos de Y-STR nas populações
de referência (europeus, africanos e ameríndios), levando-se em
consideração tanto aspectos históricos quanto os dados genéticos. A
abordagem estatística assumiu o modelo SMM - Stepwise Mutation Model
(Kimura e Ohta 1978). Desta forma foi possível estabelecer um método de
trabalho que se mostrou útil na determinação da contribuição genética das
três principais etnias formadoras da população de Pernambuco, assim
como na predição do haplogrupo de cada haplótipo.
Material e métodos
A Extração do DNA, a PCR e a tipagem dos dados foram realizados no
trabalho em publicação de Barros et al. (2006), do qual foram retirados os
haplotipos usados neste trabalho.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
100
Análise de Dados: As freqüências relativas dos alelos, haplótipos e
diversidade haplotípica foram calculadas usando um software desenvolvido
para análise de dados. A análise comparativa entre populações de
variância molecular (AMOVA) entre as populações estudadas foi realizada
usando o software Arlequim 3.01 (Schneider et al. 2006).
Definição dos dados e terminologia. Foram analisados 247 haplótipos
do cromossomo Y de indivíduos não relacionados da população do Estado
de Pernambuco (Figura 1), e freqüências de haplótipos mínimos de 1413
homens, sendo 87 da população da Holanda, 984 de Portugal, 129
ameríndios e 213 africanos, disponíveis no banco de dados de haplótipos
de STR-Y (YHRD; http://www.ystr.org). Os haplótipos foram armazenados
em um banco de dados local e analisados com um aplicativo construído
especificamente para análise de STR-Y, denominado Y-STRCALC
(ferramenta de análise de haplótipos de STR do cromossomo Y). O
haplótipo mínimo foi estabelecido com os locos (DYS19, DYS385,
DYS389I, DYS39II, DYS390, DYS391, DYS392 e DYS393) segundo o
manual da International Society for Forensic Genetics – ISFG (Gusmão et
al. 2006), assumindo que este haplótipo deve ser significativamente
representativo, confiável e discriminante para a determinação dos
haplótipos mais freqüentes e modais para cada população. Os haplótipos
modais foram estabelecidos a partir das freqüências alélicas dos
haplótipos em cada população de referência: 1) europeus (Roewer et al.
2001; Roewer et al. 2005; Kayser et al. 2001; Kayser et al. 1997; Geada
et al. 2004; de Knijff et al. 1997; Carvalho et al. 2003; Gusmão et al.
2003); 2) ameríndios (Bortolini et al. 2003; Rodriguez-Delfin et al. 1997;
Zegura et al. 2004); e 3) africanos (Pereira et al. 2002; Alves et al. 2003;
Arroy-Pardo et al. 2004).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
101
Análise das Freqüências. Foram calculadas as freqüências dos
haplótipos mínimos mais freqüentes dos portugueses, holandeses,
africanos e ameríndios na população de Pernambuco. Em seguida, foram
definidos grupos (clusters) destes haplótipos, a partir do cálculo das
distâncias genéticas com 0, ±1 e ± 2 passos seguindo o Stepwise
Mutation Model (SMM) (Kimura e Ohta 1978). As freqüências dos
haplótipos foram obtidas por contagem cumulativa do número de
ocorrências de cada haplótipo de referência em Pernambuco (Gusmão et
al. 2003).
Diagnóstico do Haplogrupo do Cromossomo Y. Os haplótipos de
Pernambuco foram submetidos ao cálculo de estimativa de haplogrupo. A
classificação dos haplótipos é geralmente estabelecida através de modelos
baseados em distâncias genéticas, enquanto que a predição dos
haplogrupos tem nas freqüências dos alelos a sua principal característica
(Athey 2005). Neste trabalho introduziu-se um peso para as taxas de
mutação, inversamente proporcional às médias destas taxas por loco.
Buscou-se inferir a partir da determinação da distância genética dos
haplótipos em relação ao modal do haplogrupo. Assim, valendo-se do
conjunto de publicações de referência e dos bancos de dados disponíveis,
foi determinado o haplótipo modal para os seguintes haplogrupos: E3a;
E3b; G; I; I1a; J; N; Q; R1a; e R1b, considerados como os mais prováveis
e suficientes para a caracterização das etnias formadoras da população
Pernambucana.
As distâncias genéticas dos haplótipos da população de Pernambuco
em relação ao modal de cada haplogrupo foram calculadas usando o
programa desenvolvido especificamente para este estudo. Adotaram-se os
valores 1 para diferença e 0 para igualdade em cada loco. Em seguida, foi
dividido o valor encontrado pelo inverso da taxa de mutação do loco
multiplicada por 1.000. Assim, a menor distância apontará o grupo ao qual
um dado haplótipo será incorporado, inferindo seu haplogrupo. Como
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
102
exemplo, considera-se o seguinte haplótipo mínimo (14,11-
14,14,30,24,11,13,13). Seja {Wi} um conjunto de n alelos representados
pelo número de repetições nos locos do haplótipo {Wi} =
{14,11,14,14,30,24,11,13,13} e {Xi} o conjunto dos alelos representados
pelos haplótipos modais de cada haplogrupo. Seja Mi a taxa de mutação
média calculada para cada Xi correspondente. O cálculo da distância D
será dado por:
D = ∑=
×n
i Mi1
3101para Xi ≠ Wi
Será inferido o haplogrupo com a menor distância calculada. O
haplótipo acima foi prognosticado como pertencendo ao haplogrupo R1b
considerando o seguinte: o haplótipo modal para o haplogrupo R1b, {Xi}
= {14,11,14,13,29,24,11,13,13} apresenta diferenças nos locos DYS389I
e DYS389II para o haplótipo {Wi} = {14,11,14,14,30,24,11,13,13}. O
valor para a taxa de mutação média para os locos DYS389I e DYS389II é
1.87 x 10-3 e 2.26 x 10-3, respectivamente (Kayser et al. 2000; Kurihara
et al. 2004; Dupuy et al. 2004; Ballard et al. 2005; Budowle et al. 2005;
Gusmão et al. 2005; Bianchi et al. 1998). Assim o somatório:
977.01026.2
1011087.1
1013
3
3
3
=××
+××
= −−D
resultará na menor distância D, calculada para o haplótipo Wi para
todos os haplótipos modais Xi, indicando que o haplótipo Wi pertence ao
haplogrupo R1b. Do mesmo modo, se analisarmos a distância D, para o
haplogrupo I, {Xi}= {15,14,14,12,29,22,10,11,14}, o somatório de todos
os Xi≠Wi, compreenderá oito locos, que certamente apresentará uma
distância maior que a calculada para o modal do haplogrupo R1b. O
programa calculará a distância para todos os haplogrupos modais e a
menor distância apontará o haplogrupo a ser inferido. Para a
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
103
determinação do escore, o programa aplica a fórmula Escore = 100 – (D ×
25), considerando que o ponto médio de mudança do grupo de haplótipos
vizinhos (cluster) para os haplogrupos se encontra a uma distância
aproximada com valor igual a quatro, o qual é considerado como
referência para indeterminação. Isto significa dizer que uma distância D =
0 terá um escore de 100 e uma distância de D = 4 terá escore 0, ou seja,
as distâncias iguais ou acima de 4 não são passíveis de inferência. No caso
do exemplo acima, a distância D = 0.977 terá um valor de aderência ≈
76.00.
Análise das Árvores Filogenéticas (Network). As árvores filogenéticas
baseadas no método Median-joining networks (Bandelt et al. 1999) foram
construídas usando o programa NETWORK4.2 (Schneider et al. 2006) com
os haplótipos mínimos não únicos de Pernambuco, considerando que a
árvore construída é capaz de mostrar a congruência entre a disposição
filogenética e o prognóstico dos haplogrupos. Para os cálculos do network,
as STR’s foram ponderadas de duas formas: 1) de acordo com a variância
do número de repetições em cada loco de forma que os maiores pesos
foram atribuídos aos locos menos variáveis. Os pesos foram definidos de
acordo com a variância das freqüências dos alelos de cada loco para a
amostra de Pernambuco. Os seguintes pesos foram adotados: variância de
0 a 0.09, peso 5; variância de 0.10 a 0.19, peso 4; variância de 0.20 a
0.49, peso 3; variância de 0.50 a 0.99, peso de 2; e variância > 1.00,
peso 1 (Qamar et al. 2002); 2) através do modelo que considera as taxas
de mutação médias para cada loco, atribuindo pesos maiores aos locos
com menor taxa de mutação, tal como foi aplicado para o prognóstico do
haplogrupo.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
104
Resultados
Freqüências haplotípicas em Pernambuco. Foram identificados 183
haplótipos mínimos distintos (153 únicos), que apresentaram diversidade
haplotípica de 0.9951, poder de diferenciação de 0.7409 e probabilidade
de coincidência de 0.0049. Os haplótipos mínimos mais freqüentes foram
(14,11-14,13,29,24,11,13,13), (14,11-14,14,30,24,11,13,13) e (14,11-
14,13,29,24,11,13,12), cujas freqüências foram 0.061, 0.028 e 0.020,
respectivamente. O primeiro haplótipo acima foi considerado característico
desta população, pois além de ser o mais freqüente, apresentou-se
também como o haplótipo modal. Este haplótipo, que corresponde àquele
definido por Wilson et al. (2001) como sendo o AMH, exibiu em
Pernambuco freqüência maior que nas populações de referência na E
uropa (Portugal: 0.0459; Holanda: 0.0230). O AMH também se apresenta
como o mais freqüente em Portugal e em outras regiões do Brasil,
refletindo a semelhança entre estas populações. O segundo haplótipo mais
freqüente em Pernambuco teve freqüência 0.015 em Portugal e 0.023 na
Holanda enquanto que o terceiro apresentou freqüência de 0.001 em
Portugal e de 0.010 na Holanda. O haplótipo mais freqüente na população
da Holanda (14,11-14,13,29,23,11,13,13) calculado a partir dos dados
disponíveis pelo YHRD, que naquele país tem freqüência igual a 0.0459,
teve freqüência igual a 0.0193 em Portugal, 0.008 em Pernambuco e
0.005 em outras áreas do Brasil. Observou-se que o haplótipo modal
calculado (14,11-14,13,29,24,10,13,13) das outras regiões do Brasil
(Grattapaglia et al. 2004) e de Portugal (Roewer et al. 2001; Roewer et al.
2005; Kayser et al. 2001; Kayser et al. 1997; Geada et al. 2004; de Knijff
et al. 1997; Carvalho et al. 2003; Gusmão et al. 2003), que apresentaram
as freqüências no banco de dados YHRD, de 0.0151 e 0.0152,
respectivamente naquelas populações, não é o modal em Pernambuco
que, como visto, tem como haplótipo modal o mais freqüente. A diferença
entre os haplótipos modais de Portugal e Pernambuco consiste em uma
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
105
única variação no loco DYS391. As freqüências dos alelos 10 e 11 neste
loco mostraram-se muito semelhante nas populações (Portugal: 0.490 e
0.426; Brasil: 0.530 e 0.434; e Pernambuco: 0.466 e 0.490), como pôde
ser constatado através da análise pareada destas (FST = 0.006). A
distribuição das freqüências dos haplótipos modais de Portugal e
Pernambuco nas populações, por sua vez, mostrou-se notadamente
distinta (FST = 0.1463) e demonstrou que a diferença entre eles não deve
estar associada a este loco. A razão entre as freqüências dos haplótipos
modal e mais freqüente encontrados em Portugal, no Brasil e em
Pernambuco esteve relacionada com a prevalência dos haplótipos
dominantes quando ambos estão representados na população.
O haplótipo mínimo modal dos ameríndios (13,15-
17,13,31,23,10,14,13) calculados a partir dos trabalhos de Bortolini et al.
2003, Rodriguez-Delfin et al. 1997 e Zegura et al. 2004 não foi observado
na amostra de Pernambuco. Foi constatada uma única ocorrência do
haplótipo de referência africano (15,15-16,13,30,21,10,11,14) calculado a
partir dos trabalhos de Pereira et al. (2002), Alves et al. (2003) e Arroy-
Pardo et al. (2004). Embora tenha sido verificada a presença de um
haplótipo característico de Moçambique na população de Pernambuco, as
maiores freqüências dos haplótipos de africanos detectadas na população
(13,13-14,14,30,24,9,11,13) estão dispersas pela Europa, pelas Américas
e é bem característico de Zriba na Tunísia, onde aparece com a freqüência
de 0.61 (YHRD). Verificou-se na amostra o haplótipo (15,16-
18,14,31,21,11,11,13) que é encontrado na Guiné-bissau e este é muito
próximo (1 SMM) de haplótipos freqüentemente encontrados nas
populações de Angola e África do Sul (YHRD) (Tabela 1).
A análise AMOVA revelou não haver diferença entre as populações de
Pernambuco, Portugal e Holanda (Fst: 0.003) e, quando pareadas, as
maiores diferenças haplotípicas encontradas foram entre Pernambuco e
Holanda (FST: 0.004).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
106
Expansão do agrupamento (clusters). A progressão das freqüências
dos haplótipos quando realizada a expansão dos clusters se mostrou
diferente para cada grupo de referência (Portugal, Holanda, África e
Ameríndio). Apesar disto, a ordem das freqüências dos clusters
permaneceu inalterada. A expansão para distâncias até ±2 (SMM)
abrangeu 63% da amostra da população. A projeção de crescimento das
freqüências nos clusters holandês e português foi maior que nos clusters
africanos e ameríndios. A média das freqüências acumuladas apresentou a
seguinte ordem decrescente dos clusters de referência: português,
holandês, africano e ameríndio (Tabela 2). Os haplótipos mínimos mais
freqüentes em Portugal e na Holanda são muito semelhantes, com
distância genética de 1 (SMM), enquanto que os haplótipos mais
freqüentes nas demais populações exibiram distâncias genéticas acima de
7 (SMM) entre elas. Esta proximidade entre as populações da Holanda e
de Portugal implicou na sobreposição de agrupamentos.
Inferência do Haplogrupo. Na população de Pernambuco 30 haplótipos
não únicos, representando 94 indivíduos, foram selecionados para a
predição dos haplogrupos segundo o método de Athey (2005), e o
software baseado na metodologia já descrita. A Tabela 3 mostra os
resultados obtidos através dos dois métodos. Foram identificados sete
haplogrupos e somente um haplótipo apresentou discordância entre os
dois métodos de prognóstico. Este haplótipo foi mantido na amostra como
referência para visualização do seu posicionamento na árvore segundo o
modelo Median-Joining (Bandelt et al. 1999). O coeficiente de correlação
de Pearson para os escores foi igual a 0.73. A participação das etnias
variou entre 0.818 e 0.862 para europeus, 0.117 e 0.166 para os
africanos e entre 0.020 e 0.024 para os ameríndios. Um dos testes
realizados utilizando o programa de prognóstico foi confrontar com
haplogrupos já prognosticados em outros bancos de dados. Com este
propósito foi acessado o banco de dados do YBase (Genetic Genealogy
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
107
Database) para verificar a concordância dos prognósticos. A Tabela 3
mostra os resultados obtidos nesta comparação. Somente três
haplogrupos não coincidiram e um deles foi no haplótipo prognosticado
como pertencente ao haplogrupo Q, o qual não está presente nas
amostras do Ybase. Outro não coincidente foi o haplótipo prognosticado
como E3b-I com o baixo valor de escore e uma terceira discordância
aconteceu no haplótipo prognosticado como J que o Ybase obteve
resultados indicando este haplótipo como pertencente ao haplogrupo I. A
média final dos scores obtidos com o Y-STRCALC foi próximo de 70
enquanto o de Athey foi próximo a 68.
Os dados mostram que a o prognóstico do haplótipo estendido não
modificou significativamente o resultado obtido com o prognóstico do
haplótipo mínimo, ou seja, o percentual de participação dos ameríndios
não variou e o percentual das demais etnias variou apenas 5% (Tabela 4).
Árvores Median-joining de haplótipos de Y-STR. Árvores Median-
joining foram construídas usando o software Network 4.200 (Bandelt et al.
1999) a partir dos haplótipos de Y-STR para examinar a disposição
filogenética das STR’s em relação aos haplogrupos. Uma árvore foi
construída usando como argumento de ponderação as taxas de mutação
média de cada loco, a exemplo do que foi feito para o prognóstico do
haplogrupo (Figura 2). As árvores foram construídas a partir dos
haplótipos que ocorreram ao menos 2 vezes na amostra e mostraram uma
disposição muito similar. Os haplogrupos prognosticados de dispuseram
em uma ordem filogenética e cronológica compatívis. Do topo da árvore
observa-se uma ramificação descendente por haplogrupo. O agrupamento
dos haplótipos prognosticados como R1b evidenciam a reunião dos
haplótipos em torno do mais frequente (modal). O tamanho dos braços
entre os haplogroupos E3b e E3a mostrou a diversidade dos haplótipos
para estas linhagens e a maior dispersão, notadamente o reflexo de sua
baixa freqüência na amostra. A incerteza do prognóstico do haplótipo
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
108
chamado E3a-I na árvore apresentada na Figura 2 o qual foi definido de
forma diferente pelos métodos aplicados é evidenciada pelo seu
posicionamento não ajudou a esclarecer esta ambigüidade.
Discussão
A colonização do Brasil começou pela região Nordeste e está
intimamente relacionada com a história do Estado de Pernambuco. Uma
característica marcante da colonização foi a ocorrência dos fluxos
migratórios determinados, tanto em relação à cronologia, quanto origem,
intensidade e finalidade, que foram parâmetros importantes para a
seleção das populações usadas como referência neste trabalho.
Historicamente, a população de Pernambuco se constitui basicamente de
descendentes de europeus vindos principalmente de Portugal e Holanda,
ameríndios e de africanos introduzidos na condição de escravos (Ferreira
1987).
Neste trabalho, observou-se que a contribuição genética dos
africanos foi maior do que a dos ameríndios. O número reduzido de
mulheres oriundas da Europa (Maior 1968) e o modelo social adotado no
período colonial foram fatores que contribuíram para o processo de
miscigenação entre europeus, nativos e africanos. O predomínio da
colonização portuguesa pôde ser constatado através da prevalência do
Haplótipo Modal do Atlântico (AMH) em Pernambuco, evidenciando o seu
papel como promotora do aumento demográfico e do processo de
miscigenação que bem define o povo brasileiro. Estes mestiços,
descendentes dos primeiros colonizadores, mantiveram a patrilinhagem
européia ao longo das gerações que se expressa na freqüência do AMH na
população atual (Tabela 1). A característica do haplótipo mais freqüente
de Pernambuco (14,11-14,13,29,24,11,13,13) de ser também o modal
reafirma a predominância absoluta da ancestralidade paterna portuguesa.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
109
Este haplótipo possui freqüência acima das verificadas nas populações de
referência européias (Tabela 1), sendo significativamente maior do que as
observadas nas populações de Portugal, Holanda (YHRD) e em outras
regiões do Brasil (Grattapaglia et al. 2004). Este haplótipo é considerado
um dos mais significativos na Europa e corresponde ao Haplótipo Modal do
Atlântico (AMH) (Wilson et al. 2001) por ser o principal nas populações do
País de Gales, Bascos e Irlandêses, sugerindo que este deve ser uma
assinatura haplotípica européia do período paleolítico. Em contraste, o
segundo haplótipo mais freqüente em Portugal (14,11-
14,13,29,24,10,13,13) (YHRD) apresentou uma freqüência muito baixa
em Pernambuco (0.008) e é ausente na Holanda. A freqüência do AMH,
em geral, é cerca do dobro da freqüência observada para este haplótipo
(14,11-14,13,29,24,10,13,13) no Brasil, em Portugal, na Europa e em
outras áreas do mundo, mas não em Pernambuco, onde é cerca de seis
vezes maior. A freqüência do AMH na população de Pernambuco acima da
encontrada em Portugal, poderia ser explicada através do efeito do
fundador.
O haplótipo holandês tomado como referência (14,11-
14,13,29,23,11,13,13) (YHRD) tem freqüência de 0.046 naquela
população, 0.019 em Portugal, 0.010 no Brasil e 0.008 em Pernambuco.
Outro haplótipo freqüente na população holandesa (14,13-
14,12,28,22,10,11,13) (YHRD) apresentou as freqüências de 0.011 na
Holanda, 0.007 em Portugal, 0.010 no Brasil e 0.004 em Pernambuco.
Este resultado reforçou a idéia de um fluxo migratório independente da
população holandesa para o Brasil, já que a freqüência deste segundo
haplótipo no Brasil é semelhante à da Holanda e maior que em Portugal.
Esta idéia foi levantada por Carvalho-Silva et al. (2001) que analisaram
haplogrupos definidos por marcadores binários e observaram uma
freqüência relativamente alta no sul do Brasil (28%) de um haplogrupo
europeu, que apresentou um incremento na região Nordeste (18%), cuja
amostra foi tomada em Pernambuco e comparada com a freqüência em
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
110
Portugal (12%). Eles argumentaram que o incremento da freqüência deste
haplogrupo no Nordeste foi muito discreto e pode ser atribuída ao acaso,
mas observaram também que esta região esteve sob o domínio holandês
por quase três décadas no século XVII e que a freqüência do haplogrupo
em questão é de 32% na Holanda.
O haplótipo de referência africano (15-15,16-13-30-21-10-11-14)
foi encontrado em baixa freqüência em Pernambuco (0.004). Thomas et
al. (2000) descreveram um forte “efeito do fundador” para Y-STRs nos
indivíduos do sul da África de origem Bantu, reforçando a hipótese de que
um haplótipo considerado fundador foi também o mais freqüente em
outras populações que estiveram no caminho da migração Bantu (Pereira
et al. 2002). Moçambique foi uma colônia portuguesa de 1752 a 1975 e
desde 1493 estabeleceram relações mercantis. O colonialismo português
foi caracterizado pela migração de um baixo número de pessoas (exceção
do Brasil), predominantemente homens que intercruzaram com as
mulheres locais (Russell-Wood 1998). O haplótipo fundador hipotético
Bantu compreende sete STR’s dos quais cinco locos pertecem ao haplótipo
mínimo (DYS19=15, DYS390=21, DYS391=10, DYS392=11 e
DYS393=13), e está somente a 1 passo (SMM) do haplótipo de referência
africano calculado. É o mais freqüente em Angola (0.28), São Tomé e
Príncipe (0.10) enquanto em Moçambique ele possui a mesma freqüência
(0.10) do haplótipo (15,21,10,11,14). A grande diversidade de
haplogrupos africanos é compatível com o fato de que os escravos foram
trazidos para o Brasil de muitas áreas, principalmente do oeste africano,
mas também de Moçambique, no leste (Pena et al. 2000).
Apesar de terem representado uma parcela significativa da
população colonial, os homens africanos devem ter deixado um menor
número de descendentes em conseqüência da sua condição social (Pena et
al. 2000). Embora o efeito disto possa ser identificado na baixa proporção
de haplótipos africanos em relação aos europeus, não raro encontraremos
na população pernambucana, homens de patrilinhagens européias que
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
111
apresentam características fenotípicas semelhantes aos africanos e, com
menor probabilidade o inverso, já que os casamentos entre mulheres de
origem européia e homens de origem africana é um fenômeno mais
recente e incomum no período colonial.
O haplótipo mínimo de referência dos ameríndios (13,15-
17,13,31,23,10,14,13) não foi detectado na população de Pernambuco, à
semelhança do que já havia sido observado por Carvalho-Silva et al.
(2001) e Parra et al. (2003) em outras áreas do Brasil. Apesar disto,
reportando aos trabalhos de Bortolini et al. (2003), a ausência deste
haplótipo poderia ser explicada considerando que a contribuição masculina
dos ameríndios na determinação da composição genética da população
pernambucana deve ter sido muito discreta. Apesar de inexistente na
amostra de Pernambuco, há uma forte tendência para considerá-lo como
um haplótipo de referência. Este haplótipo foi definido considerando o
grupo parental (Q-M3) que foi detectado em todas as populações
ameríndias do sul, onde é marcadamente predominante, com a freqüência
média de 77%. O haplótipo mais freqüente (0.265) encontrado na
linhagem M3 do haplogrupo Q usando quatro locos do haplótipo mínimo
foi referenciado nos dados obtidos por Lell et al. (2002). Três locos
(DYS19, DYS390, and DYS391) dos haplótipos que foram empregados
neste trabalho, mostraram que o haplótipo característico correspondendo
aos alelos (13,24,10) tem uma ampla distribuição entre os nativos na
América do norte e central, podendo definir uma característica do
haplótipo ancestral da linhagem Q-M3 (Bortolini et al. 2003). Verificou-se
que o haplótipo modal não é o mais freqüente e o loco DYS390, que
determina esta diferença, possui as freqüências dos alelos para haplótipo
modal e mais freqüente muito próximas. Considerando que a distância de
um passo no loco DYS390 é a diferença para o haplótipo mínimo de
referência da população em estudo, qualquer ocorrência de ambos deverá
será expressa no cluster para ±1 (SMM). Outro estudo feito por Tarazona-
Santos et al. (2001), usando o polimorfismo bialélico de SNP (DYS199-T)
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
112
que define a linhagem M3, evidenciou que na amostra de 169 indivíduos
de diferentes populações de ameríndios do sul, os haplótipos mais
freqüentes encontrados usando os locos DYS19, DYS389I, DYS389II,
DYS390, DYS391 e DYS393 foram (13,16,10,25,10,15),
(13,17,10,24,10,13) e (13,16,10,24,10,13), que juntos representam 17%
dos haplótipos da amostra. Observou-se que os alelos DYS19=13,
DYS391=10 and DYS393=13 são característicos para estas populações. A
alta freqüência do haplótipo de referência ameríndio em suas
comunidades (0.16) deve ser o reflexo da baixa diversidade haplotípica
observada nesta etnia, quando comparadas a outras populações (Zegura
et al. 2004). Isto leva a considerar que os resultados encontrados
expressam o baixo número de patrilinhagens ameríndias na população
pernambucana, a exemplo do que já havia sido observado em outro
estudo (Pena et al. 2000). Historicamente, é possível especular que, à
semelhança do que aconteceu com os descendentes africanos, uma
grande parte dos homens mestiços nativos, possui patrilinhagem
européia, embora ainda não existam dados genéticos concretos acerca
deste tema.
Os resultados deste trabalho evidenciam uma forte tendência de um
quadro direcionado no Brasil envolvendo cruzamentos entre homens
europeus e mulheres africanas e ameríndias. Isto está em consonância
com a história conhecida sobre a população brasileira desde o século XVI
(Carvalho-silva et al. 2001). Estas observações nos permitiram inferir o
nível de contribuição de cada etnia na determinação da constituição
haplotípica masculina de Pernambuco. Também nos fez perceber que
Pernambuco apresentou um perfil haplotípico ligeiramente diferenciado em
relação às populações de outras regiões do Brasil, o qual está diretamente
relacionado à sua história e provavelmente ligado ao efeito do fundador e
ao fluxo migratório holandês, sugerido pelos resultados obtidos.
Considerando que a especificidade do haplótipo de referência pôde
dificultar o reconhecimento dos grupos étnicos diretamente, buscou-se
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
113
flexibilizar a detecção das linhagens haplotípicas daquelas populações na
população de Pernambuco. A ocorrência de eventos mutacionais nos locos
analisados resultaria numa maior diversidade de haplótipos vizinhos e
determinaria o surgimento de haplótipos que orbitariam em torno do
haplótipo de referência. Para avaliar esta possibilidade, adotou-se o
modelo de stepwise mutation e foram criados grupos de haplótipos com
distâncias genéticas ±1 e ±2, o que possibilitou um relaxamento no
critério de busca.
O agrupamento dos haplótipos de referência não alterou o nível de
percepção quanto à participação das populações de referência na
população de Pernambuco, confirmando a ordem definida a partir da
identificação das freqüências dos haplótipos de referência em Pernambuco
(Tabela 2). O efeito causado pela distribuição das freqüências vizinhas
entre as duas populações européias (Portugal e Holanda) não afetou a
ordem final. Os haplótipos mais comuns destas populações são bastante
semelhantes (1 SMM) e foram incorporados ao mesmo grupo. A
progressão das freqüências expressou o compartilhamento dos
agrupamentos europeus (Portugal e Holanda) e a tendência de
crescimento destas, em contraste com o pequeno crescimento nas
freqüências de ameríndios e africanos. Este resultado mostrou a maior
influência européia em detrimento da pequena contribuição das demais
etnias, como já havia sido sugerido na análise específica dos haplótipos de
referência.
Apesar de ter-se determinado a participação e a ordem, buscou-se
também quantificar a contribuição das três etnias, introduzindo um
modelo de agrupamento baseado no prognóstico dos haplogrupos.
Conforme esperado, a maioria dos haplótipos foi prognosticada como
pertencente ao haplogrupo R1b, tipicamente europeu, tendo o AMH obtido
o escore de valor 100. Por estarem geneticamente muito próximos, os
haplótipos de referência das populações de Portugal e Holanda não
permitiram a distinção dos indivíduos destas populações. Apesar da
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
114
existência de dois haplótipos de referência holandês na amostra de
Pernambuco sugerir a contribuição genética holandesa na sua composição,
não foi possível individualizá-la em relação à portuguesa.
O haplogrupo Q da sublinhagem M3 foi considerado o mais próximo
dos ameríndios brasileiros (Bortolini et al. 2003; Zegura et al. 2004). Um
prognóstico incerto pôde ser atribuído ao haplótipo de haplogrupo Q
conforme é observado na tabela 3. O escore (46) foi muito baixo levando a
suspeita de que não foi suficientemente preciso para considerá-lo um um
haplótipo ameríndio. No entanto este haplótipo tem os marcadores típicos
DYS390=23, DYS392=14 and DYS393=13 que apontam para o haplogrupo
prognosticado. Assumindo-se que esta baixa precisão e considerando a
probabilidade de 2% apenas de encontrar um haplótipo ameríndio na
amostra de 247 indivíduos, foram pesquisados outros haplótipos no
restante da amostra, que poderiam espressar mais precisamente a
presença de um haplótipo típico ameríndio. Então foi identificado o
haplótipo único (13,15-18,13,29,24,10,14,13), também prognosticado
como pertencente ao haplogrupo Q com um score de 67.
E3a e E3b são os haplótipos característicos dos africanos de origem
Banto e do norte da África (Cruciani et al. 2004). Como conseqüência dos
resultados, quanto ao grau de influência na formação das patrilinhagens da
população de Pernambuco, o posicionamento dos europeus é seguido por
africanos e por último pelos ameríndios.
Ao separar os haplótipos em haplogrupos prognosticados para
verificação de sua provável origem, foi permitido agrupá-los etnicamente e
assim estimar percentualmente a contribuição de cada um para a formação
da população pernambucana. Observou-se que, em média, a principal
contribuição foi de genes europeus (83%), seguido de genes africanos
(15%) e ameríndios (2%). A distribuição genotípica masculina não reflete o
alto grau de miscigenação que caracteriza a formação da população
pernambucana, atribuindo-se conseqüentemente às mulheres, o equilíbrio
da participação das diferentes etnias. Diferentemente dos resultados
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
115
obtidos através deste estudo com cromossomo Y e embora no Nordeste
tenha predominado as matrilinhagens africanas (44%), a análise de DNA
mitocondrial em populações de outras áreas do Brasil evidenciou uma
distribuição uniforme destas matrilinhagens entre as três etnias. Isto está
de acordo com o trabalho de Alves-Silva et al. (2000), que analizou 247
mtDNAs e encontrou a contribuição Ameríndia (33%) e Africana (28%) no
pool total de mtDNA de brasileiro brancos.
As árvores Median Joining construídas a partir dos haplótipos de STR-
Y mais freqüentes de Pernambuco apresentaram um padrão de
agrupamento semelhante ao obtido através da predição dos haplogrupos,
destacando-se o haplótipo que teve baixo valor de escore prognosticado
(Figura 2). Também foi observado que o arranjo dos haplogrupos coincidiu
com a inferência cronológica proposta pelo YCC (2002). A similaridade
observada entre as árvores construídas a partir da atribuição de pesos
diferenciados em função da variância e das taxas de mutação permitiu
verificar que os critérios de agrupamentos filogenéticos baseados em
STR’s obedeceram à ordem cronológica dos haplogrupos e seu
prognóstico. Desta forma verificou-se a adequação de ambos os critérios
de ponderação usados neste trabalho e reafirmou a relação existente
entre a variância e as taxas de mutação abordada por Zhivotovsky et al.
(2004). A escolha do critério de ponderação neste caso, não foi relevante
para o estudo filogenético, uma vez que não se buscou a determinação de
tempos para ancestralidade dado que a cronologia e a abordagem
histórica se encontram dentro do período de 500 anos. Os critérios
confirmaram similaridade entre os agrupamentos e a existência da relação
filogenética baseadas no prognóstico feito deste trabalho. No entanto, não
foi descartada a possibilidade de que em novos estudos envolvendo
eventos coalescentes, possa-se adotar alternativamente as taxas de
mutação por loco como critério para ponderação na construção de
networks.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
116
Foi constatado que os haplótipos de Y-STR podem ser agrupados de
duas maneiras para o estudo da composição de uma população. Uma
expandindo o haplótipo de referência e a outra inferindo o haplogrupo. Os
resultados dos prognóticos levaram a concluir que o haplótipo conserva
certa informação que permite a construção de uma filogenia baseada nas
Y-STR’s. O agrupamento dos haplótipos seguindo o modelo de stepwise
mutation para os principais haplótipos das populações de referência
permitiu detectar representantes das populações européias, africanas,
indígenas na população de Pernambuco, estabelecendo esta ordem em
termos de participação nas patrilinhagens. A inferência do haplogrupo, a
partir das freqüências alélicas dos haplótipos ponderados através das
taxas de mutação para cada loco, apresentou similaridade com outros
métodos de inferência e também com os resultados em análises por
polimorfismos binários disponibilizadas em bancos de dados. A
quantificação das contribuições étnicas usando os hapotipos não únicos,
estendidos, ou toda a amostra não alterou os resultados
significativamente, sendo que, em média, a principal contribuição foi de
genes europeus (83%), seguido de genes africanos (15%) e ameríndios
(2%). Os resultados mostram também que além dos interesses forenses,
os haplótipos de STR são úteis para estudos populacionais, incluindo
aspectos históricos, étnicos e análise filogenética.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
117
Tabela 1 - Haplótipo mais freqüente nas populações de referência e respectivas freqüências na população de
Pernambuco, Brasil.
População DYS19 DYS385 DYS389I DYS389II DYS390 DYS391 DYS392 DYS393 f0 f1 Fonte
Portugal 14 11-14 13 29 24 11 13 13 0,0457 0,0607 1
Holanda 14 11-14 13 29 23 11 13 13 0,0459 0,0081 1
Ameríndios 13 15-17 13 31 23 10 14 13 0,1666 0,0000 2
África 15 15-16 13 30 21 10 11 14 0,0632 0,0040 3
f0 = freqüência nas populações de referência ; f 1= freqüência na população de Pernambuco 1) Roewer et al. 2001; Roewer et al. 2005; Kayser et al. 2001; Kayser et al. 1997; Geada et al 2004; de Knijff et al. 1997;
Carvalho et al. 2003; Gusmão et al. 2003; 2) Bortolini et al. 2003; Rodriguez-Delfin et al. 1997; Zegura et al. 2004 3) Pereira et al. 2002; Alves et al. 2003; Arroy-Pardo et al. 2004
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
118
Tabela 2 – Freqüência acumulada do haplótipo de
referência e distância genética em Pernambuco
estimada pelo SMM .
Stepwise Mutation Model População
0 1 2
Portugal 0,061 0,194 0,340
Holanda 0,008 0,117 0,279
Ameríndios 0,000 0,000 0,004
África 0,004 0,008 0,008
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
119
Tabela 3 – Haplótipos não únicos na população de Pernambuco,
comparação com dados do Ybase, Freqüências, escore e
prognóstico segundo Athey (2005) e este estudo (Y-STRCALC).
Athey Y-STRCALC Haplótipo Ybase F Escore Haplogrupo Escore Haplogrupo
(14,11-14,13,29,24,11,13,13) 0 0,061 100 R1b 100 R1b (14,11-14,14,30,24,11,13,13) 0 0,028 79 R1b 76 R1b (14,11-14,13,29,24,11,13,12) 0 0,020 65 R1b 67 R1b (14,11-14,14,30,23,11,13,13) 0 0,016 73 R1b 63 R1b (14,11,14,13,28,24,11,13,13) 0 0,016 74 R1b 89 R1b (14,11-14,13,29,23,11,13,12) 0 0,016 61 R1b 56 R1b (14,11-15,13,29,24,11,13,13) 0 0,016 85 R1b 65 R1b (14,11-14,13,29,24,11,13,14) 0 0,012 77 R1b 67 R1b (14,12-14,13,29,24,11,13,13) 0 0,012 57 R1b 89 R1b (15,11-14,13,29,24,11,13,13) 0 0,012 73 R1b 85 R1b (14,14-14,12,29,23,10,11,12) - 0,012 56 J2 53 J (17,12-12,13,28,23,10,11,13) - 0,012 63 I 41 E3b (14,11-14,13,30,24,11,13,13) 0 0,008 83 R1b 89 R1b (14,11-14,13,29,23,11,13,13) 0 0,008 93 R1b 89 R1b (14,11-14,13,29,24,10,13,13) 0 0,008 93 R1b 93 R1b (14,11-14,13,29,25,11,13,13) 0 0,008 80 R1b 89 R1b (14,11-14,13,30,23,11,13,13) 0 0,008 77 R1b 78 R1b (14,11-14,13,29,23,11,13,14) 0 0,008 36 R1b 56 R1b (14,11-15,13,29,23,11,13,13) 0 0,008 79 R1b 78 R1b (14,11-14,13,29,25,10,13,13) 0 0,008 80 R1b 82 R1b (14,12-14,13,29,24,10,13,13) 0 0,008 69 R1b 82 R1b (15,11-14,13,28,23,11,13,13) 0 0,008 50 R1b 63 R1b (14,11-14,12,28,23,11,14,13) - 0,008 46 Q 31 Q (15,11-13,13,31,24,11,13,13) 1 0,008 38 R1b 63 R1b (14,11-14,12,27,24,12,13,14) 3 0,008 26 R1b 35 R1b (13,13-14,14,30,24,9, 11,13) 0 0,008 49 E3b 57 E3b (15,14-16,11,29,22,10,11,14) 2 0,008 68 G 75 G (14,16-17,13,31,21,11,11,13) 1 0,008 55 E3a 45 E3a (13,16-18,13,30,23,10,11,13) 1 0,008 84 E3b 89 E3b (15,16-18,14,31,21,11,11,13) 2 0,008 70 E3a 43 E3a F = freqüência; Athey (2005); Y-STRCALC = programa de cálculo de
prognóstico do haplogrupo; Ybase = diferenças para enquadramento de
haplótipos no banco de dados;
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
120
Tabela 4 - Composição da população de Pernambuco
prognosticada pelo programa Y-STRCALC a partir dos haplótipos
mínimo e estendido da população total e dos haplótipos
apresentados na Tabela 3.
Haplogrupos Haplótipo
Mínimoa
Haplótipo
Estendidoab
Haplótipo
Mínimo não únicosc
África E3a 0,093 0,097 0,074
E3b 0,065 0,069 0,043
Europa G 0,081 0,069 0,021
I 0,040 0,053
J 0,085 0,085 0,032
N 0,008 0,012
R1a 0,077 0,069
R1b 0,526 0,526 0,809
Ameríndios Q 0,024 0,02 0,021
Europa 0,818 0,814 0,862
África 0,158 0,166 0,117
Ameríndios 0,024 0,020 0,021
(a) n = 247; (b) Haplótipo mínimo (ISFG) mais os locos DYS447, DYS458
e DYS464; (c) n = 94
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
121
Figura 01: Mapa do brasil mostrando a região Nordeste e o Estado de
Pernambuco onde as amostras foram coletadas.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
122
Figura 2 – Árvore Median-joining das STR’s dos 30 haplótipos mínimos
mais comuns e os respectivos haplogrupos prognosticados, representando
94 indivíduos da amostra de Pernambuco. (A) Ponderação baseada na
média das taxas de mutação por loco. (B) baseada na variância dos locos.
As cores indicam os grupos étnicos prognosticados: Listrado, preto e
branco são africanos, ameríndios e europeus respectivamente. O cículo
metade preto representa o haplótipo com baixo escore de prognóstico
(E3a-I) qua foi prognosticado diferente nos dois cálculos apresentados. O
tamanho dos braços são proporcionais às distâncias genéticas e os
círculos são proporcionais às freqüências.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
123
Bancos de dados Eletrônicos disponíveis na internet
www.ysearch.org genetic genealogy database
www.ybase.org genetic genealogy database
https://home.comcast.net/~whitathey/predictorinstr.htm haplogroup predictor
http://www.fluxus-engineering.com/sharenet.htm
Referências
Alves-Silva J, Santos MS, Guimarães PEM, Ferreira ACS, Bandelt H-J, Pena
SDJ, Prado VF (2000) The Ancestry of Brazilian mtDNA lineages.
Am. J. Hum. Genet. 67:444–461
Alves C, Gusmão L, Barbosa J, Amorim A (2003) Evaluating the informative power
of Y-STRs: a comparative study using European and new African haplotype
data. Forensic Science International 134:126–133
Arroyo-Pardo E, Gusmâo L, Lopez-Parra AM , Baeza C, Mesa MS, Amorim A (2004)
Genetic variability of 16 Y-chromosome STRs in a sample from Equatorial
Guinea (Central Africa). Forensic Sci Int 149(1):109-13
Athey TW (2005) Haplogroup Prediction from Y-STR Values Using an Allele-
Frequency Approach. Journal of Genetic Genealogy 1:1-7
Ballard DJ, Phillips C, Wright G, Thacker CR, Robson C, Revoir AP, Court DS (2005)
A study of mutation rates and the characterisation of intermediate, null and
duplicated alleles for 13 Y chromosome STRs. Forensic Sci Int 155(1):65-70
Bandelt H-J, Forster P, Röhl A (1999) Median-joining networks for inferring
intraspecific phylogenies. Mol Biol Evol 16:37-48
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
124
Bianchi NO, Catanesi CI, Bailliet G, Martinez-Marignac VL, Bravi CM, Vidal-Rioja LB,
Herrera RJ, Lopez-Camelo JS (1998) Characterization of ancestral and derived
Y-chromosome haplotypes of New World native populations. Am J Hum Genet
63(6):1862-71
Bortolini MC, Salzano FM, Thomas MG, Stuart S, Nasanen SPK , Bau CHD, Hutz
MH, Layrisse Z, Petzl-Erler ML, Tsuneto LT, Hill K, Hurtado AM, Castro-de-
Guerra D, Torres MM, Groot H ,Michalski R, Nymadawa P, Bedoya G,
Bradman N, Labuda D , Ruiz-Linares A (2003), Y-Chromosome Evidence for
Differing Ancient Demographic Histories in the Americas Am. J. Hum. Genet.
73:524–539
Budowle B, Adamowicz M, Aranda XG, Barna C, Chakraborty R, Cheswick D, Dafoe
B, Eisenberg A, Frappier R, Gross AM, Ladd C, Lee HS, Milne SC, Meyers C,
Prinz M, Richard ML, Saldanha G, Tierney AA, Viculis L, Krenke BE (2005)
Twelve short tandem repeat loci Y chromosome haplotypes: genetic analysis on
populations residing in North America. Forensic Sci Int 150(1):1-15
Carvalho M, Anjos MJ, Andrade L, Lopes V, Santos MV, Gamero JJ, Real FC, Vide
MC (2003) Ychromosome STR haplotypes in two population samples:Azores
Islands and Central Portugal. Forensic Science International 134 :29–35
Carvalho-Silva DR, Santos FR, Rocha J and Pena SDJ (2001) The phylogeography
of brazilian Ychromosome lineages. Am J Hum Genet 68: 281286.
Corach D, Filgueira-Risso L, Marino M, Penacino G, Sala A, Routine Y-STR typing
in forensic casework. Forensic Sci. Int. 15 (2001) 131-135
Cruciani F, Fratta RL, Santolamazza P, Sellitto D, Pascone R, Moral P,
Watson E, Guida V, Colomb EB, Zaharova B, Lavinha J , Vona G,
Aman R, Calý`F, Akar N, Richards M, Torroni A, Novelletto A, Scozzari
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
125
R (2004) Phylogeographic Analysis of Haplogroup E3b (E-M215) Y
Chromosomes Reveals Multiple Migratory Events Within and Out Of
Africa Am. J. Hum. Genet. 74:1014–1022
de Knijff P, Kayser M, Caglià A, Corach D, Fretwell N, Gehrig C, Graziosi F,
Heidorn G, Herrmann S, Herzog B, Hidding M, Honda K, Jobling M, ,Krawczak
M., Leim K, Meuser S, Meyer E,. Oesterreich W, Pandya A, Parson W,
Penacino G, Perez-Lezaun A,·Piccinini A, Prinz M,.Schmitt C, Schneider PM,
Szibor R, Teifel-Greding J, Weichhold G, Roewer L (1997) Chromosome Y
microsatellites: population genetic and evolutionary aspects. Int J Legal Med
(1997) 110 : 134–140
Dupuy BM, Stenersen M, Egeland T, Olaisen B (2004) Y-chromosomal microsatellite
mutation rates: differences in mutation rate between and within loci. Hum Mutat
23(2):117-24
Ferreira OL (1987) História do Brasil, 12th edn. Ática, São Paulo Brazil
Garcia C (1986) O que é o Nordeste Brasileiro, 2nd edn. Brasiliense, São Paulo
Brasil
Geada H, Baptista J, Felgueiras M, Silva VS, Cruz C,Lucas I, Ribeiro T, Espinheira
R (2004) Portuguese population study with 16 Y-STR loci. International
Congress Series 1261:319– 321
Grattapaglia D, Kalupniek S, Guimarães CS, Ribeiro MA, Diener PS and Soares CN
(2004) Ychromosome STR haplotype diversity in brazilian populations. Forensic
Sci Int 149: 99-107.
Gusmão L, Sanchez-Diz P, Alves C, Beleza S, Lopes A, Carracedo A, Amorim A
(2003) Grouping of Y-STR haplotypes discloses European geographic clines.
Forensic Science International 134 :172–179
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
126
Gusmão L, Sánchez-Diz P, Calafell F, Martín P, Alonso CA, Álvarez-Fernández F,
Alves C, Borjas-Fajardo L, Bozzo WR, Bravo ML, Builes JJ, Capilla J, Carvalho
M, Castillo C, Catanesi CI, Corach D, Di Lonardo AM, Espinheira R, Fagundes
de Carvalho E, Farfán MJ, Figueiredo HP, Gomes I, Lojo MM, Marino M,
Pinheiro MF, Pontes ML, Prieto V, Ramos-Luis E, Riancho JA, Souza Góes AC,
Santapa OA, Sumita DR, Vallejo G, Vidal Rioja L, Vide MC, Vieira da Silva CI,
Whittle MR, Zabala W, Zarrabeitia MT, Alonso A, Carracedo A, Amorim A
(2005) Mutation rates at Y chromosome specific microsatellites. Human
Mutation 26(6): 520-528.
Gusmão L, Butler J, Carracedo A, Gil Pl, Kayser M, Mayr W, Morling N, Prinz M,
Roewer L, Tyler-Smith C (2006) DNA Commission of the International Society of
Forensic Genetics (ISFG): An update of the recommendations on the use of Y-
STRs in forensic analysis?. Forensic Science International 157:(2-3) 187-197
Jobling MA and Tyler-Smith C (2003) The Human Y Chromosome:an
evolutionary marker comes age. Nature Reviews. 4.
Kayser M, Caglià V, Corach D, Fretwell N, Gehrig C, Graziosi G, Heidorn F,
Herrmann S, Herzog B, Hidding M, Honda K, Jobling M, Krawczak M, Leim K,
Meuser S, Meyer E, Oesterreich W, Pandya A, Parson W, Penacino G, Perez-
Lezaun A, Piccinini A, Prinz M, Schmitt C, Schneider PM, Szibor R, Teifel-
Greding J, ·Weichhold G, de Knijff P, Roewer L (1997) Evaluation of Y-
chromosomal STRs: a multicenter study. Int J Legal Med (1997) 110 : 125–133
Kayser M, Roewer L, Hedman M, Henke L, Henke J, Brauer S, Krüger C, Krawczak
M, Nagy M, Dobosz T, Szibor R, de Knijff P, Stoneking M, Sajantila A (2000)
Characteristics and frequency of germline mutations at microsatellite loci from
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
127
the human Y chromosome, as revealed by direct observation in father/son pairs.
Am J Hum Genet66(5):1580-8
Kayser M, Krawczak M, Excoffier L, Dieltjes P, Corach D, Pascali V, Gehrig C,
Bernini LF, Jespersen J, Bakker E, Roewer L, de Knijff P (2001) An extensive
analysis of Y-chromosomal microsatellite haplotypes in globally dispersed
human populations. Am. J. Hum. Genet. 68 (4) 990–1018
Kimura M and Ohta T (1978) Stepwise mutation model and distribution of allelic
frequencies in a finite population. Proc. Nati. Acad. Scd. USA 75(6) 2868-4
Kurihara R, Yamamoto T, Uchihi R, Li SL, Yoshimoto T, Ohtaki H, Kamiyama K,
Katsumata Y (2004) Mutations in 14 Y-STR loci among Japanese father-son
haplotypes. Int J Legal Med 118(3):125-31
Lell JT, Sukernik RI, Starikovskaya YB, Su B, Jin L, Schurr TG, Underhill PA,
Wallace DC (2002) The dual origin and Siberian affinities of Native American Y
chromosomes. Am J Hum Genet 70:192–206
Medeiros T (1980) O negro na etnia do Rio Grande do Norte. Revista do Instituto
Histórico e Geográfico do Rio Grande do Norte 7:1909
Miller SA, Dykes DD and Olesky HF (1988) A simple salting-out procedure
for extract DNA from human nucleated cells. Nucleic Acids Res.
16:1255.
Pereira L, Gusmão L, Alves C, Amorim A, Prata MJ (2002) Bantu and European Y-
lineages in Sub-Saharan Africa. Ann. Hum. Genet: 66, 369±378
Parra FC, Amado RC, Lambertucci JR, Rocha J, Antunes C, Pena SDJ (2003) Color
and genomic ancestry in Brazilians. PNAS 100:177-182.
Pena SDJ, Carvalho-Silva DR, Alves-Silva J, Prado VF (2000) Retrato Molecular do
Brasil. Ciência Hoje 27: 16-25
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
128
Qamar R, Ayub Q, Mohyuddin A, Helgason A, Mazhar K, Mansoor A, Zerjal T,Tyler-
Smith C, Mehdi SQ (2002) Y-Chromosomal DNA Variation in Pakistan. Am. J.
Hum. Genet. 70:1107–1124
Rodrigues-Delfin L, Santos SEB, Zago MA (1997) Diversity of the human Y
chromosome of South American Amerindians: a comparison with Blacks, hites,
and Japanese from Brazil. Ann. Hum. Genet.:61, 439±448
Roewer L, Krawczak M, Willuweit S, Nagy M, Alves C, Amorim A, Anslinger K,
Augustin C , Betz A, Bosh E, Caglia A, Carracedo A, Corach D, Dekairelle AF,
Dobosz T, Dupuy BM, Furedi S, Gehring C, Gusmao L, Henke J, Henke L,
Hidding M, Hohoff C, Hoste B, Jobling MA, Kargel HJ, de Knijff P, Lessig R,
Liebeherr E, Lorente M, Martinez-Jarreta B, Nievas P, Nowak M, Parson W,
Pascali VL, Penacino G, Ploski R, Rolf B, Sala A, Schmidt U, Schmitt C,
Schneider PM., Szibor R, Teifel-Greding J., Kayser M (2001) Online reference
database of European Y-chromosomal short tandem repeat (STR) haplotypes.
Forensic Sci. Int. 118 :106-113.
Roewer L, Croucher PJ, Willuweit S, Lu TT, Kayser M, Lessig R, Knijff P, Jobling MA,
Tyler-Smith C, Krawczak M (2005) Signature of recent historical events in the
European Y-chromosomal STR haplotype distribution. Hum Genet (2005) 116:
279–291
Russell-Wood, A. J. (1998) A sociedade portuguesa no ultramar em Francisco
Bethencourt e Kirti Chaudhuri (orgs.), História da Expansão Portuguesa: I,266-
281
Schneider S, Guillaume L, Excoffier L (2006) Arlequin Ver. 3.01, An integrated
software package for population genetic data analysis. University of Berne
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
129
Computational and Molecular Population Genetics Lab
http://cmpg.unibe.ch/software/arlequin3.
Tarazona-Santos E, Carvalho-Silva DR, Pettener D, Luiselli D, De Stefano GF,
Labarga CM, Rickards O,Tyler-Smith C, Pena SDJ, Santos FR (2001) Genetic
Differentiation in South Amerindians Is Related to Environmental and Cultural
Diversity: Evidence from the Y Chromosome. Am. J. Hum. Genet. 68:1485–
1496
The Y-chromosome consortium, A nomenclature system for the tree of human Y-
Chromosomal binary haplogroups, Genome Res. 12 (2002) 339–348.
Thomas MG, Parfitt T, Weiss DA, Skorecki K, Wilson JF, le Roux M, Bradman N,
Goldstein DB (2000) Y chromosomes traveling south: the Cohen modal
haplotype and the origins of the Lemba—the “Black Jews of Southern Africa.”
Am J Hum Genet 66:674–686
Wilson JF, Weiss DA, Richards M, Thomas MG, Bradman N, Goldstein DB (2001)
Genetic evidence for different male and female roles during cultural transitions
in the British Isles. Proc Natl Acad Sci USA 98:5078–5083
Zegura SL, Karafet TM, Zhivotovsky LA, Hammer MF (2004) High-Resolution SNPs
and Microsatellite Haplotypes Point to a Single Recent Entry of Native American
Y Chromosomes into the Americas. Mol. Biol. Evol. 21(1):164–175.
Zhivotovsky LA, Underhill PA, Cinnioglu C, Kayser M, Morar B, Kivisild T, Scozzari R,
Cruciani F, Destro-Bisol G, Spedini G, Chambers GK, Herrera RJ,Yong KK,
Gresham D, Tournev I, Feldman MW, Kalaydjieva L (2004) The Effective
Mutation Rate at Y Chromosome Short Tandem Repeats with Application to
Human Population-Divergence Time. Am. J. Hum. Genet. 74:000–000
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
130
5 – Conclusões
A população de Pernambuco apresenta um padrão haplotípico
masculino, em termos de variabilidade e diversidade e haplótipos mais
comuns, semelhante às populações do Nordeste, do Brasil e de
Portugal.
O haplótipo mais comum da população de Pernambuco é o haplótipo
modal e é o mesmo haplótipo mais freqüente em Portugal, na Europa e
no restante do Brasil. A freqüência deste haplótipo varia entre as
regiões, sendo em Pernambuco, maior que de outras regiões do Brasil
e de Portugal, evidenciando um “efeito do fundador”.
O agrupamento dos haplótipos seguindo o modelo de stepwise
mutation para os principais haplótipos das populações de referência
permitiu detectar representantes das populações européias, africanas,
indígenas na população de Pernambuco, estabelecendo esta ordem em
termos de participação nas patrilinhagens.
O prognóstico do haplogrupo, a partir das freqüências alélicas dos
haplótipos, ponderados através das taxas de mutação para cada loco,
apresentou similaridade com outros métodos de prognóstico e também
com os resultados em análises por polimorfismos binários
disponibilizadas em bancos de dados.
As árvores filogenéticas a partir de Y-STR’s de Pernambuco
apresentam um padrão de agrupamento semelhante ao do prognóstico
dos haplogrupos, tanto ponderadas através da variância das
freqüências, quanto por taxas de mutação.
A quantificação das contribuições étnicas usando os hapotipos não
únicos, estendidos, ou de toda a amostra não alterou os resultados
significativamente, sendo que em média, a principal contribuição foi de
genes europeus (83%), seguido de genes africanos (15%) e
ameríndios (2%).
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
131
6. Abstract
The use of microsatellites from the non-recombining region of Y
chromosome (NRY) is widespread in forensic and population genetic
studies. In this work the polymorphism analysis was made for 15 Y
chromosome microsatellites (minimal haplotype plus DYS447, DYS458 and
DYS464) from Pernambuco State - Brazil, consisting of a sample of 247
not related individuals and a set of haplotypes from other populations that
had historically participated in the population composition of this state.
The boarding statistics was made on the basis of the haplotype
frequencies assuming the Stepwise Mutation Model. It was possible to
establish a method that it showed useful in the determination of the
genetic contribution of the three main etnias of the population from
Pernambuco, as well as in the prediction of each haplotype haplogroup. In
a total of 247 different observed haplotypes, 183 distinct minimum
haplotypes (153 unique) were identified. They presented the haplotype
diversity of 0.9951, differentiation power of 0.7409 and the probability of
coincidence of 0.0049. The more common minimum haplotype of the
African population had frequency above of the amerindian’s one in the
analysis made with clusters of haplotypes. The prognostic method showed
efficient and compatible with the others existing ones, and was capable to
determine the haplogrupos and consequently, to quantify the contribution
of each ethnic group for this population as any other one. The Median
Joining phylogenetic trees, weighted using the STR mutation taxes mean,
showed very similar with those ones using the alelle frequencies variances
and they presented coherence in the distribution of the haplotypes in the
predicted haplogroups.
KKEEYY WWOORRDDSS:: Haplogruoup prediction, ethnic, microsatellites, Y chromosome haplotypes, DYS447, DYS458, DYS464 Pernambuco, Brasil.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
132
7. Anexos
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
133
7.1. Anexo 1 IINNFFOORRMMAAÇÇÕÕEESS CCOOMMPPLLEEMMEENNTTAARREESS
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
134
7.1.1 Detalhamento das metodologias utilizadas
7.1.1.1 Obtenção da amostra
Foram analisados 247 haplótipos do cromossomo Y de indivíduos
não relacionados da população do estado de Pernambuco (Tabela 1),
genotipados a partir dos trabalhos realizados por Barros et al. (2006)* e
freqüências de haplótipos mínimos de 1413 homens, sendo 87 da
população da Holanda, 984 de Portugal, 129 ameríndios e 213 africanos,
disponíveis no banco de dados de haplótipos de STR-Y (YHRD;
http://www.ystr.org). Os haplótipos foram armazenados em um banco de
dados e analisados com Y-STRCALC, aplicativo construído especificamente
para análise de STR-Y. Estes haplótipos foram determinados a partir da
freqüência dos alelos em cada loco e os mais freqüentes, a partir da
freqüência do haplótipo em cada população de referência: europeus
(Roewer et al. 2001; Roewer et al. 2005; Kayser et al. 2001; Kayser et al.
1997; Geada et al. 2004; de Knijff et al.1997; Carvalho et al. 2003;
Gusmão et al. 2003), ameríndios (Bortolini et al. 2003; Rodriguez-Delfin
et al. 1997; Zegura et al., 2004) e africanos (Pereira et al., 2002; Alves et
al. 2003; Arroy-Pardo et al. 2005).
Extração do DNA: O DNA foi isolado de sangue periférico de células
mononucleadas usando o método de salting out de acordo com Miller et
al.(1988)
PCR: As reações de multiplex para o haplótipo mínimo foram feitas de
acordo com Corach et al. (2001). O triplex incluindo os locos DYS447,
DYS458 e DYS464 loci foi montado em uma reação de 25 µL contendo
100 ng de DNA, 5pmol de primers, 10mM dNTP, 10X PCR Buffer, 50 mM
MgCl2, 0,05% BSA, 0,75 U Taq DNA polymerase. Ciclagem térmica
estabelecida para o multiplex foi 94 oC por 2min, 30 ciclos de 94 oC por
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
135
30 s, 61 oC por 30 s, 72 oC por 30 s, e uma estensão final 72 oC por 7
min.
Tipagem: O produto da PCR foi tipado por eletroforese vertical usando
modelo SQ3 (Hoefer Pharmacia Biotech, San Francisco, CA). Os produtos
amplificados foram detectados em gel de policrilamida a 6% em nitrato de
prata e a identificação dos alelos realizada por comparação com
fragmentos amplificados “allelic ladders”, e confirmado usando Powerplex
Y® (Promega Corp., Madison, USA).
Análise de Dados: As freqüências relativas dos alelos e haplótipos e
diversidade haplotípica foram calculadas usando um software
desenvolvido (Y-STRCALC) para análise de dados. A análise comparativa
entre populações de variância molecular (AMOVA) entre as populações
estudadas foi realizada usando o software Arlequim 3.01 (Schneider et al.
2006).
7.1.1.2 Análise das freqüências
A freqüência alélica (pi) foi estimada segundo a fórmula,
na qual xi é o número de observações do alelo e n é o número total de
alelos. A freqüência haplotípica foi estimada do mesmo modo sendo xi o
número de ocorrências do haplótipo. A variância desta estimativa é dada
por:
nxp i
i =ˆ
1)ˆ1(ˆ
)ˆ(−−
=n
pppV iii
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
136
A diversidade gênica e a diversidade haplotípica foram calculadas
com a mesma fórmula, sendo que no cálculo da diversidade gênica são
considerados os alelos de um loco enquanto que a diversidade haplotípica
é calculada para a combinação de todos os locos na forma de haplótipo. A
diversidade haplotípica é definida como a probabilidade de que dois
haplótipos tomados ao acaso sejam diferentes (Nei 1987). Para o
cromossomo Y a diversidade haplotípica é numéricamente idêntica a dois
parâmetros usados em genética forense, o poder de discriminação (PD) e
a chance de exclusão (CE) (Bosch et al. 2002). A diversidade (D) e a sua
variância (V) são dadas pelas fórmulas:
Foram calculadas as freqüências dos haplótipos mínimos mais
freqüentes de portugueses, holandeses, africanos e ameríndios na
população de Pernambuco. Em seguida, foram definidos grupos (clusters)
destes haplótipos a partir do cálculo das distâncias genéticas com 0, ±1 e
± 2 seguindo o Stepwise Mutation Model (SMM) (Kimura e Ohta 1978). As
freqüências dos haplótipos de cada cluster foram obtidas por contagem
cumulativa do número de ocorrências de cada freqüência de referência em
Pernambuco. Para quantificar a contribuição genética de cada etnia na
formação da população de Pernambuco, foram usados os haplótipos
mínimo e estendido (mínimo + DYS447 + DYS458 + DYS464).
7.1.1.3 Prognóstico do Haplogrupo de Y
Os haplótipos de Pernambuco foram submetidos ao cálculo de
estimativa de haplogrupo. A classificação dos haplótipos é geralmente
estabelecida através de modelos baseados em distâncias genéticas,
enquanto que a predição dos haplogrupos tem nas freqüências dos alelos
a sua principal característica (Athey, 2005). Neste trabalho introduziu-se
um peso para as taxas de mutação, inversamente proporcional às médias
)1(1
ˆ1
2∑=
−−
=k
iip
nnD
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
137
das taxas por loco. Buscou-se prognosticar os haplótipos a partir da
determinação da distância genética dos mesmos em relação ao modal de
cada haplogrupo. Os haplótipos modais foram determinados a partir da
identificação dos alelos mais freqüentes de cada loco. Assim, valendo-se
do conjunto de publicações de referência e dos bancos de dados
disponíveis, foi determinado o haplótipo modal para os haplogrupos: R1b;
R1a; E3b; E3a; J; N;G;I; I1a e Q, considerados como os mais prováveis e
suficientes para a caracterização das etnias formadoras da população
Pernambucana.
As distâncias genéticas dos haplótipos da população de Pernambuco
em relação ao modal de cada haplogrupo foram calculadas usando o
programa Y-STRCALC, desenvolvido especificamente para este estudo.
Adotaram-se os valores 1 para diferença e 0 para igualdade em cada loco.
Em seguida, foi dividido o valor encontrado pelo inverso da taxa de
mutação do loco multiplicada por 1.000. Assim, a menor distância
apontará o cluster ao qual um dado haplótipo será incorporado,
prognosticando seu haplogrupo. Como exemplo, considera-se o seguinte
haplótipo mínimo (14,11-14,14,30,24,11,13,13). Seja {Wi} um conjunto
de n alelos representados pelo número de repetições nos locos do
haplótipo {Wi} = {14,11,14,14,30,24,11,13,13} e {Xi} o conjunto dos
alelos representados pelos haplótipos modais de cada haplogrupo. Seja Mi
a taxa de mutação média calculada para cada Xi correspondente. O
cálculo da distância D será dado por:
D = ∑=
×n
i Mi1
3101para Xi ≠ Wi
Será prognosticado o haplogrupo com a menor distância calculada. O
haplótipo acima foi prognosticado como pertencendo ao haplogrupo R1b
considerando o seguinte: o haplótipo modal para o haplogrupo R1b, {Xi}
= {14,11,14,13,29,24,11,13,13} apresenta diferenças nos locos DYS389I
e DYS389II para o haplótipo {Wi} = {14,11,14,14,30,24,11,13,13}. O
valor para a taxa de mutação média para os locos DYS389I e DYS389II é
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
138
1,87 x 10-3 e 2,26 x 10-3, respectivamente (Kayser et al. 2000, Kurihara
et al. 2004, Dupuy et al. 2004, Ballard et al. 2005, Budowle et al. 2005,
Gusmao et al. 2005 , Bianchi et al. 1998 , Dupuy et al. 2004). Assim o
somatório:
977,01026,2
1011087,1
1013
3
3
3
=××
+××
= −−D
resultará na menor distância D, calculada para o haplótipo Wi para todos
os haplótipos modais Xi, indicando que o haplótipo Wi pertence ao
haplogrupo R1b. Do mesmo modo, se analisarmos a distância D, para o
haplogrupo I, {Xi}= {15,14,14,12,29,22,10,11,14}, o somatório de todos
os Xi≠Wi, compreenderá oito locos, que certamente apresentará uma
distância maior que a calculada para o modal do haplogrupo R1b. O
programa calculará a distância para todos os haplogrupos modais e a
menor distância apontará o haplogrupo a ser prognosticado. Para a
determinação do escore, o programa Y-STRCALC aplica a fórmula Escore
= 100 – (D × 25), considerando que o ponto médio de mudança de cluster
para os haplogrupos se encontra a uma distância aproximada com valor
igual a quatro, o qual é considerado como referência para indeterminação.
Isto significa dizer que uma distância D = 0 terá um escore de 100 e uma
distância de D = 4 terá escore 0, ou seja, as distâncias iguais ou acima de
4 não são passíveis de prognóstico. No caso do exemplo acima, a
distância D = 0,977 terá um valor de escore ≈ 76.
7.1.1.4 Análise de Network
As árvores median-joining (Bandelt et al. 1999) foram construídas
usando o programa NETWORK 4.2 com os haplótipos mínimos não únicos
de Pernambuco. Para os cálculos do network, as STR’s foram ponderadas
de duas formas: uma de acordo com a variância do número de repetições
em cada loco, de forma que os maiores pesos forma atribuídos aos locos
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
139
menos variáveis, e um outro modo proposto neste trabalho, que considera
as taxas médias de mutação para cada loco, atribuindo pesos maiores aos
locos com menor taxa de mutação, tal como foi feito para o prognóstico
do haplogrupo.
7.1.1.5 Construção do Banco de dados
Foi construído um banco de dados com uso de entidades relacionais
(tabelas) de dados, usando a ferramenta de Banco de dados ORACLE® 8i e
linguagem PL-SQL para a armazenagem dos dados de STR. Foram
desenvolvidos programas de Banco (Storage procedures) e de aplicação
para ambiente Windows de manipulação dos dados e interface com os
usuários usando linguagem estruturada SQL e software Developer 6.0
com linguagem orientada a objeto, constituído pelos seguintes módulos e
funções:
Cadastro de haplótipos do Cromossomo Y (figura 1)
Número, freqüência relativa e absoluta no banco
Seleção por domínio, por “string” ou aritmética
Importação de dados gerados pela planilha excel
Pesquisa do Banco de Dados
Geração de tabela de amostra por seleção (figura 2)
Cálculo de freqüências, diversidade Haplotípica,
Probabilidade de coincidência e poder de discriminação
da amostra e do banco.
Análise do Banco de dados (figura 3)
Cálculo das freqüências haplotípicas, absoluta e relativa
Cálculo do modal e do antimodal
Calculo da distancia genética para o modal SMM
Inferência do haplogrupo
Relatório das freqüências alélicas da amostra
Pesquisa de origem haplótipo (figura 4)
Importação de dados
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
140
Verificação da origem de haplótipos através de
cruzamento com bancos de dados incorporados
Figura 1: Interface de cadastro de haplótipos do cromossomo Y na qual calcula-se e informa-se as freqüências relativas e absolutas, número de registros do banco número de haplótipos, diversidade haplotípica de poder de discriminação.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
141
Figura 2: Interface de seleção de haplótipos do cromossomo Y do banco para análise através da qual é possível verificar os parâmetros básicos do banco e da amostra selecionada e informa os dados, freqüências relativas e absolutas, número de registros do banco número de haplótipos, diversidade haplotípica de poder de discriminação e probabilidade de coincidência.
Figura 3: Interface de análise haplótipos do cromossomo Y a partir da amostra selecionada do banco através da qual pode se calcular as distância genéticas para o haplótipo modal da amostra, fazer prognóstico de haplogrupo por diferentes métodos de cálculo verificar o anti-modal (alelos menos freqüentes por loco) freqüências relativas e absolutas e impressão das freqüências alélicas.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
142
Figura 4: Interface de rastreamento de haplótipos do cromossomo Y em outros bancos de dados em função das menores distâncias genéticas a partir da amostra selecionada. 7.1.2. Detalhamento dos resultados
7.1.2.1. Análise de polimorfismo
Como resultado do estudo realizado por Barros et al. (2006)* Tabela
1, a análise de variabilidade alélica e haplotípica apresentada foi refeita e
confirmada com a utilização do programa Y-STRCALC. A Figura 5
apresenta graficamente as freqüências alélicas encontradas.
Dados da pesquisa:
Tamanho da amostra: 247 indivíduos não aparentados
Número de Haplótipos da amostra: 224
Diversidade Haplotípica: 0,9994
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
143
Poder de diferenciação: 0,9069
Probabilidade de coincidência de Haplótipos: 0,0006
Haplótipo mínimo modal de Pernambuco: • encontrado 15 vezes na amostra de PE (6,07%)
• na Europa corresponde a 2,96% na amostra de 4688
• taxa de mutação média de 2.8 x 103 Europa (Kayser et al.2001)*
Haplótipos estendidos mais freqüentes em Pernambuco: f = (0.0162) n = 4 Tabela 1:Lista dos 224 haplótipos do cromossomo Y dos 247 homens de Pernambuco., Freqüências absolutas e relativas. Ha DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS nb Fc
19 385 389I 389II 390 391 392 393 447 458 464
001PE 15 15-15 13 29 23 11 12 14 26 15 13-14-15 1 0.0040
002PE 14 12-14 13 30 24 10 13 13 25 18 15-16-17 1 0.0040
003PE 13 16-16 13 32 24 10 11 13 26 18 14-15-16-17 1 0.0040
004PE 14 11-14 13 29 24 11 13 13 25 17 15-16-17 4 0.0162
005PE 15 14-16 11 29 22 10 11 14 22 17 12-13 2 0.0081
006PE 15 9-11 13 29 24 10 13 13 24 17 15-16-17 1 0.0040
007PE 15 11-13 13 31 24 11 13 13 25 18 15-16-17 1 0.0040
008PE 15 15-17 12 30 21 11 11 13 26 16 13-16-18 1 0.0040
009PE 15 16-18 14 31 21 11 11 13 26 16 14-16-18 1 0.0040
010PE 14 18-20 14 31 25 10 11 13 25 15 14-16-18 1 0.0040
011PE 14 11-14 12 27 24 12 13 14 24 17 15-16-17 1 0.0040
012PE 17 16-19 13 30 21 10 11 14 25 17 13-17-18 1 0.0040
013PE 13 13-14 14 30 24 9 11 13 25 18 14-16-17 1 0.0040
014PE 14 12-13 14 30 24 11 13 13 26 17 14-15-16-17 1 0.0040
015PE 15 13-13 13 29 26 10 11 12 24 20 13-15-16-17 1 0.0040
016PE 16 12-14 12 27 22 10 11 13 23 19 12-14 1 0.0040
017PE 13 13-15 13 28 23 10 13 13 27 17 13-15-16 1 0.0040
018PE 14 11-14 13 29 25 10 13 13 25 17 15-17 2 0.0081
019PE 15 16-16 13 31 21 11 11 13 25 17 13-16-17 1 0.0040
020PE 15 11-14 13 30 23 10 13 13 25 17 15-16-17 1 0.0040
021PE 17 12-12 13 28 23 10 11 13 24 18 11-14-15 1 0.0040
022PE 14 11-12 13 29 24 11 12 13 25 16 14-15-16-17 1 0.0040
023PE 14 11-14 13 29 23 11 13 12 25 17 14-15-17-18 1 0.0040
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
144
024PE 15 15-18 13 31 21 10 11 13 25 16 13-15-16 1 0.0040
025PE 14 11-11 12 29 25 11 13 13 24 16.2 15-16-17 1 0.0040
026PE 13 13-14 14 30 23 9 11 13 23 18 14-15-16-17 1 0.0040
027PE 15 11-14 13 29 23 11 13 13 26 17 15-16-17 1 0.0040
028PE 15 13-15 12 29 23 10 11 12 26 17 13-13-13-13 1 0.0040
029PE 14 11-14 13 29 24 11 13 14 24 16 15-16-18 2 0.0081
030PE 13 15-17 13 30 25 10 13 13 26 14 14-15-19 1 0.0040
031PE 14 11-14 14 30 24 11 13 13 25 17 15-16-17 1 0.0040
032PE 14 11-14 14 30 24 11 13 13 25 18 15-16-17 1 0.0040
033PE 14 11-14 13 30 24 11 13 13 25 19 15-16-17 1 0.0040
034PE 14 11-14 12 28 23 11 14 13 25 18 15-17 1 0.0040
035PE 16 11-14 13 30 25 10 11 14 24 15 12-15-16 1 0.0040
036PE 14 11-14 13 30 24 11 13 13 24 17 15-16-17 1 0.0040
037PE 15 11-15 13 29 24 10 13 13 26 18 15-16-17 1 0.0040
038PE 14 11-14 14 30 24 11 13 13 25 18 15-17 3 0.0121
039PE 14 11-14 13 28 24 11 13 13 26 17 15-17 1 0.0040
040PE 14 11-14 13 29 24 11 13 12 25 16 14-15-17-19 3 0.0121
041PE 14 11-11 13 29 25 11 13 13 25 16 15-16-17 1 0.0040
042PE 14 11-15 13 29 23 11 12 13 25 18 15-17 1 0.0040
043PE 14 16-18 13 30 24 10 11 13 25 17 16-16-16-16 1 0.0040
044PE 14 11-15 13 29 24 11 13 13 26 18 15-16-17-18 1 0.0040
045PE 14 13-15 14 31 23 10 11 12 25 18.2 12-13-15-16 1 0.0040
046PE 15 14-14 13 31 21 10 11 13 24 19 13-16-17 1 0.0040
047PE 14 14-14 12 29 23 10 11 12 23 15 12-14-15-16 3 0.0121
048PE 16 15-15 13 29 23 11 12 14 26 15 11-13-15 1 0.0040
049PE 14 11-14 13 29 23 10 13 14 25 15 14-16-17 1 0.0040
050PE 15 11-14 13 29 22 10 13 13 25 14 15-17 1 0.0040
051PE 14 14-14 13 29 23 11 13 13 25 18 15-16-17 1 0.0040
052PE 15 12-14 14 31 25 10 11 13 24 15 12-15-16 1 0.0040
053PE 14 11-14 13 29 23 11 13 12 25 17 14-15-16-18 1 0.0040
054PE 15 11-15 13 30 24 10 13 14 25 17 15-16-17 1 0.0040
055PE 15 12-16 12 30 22 10 11 14 23 17 12-13-14 1 0.0040
056PE 14 11-11 13 29 24 11 13 12 25 20 15-17-18 1 0.0040
057PE 13 14-14 14 30 24 9 11 13 23 17 14-16-17 1 0.0040
058PE 15 11-13 14 30 24 11 13 13 24 17 15-17-18 1 0.0040
059PE 14 11-14 13 29 24 11 13 12 25 17 15-16-17 1 0.0040
060PE 16 14-14 12 29 23 10 12 15 25 16 11-15 1 0.0040
061PE 15 11-14 14 30 23 10 13 13 25 17 15-16-17 1 0.0040
062PE 15 13-15 11 29 22 10 10 14 23 20 12-13-14 1 0.0040
063PE 14 11-14 13 29 24 11 13 13 25 17 15-16-19 2 0.0081
064PE 14 11-14 14 30 24 11 13 13 25 16 15-17 1 0.0040
065PE 14 11-14 13 29 23 11 13 14 24 17 15-17 2 0.0081
066PE 14 11-14 13 29 24 10 13 13 25 17 15-17 1 0.0040
067PE 14 12-12 13 29 24 11 13 13 25 18 15-15-15-15 1 0.0040
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
145
068PE 17 12-12 13 28 23 10 11 13 24 17 11-14-15 1 0.0040
069PE 14 13-18 12 29 23 10 14 13 27 16 14-15-16 1 0.0040
070PE 14 11-14 13 29 24 11 13 13 25 17 15-17 4 0.0162
071PE 14 12-14 13 29 24 12 13 13 25 17 12-15-17-18 1 0.0040
072PE 15 16-17 13 30 21 10 11 13 25 17 11-16-18 1 0.0040
073PE 16 14-15 12 28 22 10 11 14 23 16 12-13-14 1 0.0040
074PE 13 16-18 13 30 23 10 11 13 27 15 14-15.3-17 1 0.0040
075PE 15 11-13 13 31 24 11 13 13 26 18 14-15-17 1 0.0040
076PE 13 16-16 13 30 23 10 11 14 25 16 13-15-16 1 0.0040
077PE 14 12-14 13 29 24 11 13 13 25 17 15-16-17 1 0.0040
078PE 14 16-18 13 30 24 10 12 12 26 17 12-14.3-16-17 1 0.0040
079PE 14 10-14 13 29 25 11 13 13 25 18 15-17-18 1 0.0040
080PE 13 15-18 13 29 24 10 14 13 26 16 14-16-17 1 0.0040
081PE 15 16-18 12 30 21 10 11 13 25 15 16-19 1 0.0040
082PE 17 15-18 13 31 22 10 14 13 26 17 11-13-16 1 0.0040
083PE 15 11-14 13 29 24 11 13 13 26 18 15-16-17 1 0.0040
084PE 15 16-18 12 28 24 10 11 12 26 20 14-15-18 1 0.0040
085PE 14 11-14 13 28 24 11 13 13 25 17 15-17 1 0.0040
087PE 14 11-14 14 30 23 11 13 13 25 17 14-15-17 1 0.0040
088PE 15 14-20 13 29 23 10 11 12 26 16 13-16 1 0.0040
089PE 14 12-14 13 29 24 10 13 13 25 17 15-16-18 1 0.0040
091PE 15 16-17 13 30 21 10 11 15 27 15 14-15-17 1 0.0040
092PE 16 13-14 13 29 23 9 11 12 26 14 11-13-15 1 0.0040
093PE 16 14-17 12 28 24 10 11 13 28 17 13-15-16-17 1 0.0040
094PE 14 11-15 13 29 24 11 13 13 25 16 15-16-18 1 0.0040
095PE 15 14-16 14 31 23 10 12 14 26 16 12-14-15 1 0.0040
096PE 14 12-14 13 29 24 10 13 13 25 17 15-17 1 0.0040
097PE 15 15-18 13 30 21 10 11 13 25 17 13-16 1 0.0040
098PE 14 11-15 13 29 25 11 13 13 25 17 15-16-17 1 0.0040
099PE 14 11-14 13 29 24 10 13 13 25 17 15-16-17 1 0.0040
100PE 14 16-17 13 29 23 10 14 12 24 16 15-16 1 0.0040
101PE 14 11-14 13 29 23 11 13 13 25 17 15-17 1 0.0040
102PE 14 13-14 13 29 22 10 11 12 26 16 13-14-15-16 1 0.0040
103PE 14 13-15 12 28 23 10 11 14 22 15 12-14-15-16 1 0.0040
104PE 16 11-14 13 31 24 10 11 14 23 15 12-13-15-16 1 0.0040
105PE 15 14-14 13 30 24 10 12 15 26 17 11-14-16 1 0.0040
106PE 14 11-14 13 29 24 11 13 12 25 19 15-16-18 1 0.0040
107PE 14 11-13 13 29 24 11 14 12 25 16 15-16-19 1 0.0040
108PE 14 12-15 13 29 25 11 12 13 25 16 15-16-17 1 0.0040
109PE 14 11-11 13 29 24 11 12 13 26 16 15-16-17 1 0.0040
110PE 14 11-14 13 29 24 11 13 13 26 17 15-16-17 1 0.0040
111PE 14 11-14 13 29 24 11 13 13 24 17 15-17 1 0.0040
112PE 14 11-14 13 30 24 10 13 13 25 17 16-18 1 0.0040
114PE 14 11-14 13 29 24 11 13 14 25 16 15-17 1 0.0040
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
146
115PE 13 11-14 13 29 23 11 13 13 25 17 15-17 1 0.0040
116PE 13 17-17 12 29 24 10 11 13 27 14 14.3-16-17 1 0.0040
117PE 14 15-16 14 32 23 10 11 12 23 16 12-14-15 1 0.0040
118PE 14 14-14 12 29 23 11 11 13 23 15 12-14-15-16 1 0.0040
119PE 16 16-18 13 30 22 10 11 15 26 15 13-16-18 1 0.0040
120PE 14 11-14 13 29 24 11 13 13 26 16 15-16-17 2 0.0081
121PE 15 11-14 12 28 25 11 13 13 25 19 15-17 1 0.0040
122PE 14 11-14 13 29 24 11 14 13 25 18 15-16-17-18 1 0.0040
123PE 13 13-14 14 30 24 9 11 13 23 20 14-16-17 1 0.0040
124PE 14 14-16 13 26 23 10 13 13 26 18 11-13-16 1 0.0040
125PE 15 11-14 13 28 23 11 13 13 25 17 15-18 2 0.0081
126PE 14 11-14 13 29 23 11 13 12 25 17 14-15-18 1 0.0040
127PE 15 13-18 13 29 24 10 11 12 26 17 12-15-18 1 0.0040
128PE 15 11-14 13 30 24 11 13 14 25 17 15-16-17 1 0.0040
129PE 16 14-14 12 29 23 10 12 14 25 17 11-15 1 0.0040
130PE 14 11-14 13 28 24 11 13 13 25 17 15-16-17 1 0.0040
131PE 15 14-14 14 32 23 10 13 12 26 18 11-13-16 1 0.0040
132PE 15 15-15 12 29 22 10 10 14 23 20 12-13-14 1 0.0040
133PE 16 17-18 14 31 21 9 11 14 26 17 13-17-18 1 0.0040
134PE 14 11-14 13 29 23 11 13 12 24 18 15-17-18 1 0.0040
135PE 14 11-14 13 29 25 11 13 13 25 18 15-17 1 0.0040
136PE 14 11-14 13 30 25 11 13 13 26 17 15-17 1 0.0040
137PE 14 17-17 13 30 24 10 11 13 25 16 14-15.3-17 1 0.0040
138PE 15 11-11 14 32 24 10 11 13 26 17 15-16-17 1 0.0040
139PE 15 16-17 13 31 21 10 11 13 26 18 13-16-17 1 0.0040
140PE 13 16-16 13 30 23 10 11 13 25 16 13-15-17 1 0.0040
141PE 15 15-15 14 31 24 10 12 14 25 16 11-15 1 0.0040
142PE 15 13-14 14 30 22 11 11 14 23 18 12-13 1 0.0040
143PE 14 11-16 13 29 24 11 13 13 26 16 15-16-17 1 0.0040
144PE 14 11-15 14 30 25 11 13 13 25 16 15-17-18 1 0.0040
145PE 14 11-14 12 28 23 11 13 13 25 18 15-17 1 0.0040
146PE 15 11-13 13 29 25 11 13 13 25 17 15-16-17 1 0.0040
147PE 14 11-15 13 29 24 11 13 13 25 17 15-16-17 2 0.0081
148PE 15 12-12 13 32 23 10 11 23 26 16 16-18 1 0.0040
149PE 15 15-19 14 31 21 10 11 13 25 16 16-18 1 0.0040
150PE 14 11-14 14 30 24 11 13 13 25 18 14-15-16-17 1 0.0040
151PE 14 11-15 13 29 24 10 13 13 25 18 14-15-16 1 0.0040
152PE 15 14-16 13 30 21 10 11 14 27 21 12-15-16-17 1 0.0040
153PE 15 13-16 12 29 23 11 11 12 24 20 12-13-16-17 1 0.0040
154PE 14 11-14 14 30 23 11 13 13 25 17 15-17 2 0.0081
155PE 13 11-14 13 29 24 11 13 13 25 16 14-16-17 1 0.0040
156PE 14 11-14 12 28 24 11 13 13 25 16 15-17 1 0.0040
157PE 14 11-14 13 30 23 11 13 13 23 18 14-15-17-18 1 0.0040
158PE 14 11-14 12 28 24 10 13 13 25 19 15-16-17 1 0.0040
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
147
159PE 16 11-14 13 30 25 11 11 13 24 15 12-13-14-16 1 0.0040
160PE 14 11-14 13 28 24 10 13 13 24 16 15-17 1 0.0040
161PE 14 11-14 13 29 24 11 13 13 26 17 15-16-18 1 0.0040
162PE 14 11-14 13 30 23 11 13 13 25 19 15-16-17 1 0.0040
163PE 14 11-14 12 28 23 11 14 13 25 18 15-16-17 1 0.0040
164PE 15 11-14 14 30 24 11 13 13 25 17 15-16-17 1 0.0040
165PE 14 13-17 13 29 22 9 11 12 27 16 13-16-17 1 0.0040
166PE 14 11-13 13 30 25 10 13 13 26 17 15-17 1 0.0040
167PE 15 18-18 13 32 21 10 10 13 25 16 13-15-16-18 1 0.0040
168PE 15 16-18 14 31 21 11 11 13 25 17 16-18-19 1 0.0040
169PE 14 16-17 13 31 21 11 11 13 25 16 13-16-17 1 0.0040
170PE 15 16-19 13 31 21 10 11 13 25 16 13-16-17 1 0.0040
171PE 14 14-14 12 28 23 10 11 13 22 16 12-14-15 1 0.0040
172PE 16 14-15 12 30 22 10 12 14 23 17 12-13-14 1 0.0040
173PE 14 14-19 12 28 24 11 11 13 23 17 14-15 1 0.0040
174PE 15 17-18 13 31 23 10 12 15 24 17 15-15-15-15 1 0.0040
175PE 14 11-15 13 29 23 11 13 13 24 16 15-17-18 2 0.0081
176PE 17 12-13 13 28 23 10 11 13 26 17 11-14-16 1 0.0040
177PE 16 15-19 13 29 21 10 11 15 26 16 13-15-17 1 0.0040
178PE 15 13-15 12 28 21 10 11 14 23 17 13-14 1 0.0040
179PE 16 16-17 13 29 21 10 11 15 26 16 15-15-15-15 1 0.0040
180PE 14 13-14 13 29 22 10 11 13 23 16 12-14-16 1 0.0040
181PE 13 16-18 13 30 23 10 11 13 26 15 14-15.3-17 1 0.0040
182PE 14 15-18 13 30 24 10 11 13 25 17 16-16-16-16 1 0.0040
183PE 14 11-14 13 28 24 11 13 13 24 16 15-17 1 0.0040
184PE 17 12-12 13 28 23 10 11 13 25 16 11-14-15 1 0.0040
185PE 14 13-14 12 28 22 10 11 13 22 15 12-13-14-15 1 0.0040
186PE 14 16-17 13 31 21 11 11 13 25 17 13-16-17-19 1 0.0040
187PE 15 15-15 13 30 20 10 11 13 27 18 12-15-17 1 0.0040
188PE 15 11-14 13 29 24 11 13 13 26 16 15-17-17 1 0.0040
189PE 13 16-17 13 30 23 10 11 13 27 15 13.3-15.3-17-18 1 0.0040
190PE 14 10-15 13 29 24 11 13 13 25 18 16-17 1 0.0040
191PE 14 11-14 13 29 25 11 13 13 25 17 15-16-17 1 0.0040
192PE 14 11-14 14 31 24 11 13 13 25 18 15-16-17 1 0.0040
193PE 14 11-14 14 30 23 11 13 13 25 17 15-16-18 1 0.0040
194PE 14 13-15 13 30 22 10 11 12 26 15 12-16 1 0.0040
195PE 14 12-12 13 29 24 10 13 13 25 16 15-16-17 1 0.0040
196PE 14 11-13 13 29 24 11 13 13 25 17 15-16-17 1 0.0040
197PE 14 12-14 13 29 24 11 13 13 25 18 15-17 1 0.0040
198PE 14 12-14 14 30 25 11 13 13 25 17 15-16-17 1 0.0040
199PE 14 11-14 13 31 24 11 13 13 25 19 14-15-18 1 0.0040
200PE 15 11-14 13 29 24 11 13 13 25 16 15-16-17 1 0.0040
201PE 15 14-17 12 29 23 10 11 13 27 16 14-16-17-18 1 0.0040
202PE 14 14-14 13 29 25 10 11 12 24 19 13-15-16-17 1 0.0040
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
148
203PE 13 16-17 13 30 24 10 11 13 25 16 14-16-17-18 1 0.0040
204PE 15 14-15 13 32 21 10 11 13 25 18 13-16-18 1 0.0040
205PE 14 11-14 13 29 23 11 13 13 24 17 15-16-17-18 1 0.0040
206PE 13 13-14 13 29 24 9 11 13 23 19 14-16 1 0.0040
207PE 14 13-16 13 29 22 11 11 12 27 17 12-13-15-16 1 0.0040
208PE 15 16-18 13 30 21 10 11 13 25 16 13-15-16 1 0.0040
209PE 15 13-15 13 30 22 10 10 13 20 18 13-14-15 1 0.0040
210PE 14 13-18 13 29 23 11 11 12 26 18.2 12-14-16-17 1 0.0040
211PE 15 16-18 13 31 21 11 11 13 25 16 13-16-18 1 0.0040
212PE 15 11-13 13 29 24 11 13 13 25 17 13-15-16-17 1 0.0040
213PE 16 11-14 13 31 25 10 11 14 24 15 12-15-16 1 0.0040
214PE 15 15-15 12 29 22 10 11 14 22 16 13-14-15 1 0.0040
215PE 14 11-11 13 29 24 11 13 13 24 19 15-17 1 0.0040
216PE 14 12-14 13 29 24 11 13 13 25 16 15-17 1 0.0040
217PE 15 17-18 12 29 21 10 11 15 26 16 13-16-17 1 0.0040
218PE 14 13-16 13 30 23 10 11 12 25 18 12-14-16-17 1 0.0040
219PE 15 15-18 12 30 21 10 11 13 25 16 13-15-16-17 1 0.0040
220PE 14 13-17 12 29 23 10 11 13 22 15 12-14-15 1 0.0040
221PE 14 13-19 13 30 23 10 11 12 25 17.2 14-15-16-17 1 0.0040
222PE 16 15-19 13 30 21 10 11 13 25 15 13-16-18 1 0.0040
223PE 14 11-14 13 30 24 10 13 14 26 17 15-17 1 0.0040
224PE 15 15-16 13 30 21 10 11 14 26 18 12-15-16-18 1 0.0040
225PE 14 11-15 13 30 24 11 13 13 26 20 15-17-18 1 0.0040
226PE 17 17-18 14 31 21 10 11 13 27 15 12-16-17 1 0.0040
227PE 14 12-14 14 30 24 10 13 13 25 18 16-17 1 0.0040
a: H = haplótipo; b: n = número de indivíduos observados para cada haplótipo; c: F = freqüência para cada haplótipo.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
149
Figura 5 Distribuição das freqüências alélicas de 11 locos de Y-STR, dos 247 indivíduos da amostra de Pernambuco. Para cada loco, a designação do alelo (em número de repetições) indicado no eixo das abcissas , e a freqüência observada (em %) no eixo das ordenadas.
DYS19
0
10
20
30
40
50
60
13 14 15 16 17
DYS385a
0
10
20
30
40
50
9 10 11 12 13 14 15 16 17 18
DYS385b
0
10
20
30
40
50
11 12 13 14 15 16 17 18 19 20
DYS389I
01020304050607080
11 12 13 14
DYS389II
0
10
20
30
40
50
26 27 28 29 30 31 32
DYS390
05
1015202530354045
20 21 22 23 24 25 26
DYS391
0
10
20
30
40
50
60
9 10 11 12
DYS392
0
10
20
30
40
50
10 11 12 13 14
DYS393
01020304050607080
12 13 14 15
DYS447
0
10
20
30
40
50
60
18 20 22 23 24 25 26 27 28
DYS458
05
10152025303540
14 15 16 16.2 17 17.2 18 18.2 19 20 21
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
150
7.1.2.2. Análise dos haplótipos de referência
O estudo comparativo das freqüências dos alelos mais comuns nas
populações foi importante na diferenciação das populações e na
determinação do haplótipo modal, permitindo a investigação das
prováveis “assinaturas genéticas”. A tabela 2 mostra as maiores
freqüências dos alelos nas regiões do Brasil enquanto a tabela 3 mostra
algumas populações usadas como referência neste estudo. Este resultado
mostrou que os haplótipos modais das populações do Brasil (Gratapaglia
et al. 2005), da Europa e de Portugal são diferentes, mas variam muito
pouco nas freqüências dos locos (DYS389II e DYS391), que são os
responsáveis por esta diferenciação, sendo descartada uma diferença
significativa entre modais nestas populações. Diferentemente, o loco
DYS392 é bastante discriminante para as populações ameríndias e
africanas, as quais apresentaram alelos diferentes em grande parte destes
haplótipos. A diferenciação das regiões de Portugal (central, norte e sul)
não foi constatada e desconsiderada para efeito deste estudo. A tabela 3
apresenta as freqüências dos haplótipos analisados separadamente por
região. Em seguida foi feita a verificação destas freqüências
representativas das populações de origem na população de Pernambuco.
Esta infomação foi coletada através da análise direta na amostra da
população usando o Y-STRCALC como pode ser verificado nos dados da
tabela 4. A tabela 5 mostra uma visão geral dos haplótipos de referência
e suas freqüências em diversas áreas geográficas para dar uma referência
das freqüências. Observa-se que esta tabela apresenta um haplótipo dos
países baixos (Leiden) que foi usado como uma referância típica das
populações daquela região, e que possui freqüência muito baixa em
Portugal. Isto foi feito na tentativa de estabelecer diferencial haplotípico
entre Portugal e Holanda na amostra de Pernambuco.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
151
Tabela 2: Haplótipos mínimos modais nas regiões do Brasil indicando os locos (linha superior) os alelos em número de repetições e as freqüências dos alelos (parêntesis) que apresentaram diferenças (Grattapaglia et al. 2005).
REGIÃO DYS19 DYS385 DYS389I DYS389II DYS390 DYS391 DYS392 DYS393
NORTE
14
11-14
13
30 (0.600)
29 (0.200)
24
10 (0.600)
11 (0.400)
13
13
NORDESTE
14
11-14
13
29
24
11 (0.548)
10 (0.429)
13
13
CENTRO-OESTE
14
11-14
13
29
24
10 (0.583)
11 (0.354)
11
13
SUDESTE
14
11-14
13
29
24
10 (0.583)
11 (0.361)
11
13
SUL
14
11-14
13
29
24
10 (0.489)
11 (0.489)
13
13
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
152
Tabela 3: Alelos mais freqüentes por loco dos haplótipos mínimos de Y nas populações de Pernambuco, Europa, Brasil, Ameríndios, África e Portugal em duas regiões (Central e Açores). As freqüências aparecem entre parênteses, e os alelos, em número de repetições. Os quadros nos quais aparecem duas freqüências são aqueles que definem modalidade do loco, diferenciadores ou não, em razão da semelhança entre as freqüências.
POPULAÇÃO DYS 19
DYS 385
DYS 389I
DYS 389II
DYS 390
DYS 391
DYS 392
DYS 393
PE
14
(0.558)
11-14
(0.360)
13
(0.684)
30 (0.279)
29 (0.465)
24
(0.429)
11 (0.489)
10 (0.465)
13
(0.510)
13
(0.688)
EUROPA
14
(0.601)
11-14
(0.365)
13
(0.574)
30 (0.412)
29 (0.372)
24
(0.568)
11 (0.500)
10 (0.432)
13
(0.595)
13
(0.709)
BRASIL
14
(0.566)
11-14
(0.268)
13
(0.621)
30 (0.364)
29 (0.384)
24
(0.540)
11 (0.434)
10 (0.530)
13
(0.465)
13
(0.626)
AMERÍNDIOS
13 (0.440)
15 (0.380)
12-15
(0.180)
13
(0.810)
29 (0.440)
30 (0.370)
24
(0.630)
11 (0.500)
10 (0.440)
14
(0.560)
13
(0.870)
AFRICA
15
(0.417)
16-16 (0.167) 15-16
(0.158)
13
(0.563)
30 (0.371)
31 (0.309)
21
(0.674)
10
(0.777)
11
(0.877)
14
(0.586)
PORTUGAL CENTRAL
14
(0.582)
11-14
(0.305)
13
(0.645)
30 (0.286)
29 (0.461)
24
(0.538)
11 (0.402)
10 (0.495)
13
(0.475)
13
(0.684)
PORTUGAL AÇORES
14
(0.539)
11-14
(0.317)
13
(0.555)
30 (0.285)
29 (0.396)
24
(0.492)
11 (0.412)
10 (0.460)
13
(0.539)
13
(0.746)
Tabela 4: Haplótipo mais freqüente nas populações de referência e respectivas freqüências na população de Pernambuco, Brasil.
População DYS
19
DYS
385
DYS
389I
DYS
389II
DYS
390
DYS
391
DYS
392
DYS
393
f0 F1
Portugal 14 11-14 13 29 24 11 13 13 0.0457 0.0607
Holanda 14 11-14 13 29 23 11 13 13 0.0459 0.0081
Ameríndios 13 15-17 13 31 23 10 14 13 0.1666 0.0000
África 15 15-16 13 30 21 10 11 14 0.0632 0.0040
f0 = freqüência nas populações de referência ; f 1= freqüência na população de
Pernambuco;
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
153
Tabela 5 – Haplótipos mais freqüentes e modais no Brasi e Holanda/Strasburgo, e respectivas
freqüências em Pernambuco, Portugal Central, Portugal Sul, Europa e no mundo
Haplótipo Referência PE PT HOLANDA BRASIL EUROPA MUNDO (14-11,14-13-29-24-11-13-13) PORTUGAL 0,0669 0,0457 0,0229 0,0252 0,02960 0,02040 (14-11,14-13-29-23-11-13-13) HOLANDA 0,0081 0,0193 0,0459 0,0101 0,01280 0,00091 (14-13,14-12,28,22,10,11,13) LEIDEN 0,0040 0,0071 0,0114 0,0101 0,00987 0,00610 (15-15,16-13-30-21-10-11-14) AFRICA 0,0040 0,0000 0,0000 0,0000 0,00005 0,00034 (13,15,17-13-31-22-10-14-13) YANOMAMI 0,0000 0,0000 0,0000 0,0005 0,00000 0,00005
Tendo em conta que os haplótipos de referência poderiam não ser
específicamente detectados na amostra, foi feito um relaxamento na
busca permitindo o reconhecimento de haplótipos próximos com até dois
passos de distância genética SMM (Tabela 6). O gráfico 1 mostra o efeito
da sobreposição dos haplótipos holandês e português à medida que o
agrupamento se expandiu.
Tabela 6: Freqüência acumulada do haplótipo de referência e distância genética em Pernambuco estimada pelo SMM (Kimura e ohta 1978) .
Stepwise Mutation Model População
0 1 2
Portugal 0,061 0,194 0,340
Holanda 0,008 0,117 0,279
Ameríndios 0,000 0,000 0,004
África 0,004 0,008 0,008
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
154
0,000
0,050
0,100
0,150
0,200
0,250
0,300
0,350
0,400
0 1 2
PORTUGALHOLANDAAFRICANATIVO
Gráfico 1: representação da freqüência acumulada do haplótipo de referência e distância genética em Pernambuco estimada pelo SMM (Kimura e ohta 1978) . Os números no eixo X representam as distâncias, e no eixo Y representam as freqüências.
7.1.2.3. Análise dos haplótipos modais
Os hapótipos modais usados como referência para o prognóstico do
haplogrupo foram calculados a partir dos alelos mais freqüentes de cada
loco de cada população. Uma rotina foi construída para realizar estes
cáculos dinamicamente ao momento em que são inseridos os valores
referentes à freqüência alélica de cada haplogrupo (figura 6). A tabela 7
mostra os haplótipos considerados modais para as populações de
Portugal, Europa e Brasil, destacando as diferenças encontradas no loco
DYS391. Na tabela 8 estão listados os haplótipos modais calculados a
partir do Y-STRCALC para os principais haplogrupos encontrados entre os
descendentes africanos, europeus e indígenas.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
155
Figura 6: Interface de dados das freqüências modais dos haplótipos de referência e fontes bibliográficas . Tabela 7 - Haplótipos modais nas populações de Pernambuco ,Portugal Central, Portugal
Sul e Europa
LOCAL N DH DP DYS 19
DYS 385
DYS 389I
DYS 389II
DYS 390
DYS 391
DYS 392
DYS 393
f
PE 247 0.9994 0.9069 14 11-14 13 29 24 11 13 13 0.0669 PC 206 0.993 0.8592 14 11-14 13 29 24 10 13 13 0.0291 PS 214 0.9960 0.9766 14 11-14 13 29 24 11 13 13 0.0322 PA 63 0.9955 0.7937 14 11-14 13 29 24 10 13 13 0.0159 BRASIL 198 0.998 0.8686 14 11-14 13 29 24 10 13 13 0.0151 EUROPA 4688 0.9972 14 11-14 13 29 24 11 13 13 0.0296 Perrnambuco (PE), Portugal Central (PC), Portugal Sul (PS),BRASIL e EUROPA
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
156
Tabela 8 - Haplótipos modais nas populações de Pernambuco ,Portugal Central, Portugal
Sul e Europa
HAPLOGRUPO
DYS
19
DYS
385
DYS
389I
DYS
389II
DYS
390
DYS
391
DYS
392
DYS
393
E3a 15 16-17 13 30 21 10 11 13 E3b 13 16-18 13 30 24 10 11 13 G 15 14-14 12 29 22 10 11 14 I 14 13-14 12 28 22 10 11 13
I1a 14 13-14 12 28 22 10 11 13 J 14 13-17 13 30 23 10 11 12 N 13 11-13 13 30 22 11 14 14 Q 13 14-17 13 30 24 10 14 13
R1a 15 11-14 13 30 25 10 11 13 R1b 14 11-14 13 29 24 11 13 13
7.1.2.4. Análise dos haplogrupos e prognóstico
No prognóstico dos haplogrupos e também no ponderamento na
construção da árvore filogenética foram usadas as taxas de mutação
médias disponibilizadas no YHRD (tabela 9). O gráfico 2 mostra a curva
de variação das distâncias genéticas em passos (SMM) para o modal, o
qual foi usado como base para estimar o ponto de corte das distâncias
médias no ponto em mudam de haplogupo. Nota-se que os pontos
máximos ocorreram em aproximadamente 2, 4 e 8 poassos do modal. Foi
estimado que a distância média de indeterminação de prognóstico seria de
4 passos. Isto serviu como base para determinação do escore, no qual a
distãncia 0 correponde a 100% de probabilidade e a distância 4
corresponde a 0% (indeterminação) . A tabela 10 mostra os resultados de
prognóstico e os haplogrupos encontrados. O gráfico 3 mostra a curva de
correlação dos resultados do escore obtido por ambos os métodos
testados. O coeficiente de correlação de Pearson foi 0,73. A tabela 11
mostra os dados os resultados obtidos em termos de grupos étnicos para
o estado de Pernambuco.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
157
Tabela 9: Taxa de mutação média usada no cálculo dos prognósticos do
haplogrupo (YHRD)
Loco DYS
19
DYS
385
DYS
389I
DYS
389II
DYS
390
DYS
391
DYS
392
DYS
393
Taxa de
Mutação
Média
(x 10-3)
1.68 2.24 1.87 2.26 2.27 3.51 0.61 0.75
Distâncias SMM
05
10152025303540
1 2 3 4 5 6 7 8 9 10 11 12 13
Nº de Diferenças
Hapl
ótip
os
Gráfico 2: Numero de haplótipos e respectivas distâncias para o modal, usado para determinar a distância média de mudança de haplogrupo. Para os pontos de pico no gráfico (2, 4 e 8) foram verificadso os haplgrupos e a mudança de haplogrupo acontece em média a cada 4 SMM.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
158
Tabela 10: Haplótipos não únicos na população de Pernambuco, comparação com resultados do Ybase, Freqüências, escore e prognóstico segundo Athey (2005) e este estudo (Y-STRCALC).
Athey Y-STRCALC Haplótipo * F Escore Haplogrupo Escore Haplogrupo
(14,11-14,13,29,24,11,13,13) 0 0,061 100 R1b 100 R1b (14,11-14,14,30,24,11,13,13) 0 0,028 79 R1b 76 R1b (14,11-14,13,29,24,11,13,12) 0 0,020 65 R1b 67 R1b (14,11-14,14,30,23,11,13,13) 0 0,016 73 R1b 63 R1b (14,11,14,13,28,24,11,13,13) 0 0,016 74 R1b 89 R1b (14,11-14,13,29,23,11,13,12) 0 0,016 61 R1b 56 R1b (14,11-15,13,29,24,11,13,13) 0 0,016 85 R1b 65 R1b (14,11-14,13,29,24,11,13,14) 0 0,012 77 R1b 67 R1b (14,12-14,13,29,24,11,13,13) 0 0,012 57 R1b 89 R1b (15,11-14,13,29,24,11,13,13) 0 0,012 73 R1b 85 R1b (14,14-14,12,29,23,10,11,12) - 0,012 56 J2 53 J (17,12-12,13,28,23,10,11,13) - 0,012 63 I 41 E3b (14,11-14,13,30,24,11,13,13) 0 0,008 83 R1b 89 R1b (14,11-14,13,29,23,11,13,13) 0 0,008 93 R1b 89 R1b (14,11-14,13,29,24,10,13,13) 0 0,008 93 R1b 93 R1b (14,11-14,13,29,25,11,13,13) 0 0,008 80 R1b 89 R1b (14,11-14,13,30,23,11,13,13) 0 0,008 77 R1b 78 R1b (14,11-14,13,29,23,11,13,14) 0 0,008 36 R1b 56 R1b (14,11-15,13,29,23,11,13,13) 0 0,008 79 R1b 78 R1b (14,11-14,13,29,25,10,13,13) 0 0,008 80 R1b 82 R1b (14,12-14,13,29,24,10,13,13) 0 0,008 69 R1b 82 R1b (15,11-14,13,28,23,11,13,13) 0 0,008 50 R1b 63 R1b (14,11-14,12,28,23,11,14,13) - 0,008 46 Q 31 Q (15,11-13,13,31,24,11,13,13) 1 0,008 38 R1b 63 R1b (14,11-14,12,27,24,12,13,14) 3 0,008 26 R1b 35 R1b (13,13-14,14,30,24,9, 11,13) 0 0,008 49 E3b 57 E3b (15,14-16,11,29,22,10,11,14) 2 0,008 68 G 75 G (14,16-17,13,31,21,11,11,13) 1 0,008 55 E3a 45 E3a (13,16-18,13,30,23,10,11,13) 1 0,008 84 E3b 89 E3b (15,16-18,14,31,21,11,11,13) 2 0,008 70 E3a 43 E3a f = freqüência; Athey (2005); Y-STRCALC = programa de cálculo de prognóstico do haplogrupo; * = diferenças para enquadramento para haplótipos no banco de dados Ybase;
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
159
Correlação Scores
0
20
40
60
80
100
120
0 20 40 60 80 100 120
Score Y-STRCALC
Sco
re W
. Ath
ey
Gráfico 3: Correlação entre os escores encontrados segundo método de Athey (2005) e o algoritmo do progrmam Y-STRCALC. O índice de correlação de Pearson entre os dois resultados foi de 0.73
Tabela 11: - Composição da população de Pernambuco prognosticada pelo programa Y-STRCALC a partir dos haplótipos mínimo e estendido da população total e dos haplótipos apresentados na Tabela 3. Haplogrupos Haplótipo
Mínimoa
Haplótipo
Estendidoab
Haplótipo
Mínimo não únicosc
África E3a 0,093 0,097 0,074
E3b 0,065 0,069 0,043
Europa G 0,081 0,069 0,021
I 0,040 0,053
J 0,085 0,085 0,032
N 0,008 0,012
R1a 0,077 0,069
R1b 0,526 0,526 0,809
Ameríndios Q 0,024 0,02 0,021
Europa 0,818 0,814 0,862
África 0,158 0,166 0,117
Ameríndios 0,024 0,020 0,021
(a) n = 247; (b) Haplótipo mínimo (ISFG) mais os locos DYS447, DYS458 e
DYS464; (c) n = 94
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
160
7.1.2.5. Análise usando o programa Network
As árvores de median-joining construídas foram poderadas usando as
varâncias das freqüências alélicas por loco da população de Pernambuco,
de acorro com os valores calculados e pelas as taxas de mutação média
disponibilizado no YHRD. O resultado é apresentado na figura 7.
Tabela 12: Variâncias calculadas a partir das freqüências alélicas para cada loco do
haplótipo mínimo da amostra da população de Pernambuco usando o Software Microsoft
Excel
Loco DYS
19
DYS
385a
DYS
385b
DYS
389I
DYS
389II
DYS
390
DYS
391
DYS
392
DYS
393
Varância das
freqüências 0,758 4,091 3,532 0,3434 1,000 1,4242 0,336 1,088 0,850
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
161
Figura 7 – Árvore Median-joining das STR’s dos 30 haplótipos mínimos mais comuns
encontrados em Pernambuco e o haplogrupo prognosticado pelo Y-STRCALC
representando 94 indivíduos da amostra, evidenciando a similaridade entre ambas. (A)
Árvore construída usando como critério de poderação a média das taxas de mutação por
loco. (B) Árvore construída usando como critério de poderação a variância de cada loco.
As cores indicam os grupos étnicos prognosticados: Listrado, preto e branco são
africanos, ameríndios e europeus respectivamente. O cículo metade preto representa o
haplótipo com baixo escore de prognóstico (E3a-I) que foi prognosticado diferente nos
dois cálculos apresentados (Athey e Y-STRCALC). O tamanho dos braços são
proporcionais às distâncias genéticas e os cículos são proporcionais às freqüências dos
haplótipos.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
162
7.1.3. Resultados em Alagoas
A partir do método de trabaho aplicado para análise de Haplótipo de
Pernambuco, foi realizada a mesma análise no Y-STRCALC, utilizando os
mesmos parâmetros para o estado de Alagoas, os quais serão
apresentados resumidamente a seguir nas tabelas 13,14 e 15.
Tabela 13: Resultados computados para a amostra selecionada de Alagoas
Haplótipo Mínimo Haplótipo Estendido
Indivíduos da amostra 255 255
Haplótipos 190 230
Diversidade Haplotípica 0.9953 0.9996
Poder de Diferenciação 0.7451 0.9020
Probabilidade Coincidência 0.0047 0.0004
Haplótipo Mínimo Modal : (14,11-14,13,11,24,10,13,13)
Frequência = 0.196
Haplótipo mínimo mais freqüente: (14,11-14,13,11,24,11,13,13)
Freqüência = 0.627
Tabela 14: Freqüência acumulada do haplótipo de referência e distância genética em Alegoas estimada pelo SMM (Kimura e ohta 1978) .
Stepwise Mutation Model População
0 1 2
Portugal 0,063 0,165 0,333
Holanda 0,004 0,109 0,243
Ameríndios 0,000 0,000 0,011
África 0,000 0,000 0,008
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
163
Tabela 15: - Composição da população de Alagoas prognosticada pelo programa Y-STRCALC a partir dos haplótipos mínimo e estendido da população total e dos haplótipos apresentados na Tabela 3. Haplogrupos Haplótipo
Mínimoa
Haplótipo
Estendidoab
Haplótipo
Mínimo não únicosc
África E3a 0,093 0,062 0,000
E3b 0,050 0,090 0,106
Europa G 0,066 0,054 0,063
I 0,054 0,054 0,020
J 0,105 0,125 0,068
N 0,000 0,000 0,000
R1a 0,039 0,019 0,036
R1b 0,572 0,595 0,707
Ameríndios Q 0,027 0,023 0,000
Europa 0,834 0,847 0,894
África 0,142 0,152 0,106
Ameríndios 0,024 0,000 0,000
(a) n = 255; (b) Haplótipo mínimo (ISFG) mais os locos DYS447, DYS458 e
DYS464; (c) n = 101
Estes resultados mostram não haver diferenças significativas entre
Pernambuco e Alagoas na composição étnica masculina. Mostra ainda que
a população de Alagoas reflete o mesmo efeito do fundador verificado em
Pernambuco para o Haplótipo Modal do Atlântico. Uma característica
diferencial para os estados de Pernambuco e Alagoas observável foi a
freqüência do modal de Alagoas ser o dobro da apresenada em
Pernambuco. Embora as freqüências dos AMH estejam muito próximas, a
freqüência do alelo 11 no haplogrupo de referência R1b é cinco vezes
maior que o alelo 10 em Pernambuco enquanto que esta razão cai para
duas vezes em Alagoas.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
164
Estes resultados sugerem que a influência do AMH em Pernambuco foi
maior que em Alagoas.
7.1.4 Perspectivas
Este trabalho faz parte do projeto de criação de um banco de dados
de haplótipos do cromossomo Y para todos os estados do nordeste. Para
isso é necessário que novas amostras da região Nordeste sejam
disponibilizadas. Este é o início de um trabalho de determinação de perfis
haplotípicos com intuito de auxiliar em diversos estudos, sejam estes
históricos, forenses ou antropológicos. A caracterização genética da
população poderá servir de base para o planejamento das políticas
públicas de saúde, uma vez existindo um perfil bemdefinido e confiável
de classificação das populações, com a estratificação dos dados precisa e
consistente. A concretização deste projeto fornecerá informações valiosas
sobre a população desta região. Vários serviços poderão ser desenvolvidos
a partir deste trabalho, vindo desde a simples detecção da ancestralidade
étnica paterna, até as possibilidade de correlação dos microssatélites com
aspectos clínicos, de modo os usuários poderão contemplar obter os dados
de forma combinada a fim de extrair a maior quantidade e qualidade das
informações.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
165
7.1.5 Glossário de Termos tácnicos usados neste trabalho
ALELOS: Formas alternativas de um gene. Para polimorfismos de seqüência os alelos se referem ao nucleotídeo específico (A, T, G, C) encontrado em uma determinada posição no cromossomo. Para polimorfismos de inserção-deleção, dois alelos são possíveis, o alelo maior (L) e o alelo menor (S). Ver também POLIMORFISMO.
AUTOSSOMO: As células humanas contêm 46 cromossomos. Há 22 pares de autossomos, que são herdados dos dois genitores. Os outros dois cromossomos, ditos sexuais, são o cromossomo X e o cromossomo Y.
BASE: ver Nucleotídeo.
CARGA GENÉTICA: a diminuição do valor adaptativo médio de uma população devido à presença de genótipos que têm uma valor adaptativo menor que o máximo da população. Em outras palavras, a carga genética é uma medida de quanto custa (em termos de perda de alelos) a existência de seleção em uma população.
CROMOSSOMO: Estrutura encontrada nos núcleo das células constituído de DNA condensado em associação com proteínas. O genoma humano consiste de um conjunto de 23 cromossomos. Cada um de nós herdou um conjunto do pai e outro da mãe. Cada cromossomo contém uma única molécula de DNA – segmentos deste DNA são os genes.
CROMOSSOMO Y: A espécie humana possui dois cromossomos sexuais, chamados de X e Y. Os homens são XY e as mulheres são XX. O cromossomo Y é responsável pelas características masculinas e contém genes para a formação dos testículos e para a produção de espermatozóides. O cromossomo Y tem herança de pai para filho.
DERIVA GENÉTICA: nome dado à flutuação puramente randômica nas freqüências alélicas de uma população ao longo do tempo, devida a um efeito de amostragem.
DNA: Ácido desoxirribonucléico. O DNA (abreviatura do inglês, Deoxyribonucleic acid) é a molécula que armazena a informação genética e consiste de duas cadeias de nucleotídeos unidas pela interação das bases complementares Adenina e Timina e Citosina e Guanina.
DNA MITOCONDRIAL (mtDNA): Um DNA circular localizado na mitocôndria contendo informação genética diferente daquela encontrada no DNA nuclear. Cada mitocôndria contém múltiplas cópias deste pequeno DNA que tem apenas 16.569 pares de base de comprimento.
ELETROFLUOROGRAMA: O resultado de uma corrida eletroforética em um sequenciador automático fluorescente de DNA que mostra a seqüência de nucleotídeos.
EUCARIOTO: Um organismo cujas células contêm um núcleo com uma membrana nuclear. Todos os seres vivos, com exceção de bactérias, vírus e algumas algas são eucariotos.
MARCADORES GENÉTICOS: Locos polimórficos (que variam em pessoas normais) no DNA que fornecem informações aos geneticistas.
GENOMA: O DNA em um conjunto haplóide (23 cromossomos) humano. Uma célula humana contém dois genomas: um paterno e um materno.
HAPLOGRUPO: Um grupo de linhagens definido por mutações diagnósticas. Os haplogrupos do DNA mitocondrial humano são rotulados de A a Z. Os haplogrupos do cromossomo Y são agrupados por letras (A-R). A freqüência relativa dos haplogrupos varia de população para população. Alguns
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
166
haplogrupos do DNA mitocondrial e do cromossomo Y são específicos de determinadas regiões geográficas.
HAPLÓTIPO: Um subgrupo mais específico de um haplogrupo. Por exemplo, uma seqüência de DNA mitocondrial de um indivíduo específico e seqüências idênticas de DNA mitocondrial de outros indivíduos constituem um haplótipo. Indivíduos com o mesmo haplótipo têm relações genealógicas. Cada haplogrupo é constituído de muitos haplótipos.
INDEL: Mutação causada pela inserção ou deleção de um ou mais nucleotídeos.
LOCO (plural: locos): A posição de um gene ou de um marcador genético em um cromossomo.
MITOCÔNDRIA: Uma organela citoplasmática (fora do núcleo) responsável pela produção de energia na célula.
MUTAÇÃO: O processo de mudança genética na estrutura do genoma, geralmente causado por um erro na duplicação do DNA. Uma mutação pode ser uma troca de uma base por outra em determinada posição, ou uma adição ou deleção de base(s). A mutação pode ter conseqüências deletérias, benéficas ou neutras.
MUTAÇÃO PUNTUAL: Mutação causada pela troca de uma base por outra na seqüência do DNA.
NÚCLEO: A organela que contém o genoma humano, organizado em cromossomos, dentro do invólucro de uma membrana. Observe que o DNA mitocondrial está localizado nas mitocôndrias, fora do núcleo.
NUCLEOTÍDEO: Subunidades informacionais que quando unidas em cadeia constituem o DNA. Existem quatro subunidades diferentes: Adenina (A), Guanina (G), Timina (T) e Citosina (C). A Adenina e Timina se pareiam especificamente, assim como a Guanina e a Citosina. Os nucleotídeos também são chamados de bases.
PCR: Veja REAÇÃO EM CADEIA DA POLIMERASE.
POLIMORFISMO: Uma diferença na seqüência de DNA freqüente entre indivíduos normais ou populações.
POLIMORFISMO DE INSERÇÃO/DELEÇÃO: Polimorfismo criado por uma inserção ou deleção de uma ou mais bases. Ver INDEL.
POLIMORFISMO DE SEQÜÊNCIA: Veja SNP.
POSIÇÃO DE NUCLEOTÍDEO: A posição de um determinado polimorfismo em um genoma, geralmente medida em pares de base.
PROTEINASE: Uma enzima que destrói proteínas.
PURINA: Um tipo de nucleotídeo ou base que faz parte da molécula de DNA. As purinas são a Adenina (A) e a Guanina (G).
PIRIMIDINA: Um tipo de nucleotídeo ou base que faz parte da molécula de DNA. As pirimidinas são a Citosina (C) e a Timina (T).
REAÇÃO EM CADEIA DA POLIMERASE (PCR): Uma técnica poderosa que permite a replicação de um segmento de DNA no tubo de ensaio. O método faz uso de reagentes químicos para duplicar o DNA em um ciclo de temperatura. Vários ciclos podem ser automatizados em um “ciclador térmico” levando a um aumento exponencial do número de moléculas. Com 30 ciclos consegue-se uma amplificação teórica de um bilhão de vezes.
SEQÜÊNCIA DE REFERÊNCIA DE CAMBRIDGE (CRS): A sequência padrão de DNA mitocondrial humano (mtDNA), com a qual todas as outras sequëncias são comparadas. A CRS foi a primeira seqüência de mtDNA completamente estudada no homem e foi publicada em 1981.
SNP: Polimorfismo caracterizado pela troca de uma base por outra na seqüência do DNA.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
167
7.1.5 Dados Suplementares
Tabela 16: - marcadores de mutação do cromossomo Y e respectivos primes (YCC 2002). Mutação Região/STS Tam. (bp) Sítio Mutação Forward Primer Reverse Primer
M2 DYS271 209 168 A->G aggcactggtcagaatgaag aatggaaaatacagctcccc M3 DYS199 241 181 C->T taatcagtctcctcccagca aaaattgtgaatctgaaatttaagg M4 DYS234 273 88 A->G tcctaggttatgattacagagcg acgtcttgtaaacatgacaagg M5 DYS214a 322 73 C->T gggtttatactgacctgccaatgtt ttattgggaactttcagggg M6 DYS198 218 37 T->C cactaccacatttctggttgg cgctgagtccattctttgag M7 DYS253 300 236 C->G actgtgagcgagctgaaaat gcagccttgtgaaccaatta M8 DYS263 267 137 G->T cccacccacttcagtatgaa aggctgacagacaagtccac M9 G10.35a 340 68 C->G gcagcatataaaactttcagg gcttgagcaaagttaggtttt M10 G10.10 343 156 T->C gcattgctataagttacctgc taataaaaattgggtcaccc M11 G10.37 222 44 A->G tctctctgtctgtctctccctcc gagcataaacaagaacttactgagc M12 DYS260a 309 286 G->T actaaaacaccattagaaacaaagg ctgagcaacatagtgacccc M13 G10.06 233 157 G->C tcctaacctggtggtctttc tgagccatgattttatccaac M14 G10.07 287 180 T->C agacggttagatcagttctctg tagataaaagcacattgacacc M15 G10.16 295 304 9 bp insertion acaaatcctgaacaatcgc tgcatgtggttaaaatttcc M16 DYS214b 266 38 C->A tgttatgtcatttgaacccag ccgtgtgttgctgggctgt M17 G10.47ª 333 68 4G->3G ctggtcataacactggaaatc tgaacctacaaatgtgaaact M18 G10.47b 333 62 2 bp insertion ctggtcataacactggaaatc tgaacctacaaatgtgaaactc M19 G10.47c 333 131 T->A ctggtcataacactggaaatc tgaacctacaaatgtgaaactc M20 G10.48 413 118 A->G gattgggtgtcttcagtgct cacacaacaaggcaccat M21 G10.43 415 357 A->T cttttatttctgactacaggg aacagcagatttgagcagg M22 DYS273 327 129 A->G agaagggtctgaaagcaggt gcctactacctggaggctt M23 G10.57ª 327 159 A->G tctctaacttctgtgagccac ggaaaaactaaactctaaatctct M25 B9.008b 340 121 G->C aaagcgagagattcaatccag ttttagcaagttaagtcaccagc M26 B9.005 321 68 G->A ccagtggtaaagttttattacaattt ttcacagtaagcaggcaatcc M27 G10.65 526 398 C->G cggaagtcaaagttatagttactgg cactgctgttctgtctaccaca M28 G10.33n 332 277 T->G gcttacttgggacacaggct agagaagttgtcatacgataatgg M30 G10.66ª 486 132 G->A gaaccagacaatacgaaatagaag tttagcggcttatctcattacc M31 G10.66b 486 71 G->C gaaccagacaatacgaaatagaag tttagcggcttatctcattacc M32 G10.68a 370 166 T->C ttgaaaaaatacagtggaac caagtgtttaaggatacaga M33 G10.68b 370 180 A->C ttgaaaaaatacagtggaac caagtgtttaaggatacaga M34 G10.69 372 131 G->T cacttcacatttgtttttagg agtcattatttagtcattccag M35 G10.72a 513 168 G->C taagcctaaagagcagtcagag agagggagcaatgaggaca M36 G10.82a 436 74 T->G agatcatcccaaaacaatcataa aaggctgaaatcaatccaatctg M37 G10.STS 84 422 203 C->T cagattggattgatttcagcctt agcatacaaaaaaaaaaaactgc M38 G10.73a 337 146 T->G cagtttttagagaataatgtcct ttaaagaaaagaaaagcagatg M39 G10.73a 337 236 C deletion cagtttttagagaataatgtcct ttaaagaaaagaaaagcagatg M42 B9.008a 340 297 A->T aaagcgagagattcaatccag ttttagcaagttaagtcaccagc M43 DYS260b 309 77 A->G actaaaacaccattagaaacaaagg ctgagcaacatagtgacccc M44 G10.87 389 263 G->C ctggcaccttctgatattttgag tgtgatttctatgtgtttgaggac M45 B9.12 352 109 G->A gctggcaagacacttctgag aatatgttcctgacaccttcc M47 G10.82b 436 395 G->A agatcatcccaaaacaatcataa aaggctgaaatcaatccaatctg M48 G10.79n 240 160 A->G aaacaatatgtatgctaattttgct tcaatgtaaatgttagtataaggatg M49 B9.15new a 354 229 T->C cggcaacagtgaggacagt tgcttcaggagatagaggctc M50 B9.15new b 354 175 T->C cggcaacagtgaggacagt tgcttcaggagatagaggctc M51 B9.16 339 33 G->A gagcctctatctcctgaagc tgactgctctgttgcgaca M52 G10.88 534 477 A->C actgtagcatggtcatctagggtg gacgaagcaaacatttcaagagag M54 B9.17 360 164 G->A cctcctctggtctgggttt tgtgtcaggactggttccat M55 B9.28 382 228 T->C cgtaggcgtttgacagcag cctttcttcgtaatcctccc M56 B9.29 399 39 A->T ccagaaactgaagtacaaatgc tctcattgctgcctctcttt M57 G10.85n 326 133 +1bp attgggaggaagtggtttctg gttctgtatcttttccattatttgc M58 G10.57b 327 224 G->A tctctaacttctgtgagccac ggaaaaactaaactctaaatctct M59 B9.15new c 354 179 A->C cggcaacagtgaggacagt tgcttcaggagatagaggctc M60 B9.34 388 242 +1bp gcactggcgttcatcatct atgttcattatggttcaggagg M61 G10.83new a 190 98 C->T attggattgatttcagccttc attttattttctgtgttccttgc M62 DYS260c 309 60 T->C actaaaacaccattagaaacaaagg ctgagcaacatagtgacccc M63 B9.22 308 43 G->A ctcttcccttggttcctattc ttaggcagaagcatccacc M64 B9.t23 325 279 A->G recurrent tatagaccctgactactcaagagaa ggtagccctttccagtctgt M65 B9.t26 436 152 A->T ttctgatgccagcttgttcg gctacgggattaaagtaaccttg M66 B9.41 415 135 A->C ctgtgtaacaccatcaagtgc acatcttctggagacatacttcc M67 B9.36new a 409 377 A->T ccatattctttatactttctacctgc gtcttttcacttgttcgtggac M68 B9.36new b 409 268 A->G ccatattctttatactttctacctgc gtcttttcacttgttcgtggac M69 B9.62a 257 222 T->C ggttatcatagcccactatactttg atctttattccctttgtcttgct
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
168
M70 B9.62b 257 45 A->C ggttatcatagcccactatactttg atctttattccctttgtcttgct M71 B9.6 3b 328 197 C->T ttgaattatagtcccttgcctc gcttcttttctgtgatggctg M72 B9.6 3a 328 157 A->G ttgaattatagtcccttgcctc gcttcttttctgtgatggctg M73 B9.47a 361 260 2bp deletion cagaataataggagaatttttggt attttccttattttctaagcagc M74 B9.50a 385 195 G->A atgctataataactaggtgttgaag aattcagcttttaccacttctgaa M75 B9.51 355 296 G->A gctaacaggagaaataaattacaga tattgaacagaggcatttgtga M76 G10.100a 493 339 T->G tagaagtagcagattgggagagg cctgataaaatgaaaaaaatggtc M77 G10.105 371 129 C->T cttttcttcccttagctgttcc gcaacaatgacaggtcaacc M78 B9.60a 301 197 C->T cttcaggcattattttttttggt atagtgttccttcacctttcctt M81 B9.58a 422 147 C->T acttaatttatagtttcaatccctca ttcatggagatgtctgtatctgg M82 B9.t18 328 179 -2bp ctgtactcctgggtagcctgt aagaacgattgaacacactaactc M83 B9. Alu01 503 120 C->T gggaaaggagttatccagaaa aatgacccatgcttacttagc M85 B9.67a 568 437 C->A aacagaattatcaggaaaaggttt gcaatatacgtttctgcttcca M86 B9.t25a 324 85 T->G tcccattatttgctatatttgct tttctcatttaacttttctgaccc M87 B9.t25b 324 277 T->C tcccattatttgctatatttgct tttctcatttaacttttctgaccc M88 B9.80 314 166 A->G attctagggtcaggcaactagg tgtttgttctattctatggtcttcc M89 B9.94 527 347 C->T agaagcagattgatgtcccact tccagttaggagatcccctca M90 B9.96 331 170 C->G tgatgtttcttcagtctttgagg aagatgaatcctgctaccacc M91 B9.87a 495 368 9T->8 T gagcttggactttaggacgg aaactttaaggcacttctggc M92 B9.G2 470 340 T->C ttgaatttcccagaattttgc ttcagaaactggttttgtgtcc M93 B9.93 504 459 C->T aacaaaacaaaacaaaaatactga ggttcacttgaagatagtttaggtta M94 B9.122 405 227 C->A cacatggagaacagagaaatgc cttgtgaaatgttgtgaaagtgg M95 B9.123 480 172 C->T gagtggaaatcaagatgccaag gggctttctgtaacctggaga M96 G3.05a 440 70 G->C gttgccctctcacagagcac aaggtcactggaaggattgc M97 G3.05b 440 355 T->G gttgccctctcacagagcac aaggtcactggaaggattgc M98 G3.04a 395 158 G->C gaatggggtgttacatggaga cctattatgagagacctgttttcc M99 G3.04b 395 96-98 1 bp deletion gaatggggtgttacatggaga cctattatgagagacctgttttcc M101 A8.05a 460 154 C->T tcacagcagcttcagcaaa cctttttggatcatggttctt M102 B9.101 480 301 G->C aaactgggacacttgtaatgaat gttttttgagtccttgtttattctt M103 B9.117new 463 259 C->T cagtaagtgaactcacacataattcc ccagttttatttcagtttcacagc M105 B9.6-7a 572 478 C->T gggaggcaacctaagaaag aggtgaacgcattctgtcat M106 B9.6-7b 572 411 A->G gggaggcaacctaagaaag aggtgaacgcattctgtcat M107 B9.112n 376 298 A->G caaaagcactcgggttcct ctttactcccacttatgcaacg M108 B9.113n 321 40 T->C agatggagccagcagaaag acacagatgaattgaatgatggt M109 G3.15 312 264 C->T gggtatcaaatgtcttcaacct gggaatttcctgctacttgc M110 B9.86n 389 241 T->C cagggaaggaccgtaaaagg aacctttactgcacatgataaacat M111 G3.19 393 188-189 2bp (TT) deletion aatcttctgcaaagggttcc cagctacaaaacaaaatactggac M112 G3.17a 445 286 G->A actttttccaacagttatttttga tatatttcttgatgatgagaccaat M113 G3. 17b 445 112 A->G actttttccaacagttatttttga tatatttcttgatgatgagaccaat M114 G3.23 434 387 T->C ttaccacacagttgagtagttctaaa caaataaaattggagcggtta M115 G3.22 413 201 C->T agtttacagtcacatcaatttgga tcctttttctaccatatctctgttt
M116.2 G3.25a 429 176 A->C, triallelic aagtatgacttatgaagtacgaagaa attcagttagattttacaatgagca M117 G3.25b 429 142-145 4bp deletion aagtatgacttatgaagtacgaagaa attcagttagattttacaatgagca M118 G3.29 478 109 A->T attctaagtttcacttcctgatcc tagttccctaaattacgctacctc M119 G3.32 330 224 A->C gaatgcttatgaatttcccaga ttcacacaatatacaagatgtattctt M120 B9.87b 495 224 T->C gagcttggactttaggacgg aaactttaaggcacttctggc M121 B9.87c 495 183-187 5 bp deletion gagcttggactttaggacgg aaactttaaggcacttctggc M122 G3.27a 393 73 T->C tggtaaactctacttagttgccttt cagcgaattagattttcttgc M123 G3.27b 393 161 G->A tggtaaactctacttagttgccttt cagcgaattagattttcttgc M124 G3.27c 393 246 C->T tggtaaactctacttagttgccttt cagcgaattagattttcttgc M125 B9.108a 367 301 T->C gccaccctcttatgcctct tcaggagttatgtgaggaccc M126 B9.108b 367 277-280 4 bp deletion gccaccctcttatgcctct tcaggagttatgtgaggaccc M127 G3.30 412 372 C->T tgaaaggaaatcagtgtaagagc tgtaaaggtgactgtagttcagca M128 G3. 17c 445 316-317 -2bp actttttccaacagttatttttga tatatttcttgatgatgagaccaat M129 A8.04 255 221 G->A aatggcttactacaaagaacatttc tacacggtctctaccaaagaaga M131 A8.14n 306 93-101 9 bp deletion cacacccagaatacaataatttt ctttttattctacaagtgtacattttc M132 B9.67b 568 482 G->T aacagaattatcaggaaaaggttt ttttacttgttcgtgtactttcaa M133 A8.08F-newR 211 116 1bp (T) deletion tgaaatggaaatcaataaactcagt ccttttctttttctttaacccttc M134 A8.08newF-R 232 54 -1bp agaatcatcaaacccagaagg tctttggcttctctttgaacag M135 A8.08F-newR 211 150 +1bp tgaaatggaaatcaataaactcagt ccttttctttttctttaacccttc M136 B9.61 339 196 C->T atgtgaagacaacactgtgtgg ttgtggtagtcttagttctcatgg M137 G3.27d 393 289 T->C tggtaaactctacttagttgccttt cagcgaattagattttcttgc M138 A8.17 442 291 C->T aacttccaaaactgtgaaaagatt gattaaagcagccccttcag M139 A8.28a 459 401 5G->4G ttactgataatgccatattgttttg ttctcagacaccaatggtcct M141 A8.30a 424 51 T->A catcttaaaatacatttcatagcttt gcttactattaggtctagcatcct M143 B9.50b 385 246 G->T atgctataataactaggtgttgaag aattcagcttttaccacttctgaa M144 B9.99 452 342 T->C agcacaagggtcacattgag aggacaaggctttttgttgtt M145 A8.05b 208 166 G->A ttcagcaagagtaagcaagagg cctttttggatcatggttctt M146 G3.04d 395 141 A->C gaatggggtgttacatggaga cctattatgagagacctgttttcc M147 G3.35 439 116 1 bp insertion (extra T) gtattctggggcaattttagg ttgatacaagaggttattttaagca
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
169
M148 B9.67c 568 314 A->G aacagaattatcaggaaaaggttt ttttacttgttcgtgtactttcaa M149 B9.67d 568 469 G->A aacagaattatcaggaaaaggttt ttttacttgttcgtgtactttcaa M150 B9.18 289 146 C->T gcagtggagatgaagtgagac cctactttccccctcttctg M151 B9.58b 422 209 G->A acttaatttatagtttcaatccctca ttcatggagatgtctgtatctgg M152 B9.13 287 101 C->T aagctattttggtttcctttca gccttgtgtgggtatgattg M153 A8.28c 459 427 T->A ttactgataatgccatattgttttg ttctcagacaccaatggtcct M154 B9.58c 422 252 T->C acttaatttatagtttcaatccctca ttcatggagatgtctgtatctgg M155 G10.57c 327 251 G->A tctctaacttctgtgagccac ggaaaaactaaactctaaatctct M156 A8.05c 208 147 A->G ttcagcaagagtaagcaagagg cctttttggatcatggttctt M157 B9.12b 352 176 A->C gctggcaagacacttctga aatatgttcctgacaccttcc M158 A8.08F-newR 211 77 G->A tgaaatggaaatcaataaactcagt ccttttctttttctttaacccttc M159 G10. 83new b 190 89 A->C attggattgatttcagccttc attttattttctgtgttccttgc M160 B9.47b 361 251 A->C cagaataataggagaatttttggt attttccttattttctaagcagc M161 A8.05d 460 111 C->A tcacagcagcttcagcaaa cctttttggatcatggttctt M163 G10.35b 340 168 A->C gcagcatataaaactttcagg aaaacctaactttgctcaagc M164 G10.100b 493 329 T->C tagaagtagcagattgggagagg cctgataaaatgaaaaaaatggtc M165 B9.008c 340 132 A->G aaagcgagagattcaatccag ttttagcaagttaagtcaccagc M166 G3.27e 393 53 G->A tggtaaactctacttagttgccttt cagcgaattagattttcttgc M168 DFFRY Ex01B site a 473 371 C->T agtttgaggtagaatactgtttgct aatctcataggtctctgactgttc M169 DFFRY Ex01B siteb 473 97 T->C agtttgaggtagaatactgtttgct ccagggccccgagggactctt M170 DFFRY Exon08 405 327 A->C tgcttcacacaaatgcgttt ccaattactttcaacatttaagacc M171 DFFRY Ex01B sitec 473 440 G->C agtttgaggtagaatactgtttgct ccagggccccgagggactctt M172 DFFRY Ex45 345 197 T->G ttgaagttacttttataatctaatgctt ataatttattactttacagtcacagtgg M173 DBY Ex08 417 191 A->C aagaaatgttgaactgaaagttgat aggtgtatctggcatccgtta M174 DffryEx38 348 219 T->C acatctcagatcgttgtttggt aaaaagccatgcaattacctg M175 UTY1 exon 07 444 84-88 -5bp ttgagcaagaaaaatagtaccca ctccattcttaactatctcaggga M178 G10.72b 514 220 T->C taagcctaaagagcagtcagag cagagggagcaatgaggaca M179 Dffry exon 07 426 316 C->T attatgcagaattaagatgaccag agacaggttcacatcactaatgg M180 Dffry exon 11 447 402 T->C acactactgtgctgtaatttgtgaa tggtaagatttctctacatgaacag M181 Dffry exon 12 294 130 T->C gcttttatttattctacttttgttttt aacaatgaccaattctttttcat M182 Dffry exon 13 364 38 C->T tattcaaagacttaaagcagtggtta ggaatcatcttgtaactaagttatcct M183 Dffry exon 19 427 324 A->C actgggtaaatatgactatgattgag ttccttttaacctattattactttcc M184 Dffry exon 23 305 62 G->A cactttattttagtctgtgtctttttc aaacttagtaacatctatttctcctct M185 Dffry exon 27 430 89 C->T ggagtacctatcactgaatgtgc gtcattcatttctgcttggaac M186 Dffry exon 30 365 62 1 bp deletion ttgcatttactgttctagagagttct gtacttactttaatgagattagcac M188 Dffry exon 31 401 185 C->T gtattccctttgaagaaacatattg aagtccatcacaagttaattttttc M189 Dffry exon 34 378 191 G->T actctcagcttatgtttgtcattg gcttttggtacactctgctttt M190 Dffry exon 44 346 73 A->G ctctgtcacaagtaaggaaatgat ctgtccattggtagccttttt M191 DBY exon 2 429 342 T->G ttgcatttgtcatggttggt gccaggataattttttgtattttc M192 DBY STS 02 457 202 C->T catgggctgctgacatttt aaatccttttggtttgtttgttt M193 DBY STS 03a 426 56 4 bp insertion gcctggatgaggaagtgag gccttctccatttttgacct M194 DBY STS 03b 426 101 T->C gcctggatgaggaagtgag gccttctccatttttgacct M195 DBY STS 06 515 430 A->G ccactcagctttcctcaggt cgttcgtttagtcataagatcg M196 DBY STS 07 445 330 C->G ttagacaacttactactttgatgtcct taaacattacatgagaaattgctgt M197 DBY exon 07 408 105 T->C tcagacagtttagttggttacttcc aagacacatcctcagctaatcttt M198 DBY STS 08 444 45 C->T tgaggtggaatgtatcagtatacc tgatttcaaggatttgttagtctt M199 DBY STS 08 444 404 1 bp insertion (extra G) tgaggtggaatgtatcagtatacc tgatttcaaggatttgttagtctt M200 DBY STS 09 429 318 G->A ggcttacacttgcagactttg ggagaaatgtacaagagtctaaacc M201 DBY exon 11&12 326 136 G->T tatgcatttgttgagtatatgtc gttctgaatgaaagttcaaacg M202 DBY exon 16 392 259 T->G ggaattgcagggtttaagc gccacccacctgtaatcc M203 UTY1 exon01 503 248 G->C gagtgccaagctgaggatga 2 sequnces for this primer M204 UTY1 ex 02 = Intron 1 286 234 T->G aaggggcgaagtattccag tgaagaggagtctgttagcctg M205 UTY Intron 2a 541 78 T->A gtataatactgtggttggaaagca ccaaactatgtgataataaatggg M206 UTY Intron 2b 541 31 T->G gtataatactgtggttggaaagca ccaaactatgtgataataaatggg M207 UTY1 ex03 = Intron 3a 423 79 A->G aggaaaaatcagaagtatccctg caaaattcaccaagaatccttg M208 UTY1 = Intron 3b 507 352 C->T ataaatacaaaatcacctgatggat ttaaacagcgaaattactaacaaaa M209 UTY1 = Intron 3c 550 471 A->G cactgtcttccacaatggttg aggtgattttgtatttatcttccc M210 UTY1 = Intron 3d 550 461 A->T cactgtcttccacaatggttg aggtgattttgtatttatcttccc M211 UTY1 = Intron 4a 538 381 C->T caattcactatttgaggaatcca gaagtctctgatttatttggcag M212 UTY1 ex05a 409 234 C->A tataatcaagttaccaattactggc ttttgtaacattgaatggcaaa M213 UTY1 ex05b=Intron 4c 409 290 T->C tataatcaagttaccaattactggc ttttgtaacattgaatggcaaa M214 UTY1 ex12 = Intron 11 460 404 T->C tattacaaaatatggaaacaaggc gaaatgccacttcactccag M215 UTY1 exon 14 386 163 A->G gtaaaactcagatatatacatcccatg aaaaaaaaagaatcactatcttaacg M216 UTY1 intron 18 557 54 C->T ctcaaccagtttttatgaagctag gagagtctgaactaatgtgtcttgt M217 UTY1 intron 17 461 219 A->C gcttatttttagtctctcttccat acctgttgaatgttacatttcttt M218 UTY1 intron 16 482 380 C->T ttgtgagtttttttccatcaatc tttattgacgatggtattagaagag M219 UTY1 intron 16 482 232 T->C ttgtgagtttttttccatcaatc tttattgacgatggtattagaagag M220 UTY1 intron 16 482 367 A->G ttgtgagtttttttccatcaatc tttattgacgatggtattagaagag M221 UTY1 intron 18 324 200 G->A gggaaatgtgaaaggaaaata ttaaacttttataacactgacagaaac M223 A8.05e 208 67 C->T ttcagcaagagtaagcaagagg cctttttggatcatggttctt
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
170
M224 B9.60b 301 193 T->C cttcaggcattattttttttggt atagtgttccttcacctttcctt YAP DYS287 599(Alu+) Alu- ->Alu+ caggggaagataaagaaata aagccactattagacaacct P1 DYS287 858 230 C->T aggagaagtgggagtaaga actgctaaaaggggatggat P2 DYS287 536 153 C->T gatgcaaatgagaaagaact ctaaaaactggagggagaaa P3 DYS287 536 397 G->A gatgcaaatgagaaagaact ctaaaaactggagggagaaa P4 DYS7 160 108 C->T tggtctcaggaagtttttgc gagagtcataatgccgacgt P5 DYS389 624 36 C->T aacccctgccacaaatacat tctggaacccctggagagatc P6 DYS265 122 83 G->C ctgaaggtggccatttctta ccatctggctcaatggttag P7 DYS194 327 60 T->C atgcctacaaaatgacac ccaacaatatgtcacaatctc P8 DYS190 661 461 G->A agggagatgagaagacac cgtggcatcttgtcatgtct P9 486 Ya5 475 319 C->A tgtggtaagtgtagtttcaa tctggactggaaacataa P14 DYS188 741 361 C->T tttcagagtttctctact tttttttttaatatgaggg P15 DYS221 191 138 C->T agagagttttctaacagggcg tgggaatcacttttgcaact P16 DYS211 169 105 A->T aggctccatctgtagcacac taaccttatagaccaaccccg P18 DYS194 697 208 C->T tggatctgattcacaggtag ccaacaatatgtcacaatctc P19 DYS190 661 478 T->G agggagatgagaagacac cgtggcatcttgtcatgtct P20 DYS194 697 158 C deletion tggatctgattcacaggtag ccaacaatatgtcacaatctc P21 DYS194 819 759 C->A tagccctttgtcttgattacag gtgctaggtccaaatatg P22 DYS257 369 169 G/A->A gcttcaggaacttgtcgg aggacccaattattgcacac P25 DYS194 327 79 C->A atgcctacaaaatgacac ccaacaatatgtcacaatctc P27 DYS257 369 115 G->A gcttcaggaacttgtcgg aggacccaattattgcacac P28 16E4 Ya5 519 410 C->T gaagcaatactctgaaaagt tttggagggacattattctc P29 ARSDP 684 534 A->C ggtgggctgtttgaaaaaga agccaaataccagtcgtcac P31 ARSDP 703 126 T->C taaggctgcgtgttccctat gcactgtcactgtggatgtt P33 DYS194 819 718 T->C tagccctttgtcttgattacag gtgctaggtccaaatatg P36 ARSDP 637 217 G->A tgaaggacagtaagtacaca taagtccattgatctacaga P37 ARSDP 447 135 T->C cgtctatggccttgaaga tccgaaaatgcagacttt P44 ARSDP 703 134 G->A taaggctgcgtgttccctat gcactgtcactgtggatgtt
SRY4064 SRY 612 258 G->A gcattttgttacccttctcaac tggcaagacttacgagatttc SRY9138 SRY 1,067 363 C->T tttaacattgacaggaccag gacaaccaagaagaggaacc
SRY10831a SRY 536 135 A->G ccacaacctctttcatc aataaaaatcccgtaaaata SRY10831b SRY 536 135 G->A ccacaacctctttcatc aataaaaatcccgtaaaata
92R7 92R7 722 504 G->A gacccgctgtagacctgact gcctatctacttcagtgatttct Tat RBF5 112 28 T->C gactctgagtgtagacttgtga gaaggtgccgtaaaagtgtgaa Apt 50f2/E 850 419 G->A tggattgcattcaacttcacttac ctgagttcaaatgctcgggtctc
LINE1 DYZ3 ~140 (LINE+) LINE- -> LINE+ gcacaatgtgcacatgtacccta tgatgtgtgcattcatctcatatat MSY2 DYS440 499/400 4->3 ctggctttggggacgtagta ctgcgctttatgagcatacg
SRY-2627 SRY 1242 299 C->T aggtcttttttgccttctta atgcacggtttcttttga SRY+465 SRY 148 52 C->T gccgaagaattgcagtttgc gttgatgggcggtaagtggc
47z DXYS5Y 381 291 G->C tgagtcaatgtcaatgaatc tagttacgccttg(g)cataac MEH1 50f2/E 687 330 C->G gtgcatctattgactctttcatgg caccaccatgtcccacagatttg MEH2 PCDHY intron 4 938 880 G->T attcataatatttgattcagaacag taccatgaaaattcataatccaca
50f2(P) 50f2/E 687 547 G->C caccaccatgtcccacagatttg gtgcatctattgactctttcatgg 12f2 DYS11 88 present->absent ctgactgatcaaaatgcttacagatc ggatcccttccttacaccttatac
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
171
Tabela 17: Tempo estimado de expansão e origens das linhagens das Y-STR no Norte da África
TMRCA [em 1000 anos] (95% IC) Linhagens Mutação Nº Cromossomos 30 Anos/ Geração 25 anos/ Geração
All 390 13.95 (8.08–24.67) 25.87 (20.47–30.99) E M145 237 9.70 (5.98–14.33) 19.66 (15.31–21.12) E3a M2 8 2.96 (1.83–4.25) 5.06 (3.01–7.61) E1 M33 3 3.38 (2.11–5.25) 5.6 (2.79–9.38) E3b1 M78 38 4.48 (3.01–6.16) 8.10 (5.42–10.71) E3b M35 165 8.26 (5.18–12.37) 14.33 (9.32–19.19) E3b2 M81 226 4.15 (2.84–5.97) 6.90 (5.91–8.19) F M89 152 9.77 (6.47–14..84) 19.05 (15.30–22.61) J 12f2 93 6.78 (4.38–11.10) 7.86 (6.63–9.13) J2 M172 14 3.67 (2.50–5.25) 4.98 (4.10–6.06) R M173 27 4.44 (3.04–6.62) 10.24 (8.54–12.94) I M170 2 2.83 (1.68–4.32) 5.29 (3.19–9.16) K M9 38 7.10 (4.38–11.1) 15.09 (11.56–18.16)
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
172
Tabela 18: Tempo estimado de expansão e origens das linhagens das Y-STR
Haplogrupo Linhagem Estado Ancestral Idade Origem
geográfica E* M96 / P29 SRY4064 37,000 E3* M96 / P29
SRY4064 DYS391p /P2 27,800
E3a* P2 M2 /P1 18,800 E3a1 M2 / P1 M116b E3b DYS391p M35 M215 29,200 E3b* P2 M35 (xvii) 14,900 E3b1* M35 M78 East Africa M215 25,500 Africa E3b1a M78 M148 E3b1b M215 M81 North Africa E3b1c M215 M123 E3b1c1 M35 M123 M34 Near East E3b1d M215 M35 M281 E3b1e M215 M35 V6 Eastern Africa E3b2* M35 M81 8,600 E3b2a M81 M107 E3b2b M81 M165 E3b3* M35 M215 M123 15,800 E3b3a* M123 M34 E3b3a1 M34 M136 E3b4 M35 M215 M281 18,800 F M168 / P9 M89 M213 P14 6,400/9000 Zagros (xvi) G* M89 M213 M201 9,500 Middle East 17,000 Middle East G1 M201 P20 G2* M201 P15 G2a* P15 P16 G2a1 P16 P17 P18 H M52 / M69 H1* M82 H1a M82 M36 H1b M82 M97 H1c M39 M138 I* M89/P14 M213 M170 / P19 22,000 Balkans 30,000 Central Asia 24,000 I1* M170/P19 P38 I1a* P38 P30 France I1a1 P38 P30 P40 I1a2 P39 P30 M21 I1a3 P38 P30 M72 I1b* P38 P37b (xiv) Balkans I1b1 P37b P41b I1b2* P37b M26 Iberia/France I1b2 9,000 Sardinia I1b2a M26 M161 I1c France J* M89 P14 M213 12f2.1 4,000/9,500
(vi) Zagros
14,800 19,300 Middle East 31,700 J1 12f2.1 M62 8,400 J2* 12f2.1 M172 3,600 Middle East 18,500
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
173
7/9,800 Fertile Crescent J2a M172 M47 840/2,160 J2b M172 M68 6,300 J2c M172 M137 J2d M172 M158 J2e* M172 M12 3,000 J2e1* M12 M102 S. Balkans 7,900 J2e1a M102 M99 J2f* M172 M67 4,700 11,600 J2f1 M67 M92 5,000 Aegean 8,800 J2f2 M67 M163/166 K* M9 K1 SRY9138 K2 M70 K3 M147 K4 M230 L M11 M20 M22
M61
M M4 M5 M106 M186 M189 P35
N LLY22g O M175 M214 P* M45 M74 40,000 S. Siberia P* P27 92R7 Q 92R7 P27 P36 MEH2 7,600 Altai R* 92R7 P27 M207 R1* M173 30,000 Central Asia S & W Asia R1a* SRY10831.2 3,700/6,300
(viii)
R1a1 7,500 R1a1* SRY10831.2 M17 15,000 Indo-Iranian R1a1a M17 M56 R1a1b M17 M157 R1a1c M17 M64.2 / M87 R1b* M173 P25 R1b1 P25 M18 R1b2 P25 M73 R1b3 M269 West Asia R1b3a M269 M37 R1b3b M269 M65 R1b3c M269 M126 R1b3d M269 M153 R1b3e M269 M160 R1b3f M269 SRY2627 R1b3g M269 M222 R2 M207 M124
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
174
7.1.6 Referências do Anexo
Alves C, Gusmão L, Barbosa J, Amorim A (2003) Evaluating the informative power of
Y-STRs: a comparative study using European and new African haplotype data..
Forensic Science International 134:126–133
Arroyo-Pardo E, Gusmâo L, Lopez-Parra AM , Baeza C, Mesa MS, Amorim A (2004)
Genetic variability of 16 Y-chromosome STRs in a sample from Equatorial
Guinea (Central Africa). Forensic Sci Int 149(1):109-13
Athey TW (2005) Haplogroup Prediction from Y-STR Values Using an Allele-
Frequency Approach. Journal of Genetic Genealogy 1:1-7
Bandelt H-J, Forster P, Röhl A (1999) Median-joining networks for inferring
intraspecific phylogenies. Mol Biol Evol 16:37-48
Barros JEXS, Maciel EMBB, Gomes AV,Martins AM, Silva RS, Maurício-da-
Silva L (2006) Human Y-chromosome STR haplotype diversity in
Pernambuco, Northeast Brazil( SUBMITTED TO FORENSIC SCIENCE
INTERNATIONAL)
Bortolini MC, Salzano FM, Thomas MG, Stuart S, Nasanen SPK , Bau CHD, Hutz
MH, Layrisse Z, Petzl-Erler ML, Tsuneto LT, Hill K, Hurtado AM, Castro-de-
Guerra D, Torres MM, Groot H ,Michalski R, Nymadawa P, Bedoya G,
Bradman N, Labuda D , Ruiz-Linares A (2003), Y-Chromosome Evidence for
Differing Ancient Demographic Histories in the Americas Am. J. Hum. Genet.
73:524–539
Carvalho M, Anjos MJ, Andrade L, Lopes V, Santos MV, Gamero JJ, Real FC, Vide
MC (2003) Ychromosome STR haplotypes in two population samples:Azores
Islands and Central Portugal. Forensic Science International 134 :29–35
Corach D, Filgueira-Risso L, Marino M, Penacino G, Sala A, Routine Y-STR typing
in forensic casework. Forensic Sci. Int. 15 (2001) 131-135
de Knijff P, Kayser M, Caglià A, Corach D, Fretwell N, Gehrig C, Graziosi F,
Heidorn G, Herrmann S, Herzog B, Hidding M, Honda K, Jobling M, ,Krawczak
M., Leim K, Meuser S, Meyer E,. Oesterreich W, Pandya A, Parson W,
Penacino G, Perez-Lezaun A,·Piccinini A, Prinz M,.Schmitt C, Schneider PM,
Szibor R, Teifel-Greding J, Weichhold G, Roewer L (1997) Chromosome Y
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
175
microsatellites: population genetic and evolutionary aspects. Int J Legal Med
110 : 134–140
Geada H, Baptista J, Felgueiras M, Silva VS, Cruz C,Lucas I, Ribeiro T, Espinheira
R (2004) Portuguese population study with 16 Y-STR loci. International
Congress Series 1261:319– 321
Gusmão L, Sanchez-Diz P, Alves C, Beleza S, Lopes A, Carracedo A, Amorim A
(2003) Grouping of Y-STR haplotypes discloses European geographic clines.
Forensic Science International 134 :172–179
Nei M. Molecular evolutionary genetics. New York: Columbia University
Press, 1987.
Rodrigues-Delfin L, Santos SEB, Zago MA (1997) Diversity of the human Y
chromosome of South American Amerindians: a comparison with Blacks, hites,
and Japanese from Brazil. Ann. Hum. Genet.:61, 439±448
Zegura SL, Karafet TM, Zhivotovsky LA, Hammer MF (2004) High-Resolution SNPs
and Microsatellite Haplotypes Point to a Single Recent Entry of Native American
Y Chromosomes into the Americas. Mol. Biol. Evol. 21(1):164–175.
Bosch E, Calafell F, Santos FR, Perez-Lezaun A, Comas D, Benchemsi N,
Tyler-Smith C, Bertranpetit J (1999) Variation in Short Tandem
Repeats Is Deeply Structured by Genetic Background on the Human Y
Chromosome Am. J. Hum. Genet. 65:1623–1638, 1999
Kayser M and Sajantila A (2001) Mutations at Y-STR loci: implications
forpaternity testing and forensic analysis. Forensic Sci Int 118: 116-
121.
Kayser M, Caglià V, Corach D, Fretwell N, Gehrig C, Graziosi G, Heidorn F,
Herrmann S, Herzog B, Hidding M, Honda K, Jobling M, Krawczak M, Leim K,
Meuser S, Meyer E, Oesterreich W, Pandya A, Parson W, Penacino G, Perez-
Lezaun A, Piccinini A, Prinz M, Schmitt C, Schneider PM, Szibor R, Teifel-
Greding J, ·Weichhold G, de Knijff P, Roewer L (1997) Evaluation of Y-
chromosomal STRs: a multicenter study. Int J Legal Med (1997) 110 : 125–133
Kimura M and Ohta T (1978) Stepwise mutation model and distribution of allelic
frequencies in a finite population. Proc. Nati. Acad. Scd. USA 75(6) 2868-4
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
176
Miller SA, Dykes DD and Olesky HF (1988) A simple salting-out procedure
for extract DNA from human nucleated cells. Nucleic Acids Res.
16:1255.
Pereira L, Gusmão L, Alves C, Amorim A, Prata MJ (2002) Bantu and European Y-
lineages in Sub-Saharan Africa. Ann. Hum. Genet: 66, 369±378
Roewer L, Krawczak M, Willuweit S, Nagy M, Alves C, Amorim A, Anslinger K,
Augustin C , Betz A, Bosh E, Caglia A, Carracedo A, Corach D, Dekairelle AF,
Dobosz T, Dupuy BM, Furedi S, Gehring C, Gusmao L, Henke J, Henke L,
Hidding M, Hohoff C, Hoste B, Jobling MA, Kargel HJ, de Knijff P, Lessig R,
Liebeherr E, Lorente M, Martinez-Jarreta B, Nievas P, Nowak M, Parson W,
Pascali VL, Penacino G, Ploski R, Rolf B, Sala A, Schmidt U, Schmitt C,
Schneider PM., Szibor R, Teifel-Greding J., Kayser M (2001) Online reference
database of European Y-chromosomal short tandem repeat (STR) haplotypes.
Forensic Sci. Int. 118 :106-113.
Roewer L, Croucher PJ, Willuweit S, Lu TT, Kayser M, Lessig R, Knijff P, Jobling MA,
Tyler-Smith C, Krawczak M (2005) Signature of recent historical events in the
European Y-chromosomal STR haplotype distribution. Hum Genet (2005) 116:
279–291
Schneider S, Guillaume L, Excoffier L (2006) Arlequin Ver. 3.01, An integrated
software package for population genetic data analysis. University of Berne
Computational and Molecular Population Genetics Lab
http://cmpg.unibe.ch/software/arlequin3.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
177
7.3. Anexo 2 IINNSSTTRRUUÇÇÕÕEESS PPAARRAA AAUUTTOORREESS
RREEVVIISSTTAA JJOOUURRNNAALL OOFF FFOORREENNSSIICC SSCCIIEENNCCEESS
ISSN 0022-1198
PA, U.S.A.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
178
INFORMATION FOR AUTHORS The Journal of Forensic Sciences publishes original material in the following categories: Paper --- full-length research report Technical Note --- description of a technical aspect of a field or issue, report on a procedure or method, or work on validation of techniques or methodologies. Usually shorter than papers. Brief Communication --- very brief technical communication, shorter than a typical Technical Note. Brief
Communications should generally be no more than 4-5 manuscript pages, including references, figures and
tables.
Case Report --- usually brief description or analysis of an unusual case or a small series or cases Review --- full-length paper reviewing the state of the art or the published literature in a particular area of sufficiently broad interest to the readership Letter --- usually a discussion of a previously published item, or commentary on the Journal or an issue of interest to the Academy. Publication of letters is at the sole discretion of the Editor. Letters commenting on previously published items are ordinarily shared with the original authors to afford them an opportunity to respond to the commentary. Response to Letter --- usually author(s) response to a Letter commenting on their published work Editorial or Invited Commentary --- commentary, invited by the Editor Book Review --- review of a book or other publication of interest to the forensic sciences or closely related fields. Special Communication --- occasional communication of an editorial or newsworthy nature For the Record --- a summary of population genetic data published under the condition that the complete data set be available at a readily accessible world wide web site. Papers, technical notes, brief communications, case reports and reviews are subjected to full peer review. Previously published material is not acceptable. Material from previously published work must be quoted exactly and adequately referenced. Use of previously published figures, tables, etc., require the written permission of the copyright owner of the prior work. Manuscripts submitted as papers, technical notes, brief communications, case reports, or reviews, are accepted for consideration with the understanding that their essential contents, including text, tables and figures, have neither been previously published nor concurrently submitted to another journal. Work must not be submitted to another journal unless and until the Journal of Forensic Sciences formally declines to publish it. The above-discussed prohibitions do not apply to abstracts or summaries published in connection with professional meetings, or press reports resulting from formal or oral presentation. The Journal of Forensic Sciences reserves the right of first consideration for publication of any work accepted for presentation at an annual meeting of the American Academy of Forensic Sciences (AAFS), and authors must not submit their work elsewhere for a period of six months following the annual meeting at which the work was presented. If a manuscript has not been accepted for publication, or is not under active consideration by the Journal, at the end of the six-month period, the interest of the Journal in the manuscript automatically terminates. Upon acceptance for publication, manuscripts become the copyright property of the American Society for Testing and Materials (ASTM). Author(s) of manuscripts accepted for publication must complete a Paper Submittal Form that will be furnished by the Editor along with notification of full acceptance. This form must be signed by all authors, indicating complete understanding of the work and concurrence in it. Signature(s) of authors also serve to transfer copyright in the work to ASTM. It is understood that for certain work by employees of U.S. or foreign governments, whose manuscripts have been prepared as part of their official duties, copyright is not available in the United States. Acceptance of manuscripts submitted for publication is the responsibility of the Publications Committee of the AAFS, Editorial Board of the Journal of Forensic Sciences, and the editor, and occurs only after review of the manuscript in accordance with current operating rules. Review of submitted manuscripts may ordinarily be expected to be completed within 90 days. Authors, members of the Editorial Board, invited guest reviewers, the editor, and others involved in the publication process are expected to conform to established policies concerning confidentiality, conflicts of interest, release of accepted manuscripts prior to actual publication, and the protection of anonymity of patients
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
179
and victims [J Forensic Sci 1995; 40 (3-6), 1996; 41(1-6), 1997; 42(1-6), 1998;43(1-6), and in selected issues thereafter; and see below]. The Journal requires that authors submitting manuscripts for peer review (papers, technical notes, case reports, brief communications) have obtained required approval(s) for submission from authorized principals and/or internal reviews in their laboratories and/or organizations. Submission of Manuscripts The Journal of Forensic Sciences requirements for manuscripts are generally in accordance with the Uniform Requirements for Manuscripts Submitted to Biomedical Journals. These requirements may be found published in one of the following: (1) J Forensic Sci 1995 Mar-Nov;40(2-6), 1996 41, 1997; 42, 1998;43 and selected issues thereafter; (2) JAMA 1993 May 5;269:2282-6; (3) N Engl J Med 1991 Feb 7;324(6):424-8; (4) Can Med Assoc J 1991;144(6):673-80; (5) BMJ 1991 Feb 9;302(6772):338-41; or (6) Med J Aust 1991;155(3):197-200. The following integrates the Uniform Requirements for Manuscripts Submitted to Biomedical Journals as they apply to the Journal of Forensic Sciences with the specific requirements of this journal. Manuscripts must be written in English. An original and three complete copies should be sent to: Dr. Michael A. Peat, Editor, Journal of Forensic Sciences, 6700 Woodlands Parkway, Suite 230-308, The Woodlands, TX 77381,USA. An original and three complete copies of all tables and figures (including photographs and line drawings) must be included. Type the manuscript double-spaced, including title page, abstract, text, acknowledgments, references, tables, and legends. Each manuscript component should begin on a new page, in the following sequence: title page, abstract and key words, text, acknowledgments, references, tables (each table complete with title and footnotes on a separate page), and legends for illustrations. Illustrations must be good-quality, unmounted glossy prints, usually 127 x 173 mm (5 x 7 in.), but no larger than 203 x 254 mm (8 x 10 in.). Submit an original and three complete copies of manuscripts and illustrations in a heavy-paper envelope. The submitted manuscript should be accompanied by a cover letter, as described below, and permissions to reproduce previously published material or to use illustrations that may identify human subjects. Authors should keep copies of everything submitted. Manuscript submissions should be accompanied by a cover letter specifying the name, full mailing address and telephone/fax numbers and e-mail of the person who will act as corresponding author, and the category (paper, technical note, etc.) under which the item is submitted. The editor reserves the right to publish the manuscript in a category different from the one specified by the author(s) at submission. The cover letter should also specify, if applicable, information about possible duplicate publication problems, financial or other relationships that could give rise to conflicts of interest, and any other information the editor may need to make an informed decision in accordance with established policies and practices. The manuscript must be accompanied by copies of any permissions to reproduce published material, to reproduce illustrations or report sensitive personal information about identifiable persons, or to name persons for their contributions. If color artwork is submitted, and if the authors believe color art is necessary to the presentation of their work, the cover letter should indicate that one or more authors or their institutions are prepared to pay the substantial costs associated with color art reproduction. Only the corresponding author need sign the cover letter. The corresponding author's signature on the submission cover letter signifies: a) that all required approvals and/or reviews have been obtained from authorized principals in the laboratory and/or organization in which the work was performed The cover letter can also explicitly state that such approvals have been obtained. The editor reserves the right to request explicit, written approval of authorized laboratory and/or organization principals before the work is accepted by the journal for peer review. and b) that all authors have read the manuscript, concur in its contents, are qualified for authorship by the criteria stated in these requirements, and believe the submission to represent honest work. The editor reserves the right to request explicit, written clarification of individual author’s roles, their concurrence in the manuscript content, or any other issue that must be resolved prior to accepting the manuscript for peer review. The Journal does not accept submissions of manuscripts from third parties without the explicit, written permission of the author(s). PRIOR AND DUPLICATE PUBLICATION
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
180
As noted, this journal does not consider for publication a paper on work that has already been reported in a published paper or that is described in a paper submitted or accepted for publication elsewhere in print or in electronic media. This policy does not preclude consideration of a paper that has been rejected by another journal or of a complete report that follows publication of a preliminary report, usually in the form of an abstract. Nor does it prevent consideration of a paper that has been presented at a scientific meeting if not published in full in a proceedings or similar publication. Press reports of the meeting will not usually be considered as breaches of this rule, but such reports should not be amplified by additional data or copies of tables and illustrations. When submitting a paper, an author should always make a full statement to the editor about all submissions and previous reports might be regarded as prior or duplicate publication of the same or very similar work. Copies of such material should be included with the submitted paper to help the editor decide how to deal with the matter. Multiple publication-that is, the publication more than once of the same study, irrespective of whether the wording is the same-is rarely justified. Secondary publication in another language is one possible justification, providing the following conditions are met: (1) the editors of both journals concerned are fully informed; the editor concerned with secondary publication should have a photocopy, reprint, or manuscript of the primary version; (2) The priority of the primary publication is by a publication interval of at least 2 weeks; (3) The paper for secondary publication is written for a different group of readers and is not simply a translated version of the primary paper; an abbreviated version will often be sufficient; (4) The secondary version reflects faithfully the data and interpretations of the primary version; (5) A footnote on the title page of the secondary version informs readers, peers, and documenting agencies that the paper was edited, and is being published, for a national audience in parallel with a primary version based on the same data and interpretations. A suitable footnote might read as follows: "This article is based on a study first reported in the [title of journal, with full reference]." Multiple publication other than as defined above is unacceptable. If authors violate this rule, they may expect appropriate editorial action to be taken. PREPARATION OF MANUSCRIPT Type or print out the manuscript on white bond paper, 216 x 279 mm (8 1/2 X 11 in.), or ISO A4 (212 X 297 mm), with margins of at least 25 mm (1 in.). Type or print on only one side of the paper. Use doublespacing throughout, including title page, abstract, text, acknowledgments, references, individual tables, and legends. umber pages consecutively, beginning with the title page. Put the page number in the upper right-hand corner of each page. Title Page The title page should carry: (a) the title of the article, which should be concise but informative; (b) first name, middle initial, and last name of each author, with highest academic degree(s); (c) institutional affiliation, name of department(s) and/or institution(s) to which the work should be attributed; (d) official disclaimers, if any; (e) name and address of author responsible for correspondence about the manuscript; (f) source(s) of support in the form of grants, equipment, drugs, or all of these; (g) a statement of where the work has been presented orally or in poster form at professional meetings; and (h) a short running header of no more than 40 characters (count letters and spaces) placed near the bottom of the title page and identified. Institutional affiliations of authors should be numbered footnotes to the individual’s name and highest academic degree. If an author’s present address differs fro m the institution in which the work was done, and is attributed, indicate a “Present address” for that author. A footnote to the title of the manuscript (generally designated by a superscript *) should give statements about where the work has been presented at professional meetings, and should identify any sources of support. Authorship All persons designated as authors should qualify for authorship. The order of authorship should be a joint decision of the coauthors. Each author should have participated sufficiently in the work to take public responsibility for the content. Authorship credit should be based only on substantial contributions to a) conception and design, or analysis interpretation of data; and to b) drafting the article or revising it critically for important intellectual content; and on c) final approval of the version to be published. Conditions a), b), and c) must all be met. Participation solely in the acquisition of funding or the collection of data does not justify authorship. General supervision of the research group is not sufficient for authorship. Any part of an article critical to its main conclusions must be the responsibility of at least one author.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
181
Editors may require authors to justify the assignment of authorship. Increasingly, multi-center trials or work are attributed to a corporate author. All members of the group who are named as authors, either in the authorship position below the title or in a footnote, should fully meet the criteria for authorship as defined in the Uniform Requirements. Group members who do not meet these criteria should be listed, with their permission, under Acknowledgments or in an appendix (see Acknowledgments). Abstract and Key Words The second page should carry an abstract of no more than 150 words. This journal uses unstructured abstracts. The abstract should briefly state the purposes of the study or investigation, basic procedures (selection of study subjects or laboratory animals; observational and analytical methods), main findings (give specific data and their statistical significance, if possible), and the principal conclusions. Emphasize new and important aspects of the study or observations. Below the abstract provide, and identify as such, 3 to 10 key words or short phrases that will assist indexers in cross-indexing the article and may be published with the abstract. Use terms from the medical subject headings (MeSH) list of Index Medicus; if suitable MeSH terms are not yet available for recently introduced terms, present terms may be used. The first key word is forensic science; the second and subsequent words should assist abstracters in properly categorizing the work so that it will be found in journal article data bases by interested researchers. Frequently, the second key word represents a subfield of forensic science, e.g. forensic anthropology, forensic pathology, or DNA typing. In manuscripts on DNA typing, every locus involved in the study should be listed as a separate key word. Do not use abbreviations for key words, e.g., polymerase chain reaction, not PCR; gas chromatography-mass spectrometry, not GCMS. Text The text of observational and experimental articles is usually-but not necessarily-divided into sections with headings. This journal does not use an “Introduction” heading. The introductory text begins on the first text page. Other typical headings include Methods (or Materials and Methods), Results, and Discussion. Long articles may need subheadings within the sections to clarify their content, especially the Results and Discussion sections. Other types of articles such as case reports or reviews are likely to need different headings and subheadings. Generally, avoid overuse of subheadings, especially in the Methods section. Introduction In this journal, the text component of the manuscript begins with an introduction, but we do not use the “Introduction” heading. State the purpose of the article. Summarize the rationale for the study or observation. Give only strictly pertinent references, and do not review referenced articles extensively. Do not include data or conclusions from the work being reported. Methods Describe your selection of the observational or experimental subjects (patients or laboratory animals, including controls) clearly. Identify the methods, apparatus (manufacturer's name and address in parentheses), and procedures in sufficient detail to allow other workers to reproduce the results. Give references to established methods, including statistical methods (see below); provide references and brief descriptions for methods, that have been published but are not well known; describe new or substantially modified methods, give reasons for using them, and evaluate their limitations. Identify precisely all drugs and chemicals used, including generic name(s), dose(s), and route(s) of administration. Generally avoid the overuse of subheadings in the Methods section. Describe the methods and materials in narrative style, not in the style of a laboratory procedure handout. Ethics When reporting experiments on human subjects, indicate whether the procedures followed were in accordance with the ethical standards of the responsible committee on human experimentation (institutional or regional) or with the Helsinki Declaration of 1975, as revised in 1983. Do not use patient's names, initials, or hospital numbers, especially in illustrative material. When reporting experiments on animals, indicate whether the institution's or the National Research Council's guide for, or any national law on, the care and use of laboratory animals was followed. Statistics Describe statistical methods with enough detail to enable a knowledgeable reader with access to the original data to verify the reported results. When possible, quantify findings and present them with appropriate indicators of measurement error or uncertainty (such as confidence intervals). Avoid sole reliance on statistical hypothesis testing, such as the use of P values, which fails to convey important quantitative information. Discuss eligibility of experimental subjects. Give details about randomization. Describe the methods for and success of any blinding of observations. Report treatment complications. Give numbers of observations. Report losses to observation (such as dropouts from a clinical trial). References for study design and statistical methods should be to standard works (with pages stated) when possible rather than to papers in which the designs or methods were originally reported. Specify any general-use computer programs used. Put a general description of methods in the Methods section. When data are summarized in the Results section, specify the statistical methods used to analyze them. Restrict tables and figures to those needed to explain the argument of the paper and to assess its support. Use graphs as an alternative to tables with many entries; do not duplicate data in graphs and tables.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
182
Avoid non-technical uses of technical terms in statistics, such as "random" (which implies a randomizing device), "normal," "significant," "correlations," and "sample." Define statistical terms, abbreviations, and most symbols. Results Present your results in logical sequence in the text, tables, and illustrations. Do not repeat in the text all the data in the tables or illustrations; emphasize or summarize only important observations. Discussion Emphasize the new and important aspects of the study and the conclusions that follow from them. Do not repeat in detail data or other material given in the Introduction or the Results section. Include in the Discussion section the implications of the findings and their limitations, including implications for future research. Relate the observations to other relevant studies. Link the conclusions with the goals of the study but avoid unqualified statements and conclusions not completely supported by your data. Avoid claiming priority and alluding to work that has not been completed. State new hypotheses when warranted, but clearly label them as such. Recommendations, when appropriate, may be included. In shorter manuscripts, such as those intended to be Technical Notes or Brief Communications, the Results and Discussion sections should be combined. Acknowledgments The Acknowledgements section immediately precedes the Reference list. Here, specify contributions that need acknowledging but do not justify authorship, such as general support by a department chair or acknowledgments of technical help. Persons who have contributed intellectually to the paper but whose contributions do not justify authorship may be named and their function or contribution described---for example, "scientific adviser," "critical review of study proposal," "data collection," or "participation in clinical trial." Such persons must have given their permission to be named. Authors are responsible for obtaining written permission from persons acknowledged by name, because readers may infer their endorsement of the data and conclusions. Technical help should be acknowledged in a paragraph separate from those acknowledging other contributions. Acknowledgements of financial support should appear as footnotes to the title of the paper on the Title Page. References The heading of the reference list should be "References," and it should contain only published or in-press references cited by number in the test. Published abstracts (duly noted as being abstracts), printed manufacturers' protocols or instructions, and world wide web site URLs may be validly cited as references. Personal communications and submitted manuscripts are not valid references. Personal communications should be cited in the text, in parentheses, at the appropriate location. Number references consecutively in the order in which they are first mentioned in the text. Identify references in tables, and legends by Arabic numerals. References cited only in tables or legends should be numbered in accordance with a sequence established by the first identification in the text of the particular table or figure. Within the text, tables, or figures, cite references by Arabic numeral in parentheses. Within the reference list, number the references 1., 2., 3., etc. References in the reference list should be in accord with Uniform Requirements … style of the examples given below. This style is based with slight modifications on the formats used by the U.S. National Library of Medicine in Index Medicus. The titles of journals should be abbreviated according to the style used in Index Medicus. Consult List of Journals Indexed in Index Medicus, published annually as a separate publication by the library and as a list in the January issue of Index Medicus. The references must be verified by the author(s) against the original documents. Examples of correct forms of references are given below. Articles in Journals 1) Standard journal article (List all authors, but if the number exceeds six, give six followed by et al.) You CH, Lee KY, Chey RY, Menguy R. Electrogastrographic study of patients with unexplained nausea, bloating and vomiting. Gastroenterology 1980 Aug;79(2):311-4. As an option, if a journal carries continuous pagination throughout a volume, the month and issue number may be omitted. You CH, Lee KY, Chey RY, Menguy R. Electrogastrographic study of patients with unexplained nausea, bloating and vomiting. Gastroenterology 1980;79:311-4. Goate AM, Haynes AR, Owen MJ, Farrall M, James LA, Lai LY et al. Predisposing locus for Alzheimer's disease on chromosome 21. Lancet 1989;1:352-5.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
183
2) Organization as author The Royal Marsden Hospital Bone-Marrow Transplantation Team. Failure of syngeneic bone-marrow graft without preconditioning in post-hepatitis marrow aplasia. Lancet 1977;2:742-4. 3) No author given Coffee drinking and cancer of the pancreas [editorial]. BMJ 1981;283:628. 4) Article not in English Massone L, Borghi S, Pestarino A, Piccini R, Gambini G. Localisations palmaires purpuriques de la dermatite herpetiforme. Ann Dermatol Venereol 1987;114:1545-7. 5) Volume with supplement Magni F, Rossoni G, Berti F. BN-52021 protects guinea-pig from heart anaphylaxis. Pharmacol Res Commun 1988;20 Suppl 5:75-8. 6) Issue with supplement Gardos G, Cole JO, Haskell D, Marby D, Paine SS, Moore R. The natural history of tardive dyskinesia. J Clin Psychopharmacol 1988;8(4 Suppl):31S-37S. 7) Volume with part Hanly C. Metaphysics and innateness: a psychoanalytic perspective. Int J Psychoanal 1988;69(Pt 3):389- 99. 8) Issue with part Edwards L, Meyskens F, Levine N. Effect of oral isotretinoin on dysplastic nevi. J Am Acad Dermatol 1989;20(2 Pt 1):257-60. 9) Issue with no volume Baumeister AA. Origins and control of stereotyped movements. Monogr Am Assoc Ment Defic 1978;(3):353-84. 10) No issue or volume Danoek K. Skiing in and through the history of medicine. Nord Medicinhist Arsb 1982;86-100. 11) Pagination in roman numerals Ronne Y. Ansvarsfallen Blodtransfusion till fel patient. Vardfacket 1989;13:XXXVI-XXVII. 12) Type of article indicated as needed Spargo PM, Manners JM. DDAVP and open heart surgery [letter]. Anaesthesia 1989;44:363-4. 13) Article containing retraction Shishido A. Retraction notice. Effect of platinum compounds on murine lymphocyte mitogenesis [Retraction of Alsabti EA, Ghalib ON, Salem MN. In: Jpn J Med Sci Biol 1979;32:53-65]. Jpn J Med Sci Biol 1980;33:235-7. 14) Article retracted Alsabti EA, Ghalib ON, Sale MN. Effect of platinum compounds on murine lymphocyte mitogenesis [Retracted by Shishido A. In: Jpn J Med Sci Biol 1980;33:235-7]. Jpn J Med Sci Biol 1979;32:53-65. 15) Article containing comment Piccoli A, Bossatti A. Early steroid therapy in IgA neuropathy: still an open question [comment] Nephron 1989;51:289-91. Comment on: Nephron 1988;48:12-7. 16) Article commented on Kobayashi Y, Fujii K, Hiki Y, Tateno S, Kurokawa A, Kamiyama M. Steroid therapy in IgA neuropathy: a retrospective study in heavy proteinuric cases [see comments]. Nephron 1988;48:12-7. Comment in: Nephron 1989;51:289-91. 17) Article with published erratum Schofield A. The CAGE questionnaire and psychological health [published erratum appears in Br J Addict 1989;84:701]. Br J Addict 1988;83;761-4. Books and Other Monographs 18) Personal author(s) Colson JH, Armour WJ. Sports injuries and their treatment. 2nd rev. ed. London: S. Paul, 1986 19) Editor(s), compiler as author Diener HC, Wilkinson M, editors. Drug-induced headache. New York: Springer-Verlag, 1988 20) Organization as author and publisher Virginia Law Foundation. The medical and legal implications of AIDS. Charlottesville: The Foundation, 1987.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
184
21) Chapters in a book Weinstein L, Swartz MN. Pathologic properties of invading microorganisms. In: Sodeman WA Jr, Sodeman WA, editors. Pathologic physiology: mechanisms of disease. Philadelphia: Saunders, 1974;457- 72. 22) Conference proceedings Vivian VL, editor. Child abuse and neglect: a medical community response. Proceedings of the First AMA National Conference on Child Abuse and Neglect; 1984 Mar 30-31; Chicago. Chicago: American Medical Association, 1985. 23) Conference paper Harley NH. Comparing radon daughter dosimetric and risk models. In: Gammage RB, Kaye SV, editors. Indoor air and human health. Proceedings of the Seventh Life Sciences Symposium; 1984 Oct 29-31; Knoxville (TN). Chelsea (Ml): Lewis, 1985;69-78. 24) Scientific or technical report Akutsu T. Total heart replacement device. Bethesda (MD): National Institutes of Health, National Heart and Lung Institute; 1974 Apr. Report No.: NIH-NHLI-691 218514. 25) Dissertation Youssef NM. School adjustment of children with congenital heart disease [dissertation]. Pittsburgh (PA): Univ. of Pittsburgh, 1988. 26) Patent Harred JF, Knight AR, McIntyre JS, inventors. Dow Chemical Company, assignee. Epoxidation process. US patent 3,654,317. 972 Apr 4. Other Published Material 27) Newspaper article Rensberger B, Specter B. CFCs may be destroyed by natural process. The Washington Post 1989 Aug 7; Sect. A:2 (col. 5). 28) Audiovisual AIDS epidemic: the physician's role [videorecording]. Cleveland (OH): Academy of Medicine of Cleveland, 1987. 29) Computer file Renal system [computer program]. MS-DOS version. Edwardsville (KS): MediSim, 1988. 30) World Wide Web address or URL http://www.uocf.edu/pharmacy/depts/drugdose/barbitutuates/index.html 31) Legal material Toxic Substances Control Act: Hearing on S. 776 Before the Subcomm. on the Environment of the Senate Comm. on Commerce. 94th Cong., 1st Sess. 343 (1975). 32) Map Scotland [topographic map]. Washington: National Geographic Society (US), 1981. 33) Book of the Bible Ruth 3:1-18. The Holy Bible. Authorized King James version. New York: Oxford Univ. Press, 1972. 34) Dictionary and similar references Ectasia. Dorland's illustrated medical dictionary. 27th ed. Philadelphia: Saunders, 1988;527. 35) Classical material The Winter's Tale: act 5, scene 1, lines 13-16. The complete works of William Shakespeare. London: Rex, 1973. Unpublished Material 36) In press Lillywhite HD, Donald JA. Pulmonary blood flow regulation aquatic snake. Science. In press. Additional Information and Reprint Requests A section of the manuscript, immediately following the reference list, entitled Addition information and reprint requests:, should include the full name, title, and mailing address of the corresponding author. If reprints will not be available from the author(s), entitle this section: Additional Information - Reprints Not Available from Author.
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
185
Tables Type or print out each table double-spaced on a separate sheet. Do not submit tables as photographs. Number tables with Arabic numerals consecutively in the order of their first citation in the text and supply a brief title for each. Give each column a short or abbreviated heading. Place explanatory matter in footnotes, not in the heading. Explain in footnotes all nonstandard abbreviations that are used in each table. For footnotes use the following symbols, in this sequence: *,†,‡,§,((,¶,**,††,‡‡. Identify statistical measures of variations such as standard deviation and standard error of the mean. Do not use internal horizontal and vertical rules. Be sure each table is cited in the text. If you use data from another published or unpublished source, obtain permission and acknowledge fully. The use of too many tables in relation to the length of the text may produce difficulties in the layout of pages. The editor, upon accepting a paper, may recommend or even require as a condition of acceptance, that additional tables containing important backup data too extensive to publish be deposited with an archival service, such as the National Auxiliary Publication Service in the United States, or be made available by the authors, or be available at a web site. In that event an appropriate statement will be added to the text. Submit such tables for consideration with the paper. Illustrations (Figures) Submit an original and three complete sets of figures. Figures should be professionally drawn and photographed; freehand or typewritten lettering is unacceptable. Instead of original drawings, roentgenograms, and other material, send sharp, glossy, black-and-white photographic prints, usually 127 x 173 mm (5 x 7 in.), but no larger than 203 x 254 mm (8 x 10 in.). Letters, numbers, and symbols should beclear and even throughout, and of sufficient size that when reduced for publication each item will still be legible. Xerox copies of photographs and dot-matrix printer generated figures (including spectra, chromatograms, etc.) are not acceptable. Titles and detailed explanations belong in the legends for illustrations, not on the illustrations themselves. Each figure should have a label pasted on its back indicating the number of the figure, author's name, and top of the figure. Do not write on the back of figures or scratch or mar them by using paper clips. Do not bend figures or mount them on cardboard. Photomicrographs must have internal scale markers. Symbols, arrows, or letters used in the photomicrographs should contrast with the background. If photographs of persons are used, either the subjects must not be identifiable or their pictures must be accompanied by written permission to use the photograph. Figures should be numbered consecutively (in Arabic numerals) according to the order in which they have been first cited in the text. If a figure has been published, acknowledge the original source and submit written permission from the copyright holder to reproduce the material. Permission is required irrespective of authorship or publisher, except for documents in the public domain. This journal does not routinely publis h color photographs or other color artwork. If a color photograph (or other color artwork) is considered absolutely essential to the published presentation of the work, authors must be prepared to pay the substantial costs associated with color art reproduction and printing. The editor can provide authors with estimates of these costs in advance upon request. As a general rule, the editor will keep original figures and photographs in the manuscript file during revision(s). Artwork is typically sent back to authors only if it requires modification. If figures are added or deleted during the review / revision cycle(s), authors should clearly indicate to the editor what changes were made, and any changes to the figure numbering scheme. It is never a good idea to supply the editor with only one publication-quality set of figures and/or photographs. There is always a chance that these items can be lost in the mail. Legends for Illustrations Type or print out legends for illustrations double-spaced, starting on a separate page, with Arabic numerals corresponding to the illustrations. When symbols, arrows, numbers, or letters are used to identify parts of the illustrations, identify and explain each one clearly in the legend. Explain the internal scale and identify the method of staining in photomicrographs. UNITS OF MEASUREMENT Measurements of length, height, weight, and volume should be reported in metric units (meter, kilogram, or liter or their decimal multiples. Temperatures should be given in degrees Celsius. Blood pressures should be given in millimeters of mercury. All hematologic and clinical chemistry measurements should be reported in the metric system in terms of the International System of Units (SI). In some types of manuscripts (e.g. engineering), the use of non-metric units is permitted if they are the norm in that field or professional area. ABBREVIATIONS AND SYMBOLS Terms and nomenclature in all disciplines should be in accordance with the current standards and lists approved or adopted by appropriate national or international committees or organizations, such as the International
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
186
Anatomical Nomenclature Committee, I.U.P.A.C., I.U.B., the Enzyme Commission, the Committee on International Standardization of Gene Nomenclature (ISGN), etc. Use only standard abbreviations. Generally, avoid abbreviations in the title, abstract and key words. The full term for which an abbreviation stands should precede its first use in text unless it is a standard unit of measurement. Liter(s) is abbreviated L, not l. Micro should be abbreviated with (, not u. LETTERS TO THE EDITOR Submit Letters to the Editor in three copies. Letters concerning a previously published item should be entitled "Commentary On ... full title of published item ... J Forensic Sci ... citation ..." The citation should follow Uniform Requirements … style. Letters concerning other matters should begin with a brief descriptive title. The salutation "Sir:" should follow the title and precede the body of the letter. Responses to Letters should be entitled “Author’s Response.” The salutation "Sir:" should follow the title and precede the body of the letter. The name(s) and affiliation(s) of the writer(s) should appear at the end of Letters and Replies. SUBMISSION OF MANUSCRIPT COPY ON DISKETTE Do not submit manuscripts on diskettes initially. At a subsequent stage of the editorial and peer-review process, or following final acceptance, corresponding authors will be instructed to supply a disk (at their option) to the journal editor or to the ASTM editor. Manuscripts on disk are helpful to the copy editors, and we encourage authors to submit them at the appropriate time. The electronic version of the manuscript must correspond exactly with the finally accepted version of the paper manuscript. Diskette versions of Letters, Replies, or other items that are unlikely to require changes, may be submitted with the initial hard copy. REPRINTS Authors will have the opportunity to order reprints of their published work directly from ASTM, the publisher, after notification of full acceptance. The order form is generally included with the final page proofs that are sent to authors for approval prior to actual publication. Corresponding authors should attend to this matter during the publication process if they want reprints. It is generally difficult to supply reprints at a later time. POLICIES OF THE JOURNAL OF FORENSIC SCIENCES Confidentiality (adapted from the ICMJE Statement on Confidentiality) Manuscripts should be reviewed with due respect for authors' confidentiality. In submitting their manuscripts for review, authors entrust editors with the results of their scientific labor and creative effort, upon which their reputation and career may depend. Authors' rights may be violated by disclosure or by revelation of the confidential details of the review of their manuscript. Reviewers also have rights to confidentiality, which must be respected by the editor. Confidentiality may have to be breached if there are allegations of fraud or dishonesty but otherwise must be honored. The editor should not disclose information about manuscripts, including their receipt, their content, their status in the review process, their criticism by reviewers, or their ultimate fate. Such information should be provided only to authors themselves and reviewers. The editor makes clear to reviewers that manuscripts sent for review are privileged communications and are the private property of the authors. Therefore, reviewers and other people involved in the editorial process should respect the authors' rights by not publicly discussing the authors' work or appropriating their ideas before the manuscript is published. Reviewers are not allowed to make copies of the manuscript for their files and are prohibited from sharing it with others, except with the permission of the editor. The editor will not keep copies of rejected manuscripts. Reviewers’ identities are confidential, and will not be revealed to authors or to anyone else. Reviewers' comments may be shared with other reviewers of the same manuscript. Conflicts of Interest (adapted from the ICMJE Statement on Conflict of Interest) A conflict of interest for a given manuscript exists when a participant in the peer-review and publication process--author, reviewer, or editor--has ties to activities that could inappropriately influence his/her judgment, whether or not judgment is in fact affected. Financial relationships with industry (such as employment, consultancies, stock ownership, honoraria or expert testimony), either directly or through immediate family, are generally considered the most important conflicts of interest. However, conflicts can occur for other reasons, such as personal relationships, academic or research competition, and intellectual passion. Public trust in the peer-review process and the credibility of published work depend in part on how well conflict of interest is handled during writing, peer review, and editorial decision making. Bias can often be identified and eliminated by careful attention to the scientific methods and conclusions of the work. Financial relationships and their effects are less easily detected than other types of conflicts of interest. Participants in peer review should
Martins, A.M. Análise Genético-Histórica de Haplótipos e ...
187
disclose their conflicting interests, and the information should be made available so that others can judge their effects for themselves. Authors are responsible for recognizing and disclosing financial or other conflicts of interest that might bias their work when they submit a manuscript or letter. They should acknowledge in the manuscript all financial support for the work and other financial or personal connections to the work. Submission of manuscripts or commentary primarily for the purpose of bolstering an author’s position as an expert witness in legal proceedings is not acceptable. Reviewers should disclose to the editor any conflicts of interest that could bias their opinions of the manuscript, and they should disqualify themselves from specific manuscripts if they believe it to appropriate. The editor must be made aware of conflicts of interest to interpret the reviews and judge whether the reviewer should be disqualified. Reviewers must not use knowledge of the work gained during the review process, before publication of the work, to further their own interests. The editor should have no personal financial involvement in any of the issues that he/she may be called upon to judge. Published manuscripts and letters should include a description of all financial support and any conflict of interest that, in the editor's judgment, readers should know about. Protection of the Anonymity of Patients / Victims Detailed descriptions or photographs of individual patients or victims are sometimes central to documentation in a published item. Every effort must be made to protect the anonymity of such patients or victims and their families. Masking of the eyes in photographs may not be adequate protection. Changing data about a patient or victim is never an acceptable method of protecting anonymity. It is recognized that cases or situations forming the basis of items submitted to the Journal may be matters of public record as a result of public court proceedings, news reports, etc. For purposes of publication in the journal, however, emphasis should be placed on medical and/or scientific aspects and information that should form the basis for publication. No information that might violate the privacy of people should be included unless it can be justified as absolutely necessary to the medical and/or scientific presentation. Release of Full Text of Accepted Manuscripts Prior to Publication Requests for the release of accepted papers, technical notes, brief communications, or case reports prior to their actual publication are occasionally made by the media or by attorneys involved in courtroom proceedings. The full release of accepted, but as yet unpublished, peer-reviewed items by authors is not permitted, except by permission of the editor and the publisher. "Full release" means a complete copy of the manuscript, or any other type of reproduction of the complete work including all data. This prohibition does not, and is not intended to, apply to short summaries (even in the form or brief news releases), or brief abstracts for or from meeting presentations. Requests for the pre-publication release of accepted items will be carefully considered, and generally honored for legitimate reasons in accordance with the procedure specified below. Authors must obtain the permission of the editor and of ASTM, and must provide the editor with a legitimate reason for early release. Requests should be made in writing to the editor, and provide the reasons for the request. If the approvals of the editor and of ASTM are forthcoming, ASTM will produce, for a one-time fee (approximately the same as the cost of reprints), the copies that are to be released. Because many manuscripts go through several iterations of modification, correction, and revision, this procedure helps insure that the actually accepted version of the work, as it will appear in print, is released.