ANÁLISE GENÉTICO-HISTÓRICA DE HAPLÓTIPOS … · freqüentes por loco), freqüências relativas e absolutas e impressão das freqüências alélicas. 141 . 8 Figura 4: Interface

PROGRAMA DE PÓS-GRADUAÇÃO EM GENÉTICA UUNNIIVVEERRSSIIDDAADDEE FFEEDDEERRAALL DDEE PPEERRNNAAMMBBUUCCOO

CCEENNTTRROO DDEE CCIIÊÊNNCCIIAASS BBIIOOLLÓÓGGIICCAASS DDEEPPAARRTTAAMMEENNTTOO DDEE GGEENNÉÉTTIICCAA

AANNÁÁLLIISSEE GGEENNÉÉTTIICCOO--HHIISSTTÓÓRRIICCAA

DDEE HHAAPPLLÓÓTTIIPPOOSS EE

HHAAPPLLOOGGRRUUPPOOSS DDOO

CCRROOMMOOSSSSOOMMOO YY HHUUMMAANNOO

NNOO NNOORRDDEESSTTEE BBRRAASSIILLEEIIRROO

AALLEEXXAANNDDRREE MMAAGGAALLHHÃÃEESS MMAARRTTIINNSS

Recife, PE Março, 2007

AALLEEXXAANNDDRREE MMAAGGAALLHHÃÃEESS MMAARRTTIINNSS

AANNÁÁLLIISSEE GGEENNÉÉTTIICCOO--HHIISSTTÓÓRRIICCAA

DDEE HHAAPPLLÓÓTTIIPPOOSS DDOO

CCRROOMMOOSSSSOOMMOO YY HHUUMMAANNOO

NNOO NNOORRDDEESSTTEE BBRRAASSIILLEEIIRROO,,

Dissertação apresentada ao Programa de

Pós-Graduação em Genética da

Universidade Federal de Pernambuco,

como parte dos requisitos necessários para a

obtenção do grau de Mestre em Genética.

Orientador: Prof. Dr. Luiz Maurício da

Silva, Depto. de Genética, Centro de

Ciências Biológicas, UFPE.

Recife, PE Março, 2007

Martins, Alexandre Magalhães

Análise genético-histórica de haplótipos e haplogrupos do cromossomo Y humano no nordeste brasileiro / Alexandre Magalhães Martins. – Recife: O Autor, 2007. 187 folhas : il., fig., tab., graf.

Dissertação (mestrado) – Universidade Federal de Pernambuco. CCB. Genética, 2007.

Inclui bibliografia e anexo.

1. Genética de populações 2. Polimorfismo do cromossomo Y – Nordeste brasileiro 3. Freqüência de Haplótipos – Análise de mutação I. Título. 575.17 CDU (2.ed.) UFPE 576.58 CDD (22.ed.) CCB – 2007-087

Aos meus pais

ADALGUACY e EDNA

e aos meus filhos

THIAGO, ISAAC, MATHEUS e SARA,

dedico.

AAGGRRAADDEECCIIMMEENNTTOOSS

Ao professor Dr. Luiz Mauricio pela orientação, companheirismo e

pelo constante estímulo à busca do conhecimento;

Ao professor Dr. Valdir de Queiroz Balbino, pelo inestimável apoio, e

pela amizade;

À professora Dr(a). Rosilda Silva, sempre disponível, me apoiando

nos momentos de necessidade;

Aos colegas do Laboratório de Genética Molecular Humana da

UFPE pela amizade e apoio.

Aos docentes do Programa de Pós-graduação em Genética da UFPE

que contribuiram para a minha formação;

De maneira especial aos colegas Mestres Jemima Eline Xavier da

Silva Barros e Dalmo Almeida de Azevedo que disponibilizaram as

informações para que este trabalho pudesse ser realizado.

A Deus...

Muito Obrigado!

4

SSUUMMÁÁRRIIOO 11 -- IINNTTRROODDUUÇÇÃÃOO ..................................................................................................................... 16 22 -- RREEVVIISSÃÃOO BBIIBBLLIIOOGGRRÁÁFFIICCAA ................................................................................................. 19

2.1 Estudos Genéticos nas Populações do Nordeste do Brasil..................... 19 2.2 Perfil da População do Estado de Pernambuco .......................................... 22

2.2.1 O Estado de Pernambuco............................................................................ 22 2.2.2 A mistura genética entre povos ............................................................... 23 2.2.3 As origens da população de Pernambuco............................................. 25

2.2.3.1 – Os Ameríndios ..................................................................................... 25 2.2.3.2 – Os Europeus ......................................................................................... 28 2.2.3.3 – Os Africanos ......................................................................................... 30

2.3 Organização do Genoma Humano............................................................... 33 2.3.1 - DNA Singular ou de Cópia Única ...................................................... 34 2.3.2 - DNA repetitivo disperso ....................................................................... 34 2.3.3 - DNA altamente repetitivo ou Satélite............................................ 35 2.3.4 - Famílias de DNA repetitivo e marcadores genéticos ................ 35

2.3.5 – A heranca uniparental do cromossomo Y e das mitocôndrias . 38 2.3.6 - O Cromossomo Y ........................................................................................ 40 2.3.7 Mutação em microssatélites ...................................................................... 43

2.4 Haplogrupos e Haplótipos do cromossomo Y.............................................. 46 2.4.1 Características determinantes .................................................................. 46 2.4.2 Relações entre Haplótipos e Haplogrupos............................................ 56

2.4.2.1 - Agrupamento de haplótipos ........................................................... 56 2.4.2.2 - Haplótipo modal .................................................................................. 57 2.4.2.3 Haplogrupos, Povos e Línguas.......................................................... 57 2.4.2.4 Prognóstico de Haplogrupo a partir de Haplótipos ................... 60 2.4.2.5 Os principais haplogrupos .................................................................. 62

2.5 Estimativas de origem e TMRCA dos haplótipos........................................ 66 2.5.1 Coalescência .................................................................................................... 66 2.5.2 Árvores de genes e a coalescência ......................................................... 67 2.5.3 Modelos de coalescência com mutação................................................. 70 2.5.4 Tempo para o mais recente ancestral comum (TMRCA)................ 71 2.5.5 Árvores filogenéticas baseadas em Y-STR........................................... 72

2.6 Considerações Finais ............................................................................................ 77 33 –– RREEFFEERRÊÊNNCCIIAASS BBIIBBLLIIOOGGRRÁÁFFIICCAASS ..................................................................................... 79 4 - Artigo ............................................................................................................................... 94 5 – Conclusões.................................................................................................................. 130 6 - Abstract ........................................................................................................................ 131 7 - Anexos .......................................................................................................................... 132

7.1. Anexo 1 Informações Complemenares ...................................................... 133 7.3. Anexo 2 Instruções para elaboração do manuscrito ............................ 177

5

LLIISSTTAA DDEE FFIIGGUURRAASS

Figura Página

Figura 1.Estado de Pernambuco e as suas cinco mesorregiões econômico-sociais.

23

Figura 2. Rota migratória dos ameríndios caracterizados pela mutação M3, que os classifica como pertencentes ao haplogrupo Q3

27

Figura 3. Rota migratória das populações que ocupavam a Europa cerca de 10.000 anos atrás. Em destaque a rota dos homens portadores pela mutação M343 de 30.000 anos, que os classifica como pertencentes ao haplogrupo R1b, o haplótipo mais comum na Europa e no Brasil

29

Figura 4: Região de origem do pequeno grupo de homens dos quais se originaram todas as linhagens existentes hoje, pertencentes ao haplogrupo A. Em destaque a mutação M60 do haplogrupo B de cerca de 60.000 anos

32

Figura 5: Região de origem de um marcador muito discriminante de origem africana chamado YAP que é uma inserção ALU (DYS287). Deste grupo originou-se a linhagem E, que possui a mutação M96 ocorrida entre 30.000 e 40.000 anos e da qual se originaram as linhagens E3a e E3b, usadas como referência para caracterizar os Africanos

33

Figura 6: Estrutura de um microssatélite com 11 repetições [TAGA]. A sequência acima corresponde ao alelo 11 (11 repetições).

38

Figura 7: Esquema da distribuição dos marcadores do haplótipo mínimo mais os locos DYS447, DYS458 e DYS464 ao longo do cromossomo Y. (Modificado de Short Tandem Repeat DNA Internet Database).

42

Figura 8: Esquema do deslizamento da polimerase. a) Pareamento normal do filamento novo com o filamento molde. b) Deslizamento do filamento novo para trás dando origem à

44

6

inserção. c) Deslizamento do filamento novo para frente causando a deleção

Figura 9: A diáspora do homem moderno a partir da África para Ásia, Europa e Oceania e posteriormente para as Américas. Os números correspondem à estimativa em anos.

48

Figura 10: As rotas de dispersão da população africana inicial, definidas pelas mutações binárias identificadas na NRY e respectivas haplogrupos

48

Figura 11: Árvore simplificada dos haplogrupos do cromossomo Y definidas pela YCC (2002).

49

Figura 12: Árvore completa dos Haplótipos do cromossomo Y com as respectivas mutações determinantes de cada haplogrupo definidas pelo YCC (2002).

51

Figura 13: Distribuição global dos haplogrupos de Y 54

Figura 14: O mais recente ancestral comum (seta) 17 gerações anteriores a atual, indicando o evento coalescente que caracteriza a ancestralidade comum.

68

Figura 15: Matriz simétrica geradora (a) e árvore ultramétrica gerada (b) pela matriz. A matriz é construída baseada nas distãncias genéticas calculadas entre os elementos doís a dois

75

Figura 16: Duas árvores filogenéticas (networks) construídas a partir de 256 cromossomos Y de arborígenes da África, Ásia, Europa e Austrália para os locos DYS19, DXYS156Y, DYS389, DYS390, DYS392, e DYS393 (esquerda); e usando UEP’s (direita).

75

Figura 17: Árvore filogenética (network) construída a partir de haplótipos com seis marcadores de Y-STR para ameríndios com a mutação P-M45, mostrando o posicionamento dos haplótipos dos índios nativos da América e dos mongóis na Ásia. As distâncias foram calculadas a partir das freqüências alélicas. (Bortolini et al. 2003)

76

7

Manuscrito

Figura 1: Mapa do brasil mostrando a região Nordeste e o Estado de Pernambuco onde as amostras foram coletadas.

121

Figura 2 – Árvore Median-joining das STR’s dos 30 haplótipos mínimos mais comuns e os respectivos haplogrupos prognosticados, representando 94 indivíduos da amostra de Pernambuco. (A) Ponderação baseada na média das taxas de mutação por loco. (B) baseada na variância dos locos. As cores indicam os grupos étnicos prognosticados

122

Anexo 1: Informações Complementares

Figura 1: Interface de cadastro de haplótipos do cromossomo Y na qual calcula-se e informam-se as freqüências relativas e absolutas, número de registros do banco de dados, número de haplótipos, diversidade haplotípica de poder de discriminação.

140

Figura 2: Interface de seleção de haplótipos do cromossomo Y do banco de dados para posterior análise, através da qual é possível verificar os parâmetros básicos da amostra selecionada:freqüências relativas e absolutas, número de registros do banco, número de haplótipos, diversidade haplotípica, poder de discriminação e probabilidade de coincidência.

141

Figura 3: Interface de análise dos haplótipos do cromossomo Y a partir da amostra selecionada através da qual pode se calcular as distâncias genéticas para o haplótipo modal da amostra, fazer prognóstico de haplogrupo por diferentes métodos de cálculo, verificar o anti-modal (alelos menos freqüentes por loco), freqüências relativas e absolutas e impressão das freqüências alélicas.

141

8

Figura 4: Interface de rastreamento de haplótipos do cromossomo Y em outros bancos de dados em função das menores distâncias genéticas, a partir da amostra selecionada.

142

Figura 5: Distribuição das freqüências alélicas de 11 locos de Y-STR, dos 247 indivíduos da amostra de Pernambuco. Para cada loco, a designação do alelo (em número de repetições) indicado no eixo das abcissas , e a freqüência observada (em %) no eixo das ordenadas.

149

Figura 6: Interface de dados das freqüências modais dos haplótipos de referência e fontes bibliográficas .

155

Figura 7: Árvore filogenética segundo o algoritmo Median-joining das STR’s dos 30 haplótipos mínimos mais comuns e o haplogrupo prognosticado representando 94 indivíduos da amostra de Pernambuco.

162

Gráfico 1: Representação da freqüência acumulada do haplótipo de referência e distância genética em Pernambuco estimada pelo SMM (Kimura e Ohta 1978). Os números no eixo X representam as distâncias genéticas e no eixo Y representam as freqüências haplotípicas.

155

Gráfico 2: Número de haplótipos e respectivas distâncias para o modal, usado para ordenar a distância média de mudança de haplogrupo. Para os pontos de pico no gráfico (2, 4 e 8) foram verificadas as mudanças de haplogrupo em média a cada 4 SMM.

157

Gráfico 3: Correlação de Pearson entre os escores encontrados segundo método de Athey (2005) e o algoritmo do programa Y-STRCALC. O índice de correlação entre os dois cálculos foi de 0.

159

9

LLIISSTTAA DDEE TTAABBEELLAASS

Tabela Página

Revisão da Literatura

Tabela 1. Trabalhos de genética de populações realizados com populações do Estado de Pernambuco.

24

Tabela 2. Microssatélites do cromossomo Y mais utilizados na prática forense. O alelo de referência corresponde ao número de repetições em tandem da seqüência depositada no GenBank, que em alguns casos é considerada como reversa e complementar para que haja concordância com motivos usados anteriormente.

41

Tabela 3: Taxas de mutação para marcadores do cromossomo Y e respectivos números de meioses de cada estudo

46

Tabela 4: Haplótipos modais para os haplogrupos mais comuns no banco de dados do FTDNA .

53

Tabela 5: Origens Étnico-Geográficas e afiliação lingüística das linhagens definidas pelo YCC.

58

Manuscrito

Tabela 1: Haplótipos mais freqüente nas populações de referência e respectivas freqüências na população de Pernambuco, Brasil.

117

Tabela 2: Freqüência acumulada do haplótipo de referência e distância genética em Pernambuco estimada pelo SMM

118

Tabela 3: Haplótipos não únicos na população de Pernambuco, comparação com dados do Ybase, Freqüências, escore e prognóstico segundo Athey (2005) e este estudo (Y-STRCALC).

119

Tabela 4: Composição da população de Pernambuco prognosticada pelo programa Y-STRCALC a partir dos haplótipos mínimo e estendido da população total e dos haplótipos apresentados

120

10

na Tabela 3.

Anexo 1: Informações Complementares

Tabela 1: Lista dos 224 haplótipos do cromossomo Y dos 247 homens de Pernambuco, freqüências absolutas e relativas.

143

Tabela 2: Haplótipos mínimos modais nas regiões do Brasil, indicando os locos e os alelos em número de repetições e as freqüências dos alelos, que apresentaram diferenças entre regiões do Brasil

151

Tabela 3: Alelos mais freqüentes de cada loco dos haplótipos mínimos de Y nas populações de Pernambuco, Europa, Brasil, Ameríndios, África, Portugal em duas regiões (Central e Açores). As freqüências aparecem entre parênteses, e os alelos em número de repetições. Os quadros nos quais aparecem duas freqüências são aqueles que definem modalidade do loco, mas não podem ser considerados diferenciadores em razão da semelhança entre as freqüências.

152

Tabela 4: Haplótipos mais freqüente nas populações de referência e respectivas freqüências na população de Pernambuco, Brasil.

152

Tabela 5: Haplótipos mais freqüentes e o modal no Brasi e Holanda/Strasburgo, e respectivas freqüências em Pernambuco, Portugal Central, Portugal Sul, Europa e no mundo.

153

Tabela 6: Freqüência acumulada do haplótipo de referência e distância genética em Pernambuco estimada pelo SMM (Kimura e Ohta 1978) .

153

Tabela 7: Haplótipos modais nas populações de Pernambuco ,Portugal Central, Portugal Sul e Europa.

155

Tabela 8: Haplótipos modais nas populações de Pernambuco ,Portugal Central, Portugal Sul e Europa.

156

11

Tabela 9: Taxas médias de mutação usadas no cálculo dos prognósticos dos haplogrupos.

157

Tabela 10: Haplótipos não únicos na população de Pernambuco e comparação com resultados do Ybase, freqüências, escore e prognóstico segundo Athey (2005) e este estudo (Y-STRCALC).

158

Tabela 11: Composição da população de Pernambuco prognosticada pelo programa Y-STRCALC, a partir dos haplótipos mínimo e estendido da população total e dos haplótipos apresentados na Tabela 3.

159

Tabela 12: Variâncias das freqüências alélicas calculadas, usando o Software Microsoft Excel, para cada loco do haplótipo mínimo da amostra da população de Pernambuco.

160

Tabela 13: Resultados computados para a amostra selecionada de Alagoas

162

Tabela 14: Freqüência acumulada do haplótipo de referência e distância genética em Alagoas estimada pelo SMM (Kimura e Ohta 1978).

162

Tabela 15: Composição da população de Alagoas prognosticada pelo programa Y-STRCALC a partir dos haplótipos mínimo e estendido da população.

163

Tabela 16: Marcadores de polimorfismo do cromossomo Y publicados e respectivos primes

167

Tabela 17: Tempo estimado de expansão e origens das linhagens das Y-STR no Norte da África

171

12

LLIISSTTAA DDEE AABBRREEVVIIAATTUURRAASS

AMOVA Analysis of Molecular Variance Análise Molecular de Variância

AMH Atlantic Modal Haplotype Haplótipo Modal do Atlântico

bp base pair Pares de Bases

CNPq Conselho Nacional de Desenvolvimento Científico e Tecnológico D Diversidade DAZ Deleted in Azoospermia

Deletado na Azoospermia DH Diversidade Haplotípica DHPLC Denaturing High Performance Liquid Cromatography

Cromatografia de Desnaturação Liquida de Alta Performace DNA Deoxiribonucleic Acid

Ácido Desoxirribonucléico dNTP Dinucleotideo Trifosfato

FTDNA Family Tree DNA Sitío de serviços de análise de haplótipos do Cromossomo Y

GD Gene Diversity Diversidade Gênica

H Haplótipo HD Haplotype Diversity

Diversidade Haplotípica HVR Hipervariable Region

Região Hipervariável IBGE Instituto Brasileiro de Geografia e Estatística IC Intervalo de Confiança ISFG International Society of Forensic Genetics

Sociedade Internacional de Genética Forense LGMH Laboratório de Genética Molecular Humana LINE Long INnterpersed Elements

Elementos Longos Intercalados μl Microlitro mM Milimolar mtDNA Mitocondrial Deoxiribonucleic Acid

Ácido desoxirribonucleico mitocondrial MSY Male-specific region of the Y chromosome

Região do cromossomo Y Específica do Macho MVR-PCR Minisatellite Variant Repeat Amplified by PCR

Repetição Variável de Minissatélite Amplificada por PCR ng nanograma NRY Nonrecombining Region of the Human Y Chromosome

Região não recombinante do cromossomo Y Humano PAR1 Pseudoautosomal Region 1

Região Pseudoautossômica 1 PAR2 Pseudoautosomal Region 2

Região Pseudoautossômica 2 PCR Polymerase Chain Reaction

Reação em Cadeia da Polimerase PD Poder de Discriminação

13

RFLP Restricted Fragment Length Polymorphisms Polimorfismo de comprimento de fragmentos de restrição

SINE Short INterpersed Elements Elementos curtos Intercalados

SMM Stpwise Mutation Model Modelo de Mutação Passo a Passo

SNP Single Nucleotyde Polymorphism Polimorfismo de Único Nucleotídeo

SRY Sex Determining region of the Y chromosome Região determinante do sexo no cromossomo Y

STRs Short Tandem Repeats Repetições Curtas em Tandem

Taq Thermophylus aquaticus TMRCA Time to Most Recent Common Ancestor

Tempo para o Mais Recente Ancestral Comum U Unidade UAZ Universidasde do Arizona UEP Unique Event of Polymorphism

Evento Único de Polimorfirmo UFPE Universidade Federal de Pernambuco V Variância VNTRs Variable Number of Tandem Repeats

Repetições em Tandem de Número Variável YAP Y chromosome Alu polymorphism YCC Y-Chromosome Consortium YHRD Y Haplotype Reference Database

Base de Dados de Referência de Haplótipo do Y Y-STRCALC Software desenvolvido para cálculo e prognóstco de haplogrupo do

cromossomo Y

Martins, A.M. Análise Genético-Histórica de Haplótipos e ...

14

RREESSUUMMOO

Neste trabalho foi feita a análise dos polimorfismos de 15

microssatélites do cromossomo Y (haplótipo mínimo mais locos DYS447,

DYS458, DYS464) em uma amostra da população de Pernambuco,

constituída por 247 indivíduos não aparentados e um banco de dados

construídos apartir de haplótipos das diversas populações que

historicamente participaram na composição étnica da população deste

Estado. A abordagem estatística foi feita com base nas freqüências

haplotípicas assumindo o modelo de mutação passo a passo (Stepwise

Mutation Model - SMM). Foi possível estabelecer um modelo que se

mostrou útil na determinação da contribuição genética das três principais

etnias formadoras da população de Pernambuco, e também inferir o

haplogrupo ao qual cada haplótipo pertence. Foi desenvolvido um método

de trabalho para estabelecer relações entre as freqüências alélicas dos

haplótipos e os haplogrupos com o propósito de verificar a provável

origem étnica de cada indivíduo. Também possibilitou quantificar e inferir

os haplogrupos a partir de haplótipos modais de referência, levando em

conta as taxas de mutação por loco como fator de ponderação do

prognóstico. Para isto, foi gerado um banco de dados que incorporou as

informações e foram desenvolvidos algoritmos para os cálculos e

interfaces de manipulação dos dados. Foram observados 247 indivíduos

diferentes e identificados 183 haplótipos mínimos distintos (153 únicos).

Foram estimados uma diversidade haplotípica igual a 0,9951 e um poder


15

de diferenciação igual a 0,7409. O haplótipo mínimo mais comum ocorreu

15 vezes. Este haplótipo apresentou em Pernambuco uma freqüência

superior àquelas encontradas na Europa, Portugal e das outras regiões do

Brasil. O haplótipo da população africana apresentou em Pernambuco,

uma freqüência maior do que o haplótipo ameríndio. O método de

prognóstico se mostrou eficiente e compatível com os existentes na

literatura. Como conseqüência, foi possível quantificar a contribuição de

cada etnia masculina para a composição populacional de Pernambuco. A

construção filogenética de árvores utilizando o algoritmo Median-Joining,

ponderadas pelas taxas de mutação das pequenas repetições em tandem

(STR), se mostrou bastante similar àquelas feitas utilizando as variâncias

das frequencias alélicas dos locos e apresentou coerência na distribuição

dos haplótipos, de acordo com os haplogrupos prognosticados.

PPAALLAAVVRRAASS--CCHHAAVVEE:: genética histórica, haplogrupo, microssatélites do

cromossomo Y, haplótipo mínimo, DYS447, DYS458, DYS464,

Pernambuco, Brasil.


16

1 - Introdução

Diversos marcadores polimórficos de DNA se encontram distribuídos

por todo o genoma. Estes marcadores deram uma nova dimensão aos

estudos moleculares da variabilidade genética vêm sendo amplamente

utilizados em diversas áreas, incluindo identificação individual,

mapeamento de genes e estudos populacionais.

Uma maneira de se estudar as populações atuais é através da

representação geográfica dos dados. Para este propósito, consideram-se

primordialmente as freqüências alélicas. É bem estabelecido que a

proporção de alelos varia de um lugar para outro, mas geralmente a

diferença é pequena entre populações vizinhas, de forma que as maiores

diferenças são observadas entre populações distantes. Neste sentido, é

possível realizar estudos que mostrem a distribuição das freqüências dos

alelos ao longo do planeta, caracterizando as populações em função

destas freqüências .

Os haplótipos do cromossomo Y têm sido freqüentemente usados

em estudos de evolução humana, auxiliando na identificação da origem

étnico-geográfica e da afiliação lingüística de um indivíduo. Estes estudos

sempre assumem que os haplótipos da região não recombinante do

cromossomo Y (NRY) devem ter se originado a partir de haplótipos

característicos dos primeiros ancestrais humanos (Pena et al. 2000).

Considerando que as linhagens haplotípicas apresentam diferentes

variações nas pequenas repetições em tandem do cromossomo Y (STR-Y)

em razão de suas histórias evolutivas distintas, é possível correlacionar

um indivíduo a um dado haplogrupo e, por conseguinte, estimar sua

origem étnica. Para tanto, usam-se as freqüências alélicas que

potencialmente conferem a cada sublinhagem haplotípica um padrão

característico de polimorfismo (Tarazona-Santos et al. 2001).


17

A família patriarcal, base da sociedade da região canavieira,

contribuiu para a perpetuação da patrilinhagem européia no nordeste do

Brasil, uma vez que o modelo familiar adotado previa um número elevado

de filhos e a submissão da mulher. Este último fator colaborou para a

mestiçagem, principalmente com as mulheres negras escravas, pois estas

estavam mais estreitamente relacionadas com o ambiente doméstico.

Neste contexto, definiu-se o perfil genético da população de Pernambuco,

sendo Portugal a principal referência genética masculina desta região

(Carvalho-Silva et al. 2001). Adicionalmente, deve-se ressaltar a presença

holandesa durante um quarto de século (1630-1654), cuja influência

ainda se faz notar em aspectos culturais, econômicos, urbanísticos e,

certamente na composição genética da população.

Assim, a utilização de haplótipos do cromossomo Y constituídos por

marcadores de microssatélites, é uma alternativa interessante para

estudos populacionais. Existe um grande interesse em prognosticar o

haplogrupo a partir de um conjunto de marcadores de STR (Athey 2005).

O estudo das populações miscigenadas, usando estes marcadores,

beneficia-se diretamente dos bancos de dados existentes para a

construção dos perfis haplotípicos, determinados pelo fluxo gênico

masculino ao longo das gerações.

O presente trabalho tem como objetivos:

Geral:

Estabelecer a relação entre os períodos de coalescência

dos haplótipos de Y pernambucanos e os haplogrupos e,

se possível, seus locais de origem baseado nos modelos

de coalescência.


18

Específicos:

Relacionar, a partir da análise das freqüências dos

haplótipos do cromossomo Y, como amostragem da

população pernambucana, as freqüências e a origem

desses haplótipos.

Rastrear os haplótipos do cromossomo Y até sua

provável origem.


19

22--RREEVVIISSÃÃOO BBIIBBLLIIOOGGRRÁÁFFIICCAA

2.1 Estudos Genéticos nas Populações do Nordeste do Brasil

Embora não exista fundamento biológico para o termo “raça

humana”, os estudos estratificados que utilizam esta terminologia para

enquadramento são muito freqüentes e polêmicos. Os parâmetros que

possam caracterizar as raças estão voltados para alguns padrões

fenotípicos, tais como cor da pele, formato do nariz, entre outros. O

gradiente de distribuição destes fenótipos não corresponde à distribuição

dos grupos por eles representados, ou seja, o padrão de distribuição

genética que poderia estar associado, não se enquadra ao padrão de

distribuição fenotípico das populações. Estudos realizados pelo IBGE em

1991 indicando por auto classificação a distribuição das cores ou “raças”

no Nordeste brasileiro, revelaram que aproximadamente 26,6% da

população se denomina branca, 5,6% negra, 67% parda e 0,13%

indígena. Estes percentuais variam muito entre regiões do país, chegando

a 83% de auto denominados brancos na Região Sul. O exame de

polimorfismo de nucleotídeo único (SNP) da região não recombinante do

cromossomo Y (NRY), realizado em 200 brasileiros auto definidos como

brancos de várias regiões geográficas, demonstrou que a grande maioria

dos cromossomos Y (97,5 %) é de origem européia, 2,5 % são de origem

africana e nenhum de origem ameríndia (Carvalho-Silva et al. 2001). Os

estudos comparativos demonstraram que a variação haplotípica de STR’s

do cromossomo Y (Y-STR) entre as populações das cinco regiões

geopolíticas do Brasil não é significativa (Santos et al. 2003; Grattapaglia

et al. 2004). Em razão disto, os estudos genéticos das populações não

devem basear-se em aspectos morfológicos, mas sim em relações

genealógicas, culturais, históricas e sociais, envolvendo a ancestralidade

comum entre os grupos de indivíduos, aproximando-os segundo a sua

ancestralidade.


20

Trabalhos realizados com marcadores de DNA mitocondrial para

matrilinhagens em caucasóides caracterizam a Região Nordeste do Brasil

como sendo constituída por: 44% de indivíduos de origem africana, 34%

de origem européia e 22% de origem ameríndia ou asiática.

Diferentemente do que acontece com marcadores do cromossomo Y que

apontam um percentual de 12,3% de origem africana e nenhum de

origem ameríndia (Alves-Silva et al. 2000). De acordo com Santos et al.

(2003), a diversidade de haplótipos de microssatélites do cromossomo Y

da população da Bahia é semelhante à de Portugal e significativamente

maior que a de populações do noroeste da África, região de origem de

grande parte dos africanos transportados para a região Nordeste do Brasil.

Isto sugere que a diversidade das linhagens deve-se à predominância de

haplótipos europeus, uma vez que esta diversidade tenderia a diminuir

caso as linhagens predominantes fossem africanas.

Os haplótipos do cromossomo Y no Nordeste do Brasil, a exemplo do

resto do mundo, estão sendo estudados nos últimos anos principalmente

em razão da sua aplicação forense e/ou antropológica. Apesar disto, a

disponibilidade dos dados ainda é pequena devido à falta de padronização

dos marcadores e de construção de bancos de dados unificados no Brasil.

O conjunto de marcadores genéticos tem como principal finalidade, a

determinação da diversidade dos haplótipos e de um perfil com alto poder

de discriminação para testes de paternidade. Neste sentido estuda-se em

maior detalhe os microssatélites. O principal haplótipo estudado é o

“haplótipo mínimo” assim denominado pelo Consórcio do Cromosossomo Y

(The Y-Chromosome Consortium 2002). Um estudo realizado com 198

indivíduos do sexo masculino, sendo 42 do Nordeste brasileiro, apresentou

uma diversidade haplotípica igual a 0,955 para a região Nordeste

(Grattapaglia et al. 2004). Neste estudo, as regiões do Brasil não diferem

estatisticamente entre si (FST= 0.00031). Aquele primeiro evidenciou o

haplótipo característico dos europeus no Nordeste: o “haplótipo modal do

atlântico” – AMH (Wilson et al. 2001), o mais freqüente no Brasil.


21

Outros estudos realizados com cromossomos autossômicos apontam

para a estreita relação de características genéticas entre as populações

européias e nordestinas. Algumas pessoas têm uma pequena falha nas

cópias de um gene que codifica um receptor particular na superfície da

célula, chamado de receptor 5 da beta-quimiocina (CCR5). Esses

indivíduos não produzem receptores CCR5 na superfície de suas células. A

maioria dos tipos de HIV-1, o vírus que causa a Síndrome da

Imunodeficiência Adquirida (AIDS), liga-se ao CCR5 para entrar nas

células e, portanto, as pessoas que carecem dos receptores CCR5 são

resistentes à infecção pelo HIV-1 (Samson et al. 1996). Este polimorfismo

do gene receptor CCR5 é encontrado no norte europeu, chegando a 14%

nos países escandinavos, enquanto na Península Ibérica o percentual é

mais baixo – aproximadamente 6%. Pesquisa realizada nas nove capitais

do Nordeste revela que cerca de 8% da população mostra alguma

resistência ao HIV-1, graças à presença do gene CCR5 defeituoso.

Esta amostra de estudos genéticos realizados com populações do

Nordeste do Brasil, permite uma avaliação da variedade de abordagens

que são feitas. Em algumas delas evidencia as semelhanças, em outras,

as diferenças existentes em relação a outras regiões. Espera-se, que ao

refinar os estudos, com amostras mais representativas e estratificadas,

obter uma diferenciação genética cada vez maior, não somente entre

Regiões, mas entre estados, já que muitos destes, inclusive o Estado de

Pernambuco, possuem características próprias na formação da sua

população.


22

2.2 Perfil da População do Estado de Pernambuco

2.2.1 O Estado de Pernambuco

Pernambuco é uma das 27 unidades federativas do Brasil. Está

localizada no centro-leste da região Nordeste e tem como limites os

estados da Paraíba e Ceará (NO), oceano Atlântico (L), Alagoas e Bahia

(S), e Piauí (O) e ocupa uma área de 98.937,8 km². Sua capital é a cidade

de Recife. Segundo o IBGE (2005), o Estado de Pernambuco tem

aproximadamente 8.413.593 de habitantes, sendo 47% homens, e 53%

mulheres, classificados em três “etnias”: negros (4%), brancos (37%) e

pardos (58%). Possui 185 municípios e é dividido em cinco mesorregiões

econômico-sociais: a do São Francisco Pernambucano, a Zona da Mata, o

Agreste, o Sertão e a região metropolitana de Recife (Figura 1).

Pernambuco é um dos menores estados do país. Apesar disto, possui

paisagens variadas: serras, montanhas, planaltos, brejos e desertos no

interior e costa. O Estado tem altitude crescente do litoral ao sertão - a

planície litorânea, e os planaltos e montanhas do interior ultrapassam os

1000m de altitude. O clima de Pernambuco é diversificado, variando do

tropical - quente e úmido, com fortes chuvas de inverno ao semi-árido -

quente e extremamente seco. Exceções são algumas cidades com

microclima de altitude, com temperaturas que podem chegar a 8°C

durante o inverno considerados Brejos de Altitude. Outra exceção é a

mesoregião do São Francisco, mais úmida que as circundantes por conta

do Rio São Francisco e da irrigação proveniente dele. Esta diversidade

geográfica é determinante na definição do estilo de vida e na

caracterização das populações. (http://pt.wikipedia.org/wiki/Pernambuco)


23

Figura 1: Estado de Pernambuco e as suas cinco mesorregiões econômico-sociais: a do São Francisco Pernambucano (1); o Sertão (2); o Agreste (3) a Zona da Mata (4); e a região metropolitana de Recife (5).

2.2.2 A mistura genética entre povos

Milhares de anos após a dispersão do grupo africano inicial de

humanos, povos oriundos da Ásia (ameríndios), da Europa (principalmente

portugueses) e da África (escravos da África Ocidental e Central)

reencontraram-se no Brasil. A partir dessa confluência, iniciou-se um

processo de mistura gênica resultando no brasileiro atual (Pena et al.

2000). Sendo assim, os brasileiros compõem uma das mais heterogêneas

populações do mundo, resultado de cinco séculos de cruzamento

interétnicos entre povos de três continentes: os colonizadores Europeus,

representados principalmente por portugueses; escravos africanos e

índios (Freyre 1933). Esta mistura predomina na região Nordeste do

Brasil. Pernambuco, um dos locais mais representativos estados desta

região em razão de ter prosperado e ser um dos primeiros a ser

colonizado, tem um cenário determinado por um padrão de colonização

bem definido, no qual a estrutura social influenciou o comportamento

sexual e, e como conseqüência determinou a distribuição dos genes para

composição da população atual.


24

Algumas publicações têm abordado a genética de populações do

Estado de Pernambuco, sendo grande parte voltada para as questões

forenses e antropológicas (Tabela 1).

Tabela 1: Trabalhos de genética de populações realizados com populações do Estado de Pernambuco

AUTOR TÍTULO DA PUBLICAÇÃO MARCADORES RESULTADOS (RESUMO)

Dellalibera et

al. (2004)

Genetic analysis of 13 STR

loci in the population from

the State of Pernambuco,

northeast Brazil.

13

microssatélites

autossômicos de

546 idivíduos

Constatação do equilíbrio de Hardy-

Weinberg Marcadores úteis para uso

forense.

Nigam et al.

(2004)

Polymorphism of HLA class I

genes in the Brazilian

population from the

Northeastern State of

Pernambuco corroborates

anthropological evidence of

its origin

Distribuição

alélica de

antígenos de

genes de

leucócitos

humanos (HLA)

classe I (HLA-A,

HLA-B, and HLA-

Cw)

A heterozigosidade para os loci

observados foi 79.21% para HLA-A,

87.13% para HLA-B, e 77.23% para

HLA-Cw. Os dados corroboram com

as evidências antropológicas a

respeito da origem da população de

Pernambuco.

Mauricio-da-

Silva et al.

(2000)

Population genetics of

HPRTB, F13B, and LPL in

Pernambuco, Northeast

Brazil

HPRTB, F13B,

(STRs) de 134

indivíduos.

Hardy-Weinberg proportions. Alelos

mais freqüentes H PRTB&ast;13,

F13B&ast;10, LPL&ast;10. A

probabilidade combinada de

paternidade e o poder de

discriminação foram altos permitindo

a utilização com propósitos forenses

Barros et al.

(2005)

*submetido

Y – Chromosome Human

STR Haplotype diversity and

population data in

Pernambuco, Northeast

Brazil

Marcadores de

microssatélite

do cromossomo

Y – STR de 247

indivíduos

Os alelos mais freqüentes em

Pernambuco foram comparados aos

das populações ancestrais,

demonstrando a estreita relação com

os caucasianos. A combinação do

haplótipo mínimo com os locos

DYS447, DYS458 e DYS464

aumentou significativamente o poder

de discriminação.


25

2.2.3 As origens da população de Pernambuco

O modelo sócio-econômico predominante no período colonial

garantiu a prosperidade econômica para Pernambuco e foi determinante

na composição étnica da população e na sua mestiçagem. Os

portugueses, habituados ao contato com outros povos, uniram-se a

mulheres índias e negras desde o início do período colonial (Ferreira

1987). A família patriarcal, base da sociedade da região canavieira,

contribuiu para a perpetuação da patrilinhagem européia, uma vez que o

modelo familiar adotado previa um número elevado de filhos e a

submissão da mulher. Este último fator colaborou para a mestiçagem,

principalmente com as mulheres negras escravas, pois estas estavam

estreitamente relacionadas com o ambiente doméstico, sob domínio do

senhor do engenho (Ribeiro 1995). Neste contexto, desenhou-se o perfil

genético da população de Pernambuco, sendo Portugal a principal

referência genética masculina desta região (Carvalho-Silva et al. 2001).

Adicionalmente, deve-se ressaltar a presença holandesa durante um

quarto de século (1630-1654), cuja influência ainda se faz notar em

aspectos culturais, econômicos, urbanísticos e, certamente, na

composição genética da população. Pernambuco tem em sua história uma

valiosa contribuição para a determinação de sua composição étnico-

populacional. Por esta razão, pode-se definir a população pernambucana,

a exemplo do restante do Nordeste Brasileiro, como sendo basicamente,

européia, africana e ameríndia.

2.2.3.1 – Os Ameríndios

A maioria dos indígenas das Américas descende de populações da

área central da Sibéria, na Ásia (Pena et al. 2000). Há uma concordância

geral de que a principal rota dos ancestrais de ameríndios no continente

ocorreu através do Estreito de Bering. Quando os primeiros europeus


26

chegaram ao território brasileiro, no início do século XVI, vários grupos

indígenas ocupavam a região Nordeste. Aquela primeira colonização das

américas parece ter ocorrido a cerca de 32.000 anos, como estimado por

Cavalli-Sforza et al. (1994), que usaram dados provenientes de

cromossomos autossômicos para esta datação. Por outro lado, estudos

baseados em DNA mitocondrial datam a primeira colonização há 20.000

anos (Stone e Stoneking 1998). A conclusão tanto dos estudos com

mtDNA como com cromossomo Y estão de acordo com a teoria de uma

única entrada migratória para as américas através do estreito de Bering

entre 21.000 e 25.000 anos atrás (figura 2). Este tempo baseia-se nas

estimativas de cálculo de coalescência cujo princípio básico é traçar uma

linha dos indivíduos de hoje em uma população, até seus ancestrais

comuns. Através desta linha é possível estimar o tempo de separação

entre duas populações usando-se as taxas de mutação para determinados

tipos de marcadores moleculares binários (SNP) e inserções Alu, definidos

como UEP (evento único de polimorfismo), para mutações mais raras, e

também microssatélites (Repetições pequenas em tandem - STR) com

mutações mais freqüentes. Os trabalhos de Bortolini et al.(2003) e Zegura

et al. (2004), usando marcadores binários para o cromossomo Y,

esclareceram que a linhagem ameríndia americana do sul, em sua maior

parte, descende de um único ancestral comum que possuía a mutação M3

definida para o haplogrupo Q, sendo assim considerado o mais

característico para a definição do pool gênico autóctone. Esta mutação é

atribuída a linhagem de um Americano nativo fundador caracterizada por

uma transição de bases C→T, determinando o marcador M3 na linhagem

ancestral P-M45.


27

Figura 2: Rota migratória dos ameríndios caracterizados pela mutação M3 que os classifica como pertencentes ao haplogrupo Q3. Estes homens que adentraram as Américas pelo estreito de Bering entre 21.000 e 25.000 anos atrás são os ancestrais mais comuns dos nativos da América do sul (incluindo o Brasil). Observe o começo da linha destacada (alto esquerda) que indica a região na qual a mutação (SNP) ocorreu. (Modificado de https://www3.nationalgeographic.com/genographic/atlas.html). Por outro lado, observou-se que o padrão de variabilidade das curtas

repetições em tandem do cromossomo Y (Y-STR) das populações

ameríndias modifica-se dentro e entre as populações, sugerindo que

fatores como a deriva genética são determinantes para estas variações

(Tarazona-Santos et al. 2001). Os dados convergem para uma data de

colonização da América do sul em torno de 12.000 anos, sendo este

tempo, insuficiente para descaracterizar o padrão de freqüências alélicas

do haplótipo mínimo, que é o grupo de marcadores mais utilizados

principalmente na área forense, para os locos de Y-STR mais conservados

neste haplogrupo. Apesar da deriva genética e das altas taxas de mutação

nestes locos, a neutralidade e o isolamento em relação a outras

populações em quase a totalidade deste período, garantiu a manuntenção

dos alelos mais freqüentes ao longo do tempo. Observa-se um conjunto

de alelos que compõem o haplótipo mínimo: DYS19 = 13, DYS391 = 10 e


28

DYS393 = 13, característicos para a maior parte das populações ameríndias

(Bortolini et al. 2003).

Geneticamente o grupo ameríndio está bem distante (> 20.000

anos) dos grupos que compõem as linhagens européias, e ainda mais

distante dos antepassados comum a ambas; os africanos. De maneira

análoga ao estudo do cromossomo Y, usando mtDNA, também foi possível

determinar os haplogrupos (A,B,C e D) que compõem as matrilinhagens

sul americanas nativas (Alves-Silva et al. 2000).

2.2.3.2 – Os Europeus

A costa nordestina foi a primeira área do país a ser ocupada pelos

portugueses em 1500. A população ibérica, na qual se inserem os

portugueses, no momento em que começou sua expansão, já possuía uma

grande variabilidade genética em razão do intenso processo de invasões

sucessivas ocorridas naquela região, realizadas principalmente pelos

romanos, bárbaros e mouros. Estas invasões aumentaram a variabilidade

genética, e misturou as populações o bastante para torná-las menos

diferenciáveis entre si, conforme se observa usando o grande número de

informações de Y-STR disponibilizadas por bancos de dados como o Y-

chromosomal Haplotypes Reference Database (YHRD) e pelo YBASE

(Genealogy by numbers). Estes bancos têm sido instrumentos relevantes

para pesquisas forenses e antropológicas (Roewer et al. 2001). Análises

filogenéticas de Y-STR mostraram-se até certo ponto, eficientes na

quantificação da diferenciação genética entre populações e, em geral,

concordam com os estudos feitos usando marcadores binários (Foster et

al. 2000).

O levantamento de dados filogeográficos de 25 marcadores binários e

15 Y-STR’s na população portuguesa, revelou não haver diferenças

significativas entre as regiões daquele país. A divisão tradicional das

regiões Norte, Centro e Sul, geralmente feitas nos estudos genéticos não


29

se estabeleceu usando o haplótipo mínimo. Somente a região do Alentejo

mostrou uma pequena diferenciação (Beleza et al. 2006). Estudos através

dos quais podem se estabelecer padrões entre marcadores de

microssatélites e marcadores binários (haplótipos de STR e haplogrupos)

na mesma amostra, têm se tornado mais intensos. Este último mostrou

que a população portuguesa é composta por aproximadamente 13% de

indivíduos das linhagens do haplogrupo E, 5% haplogrupo G, 10% I e J,

1% R1a e cerca de 56% R1b (Beleza et al. 2006). Este último haplogrupo

é o mais representativo da população européia. A maioria dos europeus,

dos portugueses e dos brasileiros pertence a este haplogrupo (figura 3).

Este haplogrupo é caracterizado pela mutação M343 que se expandiu pela

Europa à cerca de 30.000 anos pelo homem de Cro-Magnon (YCC 2002).

Figura 3: Rota migratória das populações que ocupavam a Europa a cerca de 10.000 anos. Em destaque a rota dos homens caracterizados pela mutação M343 de 30.000 anos, que os classifica como pertencentes ao haplogrupo R1b, o haplótipo mais comum na Europa e no Brasil.(ref.: https://www3.nationalgeographic.com/genographic/atlas.html). Ao comparar as populações brasileira e portuguesa usando

marcadores binários no cromossomo Y de 200 indivíduos brasileiros e 93

portugueses, Carvalho-Silva et al. (2001) observaram que, apesar de

vários anos de misturas genéticas que ocorreram em ambos os países,


30

existe uma grande similaridade entre as freqüências dos haplogrupos.

Referem-se ainda à provável influência genética dos holandeses, em razão

do sensível incremento na região nordeste, da freqüência do haplogrupo

mais freqüênte na Holanda. Os números desta análise do cromossomo Y

no Brasil mostraram que 57% das linhagens paternas vêm da Europa. A

grande proporção deste haplogrupo comum na Holanda, sobretudo no Sul

(28%) e Nordeste (19%) , está ligada à imigração de outros europeus

além dos portugueses e à invasão holandesa, respectivamente.

2.2.3.3 – Os Africanos

As evidências obtidas a partir da análise dos cromossomos Y são

inequívocas. Desprezando a incerteza a respeito da determinação do

tempo para o ancestral comum mais recente, nenhum ancestral de mais

de 200.000 anos atrás, de linhagem do cromossomo Y, foi achado no

mundo. A raiz desta árvore filogenética é africana com dois braços (A e B)

ambos evidenciando uma ampla distribuição, mas geralmente presente

em freqüências moderadas. Por exemplo, o haplogrupo A definido pela

mutação M91 é característico das etnias Khoisan (36%) e Khwe (12%)

desde o sul da África (na região do deserto de Kalahara), Malianos (2%) e

desde oeste, Sudaneses (45%) e Etíopes do leste (14%), mas fora da

Áfica somente na Sardenha (5% - 1 indivíduo), que foi interpretado como

resultado de um evento recente (Knight et al. 2003). O Haplogrupo B,

definido pela mutação M60 ocorrida entre 50.000 e 60.000 anos, foi

achado em grande parte das mesmas populações e também em outras

sub-saharianas incluindo a Baka (pigmeus habitantes do sudoeste das

florestas tropicais africanas, em Camarões e Congo) (35%) e Pgmeus

Mbut (catadores coletores do Congo) (33%), Bamileke (República de

Camarões) (4%) e Fali (Norte da República de Camarões) (18%).

Surpreendentemente, este haplótipo foi também achado em

Paquistaneses (2%), isto pode representar uma migração, pré-histórica ou


31

recente. Os cálculos para TMRCA, restritos às linhagens divergentes da

África e a evidência de uma expansão para fora da África em conjunto,

mostram que a diversidade de Y emergiu da África recentemente e

substituiu os cromossomos Y em todos os lugares (Figura 4). Isto não

significa dizer que outros locos devem apresentar o mesmo padrão, mas o

cromossomo Y nos dá evidências de não haver contribuição das espécies

Homo ancestrais e poucos sinais disso foram detectados usando outros

locos (Jobling e Tyler-Smith 2003). As linhagens definidas pelos

marcadores binários refletem variações das STR-Y e conseqüentemente

possuem histórias evolutivas distintas. Desta forma é possível

correlacionar um indivíduo a um dado haplogrupo e prever sua etnia

usando as freqüências alélicas, que potencialmente conferem a cada

sublinhagem um padrão característico de polimorfismo. O homem que deu

origem à linhagem E, caracterizada pela mutação M96, provavelmente

nasceu na África entre 30.000 e 40.000 anos e seus descendentes

migraram para a África Sub-sahariana, norte e oeste da África dando

origem ás sublinhagens E3a e E3b (figura 5). É atualmente postulado que

a dispersão do haplogrupo E3b se deu em torno de 3.000 anos, pela

expansão das populações Bantu (Pereira et al. 2002). Esta linhagem é a

mais comum entre os Afro-Americanos. Hoje, a maior parte dos sub-

saharianos compartilham estas linhagens. Em razão da sua predominância

na África Oriental, muitos afro-americanos traçam sua história genética a

partir desta linhagem. De acordo com os estudos de Thomas et al. (2000)

que descreveram um forte “efeito do fundador” para Y-STR nos africanos

do sul de origem Bantu, estas observações são consistentes com a

hipótese de que um haplótipo considerado fundador é também o mais

freqüente em outras populações que estiveram no caminho da migração

Bantu (Pereira et al. 2002). Moçambique desde 1493 estabeleceu relações

mercantis com Portugal e foi uma colônia portuguesa de 1752 a 1975 e. O

colonialismo português foi caracterizado pela migração de um baixo

número de pessoas (exceção do Brasil), predominantemente homens que


32

intercruzaram com as mulheres locais (Russell-Wood 1998). O haplótipo

fundador hipotético compreende sete STR’s, das quais cinco pertencem

ao haplótipo mínimo (DYS19=15, DYS390=21, DYS391=10, DYS392=11

e DYS393=13). É o mais freqüente em Angola (28%), São Tomé e

Príncipe (10%) enquanto em Moçambique ele possui a mesma freqüência

(10%) do haplótipo vizinho (15,21,10,11,14), possui diferença de apenas

1 repetição no loco DYS393 segundo Pereira et al. (2002). A grande

diversidade de haplogrupos africanos é compatível com o fato de que os

escravos foram trazidos para o Brasil de diversas áreas diferentes,

principalmente povos da etinia Banto e Sudanêsa, do oeste africano, mas

também de Moçambique, no leste (Pena et al. 2000).

Figura 4: Região de origem do pequeno grupo de homens dos quais se originaram todas as linhagens existentes hoje pertencentes ao haplogrupo A. Em destaque mutação M60 do haplogrupo B de cerca de 60.000 anos (ref.: https://www3.nationalgeographic.com/genographic/atlas.html).


33

Figura 5: Região de origem de um marcador muito discriminante de origem africana chamado YAP que é uma inserção ALU (DYS287). Deste grupo originou-se a linhagem E (em destaque) que possui a mutação M96 ocorrida entre 30.000 e 40.000 anos e da qual se originaram as linhagens E3a e E3b usadas como referência para os Africanos. (ref.: https://www3.nationalgeographic.com/genographic/atlas.html

2.3 Organização do Genoma Humano

Pelas estimativas atuais, o genoma humano contém cerca de 30.000

genes (os quais codificam cerca de 100.000 proteínas) que controlam

todos os aspectos da embriogênese, do desenvolvimento, do crescimento,

da reprodução e do metabolismo - essencialmente todos os aspectos do

que faz do ser humano um organismo funcional. As seqüências que

codificam as proteínas são compostas principalmente por nucleotídeos que

compõem os genes. As seqüências codificantes constituem a menor

porção do DNA total de nosso genoma. Além dos genes, o DNA é formado

na sua maior parte por material genético aparentemente inativo (97%), o

qual parece não possuir qualquer utilidade. Estudos recentes mostram que

este material não pode ser desprezado e coloca-se a hipótese dele

desempenhar funções de coordenação, de conservação e de regulação

gênicas (Watterson et al. 1999)


34

As regiões do genoma, similares em organização, replicação ou

expressão dos genes, não são dispostas aleatoriamente. Existe uma

tendência de agrupamento destas regiões relacionando-as com a

organização estrutural, como se verifica através do bandeamento dos

cromossomos metafásicos. O resultado disto é que os cromossomos

podem ser separados por regiões do genoma e classificados quanto ao

tipo de DNA existente nelas.

2.3.1 - DNA Singular ou de Cópia Única.

As seqüências que codificam proteínas (a porção codificadora dos

genes) compreendem apenas uma pequena proporção do DNA de cópia

única. A maior parte deste DNA encontra-se em extensões curtas

entremeadas com diversas famílias de DNA repetitivo e corresponde a

75% do genoma (Schmid e Jelinek 1982).

2.3.2 - DNA Repetitivo Disperso

Este grupo consiste em seqüências relacionadas que se espalham por

todo o genoma. Os elementos repetidos dispersos mais estudados

pertencem à família Alu e a família L1 (Schmid e Jelinek 1982).

Família Alu

Esta família tem essa denominação porque a maioria dos seus

membros é clivada por uma endonuclease de restrição bacteriana

denominada Alu I, instrumento importante da tecnologia do DNA

recombinante. Os membros dessa família têm um comprimento de cerca

de 300 pares de bases e são relacionados uns aos outros, mas não

exibem uma seqüência idêntica entre eles. No total existem cerca de

500.000 membros da família Alu no genoma, estimando-se que

constituam 3% do DNA humano (Schmid e Jelinek 1982).


35

Família L1

Constituem seqüências repetidas, longas, encontradas em

cerca de 10.000 cópias por genoma. Assim, embora existam muito

menos cópias nessa família do que na Alu, seus membros são bem

mais longos e a contribuição para a constituição do genoma pode

chegar a 30% (Boissinot e Furano 2005).

2.3.3 - DNA altamente repetitivo ouDNA satélite

Envolve seqüências repetidas em tandem, agrupadas em um ou mais

locais, intercaladas com seqüências de cópia única, ao longo do

cromossomo. As famílias de DNA satélite variam quanto à localização no

genoma, comprimento total da série em tandem e no comprimento das

unidades repetidas que constituem a série (Boissinot e Furano 2005).

2.3.4 – As Famílias de DNA repetitivo e os marcadores genéticos

Existem várias categorias diferentes de DNA repetitivo. As

seqüências repetitivas intercaladas com seqüências únicas correspondem

de 10 a 15% do genoma e são formadas por curtas seqüências de

nucleotídeos dispostas em tandem. Estes diferentes tipos são também

denominados coletivamente de DNA satélite porque muitas famílias de

repetições podem ser purificadas por densidade de centrifugação do resto

do genoma como frações “satélites” do DNA. Estas famílias variam no DNA

de acordo com a localização, o tamanho da seqüência em seqüência

(tandem) e o comprimento das unidades repetidas. Outro tipo de

seqüência diferente do DNA satélite ocorre ao longo do genoma e, em

alguns casos, constitui uma parte significativa estando associada a

algumas doenças (Floridia et al. 2000)


36

A ocorrência de variação genética em uma população, para um ou

mais locos, cujo alelo mais comum não tem freqüência superior a a 0,99

são denominadas polimorfismos de DNA. Cada variante destes

polimorfismos recebe o nome de alelo (Kendrew 1994). Existem diferentes

tipos de marcadores genéticos que são utilizados para estudos de

identificação, aplicação forense, mapeamento e estudos de populações.

Alguns são formados pela alteração de um único nucleotídeo, inserção,

deleção ou substituição de bases chamadas SNP (Single Nucleotide

Polymorphisms), e podem ser identificados por digestão de enzimas de

restrição RFLP (Restricted Fragment Length Polymorphisms),

sequenciamento ou por DHPLC (Denaturing High Performance Liquid

Cromatography) (Underhill et al. 1996). Outro tipo de polimorfismo é a

inserção de elementos transponíveis LINE (Long Interspersed Elements) e

SINE (Short Interpersed Elements). Como exemplo de SINE temos a

família Alu, mecionada anteriormente que é composta de seqüências

monoméricas de aproximadamente 300 nucleotídeos, ligadas a regiões

ricas em adenina. A presença ou ausência de seqüências Alu ou de LINE,

em determinado local configuram dois alelos (Alu+ ou Alu-). O último tipo

de polimorfismo citado são as VNTR’s (Número Variável de Repetições em

Seqüência), caracterizado pela variação no número de repetições em

tandem que determinará o alelo do marcador (Schlötterer 1998). Nesta

categoria se enquadram os minissatélites e os microssatélites (Figura 6),

cuja diferença está no número de nucleotideos das unidades de

repetições, variando de uma a seis bases nos microssatélites e de 15 a

500 bases nos minissatélites. Nos humanos, são encontrados tanto nos

autossomos como nos cromossomos sexuais e estima-se compor cerca de

20% do genoma. Podem se localizar em regiões intergênicas, em íntrons

ou em regiões flanquedoras. Os microssatélites têm diversas aplicações

em biologia molecular, em genética funcional e biologia populacional. Isso

se deve a sua hipervariabilidade, ampla distribuição por todo o genoma,

por fornecerem informação genealógica e por poderem ser amplificados


37

por PCR (Polimerase Chain Reaction). Esta variabilidade tornou os

microssatélites aplicáveis na identificação individual em casos forenses,

predominantemente utilizados a partir da década de 1990 (Goldstein e

Schlötterer 1999; Schoske 2003).

A ampla utilização de microssatélites pelos cientistas forenses tornou

necessária a criação de normas que orientassem e padronizassem o

emprego destes marcadores. Em 1998 a International Society for Forensic

Genetics (ISFG) publicou diretrizes e recomendações sobre a

nomenclatura de sistemas de microssatélites que são seguidas de forma

generalizada por cientistas forenses (Olaissen et al. 1998).

Uma importante característica desses marcadores genéticos é a

possibilidade de estimativas de tempos de ancestralidade baseados nas

taxas de mutação (Walsh 2001). Os marcadores SNP possuem baixa taxa

de mutação, tornando-se desta forma, um marcador de evolução lenta,

cujas freqüências se encontram na escala de grandeza de 10-7 a 10-9. Os

minissatélites que possuem mais de 14 bases por repetição são

marcadores de evolução rápida e a sua freqüência de mutação é, em

média, cerca 2 x 10-3 por geração (Dupuy et al. 2004).

Em 2002 o Projeto Genoma Humano relatou a caracterização de 2000

polimorfismos bialélicos de inserção-deleção (indels) no genoma humano.

Esta bateria de indels constitui uma poderosa ferramenta diagnóstica para

estudos. Um dos critérios de seleção dos indels foi o nível de variação das

freqüências alélicas entre europeus, ameríndios e africanos, já que estas

são as populações ancestrais que levaram à formação do povo brasileiro.

Um escalonamento multidimensional mostrou que havia uma significativa

distância entre estes grupos, indicando que o conjunto de indels era

realmente muito sensível à origem etnogeográfica. Quando se fez o

estudo separadamente de europeus, africanos e ameríndios com os indels,

foi obtida uma excelente discriminação indicando que este conjunto de

marcadores representa uma valiosa ferramenta para estudos de

ancestralidade etnogeográfica em brasileiros. Para estes estudos foi


38

utilizado um software estatístico que calcula as proporções de mistura

biogeográfica do genoma de um indivíduo, relacionando-o com as

populações de referência (Bastos-Rodrigues et al. 2006).

1 2 3 4 5 6 7 8 9 10 11

GTTGTTAGATAGATAGATAGATAGATAGATAGATAGATAGATAGATAGATCTG

11 repetições = alelo 11

Figura 6: Estrutura de um microssatélite com 11 repetições [TAGA].

2.3.5 – A heranca uniparental do cromossomo Y e das mitocôndrias

O genoma de um indivíduo e herdado de ambos genitores. Cada parte

é estabelecida por uma combinação do DNA transferido a cada um de nós

pelos nossos ancestrais. O processo de recombinação dos genes

autossomos a cada geração torna difícil o estudo das linhagens ancestrais,

pois cria uma mistura genética de todos os nossos antepassados.

Felizmente para os estudos genéticos antropológicos, existem partes do

genoma que são passados quase intactos de pais para filhos. Nestes

segmentos o DNA varia somente através de mutações ocasionais. Quando

estas mutações passam através das gerações elas tornam-se marcas de

descendência (Pena et al. 2000).

Esta situação é observada no segmento exclusivo do cromossomo Y

e no DNA mitocondrial, que apresentam propriedades em comum.

Primeiro, eles são herdados de apenas um dos pais: o cromossomo Y é

transmitido através do espermatozóide apenas para filhos homens e o

DNA mitocondrial é transmitido através do óvulo para filhos e filhas.


39

Segundo, não trocam genes com outros segmentos genômicos (não se

recombinam), sendo transmitidos às gerações seguintes em blocos

denominados haplótipos. Esses blocos permanecem inalterados em

patrilinhagens ou matrilinhagens até que ocorra uma mutação. As

mutações ocorridas durante a evolução humana geraram variações dos

haplótipos que servem como marcadores de linhagem. Além disso, o

cromossomo Y e o DNA mitocondrial fornecem informações

complementares, permitindo traçar patrilinhagens e matrilinhagens que

alcançam várias gerações no passado, podendo, desta forma, reconstruir

parte significante da história genética de uma população (Jobling e Tyler-

Smith 2003).

Em razão do cromossomo Y não ter homologia em toda sua

extensão, grande parte, a região (NRY), escapa do processo de

recombinação. Isto confere ao cromossomo Y a propriedade de ser

passado quase intacto para a geração seguinte, sendo a parte não

recombinante, alterada apenas pelas mutações ocasionais.

Se o cromossomo Y traça a linhagem masculina, o genoma

mitocondrial (mtDNA) pode ser considerado a contrapartida feminina ao

longo da história . Dois segmentos importantes do mtDNA são as regiões

hipervariáveis (HVR I e II), nas quais as taxas de mutação são 100 vezes

maiores que no genoma nuclear. Devido ao seu pequeno comprimento em

centenas de pares de bases, as HVR’s podem ser rapidamente mapeadas

para revelar os eventos mutacionais bastante informativos que foram

passados pela linhagem materna (Yaoa et al. 2004). A forma exata da

árvore filogenética gerada é afetada por outras forças evolutivas como

seleção natural, deriva genética e migração. Estudos realizados em

populações de vários países permitiram estabelecer a origem geográfica

da vasta maioria dessas linhagens genealógicas Torroni et al. (1998).


40

2.3.6 - O Cromossomo Y

O cromossomo Y humano apresenta nas extremidades de seus dois

braços a homologia com o cromossomo X. Aí podem existir recombinações

e estas partes são denominadas regiões pseudoautossômicas. Exclusivas

do sexo masculino, estas duas regiões, PAR1 (região pseudoautossômica

1) e PAR2 (região pseudoautossômica 2), correspondem a

aproximadamente 5% da seqüência total do cromossomo Y, tendo 2,6 e

0,34 milhões de pares de bases (Mb) nos braços curto e longo

respectivamente. A maior parte do cromossomo Y não recombina com

nenhum outro cromossomo sendo denominada região não recombinante

do cromossomo Y (NRY) ou região masculino-específica do cromossomo Y

(MSY). Com cerca de 60 Mb a NRY humana é constituída por seqüências

altamente repetitivas (Lahn et al. 2001) e é esta a região de interesse

para estudos de patrilinhagens.

O primeiro marcador polimórfico do cromossomo Y foi descoberto por

Casanova et al. (1985) denominado p122f2, enquanto o primeiro

microssatélite do cromossomo Y descrito foi o 27H39LR, atualmente

denominado DYS19, e foi utilizado para excluir um suspeito em um caso

de estupro. Vários marcadores têm sido estudados desde então, inclusive

uma inserção da família Alu denominadas YAP (Y chromosome Alu

Polymorphism) característico de populações africanas. Vários marcadores

polimórficos estão associados a determinadas populações e especificam

padrões de ancestralidade nas patrilinhagens e, no caso do marcador

DYS19, as freqüências dos alelos são amplamente conhecidas nas

populações do mundo (Roewer et al. 1992). No início de 2002 haviam

apenas 30 microssatélites descritos no cromossomo Y disponíveis para os

pesquisadores (Butler et al. 2003) mas em 2003 Jobling e Tyler Smith

citaram um número entre 100 e 200 novos microssatélites na NRY, dos

quais 30 eram marcadores polimórficos, com repetições de três, quatro e


41

cinco nucleotídeos. Como resultado de um minucioso rastreamento da

seqüência do cromossomo Y, foi possível identificar 166 novos

marcadores, o que eleva para mais de 300 o número atual de

microssatélites já descritos (Kayser et al. 2004). A Tabela 2 apresenta os

microssatélites mais utilizados até hoje.

Tabela 2: Microssatélites do cromossomo Y mais utilizados na prática forense. O alelo de referência corresponde ao número de repetições em tandem da seqüência depositada no GenBank que em alguns casos é considerada como reversa e complementar para que haja concordância com motivos usados anteriormente.

Nome do marcador

Intervalo de alelos

Motivo Número de Acesso ao GenBank

Alelo de referência

DYS19 10-19 TAGA AC017019 (r&c) 15 DYS385 a/b 7-28 GAAA AC022486 (r&c) 11 DYS389I 9-17 (TCTG)(TAGA) AC004617 (r&c) 12 DYS389II 24-34 (TCTG)(TAGA) 29 DYS390 17-28 (TAGA)(TCTG) AC011289 24 DYS391 6-14 TAGA AC011302 11 DYS392 6-17 TAT AC011745 (r&c) 13 DYS393 9-17 AGAT AC006152 12 YCAII a/b 11-25 CA AC015978 23 Modificado de Butler et al. 2003

Os microssatélites do cromossomo Y podem ser usados para várias

aplicações em identificação humana como análise forense de evidências

de estupro, testes de paternidade com pai falecido, investigações de

pessoas desaparecidas e estudos antropológicos e populacionais (Schultes

et al. 1999; Butler et al. 2003; Jobling e Tyler-Smith 2003). Em casos

complexos de teste de parentesco, a eficiência da análise feita com

marcadores autossômicos pode ser aumentada com a utilização de

marcadores do cromossomo Y (Szibor et al. 2003). Na identificação de

pessoas desaparecidas parentes da mesma patrilinhagem, os marcadores

de microssatélites do cromossomo Y, podem também ser usado como

referência (Butler et al. 2003).

Foram estabelecidos na Europa pelo Y Chromosome Haplotype

Reference Database (YHRD) um “haplótipo mínimo” e um “haplótipo

estendido” com a finalidade de padronização das informações geradas e

de normatização dos dados. O haplótipo mínimo é composto pelos

marcadores DYS19, DYS385, DYS389I, DYS389II, DYS390, DYS391,


42

DYS392 e DYS393. O haplótipo estendido é composto pelos marcadores

do haplótipo mínimo mais o marcador YCAII. Apesar de aumentar

consideravelmente o poder de discriminação do haplótipo, o marcador

YCAII não é ideal para o estudo de misturas de amostras masculinas, pois

apresenta um alto número de bandas inespecíficas (bandas de repetição

ou stutter). (Roewer et al. 2001; Schoske et al. 2004).

Na figura 7 está representada esquematicamente a distribuição ao

longo do cromossomo Y dos marcadores do haplótipo mínimo mais os

marcadores DYS447, DYS458 e DYS464.

Tendo em vista a grande diversidade de locos de microssatélites do

cromossomo Y, é evidente a necessidade de que sejam envidados esforços

para a obtenção de bancos de dados confiáveis para que estes

marcadores possam ser utilizados. Para propósitos forenses é essencial à

identificação de locos polimorficos que possibilitem a discriminação de

indivíduos entre a maioria das linhagens não relacionadas de uma dada

população e o estabelecimento de um banco de dados representativo da

distribuição geográfica e étnica das populações de interesse, cujo

tamanho possibilite estimar as freqüências de haplótipos raros (Roewer et

al. 2001).

PAR 1 PAR 2Heterocromatina

Marcadores do Haplótipo Mínimo

Figura 7: Esquema da distribuição dos marcadores do haplótipo mínimo mais DYS447, DYS458 e DYS464 ao longo do cromossomo Y. (Modificado de Short Tandem Repeat DNA Internet Database).


43

2.3.7 Mutação em microssatélites

A grande diversidade observada nos locos de microssatélite pode ser

explicada por elevadas taxas de mutação que se acumulam ao longo das

gerações e da variação em diferentes populações. Estima-se uma taxa

mutacional loco-específica entre 0 e 8,58 x 10-3, e uma taxa mutacional

média de 2,80 x 10-3 por geração para o haplótipo mínimo, tendo em

conta as diferentes taxas observadas nos trabalhos de Carvalho-Silva et

al. (1999); Goldstein e Schlötterer (1999); Kayser et al. (2000); Kayser e

Sajantila (2001) e Gusmão et al. (2005).

O deslizamento (slippage) da polimerase é tido como o mecanismo

originador de mutações em microssatélites. Este deslizamento ocorre

quando a polimerase se dissocia do DNA durante uma pausa na

replicação. O filamento em síntese se separa do filamento molde e volta a

parear com outra repetição para frente ou para trás da posição correta

(erro de pareamento). A replicação é então retomada completando o

processo no qual o comprimento do filamento recém sintetizado pode ser

maior ou menor do que o do filamento molde (figura 8) (Viguera, Canceill

e Erlich 2001). Este pareamento é uma propriedade das seqüências de

microssatélites e ocorre com frequências elevadas (Schlötterer 1998),

sendo o mecanismo responsável pela grande variabilidade observada

(Klintschar e Wiegand 2003).


44

Figura 8: Esquema do deslizamento da polimerase. a) Pareamento normal do filamento novo com o filamento molde. b) Deslizamento do filamento novo para trás dando origem à inserção. c) Deslizamento do filamento novo para frente causando deleção. Este também é o mecanismo primário de formação de bandas de repetição ou stutter. (Modificado de Butler 2003).

As regiões continuamente repetitivas mais longas, com 10 ou mais

repetições, estariam mais sujeitas à mutação do que regiões repetitivas

mais curtas ou descontínuas (Kayser et al. 2000; Holtkemper et al. 2001).

A relação entre a estrutura do microssatélite e a taxa de mutação tem se

apoiado em estudos que mostraram a existência de uma variação

substancial da taxa de mutação entre os locos de microssatélites (Di

Rienzo et al. 1998; Dupuy et al. 2004), podendo esta diferença, ser maior

que 80 % (Zhivotovsky et al. 2004).

Em casos de paternidade com pai falecido, nos quais o

reconhecimento de paternidade é requerido para um indivíduo do sexo

masculino, a tipagem com microssatélites do cromossomo Y é muito útil,


45

pois homens da mesma linhagem possuem o mesmo perfil. Verifica-se,

porém, que em alguns casos pessoas aparentadas podem apresentar uma

diferença nos haplótipos em vários locos devido à mutação. Por esse

motivo é necessário o conhecimento da taxa de mutação de cada loco

analisado para avaliar a possibilidade de uma possível falsa exclusão (Rolf

et al. 2001).

Algumas abordagens utilizadas para determinar a taxa de mutação

de microssatélites são: a análise de trios, mãe, pai e filho ou duplas pai e

filho, o monitoramento de genealogias, a estimativa teórica da taxa de

mutação através do estudo de diferentes populações e a tipagem do DNA

de células espermáticas (Holtkemper et al. 2001). Utilizando a tipagem de

células espermáticas, Holtkemper et al. (2001) registraram taxas de

mutação iguais a 1,8 x 10-3 e 2,1 x 10-3 para os marcadores DYS390 e

DYS19, respectivamente, que estão muito próximas das que foram

observadas por Heyer et al. (1997).

O método mais utilizado para a estimativa de taxas de mutação de

microssatélites do cromossomo Y é a análise direta de pares, pai e filho

com paternidade confirmada através de marcadores autossômicos e com

índice de paternidade maior que 10.000 (probabilidade de paternidade

maior que 99,99). Este método foi utilizado por Kayser et al. (1997) que

observaram uma taxa de mutação de 3,2 x 10-3 para o microssatélite

DYS19 em uma amostra de 626 pares, pai e filho. Num estudo mais

amplo, compreendendo 4.999 meioses de pares pai e filho com

paternidade confirmada (probabilidade ≥ 99,9 %), foi observada uma taxa

de mutação média de 2,80 x 10-3 para 15 microssatélites (haplótipo

mínimo mais YCAIa/b, YCAIIa/b e DYS413a/b) (Kayser et al. 2000), que

é muito semelhante à observada por Heyer et al. (1997). Outros estudos

utilizando este mesmo método foram realizados por Ballard et al. (2005) e

Dupuy et al. (2004) cujos resultados são apresentados na tabela 3

juntamente com os de outros estudos feitos de 1997 a 2005.


46

Tabela 3: Taxas de mutação para marcadores do cromossomo Y e respectivos números de meioses de cada estudo

Estudo

Marcador

Ballard et al.

(2005)

Dupuy et al.

(2004)

Kayser et al.

(2000)

Heyer et al.

(1997)

DYS390 - (1766)

4,5×10-3

(466)

8,6×10-3

-

DYS391 (248)

8,1×10-3

(1766)

4,5×10-3

(415)

4,8×10-3

-

DYS385 (472)

1,7×10-2

(3532)

4,0×10-3

(952)

2,1×10-3

(426)

4,7×10-3

DYS389II (246)

8,1×10-3

(1766)

2,3×10-3

(425)

4,7×10-3

(-)

9,3×10-3

DYS389I (247)

4,0×10-3

(1766)

2,3×10-3

(425)

2,4×10-3

-

DYS19 (245)

4,1×10-3

(1766)

1,7×10-3

(996)

2,0×10-3

-

DYS393 0 (1766)

5,7×10-4

- -

DYS392 0 - - (213)

4,7×10-3

DYS439 (249)

4,0×10-3

- - -

Os números entre parêntesis correspondem ao tamanho da amostra analisada

2.4 Haplogrupos e Haplótipos do cromossomo Y

2.4.1 Características determinantes das linhagens humanas

O termo haplogrupo tem várias definições na literatura que se

complementam. Pode-se usar a terminologia atribuída a de Knijff (2000)

na qual haplogrupo refere-se à linhagem definida por polimorfismos

binários. Pode ser também definido como mutações localizadas no

cromossomo Y ou no mtDNA, que ligam os indivíduos que as possuem ao

seu ancestral comum, no qual esta marca se originou (FTDNA-


47

http://www.familytreedna.com). Esta marca ancestral define os braços da

árvore filogenética que separa o novo haplogrupo de seu antecessor.

Pode-se dizer que haplogrupo é um grupo de haplótipos relacionados.

Chamamos haplótipo a um conjunto de alelos de locos diferentes

herdados como um bloco. O termo haplótipo é reservado para todas as

sublinhagens dos haplogrupos que são definidos por variações nas STR’s

na NRY, ou seja, um haplótipo é um subgrupo mais específico de um

haplogrupo (Jobling e Tyler-Smith 2003).

À medida que os homens migraram para novas regiões geográficas

do globo, mutações foram ocorrendo e estabelecendo-se novos

haplogrupos, cada um deles passando a se comportar como uma linhagem

evolutiva independente. Essa diáspora foi acompanhada de diversos

fatores e condições climáticas e ambientais das diferentes regiões do

mundo. Geralmente, quanto mais antigo for o haplogrupo, maior a sua

distribuição geográfica (Figura 9). Uma parte dos haplogrupos ainda tem

uma distribuição geográfica relativamente restrita a algumas partes do

globo, o que permite a suposição da sua origem geográfica ou étnica.

Quando os homens migraram para diferentes regiões continentais, há

aproximadamente 60.000 anos atrás, eles deixaram a suas marcas

genéticas possíveis de serem vistas ainda hoje através do gradiente da

distribuição das freqüências alélicas. Com o estudo filogeográfico,

incluindo o mapeamento das freqüências dos marcadores genéticos no

homem moderno, pôde ser criado um quadro que determina por onde e

quando os ancestrais se deslocaram (figura 10). Estes grandes fluxos

migratórios finalmente deixaram descendentes de um pequeno grupo de

africanos para ocupar os mais longínquos pontos do globo (Pena et al.

2000).


48

Figura 9: O mundo e as migrações históricas. A diáspora do homem moderno a partir da África para Ásia, Europa e Oceania e depois para as Américas. Os números correspondem à estimativa em anos determinados principalmente por fósseis encontrados em diferentes lugares. Fonte Cavalli-Sforza (2001)

Figura 10: As rotas de dispersão da população africana inicial, definidas pelas mutações binárias (SNP) identificados na NRY e respectivos haplogrupos (entre parêntesis). Fonte: .: https://www3.nationalgeographic.com/genographic/atlas.html


49

Um dos eventos mais precoces na evolução do cromossomo Y foi

uma mutação de A para G na posição 10831 do gene SRY (Sex-

determining Region of the Y chromossome). Isto modificou o haplogrupo

ancestral, denominado haplogrupo A, e criou um novo haplogrupo B, que

se distribuiu por todos os continentes a partir da região onde hoje é a

Ethiópia e o Sudão. Quando é feita a análise molecular dos cromossomos

humanos, podem ser estudadas hierarquicamente as mutações que

determinam os haplogrupos e suas freqüências nas populações e

estabelecer uma relação filogenética de descendência (figura 11).

Figura 11: Árvore filogenética simplificada, baseada nos principais eventos mutacionais

(nós) que caracterizam cada um dos haplogrupos (de A a R1b) definidos para o

cromossomo Y pelo YCC (2002). Cada braço da árvore representa uma linhagem que

carrega a mutação (UEP). À esquerda os haplogrupos (mutações) mais antigos para os

mais recentes à direita. Fonte: Mc Donald Group

http://www.scs.uiuc.edu/~mcdonald/WorldHaplogroupsMaps.pdf


50

Mutações definidas com prefixo “M” (Mutation) e com prefixo “P”

(Polymorphism) foram publicadas por Underhill et al. (2001), de acordo

com as freqüências dos haplogrupos e com a ordem de ocorrência dos

eventos mutacionais. A disponibilidade de seqüências do cromossomo Y

permite que existam mais de 200 mutações de SNP bem caracterizadas e

entre 100 e 200 microssatélites potencialmente úteis. Uma filogenia

bastante robusta foi desenvolvida com base nestas mutações, e um

sistema de nomenclatura unificado que permite a integração entre os

diferentes dados dos grupos de pesquisa (figura 12). Apesar disto, ainda

são apontadas várias teorias diferentes para tentar explicar os

mecanismos e o padrão de varição das freqüências dos polimorfismos

encontrados nas populações dispersas pelo mundo, o que não invalida a

filogenia já estabelecida.

A teoria policêntrica de Weindereich (Hawks et al. 2003) reconhece a

existência de diferentes mecanismos responsáveis pelo estabelecimento

os padrões iniciais de variação global e pela manutenção desses padrões

na evolução humana subseqüente. Segundo esta teoria, a formação do

homem atual aconteceu em vários territórios independentes. Em sua base

está o fato de que, segundo esta teoria, existem semelhanças entre os

representantes dos vários grupos humanos atuais e os representantes de

grupos que existiram no passado, dos quais existem fósseis. A hipótese da

origem única (monocêntrica) e mais aceita atualmente, com uma explosão

populacional global ao longo dos últimos séculos explicaria, de algum

modo, porque as freqüências dos alelos parecem ter alguma

especificidade geográfica.


51

Figura 12: Árvore completa dos Haplogrupos do cromossomo Y com as respectivas mutações que os caracterizam definidas pelo YCC (2002). As letras (brancas) correspondem aos haplogrupos e nos braços (em vermelho) as mutações. Fonte: (Jobling e Tyler-Smith 2003).


52

Estas variações de freqüência provavelmente se devem a mutações

que apareceram recentemente e não tiveram tempo suficiente para se

difundir ao longo da população global. Interpretações alternativas afirmam

que, sob a teoria de neutralidade, a heterozigosidade para uma região do

DNA seria decorrente de diferenças no tamanho efetivo da população que,

por sua vez, explicariam a diversidade gênica observada (Laguardia

2005). Para Chakravarti (1999), a baixa diversidade gênica humana é o

resultado de uma espécie relativamente jovem com uma pequena

população fundadora, exigindo que se disponha de um grande volume de

dados para discriminar, com relativa confiança, a mais adequada dentre

as diferentes histórias da origem humana. No que se refere à

diferenciação genética, as mudanças na freqüência dos alelos nas

populações devem-se à seleção natural, resultante da variação

populacional entre genótipos individuais nas suas probabilidades de

sobrevivência e/ou reprodução, à mutação, à deriva genética e à migração

(Cavalli-Sforza et al. 2003).

Os agrupamentos humanos são geralmente influenciados pelo

comportamento dos homens. Aproximadamente 70% das sociedades

modernas praticam o patriarcado significando que, se um homem ou uma

mulher se casam e não são do mesmo local, mais freqüentemente é a

mulher que muda para o local de origem do homem. Como conseqüência,

mais homens vivem próximos ao seu local de nascimento do que

mulheres, aumentando a possibilidade de determinação do local de

origem dos cromossomos Y. Em contraste, o mtDNA, que é transmitido

apenas pelas mulheres, esta diferenciação de local de origem

presumivelmente será menor. Estudos realizados com populações

européias e asiáticas que praticam o patriarcado e o matriarcado

evidenciaram este contraste (Jobling e Tyler-Smith 2003). Os estudos de

polimorfismos binários do cromossomo Y permitiram determinar a

distribuição geográfica das freqüências dos haplogrupos em diversas

populações (Figura 13).


53

A manutenção de um padrão filogenético e a nomenclatura para

marcadores binários e haplogrupos são fundamentais. Também é

necessário que existam bancos de dados com as informações sobre as

freqüências alélicas das populações.

A importância dos haplótipos para os geneticistas, em especial os

genealogistas, reside no fato de que vários marcadores do mesmo

haplogrupo são comuns e outros não. A tabela 4 mostra os haplótipos de

STR, compostos pelos alelos mais freqüentes (haplótipo modal) para

alguns haplogrupos comuns na Europa. Metade dos homens do

haplogrupo R1b por exemplo, possui vários alelos de STR dentre os mais

freqüentes encontrados neste haplogrupo. Com as diferenças espalhadas

ao longo dos marcadores de STR, é possível ter variações suficientes para

obter-se a assinatura do cromossomo Y para cada linhagem masculina do

haplogrupo.

Tabela 4: Haplótipos modais para os haplogrupos mais comuns no banco de dados do FTDNA

DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS Haplogrupo 19 385ª 385b 389I 389II 390 391 392 393 437 458 464a 464b 464c 464d

R1b 14 11 14 13 29 24 11 13 13 15 17 15 15 17 17

I1a 14 13 14 12 28 22 10 11 13 16 15 12 14 15 16

R1a1 16 11 14 13 30 25 10 11 13 14 15 12 15 15 16

Os números no corpo da tabela expressos pelo número de unidades repetidas do microssatélite


54

Figura 13: Distribuição global dos Haplogrupos do cromossomo Y. Cada círculo representa uma amostra os 18 haplogrupos principais (uma simplificação dos haplogrupos definido pelo YCC). Notar as similaridades entre as populações vizinhas. Os dados são de trabalhos publicados que foram escolhidos com o propósito de cobrir todo o globo. Em alguns casos os marcadores não foram suficientes para caracterizar os haplogrupos, então bancos de dados e dados não publicados foram consultados para complementar as informações. Fonte: Mc Donald Group.


55

Os principais usuários dos microssatélites do cromossomo Y são os

cientistas forenses, que elegeram um padrão de sete marcadores

denominado “haplótipo mínimo” e estabeleceram bancos de dados de

freqüências haplotípicas, para Europa, Estados Unidos e Ásia. O número

de microssatélites pode ser incrementado dando a vantagem de aumentar

o grau de discriminação entre indivíduos. Estudos da possibilidade de

incorporar marcadores binários, que possam ser amplificados por DNA

altamente degradado, para a prática forense, e o prognóstico de

haplogrupos binários a partir dos dados de microssatélites (por

antropólogos que querem usar os dados forenses) merecem grande

atenção, em razão da grande utilidade na prática da genética populacional

e antropológica (Jobling e Tyler-Smith 2003).

Genealogistas então interessados em obter relações entre famílias

em escalas seculares, e as taxas de mutação nas STR’s são uma boa

opção para este tipo de trabalho, enquanto que os geneticistas de

populações estão interessados em rastrear os movimentos de grupos de

humanos em escalas de tempo na ordem de milhares de anos.

Haplogrupos são definidos por padrões verificados nos valores destes

marcadores de mutação lenta. A identificação do haplogrupo pode

fornecer uma sinalização que aponte para a ancestralidade paterna.

Algumas questões residem no estabelecimento de uma relação entre os

haplogrupos estabelecidos por UEP (evento único de polimorfismo) e o

padrão de variabilidade de Y-STR. A análise dos polimorfismos bialélicos

revela a existência de haplogrupos de STR com uma subestrutura de

haplótipos (Cinnioglu et al. 2003).


56

2.4.2 Relações entre Haplótipos e Haplogrupos

2.4.2.1 - Agrupamento de haplótipos

Além da notável contribuição do estudo dos haplótipos de STR-Y

para a atividade forense, muitos estudos de genética de populações têm

sido feitos com grande sucesso. Grande parte destes estudos emprega o

modelo mutacional denominado Modelo de mutação em Degraus

(Stepwise Mutation Model – SMM) proposto por Kimura e Ohta em 1978,

que é o modelo mais comumente aceito como sendo o que melhor

representa a geração de diversidade nos locos de STR-Y em razão da

grande maioria de mutações ocorrerem com perda ou ganho de uma

unidade de repetição. Desta forma, entende-se que as menores distâncias

genéticas representarão haplótipos relacionados. Ou seja, ao agrupar

haplótipos com distâncias pequenas, estabelece-se uma relação de

proximidade, através da qual podemos distinguir grupos haplotípicos por

suposto parentesco. Este processo é usualmente chamado de

agrupamento. Os critérios de agrupamento obedecem basicamente à

proximidade por distâncias genéticas adotadas de acordo com o estudo

em questão. Em um de seus estudos, Gusmão et al. (2003)

demonstraram que o agrupamento de haplótipos vizinhos (distância de 1

SMM) em torno de dois haplótipos mais freqüentes escolhidos, evidencia

um padrão de distribuição geográfica. Bosch et al. (1999) mostraram que

a variação alélica de cada loco de STR-Y é claramente diferenciável em

cada haplogrupo definido por SNP’s. Variações nos marcadores de STR’s

com altas taxas de mutação têm sido usadas tanto em estimativas de

TMRCA (tempo para o mais recente ancestral comum), com também para

verificar se estas diferenciações entre os haplogrupos servem como

orientação filogenética. A análise molecular da variabilidade como base

para o estudo genético, tanto para determinação de haplogrupos quanto


57

para estudos de populações, podem indicar uma variabilidade de STR’s

mais propriamente estruturada por haplogrupos do que pelas populações.

2.4.2.2 - Haplótipo modal

O haplótipo modal é composto pelos alelos mais freqüentes de cada

loco e representa a expressão única do conjunto mais representativo de

alelos do haplótipo da população. Como conseqüência, o haplótipo modal

não somente deve existir na população como também pode ser o mais

freqüente nesta. Além disto, é a referência para alelos característicos da

assinatura genética do grupo mais comum de haplótipos, quando houver

(Thomas et al. 2000).

Espera-se que ao verificar os haplótipos mais freqüentes e o modal

nas populações encontrem-se pequenas variações, dado que o primeiro

refere-se às freqüências haplotípicas e o segundo, refere-se às freqüências

alélicas. Enquanto as freqüências dos haplótipos servem como referência

para a composição da população o segundo prestar-se-á como referência

do haplogrupo. Para isto o haplótipo modal deve ser identificado na

tentativa de se estabelecer relações entre eles, os mais freqüentes, e as

suas prováveis origens. Um típico haplótipo modal muito referenciado é o

Haplótipo Modal do Atlântico (AMH), o qual se refere ao conjunto de alelos

de Y-STR (haplótipo mínimo) mais freqüentes para o haplogrupo R1b

(DYS19=14, DYS385a=11, DYS385b=14, DYS389I=13, DYS389II=29,

DYS390=24, DYS391=11, DYS392=13, DYS393=13) (Wilson et al. 2001).

2.4.2.3 Haplogrupos, Povos e Línguas.

Como demonstrado nos detalhados trabalhos em várias regiões como

na Micronésia (Cavalli-Sforza e Wang 1986) e em maior escala, na

América do Norte (Spuhler 1979), Europa (Barbujani e Sokal 1990), o

padrão de variação lingüística tem similaridade com a variação genética


58

ou geográfica. Existem de fato, razões para que os conjuntos genéticos e

culturais tenham similaridades: contatos culturais e genéticos tomam as

mesmas rotas; respondem às mesmas barreiras geográficas e culturais;

uma pode influenciar a outra. Em geral, a constituição de um pool

genético é determinada por fatores geográficos, distância sócio-econômica

e pela variedade de fatores culturais (religião, língua, etc.). Importantes

correlações foram observadas entre conjuntos genéticos por um lado e

sócio-culturais de outro. Não existem fatores limitantes à concorrência

paralela entre a evolução liguística e a genética. As línguas expandem-se

mais rapidamente que os genes; duas línguas podem vir a se tornar

inteligíveis em um milhar de anos ou menos, em razão da diferenciação

progressiva. Isto é similar a origem de duas espécies diferentes em

biologia. Especiação envolve a perda da interfertilidade. Em outra escala,

seria como a perda da comunicação na lingüística. A especiação em geral

leva milhões de anos. Além disto, uma língua pode ser substituída

completamente em algumas gerações decorrente de imposição de

populações invasoras (Cavalli-Sforza et al. 1993). Apesar disto, é possível

verificar a relação entre as rotas genéticas e o padrão lingüístico das

populações. A tabela 5 mostra a correlação estabelecida entre algumas

populações bem caracterizadas, o haplogrupo predominante com a

mutação que o determina, e também, a origem geográfica e lingüística

destas populações, estabelecendo assim, uma relação indireta entre a

etnia e o haplogrupo predominante em cada população.

Tabela 5: Origens Étnico-Geográficas e afiliações lingüísticas das linhagens definidas pelo Y Chromosome Consortion.

YCC# Origem étnico-geográfica Linguagem Linhagem Mutação 2 América do Norte/Ameríndio Ameríndia Q* Q-P36* 3 América do Norte/Ameríndio Ameríndia Q* Q-P36* 4 América do Norte/Ameríndio Ameríndia Q* Q-P36* 5 Namíbia/Tsumkwe San !Kung A2* A-M6* 6 Banandu, CAR/Biaka Aka B2b4b B-MSY2a 7 Banandu, CAR/Biaka Aka B2b4b B-MSY2a 8 Ituri, Zaire/Mbuti Niger/Kordofanian E2b E-M54


59

9 Ituri, Zaire/Mbuti Niger/Kordofanian B2b* B-50f2(P)* 10 Ilhas Salomão/Melanésia Nasioi K1 K-SRY9138 11 Ilhas Salomão/Melanésia Nasioi M2* M-P22* 12 Rondônia, Brasil/Karitiana Tupi Q3* Q-M3* 13 Rondônia, Brasil/Karitiana Tupi Q3* Q-M3* 14 Rondônia, Brasil/Surui Tupi Q3c Q-M199 15 Rondônia, Brasil/Surui Tupi Q3* Q-M3* 16 Rondônia, Brasil/Surui Tupi Q3* Q-M3* 17 Campeche, Yucatan/Maya Yucatec Q3* Q-M3* 18 Campeche, Yucatan/Maya Yucatec Q3* Q-M3* 19 Namíbia/Tsumkwe San !Kung A3b1 A-M51 21 Namíbia/Tsumkwe San !Kung B2b1 B-P6 22 Namíbia/Tsumkwe San !Kung A2* A-M6* 23 Arizona, US/Navajo Navajo C3b C-P39 24 US/Ashkenazi Judeus English G2a1 G-P18 25 Arizona, US/Tohono O'odham Pima Q* Q-P36* 26 UK/Inglês Inglês R1b* R-P25* 27 S. Carolina, US/Porch Creek Porch Creek R1b* R-P25* 28 Namíbia/Tsumkwe San !Kung B2b1 B-P6 29 Namíbia/Tsumkwe San !Kung B2b4a B-P8 30 Namíbia/Tsumkwe San !Kung B2b4a B-P8 31 Africa do Sul/Herero W. Bantu E3a1 E-M58 32 Africa do Sul/Sotho E. Bantu E3* E-P2* 33 Africa do Sul/Pedi E. Bantu E3a* E-M2* 34 Namíbia/Tsumkwe San !Kung A2* A-M6* 35 Namíbia/Tsumkwe San !Kung A2b A-P28 36 Africa do Sul/Tswana E. Bantu E3a* E-M2* 37 Africa do Sul/Ovambo W. Bantu E2b E-M54 38 Namíbia/Tsumkwe San !Kung A3b1 A-M51 39 Namíbia/Tsumkwe San !Kung B2b1 B-P6 40 Africa do Sul/Herero W. Bantu E3a* E-M2* 42 Africa do Sul/Zulu E. Bantu B2a1 B-P32 43 Africa do Sul/Tswana E. Bantu E3a* E-M2* 44 Africa do Sul/Herero W. Bantu E3a1 E-M58 45 Africa do Sul/Herero W. Bantu E3a* E-M2* 47 Siberia/Yakut Turkic N3a* N-M178* 48 Siberia/Yakut Turkic N3a* N-M178* 49 Siberia/Yakut Turkic N3a1 N-P21 50 Siberia/Yakut Turkic N3a1 N-P21 51 Siberia/Yakut Turkic N3a* N-M178* 52 Krasnador/Adygean N. Caucasiano G2* G-P15* 53 Krasnador/Adygean N. Caucasiano G2* G-P15* 55 Krasnador/Adygean N. Caucasiano G2* G-P15*


60

56 Krasnador/Adygean N. Caucasiano J2* J-M172* 57 Kashmira/Pakistão Urdu O3e* O-M134* 58 Lahore/Pakistão Punjabi H1* H-M82* 59 US/Ashkenazi Judeus Inglês J* J-12f2a* 60 Multan/Pakistão Punjabi J2* J-M172* 61 Alemanha/Alemão Alemão I1* I-P38* 62 Alemanha/Alemão Alemão R1b* R-P25* 63 Alemanha/Alemão Alemão I1a1 I-P40 64 Alemanha/Alemão Alemão R1b* R-P25* 65 Ituri, Zaire/Mbuti Niger/Kordofanian E3a* E-M2* 66 China/Han Sino-Tibetano O1* O-M119* 67 China/Han Sino-Tibetano O1* O-M119* 68 China/Han Sino-Tibetano O3c O-LINE1 69 Cambodia/Khmer Mon-Khmer O2a* O-M95* 70 Russia/Russo Russo R1a1* R-M17* 71 Russia/Russo Russo R1b* R-P25* 72 Russia/Russo Russo I1b* I-P37b* 74 Russia/Russo Russo I1* I-P38* 76 Japão/Japonês Japonês D2a D-P42 77 Noto Peninsula/Japonês Japonês N1 N-M128 78 Gifu/Japão Japonês O3e* O-M134* 79 Turquia/Turco Turkic G1 G-P20 80 US/Ashkenazi Judeus Inglês G2a* G-P16* 81 US/Ashkenazi Judeus Inglês R1a1* R-M17*

“*” indica um nó interno na árvore filogenética do haplogrupos definidos pelo YCC

2.4.2.4 Prognóstico de Haplogrupo a partir de Haplótipos

Muitos pesquisadores têm se beneficiado do baixo custo e da

disponibilidade dos dados para desenvolver trabalhos com o cromossomo

Y a partir das STR’s. O conjunto de marcadores do cromossomo Y usados

para estes trabalhos é denominado haplótipo. Existe também um grande

interesse em determinar o haplogrupo que define linhagem do

cromossomo, a partir de um padrão definido por polimorfismo de um

nucleotídeo (SNP), que pode também ser testado e determinado

diretamente a partir de exames de DNA. Entretanto, o processo de

determinação do haplogrupo pelo teste direto dos SNP’s pode ser, em


61

alguns casos, um processo demorado. Para isto existe um considerável

interesse no prognóstico do haplogrupo a partir de um conjunto de

marcadores de STR, com o propósito de estabelecer uma relação entre um

indivíduo e sua ancestralidade (Athey 2005).

Uma das maiores empresas de teste de DNA, a Family Tree DNA

(FTDNA-http://www.familytreedna.com), em cooperação com a

Universidade do Arizona (UAZ), utiliza um algoritmo próprio para o

prognóstico dos haplogrupos de pessoas que têm os seus testes feitos

com o uso de Y-STR’s naquela empresa. O algoritmo não foi publicado,

mas parece basear-se na distância genética de 1 Stepwise Mutation Model

(SMM) do haplótipo em análise, em comparação com os haplótipos

depositados no banco de dados da Universidade do Arizona. Nesta

pesquisa, se um haplótipo cujo haplogrupo é conhecido existe no banco de

dados a uma distância genética limite (provavelmente 2 para 12

marcadores), então o haplogrupo ao qual pertence o haplótipo em questão

é prognosticado dentro de uma estimativa para aquele ahaplogrupo. Se

não existir no banco de dados um haplogrupo confirmado para o haplótipo

pesquisado para uma distância até 2 SMM, nenhuma estimativa é feita. O

prognóstico feito pelo FTDNA/UAZ tem obtido um razoável sucesso e

provavelmente 80% dos usuários tem um haplogrupo prognosticado

(FTDNA-http://www.familytreedna.com). A desvantagem deste tipo de

aproximação é quando não existe a possibilidade de ser feito o

prognóstico e o usuário fica sem informação ou quando vários haplogrupos

podem ser prognosticados (Athey, 2005)..

Outro método é baseado nas freqüências alélicas para cada

haplogrupo e como o teste empregado se aproxima do padrão de cada

loco para cada um deles. Neste processo por aproximação, apresentado

por Athey (2005), utilizam-se freqüências alélicas de cada loco para cada

haplogrupo. É realizado o cálculo da média geométrica (raiz n-ésima do

produto de n fatores) da razão entre a freqüência alélica do marcador de

cada loco testado e a freqüência máxima deste loco. Todas as freqüências


62

pesquisadas são pré-determinadas para cada alelo de cada loco de cada

haplogrupo. Isto é apontado como uma dificuldade no emprego do

método, já que é necessário determinar as freqüências para todos os

alelos de todos os locos de todos os haplogrupos. A média geométrica

calculada no final determina o escore para cada haplogrupo testado. A

obtenção das informações requer uma boa mineração de dados e um

conjunto consistente de amostras tão variado quanto forem o número de

populações que se diferenciem no padrão de distribuição das freqüências.

Diante da necessidade de contornar este problema existem propostas de

modelos que possam ser relativamente consistentes e menos dependentes

do tamanho e variedade da amostra.

2.4.2.5 Os principais haplogrupos

Dentre os haplogrupos determinados pelo YCC (2002), alguns

devem ser destacados em razão da importância na composição da

população brasileira, mais especificamente a do Nordeste. Estes

haplogrupos são os que devem ser preferencialmente escolhidos como

referência para estabelecer os critérios de determinação da origem étnica

dos indivíduos desta população.

Haplogrupo R1b

Este haplogrupo é definido por uma mutação SNP que ocorreu a

cerca de 35.000 anos e é o mais representativo na população européia.

Mais da metade dos homens europeus pertence a este haplogrupo. Foi

encontrada em todos os homens europeus R1b uma mutação adicional

chamada M269. Assim a versão 2003 do YCC (2002) nomeou o grupo

definido pela M269 com R1b3. Entretanto, este grupo continua sendo

referenciado como R1b para evitar confusões entre a nomenclatura de

2002 e 2003. Acredita-se que esse haplogrupo se expandiu pela Europa e


63

são descendentes dos primeiros humanos modernos que lá adentraram

entre 35.000 e 40.000 anos (Wells 2002; Cavalli-Sforza 2003). O AMH faz

parte do Haplogrupo R1b.

Haplogrupo E

Pouco ainda se sabe a respeito da origem da linhagem caracterizada

pela mutação chamada M96 que define este haplogrupo. O que se sabe é

que existiram dois grandes processos migratórios desde a África. O

primeiro a cerca de 60.000 anos formado por pequenos grupos que

migraram ao longo da costa e devem ter chegado até a Austrália. O

segundo fluxo há 50.000 anos aproximadamente rumo ao norte. Um

grupo destes viajantes é descendente de um homem com a mutação M89

chamado de Clã do Meio-Oeste. De 90 a 95% dos não africanos são

descendentes deste clã. Os grupos de homens descendentes do mutante

M96 deram origem a duas linhagens tipicamente africanas: a E3a e E3b

(YCC 2002) .

Haplogrupo E3a

O haplogrupo E3a, definido pela mutação chamada M2, também é

uma linhagen africana. A hipótese atual é que este haplogrupo se

dispersou do norte para o sul da África nos últimos 3.000 anos na

expansão agrícola da população Bantu. É restrito geograficamente, e o

mais comum aos povos descendentes dos africanos sub-saarianos. Este

haplogrupo é comum também nos povos Mbenzele e Biaka, pigmeus da

África central (Coia et al. 2003; Cruciani et al. 2004).


64

Haplogrupo E3b

O homem no qual surgiu a mutação M35 nasceu próximo ao Oriente

Médio há cerca de 20.000 anos. Seus descendentes estiveram entre os

primeiros agricultores do oriente médio e ajudaram a disseminar a

agricultura ao longo do Mar Mediterrâneo. No final da última glaciação

(mais ou menos 10.000 anos), a atividade agrícola foi estimulada em

razão das condições existentes o que ajudou o homem mediterrâneo a se

fixar e, mais tarde (8.000 anos), encorajando a expansão desta população

ao longo do litoral Mediterrâneo. Estes fazendeiros ancestrais ajudaram a

trazer a revolução neolítica para aquela região. Esta mutação é

compartilhada pelos africanos do sul e do leste (Cruciani et al. 2004).

Homens do haplogrupo E3b são encontrados também na Ásia e na Europa

em menor proporção chegando a 4% em Portugal 16% na Etiópia e 30%

no sul da África.

Haplogrupo G

Estudos comparativos dos haplótipos modais (Cinnioglu et al. 2004;

Behar et al. 2004) remetem para a origem oeste da Europa do haplogrupo

G. Uma análise mais detalhada nas áreas do sul da Rússia e Kazaquistão

provê mais pistas para a determinação remota do haplogrupos G. A maior

2003 freqüência para o haplogrupo G é encontra na região do Cáucaso na

qual 30% dos homens pertencem ao haplogrupo G. A análise dos

haplótipos modais evidenciou que a distinção entre os subgrupos G2 e G

está nos locos DYS390 e DYS393.


65

Haplgrupo J

O estudo realizado por Semino et al. (2004) é um dos mais

informativos sobre o haplogrupo J. Em geral os indivíduos J são mais

comuns no sul e leste da Europa, com concentração máxima na costa do

mediterrâneo, com as freqüências de 22% na Grécia, 20 a 30% na Itália,

7,3% na Ucrânia e inexistente na Alemanha. De acordo com Al-Zahery et

al.(2003), os subgrupos do haplogrupo J se expandiram há cerca de 7.000

a 9.000 anos. Verificou-se que as STR’s para vários destes subgrupos do

haplogrupo J com resultados combinados que o haplótipo mínimo modal

para o hapogrupo J é: DYS19=14, DYS389I=13, DYS389II=29 ou 30,

DYS390=23, DYS391=10 ou 11, DYS392=11 e DYS393=12.

Haplogrupo Q3

Logo após os primeiros exploradores adentrarem o continente

Americano uma nova mutação denominada M3 surgiu. Este ancestral

nascido na América do Norte é o patriarca da linhagem mais disseminada

nas Américas com tempo estimado entre 10 e 15 mil anos atrás. Enquanto

os descendentes do clã de siberianos da primeira leva de homens a

explorar a América do Norte são encontrados na Ásia a na América, estes

primeiros são encontrados nas três Américas, levando os geneticistas a

acreditar que a mutação surgiu após a entrada do homem na América do

Norte. A deteminação do haplótipo modal característico para os

ameríndios teve como base a combinação de locos pesquisados nos

ameríndios (Bortolini et al. 2003; Rodriguez-Delfin, 1997; Zegura et al.

2004) e os dados disponibilizados no Ybase

(http://www.ybase.org/shaplo.asp). Este haplótipo foi definido

considerando o grupo parental (Q-M3) que foi detectado em todas as


66

populações ameríndias do sul aonde é marcadamente predominante, com

a freqüência média de 77%. O haplótipo mais freqüente (0,265)

encontrado no haplogrupo Q usando quatro locos do haplótipo mínimo foi

referenciado nos dados obtidos por Lell et al. (2002). Três locos (DYS19,

DYS390, e DYS391) foram empregados neste trabalho e mostraram que o

haplótipo característico correspondendo aos alelos para os três locos

(13,24,10), têm uma ampla distribuição entre os nativos na América do

Norte e da América Central, indicando que pode definir esta característica

como de um haplótipo ancestral da linhagem Q-M3 da América do Sul

(Bortolini et al. 2003).

2.5 Estimativas de origem e de TMRCA dos haplótipos

2.5.1 Coalescência

O processo de coalescência é uma poderosa ferramenta de

modelagem para genética de populações. Os estados alélicos de todos os

genes homólogos na população são determinados pela história

genealógica e mutacional dessas cópias. A aproximação coalescente é

baseada na observação que a genealogia é facilmente modelável para trás

no tempo, e a mutações neutras podem se perpetuar. Um grande campo

de fenômenos biológicos pode ser modelado usando estas aproximações.

Enquanto a genética clássica aborda o futuro de uma população, dado um

ponto de partida, a coalescência considera o presente levando em conta o

passado (Kingman 1982a).

O coalescente, de um modo geral, se refere a todos os aspectos da

linhagem ancestral de uma população. Dois aspectos importantes são o

tempo de coalescência até um ancestral e a forma da árvore. A árvore se

reduzirá até que restem apenas dois indivíduos no tempo de coalescência.

Espera-se que o efeito da seleção seja maior quando a taxa de mutação


67

for alta e, quando a taxa de mutação for baixa predomine o efeito da

deriva genética aleatória (Nordborg 2000). Considerando a ausência de

recombinação e da expressão gênica e que os haplótipos do cromossomo

Y humano possuem alta taxa de mutação por loco, o modelo de

coalescente a ser aplicado, deverá primeiramente, se apoiar na teoria

neutralista como ponto de partida (Barton et al. 2002).

2.5.2 Árvores de genes e a coalescência

Uma amostra de genes de uma população representa mais do que

uma quantidade de alelos. Cada gene da amostra tem uma história datada

de centenas ou milhares de gerações atrás. É possível que um par de

alelos em uma amostra atual venha de cópias idênticas do mesmo alelo

produzido por um indivíduo há várias gerações atrás, tendo sido

reproduzidos por descendência ao longo delas de um único ancestral

comum (Kingman 1982a). O termo coalescência se refere a isto, olhar

para o tempo em gerações que se passaram e verificar que dois alelos se

juntam a um ancestral comum (figura 14). Ao longo deste processo de

transferência de genes por descendência, um deles vai de uma amostra k

na população atual para k-1 ancestrais após a primeira coalescência, k-2

ancestrais após a segunda coalescência, até existir dois ancestrais para

toda a amostra no caso de organismos diplóides ou um ancestral apenas

no caso de herança uniparental. A idéia de coalescência considera a

história ancestral de genes, em uma amostra, desenvolvendo um modelo

matemático para determinar o tempo decorrido até um ancestral comum

conhecido com tempo para o mais recente ancestral comum (TMCRA)

(Walsh 2001).

A coalescência se caracteriza pela observação que a população atual

é o efeito de eventos na população anterior k-1 proposta pelo modelo de

Wright-Fisher. Neste modelo, são considerados a princípio que o tamanho

da população (N) é constante ao longo do tempo, as gerações são


68

formadas aleatóriamente por um conjunto gamético grande e que as

freqüências genéticas são originadas somente a partir da deriva. Na

ausência de mutação o alelo se tornará fixo na população, contudo, por

causa da mutação que pode ocorrer ao longo do processo, os alelos não

serão idênticos na seqüência nucleotídica, mesmo sendo de um ancestral

comum (Kingman 1982a). Tipicamente o que se tem é um instantâneo

representado por uma pequena amostra de alelos retirados no tempo

presente. Quando se retrocede ao longo das gerações observa-se que o

número de alelos ancestrais tende a se manter ou a diminuir. Quando este

último ocorre, a cada redução no número de alelos ancestrais denomina-

se evento coalescente (Hein et al. 2004).

Present

Tempo

Mais recente ancestral comum(MRCA)

TCGAGGTATTAACTCTAGGTATTAACTCGAGGCATTAACTCTAGGTGTTAACTCGAGGTATTAGCTCTAGGTATCAAC* ** * *

Presente

Figura 14: Mais recente ancestral comum (seta), 17 gerações anteriores a geração atual indicando o evento coalescente que caracteriza a ancestralidade comum. Observar que as mutações (asteriscos) se perpetuam e definem sublinhagens (cores) do ancestral comum e os eventos coalescentes destas sublinhagens


69

Considerando dois alelos, a probabilidade de que venham de um mesmo

alelo da geração anterior é dada por 1/2N (população diplóide de tamanho

N), logo a chance de que venham de alelos distintos é dada por 1 – 1/2N.

A probabilidade de vários alelos (k1, K2, K3..Ki) ter k alelos parentais

distintos de uma geração anterior é

A probabilidade de que 2 alelos tenham ancestral comum em t gerações

atrás é:

1/2N [1-(1/2n)]t ≈ 1/2N е-t/(2N)

que é o produto da probabilidade de não coalescer em t gerações (1-

1/2N)t multiplicado pela chance de coalescerem em qualquer geração

1/2N.

A exponencial é uma aproximação muito boa quando 1/2N é

pequena. Esta distribuição tem uma média de 2N gerações e uma

variância de (4N)2.

O processo de coalescência pode ser representado pela árvore

genealógica. A cada geração, se existem k alelos presentes, o tempo

passado esperado desde a ultima coalescência é

2N/ ⎟⎟⎠

⎞⎜⎜⎝

⎛2k

A distribuição de cada intervalo de tempo é exponencial, com as

médias sempre crescendo quando voltamos no tempo. O tempo de

coalescência de todos os alelos k é:

t = 4N (1-1/k)


70

com variância

V= 4N2 2

2

2

1

⎟⎟⎠

⎞⎜⎜⎝

⎛Π= i

k

i

(Kingman 1982a; Tajima 1983).

Para o cálculo para populações haplóides, mtDNA e NRY, reduzir-se-á os

coeficientes de N à metade.

2.5.3 Modelos de coalescência com mutação

O que deve ser acrescido ao modelo é a mutação. Obedecendo ao

modelo de infinitos sítios e a neutralidade da mutação, pode-se proceder

do seguinte modo:

• Determinar o tamanho da amostra k e o parâmetro Θ = 4Neμ para

a região gênica de interesse onde Ne é o número efetivo da

população e μ é a taxa de mutação para o sítio. O parâmetro Θ

corresponde à heterozigozidade média calculada pela probabilidade

de ocorrência de uma mutação em qualquer geração dividida pela

probabilidade da ocorrência de uma mutação ou coalescente.

• Retirar os números aleatórios com distribuiçao exponencial

apropriadas para construir uma genealogia gênica, tal que tempos

de coalescência possam ser calculados para k alelos em tempos t e

t-1;

• Em cada ramo da árvore distribuir mutações de acordo com a

distribuição de Poisson, tal que o número da média de mutações em

cada ramo seja dado por 2Nμt, onde t é comprimento do ramo.

Este procedimento tem sido usado em séries de dados gerados sob

a hipótese neutralista para comparar conjuntos de dados observados. A


71

aproximação coalescente pode ser usada para derivar muitos princípios

fundamentais em genética de populações. Métodos de coalescência não

são limitados à consideração do modelo de Wright-Fisher. Pode-se

desenvolver uma equação recursiva para probabilidades de recombinação,

migração ou outros fenômenos em uma árvore de gene, a partir daí,

geralmente inferências poderosas podem ser derivadas de aproximações

coalescentes. É suficiente dizer que o método pode gerar resultados,

geralmente com muito menos dificuldade e a aproximação de coalescência

é especialmente boa para testar hipóteses sobre amostras populacionais

(Donnelly e Tavaré 1995; Kingman 1982a; Kingman 1982b).

2.5.4 Tempo para o mais recente ancestral comum (TMRCA)

Uma boa aproximação para a estimativa do tempo para o mais

recente ancestral comum (TMRCA), aplicado a um conjunto de

cromossomos Y de origens próximas, é o uso da variação de

microssatélites nos cromossomos e das taxas de mutação que são

originadas por análise de famílias ou outros estudos. A base para esta

aproximação é intuitivamente óbvia: um haplogrupo de Y é originado a

partir da ocorrência de uma mutação gerando um marcador binário (SNP

ou Alu). Isto acontece em um único cromossomo, sem necessariamente

estar associado a uma variação no microssatélite, alterando as STR’s. Se a

linhagem originada se espalha, mutações nos microssatélites irão ocorrer:

quanto maior o tempo, maior a variação acumulada. Na prática, vários

fatores podem influenciar a estimativa. Primeiro, a taxa de mutação não é

precisamente definida e os resultados dos trabalhos variam muito. As

taxas de mutação também diferem entre microssatélites e entre alelos.

Segundo, o tempo entre gerações, que compreende uma faixa entre 20 e

35 anos na espécie humana, deve ser escolhido para converter o tempo

medido em gerações para anos. Terceiro, e provavelmente mais

importante, a variação não é acumulada a uma taxa constante, mas


72

variações são algumas vezes perdidas por deriva genética aleatória. Em

decorrência, a estrutura demográfica e populacional tem grande influência

e, em gera,l é mal conhecida. O efeito destas complicações é a existência

de um certo grau de incerteza nas medidas (Jobling e Tyler-Smith 2003).

Um programa de computador (MRCA) foi desenvolvido de acordo

com o estudo realizado por Bruce Walsh (2001) no qual é possível, usando

os parâmetros de taxa de mutação e número de marcadores, estimar o

tempo em gerações para o MRCA. Para dois indivíduos dados que

combinam em k marcadores de microssatélites de n marcadores totais, a

distribuição do tempo t ao MRCA é a medida mais natural de relação para

tais regiões não recombinantes. Um número modesto (20) de marcadores

de microsatélites é suficiente para obter estimativas razoavelmente

precisas de tempo t para os indivíduos separados por 200 ou menos

gerações. Assumindo que um número n de marcadores de dois indivíduos

são examinados e são classificados como iguais ou não, baseado na

semelhança entre os alelos do mesmo loco, usa-se então um método de

aproximanção para o cálculo da distribuição para o tempo t em gerações,

em função do número de marcadores de alelos correspondentes, da taxa

de mutação e um hiperparâmetro que corresponde à estimativa do

tamanho populacional.

(http//lists.rootsweb.com/index/other/miscelanious/genealogy-DNA.html).

2.5.5 Árvores filogenéticas baseadas em Y-STR

A diferenciação entre indivíduos, estimada pela distância genética,

pode ser utilizada para elaboração de árvores evolucionárias de

populações. Uma alternativa popular de estimativa de TMRCA é o uso da

análise do Median-Joining Network (MJN) (Bandelt et al. 1999). Nesta

análise, a genealogia de n indivíduos é considerada como uma árvore

ultramétrica (figura 15) na qual o comprimento dos braços de ligação

corresponde ao tempo em escala e cada nó entre as ligações corresponde


73

a um evento coalescente, sempre representado por uma mutação. Se

existem k ligações (≤ 2n – 2) de comprimentos t1, t2 .... tk em unidades

de tempo em gerações, e se cada clado for definido pela i-ésima ligação

que possui ni indivíduos (i = 1, 2,...k) então o tempo de coalescência t

pode ser expresso por:

t = (n1t1 + n2t2 + ...+ nktk)/n

Se μ denota a taxa de mutação, expressa como a expectativa do número

de mutações em um seguimento por unidade de tempo em gerações,

então é possível associar a i-ésima ligação a uma variável X da

distribuição de Poisson, com parâmetro μi = tiμ. A variável X tem valor

esperado:

E(X) = [(n1t1 + n2t2 + ...+ nktk)/n]μ = tμ

E variância:

V(X) = [(n12t1 + n2

2t2 + ...+ nk2tk)/n2]μ

Dada uma amostra de n seqüências com mutações observadas,

simplesmente é escolhida uma árvore (a mais parcimoniosa) com uma

raiz especificada e m ligações, como estimativa da genealogia

desconhecida e é tomado o número li de mutações observadas ao longo da

i-ésima ligação como estimativa de tiμ. Se mais de uma árvore plausível

existir, o cálculo abaixo deve ser realizado para cada árvore candidata.

Partindo da hipótese de que a árvore considerada é a correta:

ρ= (n1l1 + n2l2 + ...+ nmlm)/n)


74

é uma estimativa não tendenciosa para a idade da raiz especificada. Note

que ρ é a distância média para a raiz, como empregada por exemplo por

Morral et al. (1994). Além disto, pode-se perceber que

σ2 = (n12l1 + n2

2l2 + ...+ nm2lm)/n2

serve como estimativa para variância. Observe que σ2 ≥ ρ/n onde a

equação determina exatamente quando atinge o “star index” como

definido por Torroni et al. (1998), com valor limite máximo de 1 para os

casos de filogenias definidas como “perfect star” (quando o mais freqüente

elemento é o centro da árvore filogenética), ou seja, quando a estimativa

de definição correta da árvore é a mais alta possível. Define-se star-index

(índice estrela) de uma amostra de seqüências, relativo a uma árvore

enraizada, como a freqüência relativa dos pares de seqüências na amostra

que coalescem na raiz da árvore ou que estão conectados por um trajeto

que passa através da raiz. Um grupo mais próximo ao formato estrela na

árvore estará mais próximo de 1. Em geral ρ/σ2 arredondado para o

inteiro mais próximo deverá indicar o tamanho de uma “perfect star” com

aproximadamente os mesmos valores para ρ e σ2. Quanto mais a razão

ρ/σ2 se aproxima de 1, mais próximo de “perfect star” ela se encontra.

Em decorrência, define-se a razão ρ/σ2, como “effective star size” e a

razão ρ/nσ2 a eficiência (para definição do tempo de coalescência) da

amostra.


75

Figura 15: Matriz simétrica geradora (a) e a árvore ultramétrica gerada (b) pela matriz.

Esta matriz é construída baseada nas distãncias genéticas calculadas entre os elementos

dois a dois.Note que a maior distância serve como referência de ramificação

Vários trabalhos foram publicados estabelecendo comparação entre

árvores filogenéticas construídas com base em polimorfismos binários

(SNP e Alu) e microssatélites (STR). Foster et al. (2000), mostraram que

o uso adequado de metodologias permite a construção de duas árvores

filogenéticas para diferentes populações baseadas nos dois tipos de

marcadores e aponta a similadridade entre elas (Figura 16).

Figura 16: Duas árvores filogenéticas (networks) construídas a partir de 256

cromossomos Y de arborigenes da África, Ásia, Europa e Austrália. À esquerda, com

base em microssatélites formado pelos locos DYS19, DXYS156Y, DYS389, DYS390,

DYS392, e DYS393; e à direita usando marcadores de polimorfismos binários (UEP),

evidenciando a similaridade entre elas. O tamanho dos círculos correspondem ao número

de indivíduos, o tamanho dos braços são proporcionais a distância genética. Fonte:

Foster et al. (2000)


76

Um dos trabalhos que reforça a tese de diferentes linhagens, ou

incursões migratórias para o continente americano, das quais se

originaram os ameríndios, é mais um exemplo da aplicação das STR’s do

cromossomo Y para construção de árvores filogenéticas como ferramenta

científica (Bortolini et al. 2003). Neste caso, a árvore permite verificar a

distribuição dos haplótipos referentes aos americanos nativos e mongóis,

nos diferentes braços da árvore filogenética, evidenciando o ponto

coalescente das duas linhagens haplotípicas (Figura 17).

Figura 17: Árvore de network construída a partir de haplótipos formados

por seis marcadores de Y-STR de populações ameríndias com a mutação

P-M45, mostrando o posicionamento dos haplótipos dos índios nativos da

América e dos mongóis na Ásia. As distâncias foram calculadas a partir

das freqüências alélicas. Notar a divisão dos braços (estrela).

Fonte:(Bortolini et al. 2003).


77

2.6 Considerações Finais

Os estudos dos microssatélites do cromossomo Y e do mtDNA

permitem a construção da história humana, através de uma visão

genética, estabelecendo relações entre a genética populacional, o

ambiente e o comportamento.

Segundo o geneticista norte-americano John Avise, a filogeografia pode

ser definida como o campo de estudo dos princípios e processos que

governam a distribuição geográfica de linhagens genealógicas dentro das

espécies, com ênfase em fatores históricos (Avise 2000). Desta forma, a

filogeografia ajuda a contar a história da humanidade desde sua gênese,

reconstruindo teoricamente os processos evolutivos que a originou, até os

mais recentes processos de colonização. Os modelos evolucionários

propostos buscam apontar quais os possíveis mecanismos que teriam

determinado os grupos populacionais e os padrões de variação que são

observados nas populações modernas, por serem estes, reflexos desta

história demográfica. Como conseqüência, diversos trabalhos apresentam

a composição da população Pernambucana como sendo uma mistura de

ameríndios, europeus e africanos. Alguns tomam como base as

freqüências alélicas e haplotípicas de STR, outros utilizam os marcadores

característicos de algumas populações como os SNP, Indels, CCR5 entre

outros (Bastos-Rodrigues et al. 2006).

O estudo dos hapótipos humanos tem, invariavelmente,

transformado, não só a área forense, como tem causado avanços em

serviços relacionados à ancestralidade e genealogia. Alguns projetos

incorporam várias gerações e famílias com o propósito de determinar a

linhagem ancestral e graus de parentesco entre pessoas. Vários sitios na

Internet disponibilizam uma grande diversidade de serviços que podem

ser oferecidos, que compreendem a análise de haplótipos. Como exemplo


78

podemos citar o Family Tree DNA, que oferece uma gama de serviços de

análise de Y-STR com até 37 marcadores e análise de genealogia, com

consulta on-line; a página de Charles F. Kerchner Jr.:

(http://www.kerchner.com/haplogroups-ydna.htm),

através da qual participa-se de grupos de discussão e pode-se

adquirir adereços com alusão aos haplogrupos do cromossomo Y e de

mtDNA; e o YBASE (http://www.ybase.org/shaplo.asp), uma página na

qual pode-se verificar os haplótipos existentes no banco de dados, origem

geográfica e haplogrupos já identificados; o Etno Ancestry

(http://www.ethnoancestry.com), no qual emite-se a certificação do

indivíduo pertencente ao haplogrupo após submeter-se ao exame de

diversos marcadores binários; e ainda o GENE

(http://laboratoriogene.info/Genealogia_por_DNA/index.htm), um grupo

de pesquisa brasileiro, que entre outros serviços, oferece o diagnóstico da

ancestralidade genômica utilizando os marcadores autossômicos (indels)

para prognosticar as contribuições genômicas (européia, africana e

ameríndia) de um indivíduo. Deve-se observar que quanto mais

informação existir sobre a genealogia, composição haplotípica e relação

genética entre os indivíduos, maior será a acurácia dos modelos propostos

nos estudos filogeográficos e de genética de populações. Estes modelos

ajudarão a propor os mecanismos que orientam a distribuição das

freqüências gênicas, e como conseqüência, resolver os problemas futuros

de natureza populacional, auxiliando inclusive nas políticas públicas de

saúde, uma vez estabelecidas relações entre os marcadores genéticos e

determinadas doenças.


79

33–– RREEFFEERRÊÊNNCCIIAASS BBIIBBLLIIOOGGRRÁÁFFIICCAASS

Al-Zahery (2003) Y-chromosome and mtDNA polymorphisms in Iraq, a

crossroad of the early human dispersal and of post-Neolithic

migrations. Mol Phyl Evol 28:458-472

Alves-Silva J, Santos MS, Guimarães PEM, Ferreira ACS, Bandelt H-J, Pena

SDJ, Prado VF (2000) The Ancestry of Brazilian mtDNA lineages.

Am. J. Hum. Genet. 67:444–461

Athey TW (2005) Haplogroup Prediction from Y-STR Values Using an

Allele-Frequency Approach. Journal of Genetic Genealogy 1:1-7

Avise JC 2000. Phylogeography: The History and Formation of Species.

Harvard University Press, Cambridge, MA. (447 pp.).

Azevedo DA, Silva LAF, Barbosa ABG, Mauricio-da-Silva L (2005) Diversity

and Mutation Analysis of Minimal Haplotype Y-Microsatellites Loci Plus

DYS447, DYS458 and DYS464 in Alagoas, Northeastern Brazil

Ballard DJ, Phillips C, Wright G, Thacker CR, Robson C, Revoir AP, Court

DS (2005) A study of mutation rates and the characterisation of

intermediate, null and duplicated alleles for 13 Y chromosome STRs.

Forensic Sci Int 155(1):65-70

Bandelt H-J, Forster P, Röhl A (1999) Median-joining networks for inferring

intraspecific phylogenies. Mol Biol Evol 16:37-48


80

Barbujani, G. and R.R. Sokal. 1990. Zones of sharp genetic change in

Europe are also linguistic boundaries. Proceedings of the National

Academy of Sciences USA 87:1816-1819.

Barros JEXS, Maciel EMBB, Gomes AV,Martins AM, Silva RS, Maurício-da-

Silva L (2006) Human Y-chromosome STR haplotype diversity in

Pernambuco, Northeast Brazil (submitted to forensic science

international)

Barton NH, Depaulis, Etheridge FAM (2002) Neutral evolution in spatially

continuous populations. Theor Popul Biol. 61:31-48

Bastos-Rodrigues L, Pimenta JR, Pena SDJ (2006) The Genetic Structure

of Human Populations Studied Through Short Insertion-Deletion

Polymorphisms. Annals of Human Genetics 70: 658

Behar DM, Garrigan D, Kaplan ME, Mobasher Z, Rosengarten D, Karafet

TM, Quintana-Murci, Ostrer H, Skorecki K, Hammer MF (2004)

Contrasting patterns of Y chromosome variation in Ashkenazi Jewish

and host non-Jewish European populations. Hum Genet 114:354-

365

Beleza S, Gusmão L, Lopes A, Alves C, Gomes I, G Maria, Calafell,

Carracedo A, Amorim A (2006) Micro-Phylogeographic and

Demographic History of Portuguese Male Lineages Annals of Human

Genetics 70: 181-194

Boissinot S and Furano AV (2005) The recent Evolution of human

retrotransposons. Cytogenetic and Genome Research 110:402-406


81

Bortolini MC, Salzano FM, Thomas MG, Stuart S, Nasanen SPK , Bau CHD,

Hutz MH, Layrisse Z, Petzl-Erler ML, Tsuneto LT, Hill K, Hurtado AM,

Castro-de-Guerra D, Torres MM, Groot H ,Michalski R, Nymadawa P,

Bedoya G, Bradman N, Labuda D , Ruiz-Linares A (2003), Y-

Chromosome Evidence for Differing Ancient Demographic Histories in

the Americas Am. J. Hum. Genet. 73:524–539

Bosch E, Calafell F, Santos FR, Perez-Lezaun A, Comas D, Benchemsi N,

Tyler-Smith C, Bertranpetit J (1999) Variation in Short Tandem

Repeats Is Deeply Structured by Genetic Background on the Human Y

Chromosome Am. J. Hum. Genet. 65:1623–1638, 1999

Butler JM, Schoske R and Vallone PM (2003) Highly multiplexed assays for

measuring polymorphisms on the Y-chromosome. Int Congress series

1239: 301-305.

Carvalho-Silva DR, Santos FR, Hutz MH, Salzano FM and Pena SDJ (1999)

Divergent human Y-chromosome microsatellite evolution rates. J Mol

Evol: 49: 204-214.

Carvalho-Silva DR, Santos FR, Rocha J and Pena SDJ (2001) The

phylogeography of brazilian Ychromosome lineages. Am J Hum Genet

68: 281286.

Casanova M, Leroy P, Boucekkine C, Fellous M, Purrello M, Fiori G,

Siniscalco M (1985) A human Y-linked DNA polymorphism and its

potential for estimating genetic and evolutionary distance. Science,

230, 1403–1406.


82

Cavalli-Sforza LL, Wang WSY (1986) Spatial distance and lexical

replacement. Language 62:38-55

Cavalli-Sforza LL (1993) Genes, povos e línguas. Tradução de Carlos

Afonso Malferrari. São Paulo: Companhia das Letras, 2003. 294 p.

Cavalli-Sforza L L., Menozzi P, Piazza A (1994) The history and geography

of human genes.Princeton, Princeton University Press.

Cavalli-Sforza L.L., Feldman MW (2003) The application of molecular

genetic approaches to the study of human evolution. Nature

Genetics, 33, 266-75.

Chakravarti A, (1999) Population genetics – making sense out of

sequence. Nature genetics,24,56-60.

Cinnioglu C, King R, Kivisild T, Kalfoglu E, Atasoy S, Cavalleri GL, Lillie AS,

Roseman CC, Lin AA, Prince K, Oefner PJ, Shen P, Semino O,

Cavalli-Sforza LL, Underhill PA (2004) Excavating Y-chromosome

haplotype strata in Anatolia. Hum Genet 114:127–148.

Coia V, Caglià A, Arredi B, Donati F, Santos FR, Pandya A, Taglioli L, Paoli

G, Pascali V, Destro-Bisol G, Tyler-Smith C (2003) Binary and

microsatellite polymorphisms of the Y-chromosome in the Mbenzele

pygmies from the Central African Republic. American Journal of

Human Biology 16: 1 , 57 – 67

de Knijff P (2000) Messages through bottlenecks: on the combined use of

slow and fast evolving polymorphic markers on the human Y-

chromosome. Am J Hum Genet 67: 1055-1061


83

Dellalibera E, Havro MLB, Souza M, Kajihara K, Mauricio-da-Silva L,Silva R

S (2004) Genetic analysis of 13 STR loci in the population from the

State of Pernambuco, Northeast Brazil. Forensic Scic Int.

Di Rienzo A, Donelly P, Toomajian CH, Sisk B, hill A, Petzl-Erler ML, Haines

GK and Barch DH (1998) Heterogeneity of microsatellite mutations

within and between loci, and implications for human demographic

histories. Genetics 148: 1269-1281.

Donnelly P and Tavaré S (1995) Coalescents and genealogical structure

under neutrality. Anna. Rev. Genet. 1995. 29:401-21

Dupuy BM, Stenersen M, Egeland T, Olaisen B (2004) Y-chromosomal

microsatellite mutation rates: differences in mutation rate between

and within loci. Hum Mutat 23(2):117-24

Ferreira OL (1987) História do Brasil, 12th edn. Ática, São Paulo Brazil

Floridia G, Gimelli G, Zuffardi O, Earnshaw WC, Warburton PE, Tyler-

Smith C (2000) A neocentromere in the DAZregion of the human Y

chromosome. Chromosoma (2000) 109:318–327

Forster P, Rohl A, Lunnemann P, Brinkmann C, Zerjal T, Tyler-Smith C,

Brinkmann B (2000) A Short Tandem Repeat–Based Phylogeny for

the Human Y Chromosome. Am. J. Hum. Genet. 67:182–196.

Freyre G (1933) Casa Grande e Senzala. São Paulo, Círculo do Livro S.A

Garcia C (1986) O que é o Nordeste Brasileiro, 2nd edn. Brasiliense, São

Paulo Brasil


84

Goldstein DB and Schlötterer C (1999) Micosatellites evolution and

applications. Oxford University Press, New York. 352 pp.

Grattapaglia D, Kalupniek S, Guimarães CS, Ribeiro MA, Diener PS and

Soares CN (2004) Ychromosome STR haplotype diversity in brazilian

populations. Forensic Sci Int 149: 99-107.

Gusmão L, Sanchez-Diz P, Alves C, Beleza S, Lopes A, Carracedo A,

Amorim A (2003) Grouping of Y-STR haplotypes discloses European

geographic clines. Forensic Science International 134 :172–179

Gusmão L, Sánchez-Diz P, Calafell F, Martín P, Alonso CA, Álvarez-

Fernández F, Alves C, Borjas-Fajardo L, Bozzo WR, Bravo ML, Builes

JJ, Capilla J, Carvalho M, Castillo C, Catanesi CI, Corach D, Di Lonardo

AM, Espinheira R, Fagundes de Carvalho E, Farfán MJ, Figueiredo HP,

Gomes I, Lojo MM, Marino M, Pinheiro MF, Pontes ML, Prieto V,

Ramos-Luis E, Riancho JA, Souza Góes AC, Santapa OA, Sumita DR,

Vallejo G, Vidal Rioja L, Vide MC, Vieira da Silva CI, Whittle MR,

Zabala W, Zarrabeitia MT, Alonso A, Carracedo A, Amorim A (2005)

Mutation rates at Y chromosome specific microsatellites. Human

Mutation 26(6): 520-528.

Hawks J, Wolpoff MH (2003) Sixty years of modern human origins in the

American Anthropological Association. American Anthropologist, 105,

89-100.

Hein J, Schierup MH, Wiuf C (2004) Gene Genealogies, Variation and

Evolution-A Primer in Coalescent Theory. Oxford University Press UK

Heyer E, Puymirat J, Dieltjes P, Bakker E and knijff P (1997) Estimating Y

chromosome specific microsatellite mutation frequencies using deep

rooting pedigrees. Hum Mol Gen 6: 799-803.


85

Holtkemper U, Rolf B, Hohoff C, Forster P and Brinkmann B (2001)

Mutation rates at two human Y-chrosomal microsatellite loci using

small pool PCR techniques. Hum Mol Gen 10: 629-633.

Hopkinson DA; Harris H.(1966) Rare phosphoglucomutase phenotypes.

Ann. Hum. Genet. 30: 167-181, 1966.

IBGE-Instituto Brasileiro de Geografia e Estatística (2000;2001) Brasil:

500 anos de povoamento. IBGE, Rio de Janeiro.

Jobling MA and Tyler-Smith C (2003) The Human Y Chromosome:an

evolutionary marker comes age. Nature Reviews. 4.

Kayser M, Caglià V, Corach D, Fretwell N, Gehrig C, Graziosi G, Heidorn F,

Herrmann S, Herzog B, Hidding M, Honda K, Jobling M, Krawczak M,

Leim K, Meuser S, Meyer E, Oesterreich W, Pandya A, Parson W,

Penacino G, Perez-Lezaun A, Piccinini A, Prinz M, Schmitt C, Schneider

PM, Szibor R, Teifel-Greding J, ·Weichhold G, de Knijff P, Roewer L

(1997) Evaluation of Y-chromosomal STRs: a multicenter study. Int J

Legal Med (1997) 110 : 125–133

Kayser M, Roewer L, Hedman M, Henke L, Henke J, Brauer S, Krüger C,

Krawczak M, Nagy M, Dobosz T, Szibor R, de Knijff P, Stoneking M,

Sajantila A (2000) Characteristics and frequency of germline

mutations at microsatellite loci from the human Y chromosome, as

revealed by direct observation in father/son pairs. Am J Hum Genet

66(5):1580-8


86

Kayser M and Sajantila A (2001) Mutations at Y-STR loci: implications

forpaternity testing and forensic analysis. Forensic Sci Int 118: 116-

121.

Kayser M, Kittler R, Erler A, Hedman M, Lee AC, Mohyuddin A, Mehdi SQ,

Rosser Z, Stoneking M, Jobling MA, Sajantila A and Tyler-Smith

(2004) A comprehensive survey of human Y-chromosomal

microsatellites. Am J Hum Genet 74: 1183-1197.

Kendrew J. (1994) The Encyclopedia of Molecular Biology. Blackwell

Science Ltd 262-64

Kingman, J.F.C. (1982a). The coalescent, Stochastic Processes and their

Applications 13, 235–248.

Kingman, J.F.C. (1982b). On the genealogy of large populations. Journal

of Applied Probability 19A, 27–43.

Klintschar M and Wiegand P (2003) Polymerase slippage in relation to the

uniformity of tetrameric repeat stretches. Forensic Sci Int 135:163-

166.

Knight A, Underhill PA, Mortensen HM, Zhivotovsky LA, Lin AA, Henn BM,

Louis D, Ruhlen M, Mountain JL (2003) African Y Chromosome and

mtDNA Divergence Provides Insight into the History of Click

Languages. Current Biology 13: 464–473

Laguardia, J (2005) Raça, evolução humana e as (in)certezas da genética.

Antropo, 9: 13-27.


87

Lahn BT, Pearson NM, Jegalian K (2001) The human Ychromosome, in the

light of evolution. Nat. Rev. Genet. 2: 207–216.

Lell JT, Sukernik RI, Starikovskaya YB, Su B, Jin L, Schurr TG, Underhill

PA, Wallace DC (2002) The dual origin and Siberian affinities of Native

American Y chromosomes. Am J Hum Genet 70:192–206

Lewontin RC and Hubby JL (1966) A molecular approach to the study of

genic hetero-zygosity in natural populations. 11 Amount of variation

and degree of heterozygosity in natural populations of Drosophila

pseudoobscura. Genetics 54 : 595-609

Mauricio-da-Silva L, SILVA RS, DELLALIBERA E, DONADI E A (2000)

Population Genetics of HPRTB, F13B and LPL in Pernambuco,

Northeast of Brazil. Journal Of Forensic Sciences 45:684 – 686.

Medeiros T (1980) O negro na etnia do Rio Grande do Norte. Revista do

Instituto Histórico e Geográfico do Rio Grande do Norte 7:1909

Morral N, Bertranpetit J, Estivill X, Nunes V, Casals T, Gimenez J, Reis A,

Varon-Mateeva R, Macek Jr. M, KalaydjievaL, Angelicheva D,

Dancheva R, Romeo G, Russo MP,Garnerone S, Restagno G, Ferrari

M, Magnani C, Claustres M, Desgeorges M, Schwartz M, Schwarz M,

Dallapiccola B, Novelli G, Ferec C, et al (1994) The origin of the

major cystic fibrosis mutation (�F508) in European populations. Nat

Genet 7:169–175

Nigam P, Dellalibera E, Mauricio-Da-Silva L., Donadi EA, Silva R. S (2004)

Polymorphism of HLA class I genes in the Brazilian population from

the Northeastern State of Pernambuco corroborates anthropological

evidence of its origin. Tissue Antigens 64: 204-209


88

Nordborg M (2000) Coalescent theory In Statistical Genetics, ed. D.J.

Balding, M. Bishop and C. Cannings, Wiley and Sons. New York. 179-

212

Olaissen B, Bär W, Brinkmann B, Budowle B, Carracedo A, Gill P, Lincoln

P, Mayr WR and Rand S (1998) DNA recommendations 1997 of the

International Society for Forensic Genetics. Vox Sang 74: 61-63.

Parra FC, Amado RC, Lambertucci JR, Rocha J, Antunes C, Pena SDJ

(2003) Color and genomic ancestry in Brazilians. PNAS 100:177-182.

Pena SDJ, Carvalho-Silva DR, Alves-Silva J, Prado VF (2000) Retrato

Molecular do Brasil. Ciência Hoje 27: 16-25

Pereira L, Gusmão L, Alves C, Amorim A, Prata MJ (2002) Bantu and

European Y-lineages in Sub-Saharan Africa. Ann. Hum. Genet: 66,

369±378

Ribeiro D – O Povo Brasileiro (Edição integral). São Paulo, Círculo do Livro

S.A, 1995

Rodrigues-Delfin L, Santos SEB, Zago MA (1997) Diversity of the human Y

chromosome of South American Amerindians: a comparison with

Blacks, hites, and Japanese from Brazil. Ann. Hum. Genet.:61,

439±448

Roewer L, Krawczak M, Willuweit S, Nagy M, Alves C, Amorim A, Anslinger

K, Augustin C , Betz A, Bosh E, Caglia A, Carracedo A, Corach D,

Dekairelle AF, Dobosz T, Dupuy BM, Furedi S, Gehring C, Gusmao L,

Henke J, Henke L, Hidding M, Hohoff C, Hoste B, Jobling MA, Kargel


89

HJ, de Knijff P, Lessig R, Liebeherr E, Lorente M, Martinez-Jarreta B,

Nievas P, Nowak M, Parson W, Pascali VL, Penacino G, Ploski R, Rolf

B, Sala A, Schmidt U, Schmitt C, Schneider PM., Szibor R, Teifel-

Greding J., Kayser M (2001) Online reference database of European

Y-chromosomal short tandem repeat (STR) haplotypes. Forensic Sci.

Int. 118: 106-113.

Roewer L, Arnemann J, Spurr NK, Grzeschik KH and Epplen JT (1992)

Simple repeat sequence on the human Y chromosome are equally

polymorphic as their autosomal counterparts. Hum Genet 89: 389-

394.

Roewer L, Krawczak M, Willuweit S, Nagy M, Alves C, Amorim A, Anslinger

K, Augustin C , Betz A, Bosh E, Caglia A, Carracedo A, Corach D,

Dekairelle AF, Dobosz T, Dupuy BM, Furedi S, Gehring C, Gusmao L,

Henke J, Henke L, Hidding M, Hohoff C, Hoste B, Jobling MA, Kargel

HJ, de Knijff P, Lessig R, Liebeherr E, Lorente M, Martinez-Jarreta B,

Nievas P, Nowak M, Parson W, Pascali VL, Penacino G, Ploski R, Rolf

B, Sala A, Schmidt U, Schmitt C, Schneider PM., Szibor R, Teifel-

Greding J., Kayser M (2001) Online reference database of European

Y-chromosomal short tandem repeat (STR) haplotypes. Forensic Sci.

Int. 118 :106-113.

Rolf B, Keil W, Brinkman B and Rower L (2001) Paternity testing using Y-

STR haplotypes: assigning a probability for paternity in cases of

mutations.

Russell-Wood, A. J. (1998) A sociedade portuguesa no ultramar em

Francisco Bethencourt e Kirti Chaudhuri (orgs.), História da Expansão

Portuguesa: I,266-281


90

Samson M, Libert F, Doranz B, Rucker J, Liesnard C, Farber CM, Saragosti

S, Lapoumeroulie Cognaux J, Forceille C, Muyldermans G,

Verhofstede C, Burtonboy G, Georges M, Imai T, Rana S, Yi Y, Smith

R, Collman R, Doms R, Vassart G & Parmentier M (1996). Resistance

to HIV-1 infection in Caucasian individuals bearing mutant alleles of

the CCR-5 chemokine receptor gene. Nature, 382: 722-725.

Santos MV, Carvalho M, Anjos MJ, Andrade L, Lopes V, Corte-Real F, Vieira

DN and Vide MC (2003) Y-chromosome DNA haplotypes in human

samples from Bahia, Brazil. Int Congr Ser 1239: 443– 448

Semino O, Magri C, Benuzzi G, Lin AA, Al-Zahery N, Battaglia V, Maccioni

L, Triantaphyllidis C, Shen P, Oefner PJ, Zhivotovsky LA , King R,

Torroni A, Cavalli-Sforza LL, Underhill PA, Santachiara-Benerecetti AS

(2004) Origin, Diffusion, and Differentiation of Y-Chromosome

Haplogroups E and J: Inferences on the Neolithization of Europe and

Later Migratory Events in the Mediterranean Area. Am. J. Hum.

Genet. 74:1023–1034, 2004

Schlötterer C (1998) Genome evolution: are microsatellites really simple

sequences? Curr. Biol. 8: 132-134.

Schoske R (2003) The design, optimization and testing of Y chromosome

short tandem repeat megaplexes. PhD Thesis, American University,

Washington D. C.

Schoske R, Vallone PM, Kline MC, Redman JW and Butler JM (2004) High-

throughput Y-STR typing of U. S. populations with 27 regions of the Y

chromosome using two multiplex PCR assays. Forensic Sci Int 139:

107-121.


91

Schultes T, Hummel S and Herrmann B (1999) Amplification of

Ychromosomal STR’s from ancient skeletal material. Hum Genet

104:164-166.

Schmid CW and Jelinek WR (1982) The Alu family of dispersed repetitive

sequences. Science 216: 1065–1070.

Spuhler JN (1979) Genetic Distances, Trees, and Maps of North American

Indians. In The First Americans: Origins, Affinities, and Adaptations,

ed. W. S. Laughlin and A. B. Harper, pp. 135-83. New York: G.

Fischer.

Stone AC and Stoneking M (1998) mtDNA analysis of a prehistoric

Oneonta population: implications for the peopling of the New World.

Am. J. Hum. Genet. 62:1153– 1170.

Szibor R, Krawczak M, Hering S, Edelmann J, Kuhlisch E and Krause D

(2003) Use of X-linked markers for forensic purposes. Int J Legal Med

117: 67-74.

Tajima F (1983) Evolutionary relationship of DNA sequences infinite

populations. Genetics 105: 437–460.

Tarazona-Santos E, Carvalho-Silva DR, Pettener D, Luiselli D, De Stefano

GF, Labarga CM, Rickards O,Tyler-Smith C, Pena SDJ, Santos FR

(2001) Genetic Differentiation in South Amerindians Is Related to

Environmental and Cultural Diversity: Evidence from the Y

Chromosome. Am. J. Hum. Genet. 68:1485–1496


92

The Y-chromosome consortium, a nomenclature system for the tree of

human Y-Chromosomal binary haplogroups, Genome Res. 12 (2002)

339–348.

Thomas MG, Parfitt T, Weiss DA, Skorecki K, Wilson JF, le Roux M,

Bradman N, Goldstein DB (2000) Y chromosomes traveling south: the

Cohen modal haplotype and the origins of the Lemba—the “Black

Jews of Southern Africa.” Am J Hum Genet 66:674–686

Torroni A, Bandelt H-J, D’Urbano L, Lahermo P, Moral P, Sellitto D, Rengo

C, Forster P, Savontaus M-L, Bonne´-Tamir B, Scozzari R (1998)

mtDNA analysis reveals a major late paleolithic population expansion

from southwestern to northeastern Europe. Am J Hum Genet

62:1137–1152

Yaoa Y, Bravib CM, Bandelt HC (2004) A call for mtDNA data quality

control in forensic science. Forensic Science International 141: 1–6

Walsh B (2001) Estimating the Time to the Most Recent Common Ancestor

for the Y chromosome or Mitochondrial DNA for a Pair of Individuals.

Genetics 158: 897–912

Watterson DM, Schavocky JP, Guo L, Weiss C, Chlenski A, Shirinsky VP,

Eldik LJV, Haiech J (1999) Analysis of the kinase-related protein gene

found at human chromosome 3q21 in a multi-gene cluster:

Organization, expression, alternative splicing, and polymorphic

marker. Journal of Cell. Bioch. 75: 481-491

Wells S (2002) The Journey of Man: A Genetic Odyssey. Ed.. Princeton

University Press UK


93

Wilson JF, Weiss DA, Richards M, Thomas MG, Bradman N, Goldstein DB

(2001) Genetic evidence for different male and female roles during

cultural transitions in the British Isles. Proc Natl Acad Sci USA

98:5078–5083

Underhill PA, Jin L, Zemans R, Oefner PJ and Cavalli-Sforza LL (1996) A

pre-Columbian Y chromosomespecific transition and its implications

for human evolutionary history. Proc. Natl. Acad. Sci. USA 93:196–

200.

Underhill PA, Passarino G, Lin AA, Shen P, Lahrs MMN, Foley RA, Oefner

PJ, Cavalli-Sforza LL (2001) The phylogeography of Y chromosome

binary haplotypes and the origins of modern human populations Ann.

Hum. Genet. (2001), 65, 43±62

Viguera E, Canceill D and Erlich SD (2001) Replication slippage involves

DNA polymerase pausing and dissociation. The EMBO J 20:2587-

2595.

Zegura SL, Karafet TM, Zhivotovsky LA, Hammer MF (2004) High-

Resolution SNPs and Microsatellite Haplotypes Point to a Single

Recent Entry of Native American Y Chromosomes into the Americas.

Mol. Biol. Evol. 21(1):164–175.

Zhivotovsky LA, Underhill PA, Cinnioglu C, Kayser M, Morar B, Kivisild T,

Scozzari R, Cruciani F, Destro-Bisol G, Spedini G, Chambers GK,

Herrera RJ,Yong KK, Gresham D, Tournev I, Feldman MW, Kalaydjieva

L (2004) The Effective Mutation Rate at Y Chromosome Short Tandem

Repeats with Application to Human Population-Divergence Time. Am.

J. Hum. Genet. 74:000–000


94

4. Artigo


95

HHAAPPLLÓÓTTIIPPOOSS EE HHAAPPLLOOGGRRUUPPOOSS DDOO

CCRROOMMOOSSSSOOMMOO YY DDOO EESSTTAADDOO DDEE

PPEERRNNAAMMBBUUCCOO,, BBRRAASSIILL::

AA CCOONNTTRRIIBBUUIIÇÇÃÃOO DDEE TTRRÊÊSS EETTNNIIAASS

Manuscrito a ser encaminhado à revista

JJoouurrnnaall ooff FFoorreennssiicc SScciieenncceess

ISSN 0022-1198 PA, U.S.A.

HHAAPPLLÓÓTTIIPPOOSS EE HHAAPPLLOOGGRRUUPPOOSS DDOO CCRROOMMOOSSSSOOMMOO YY DDOO EESSTTAADDOO DDEE

PPEERRNNAAMMBBUUCCOO,, BBRRAASSIILL::

AA CCOONNTTRRIIBBUUIIÇÇÃÃOO DDEE TTRRÊÊSS EETTNNIIAASS


96

Alexandre M. Martins,1 M.Sc.; Valdir de Q. Balbino,1 Ph.D.; Jemima E.X.S Barros.1 M.Sc.; and Luiz Mauricio-da-Silva,1 Ph.D. 1 Departamento de Genética, Centro de Ciências Biológicas, Universidade

Federal de Pernambuco.

Corresponding author:

Luiz Mauricio da Silva

Dept. de Genética – CCB

Universidade Federal de Pernambuco – Cidade Universitária

50.000-000 Recife, PE, Brazil

[email protected]


97

HAPLÓTIPOS E HAPLOGRUPOS DO CROMOSSOMO Y NO

ESTADO DE PERNAMBUCO, BRASIL: a contribuição de três

etnias

Introdução

Os haplótipos do cromossomo Y têm sido freqüentemente usados em

estudos de evolução humana auxiliando na identificação da origem étnico-

geográfica e da afiliação lingüística dos indivíduos. Estes estudos levam

em conta que os haplótipos da região não recombinante do cromossomo Y

(NRY) devem ter se originado a partir de haplótipos característicos dos

primeiros ancestrais humanos. À medida que estes indivíduos migraram

para novas regiões, o conjunto inicial de genes foi sendo alterado por

mutações que resultaram em novos haplótipos e passaram a se comportar

como uma nova linhagem evolutiva independente (Pena et al. 2000).

O agrupamento dos indivíduos em haplogrupos tem base na

classificação cladística do polimorfismo binário encontrado na NRY (Jobling

e Tyler-Smith 2003). Considerando que as linhagens haplotípicas

apresentam diferentes variações nas curtas repetições em tandem do

cromossomo Y (STR-Y) em razão de suas histórias evolutivas distintas, é

possível correlacionar um indivíduo a um dado haplogrupo e, por

conseguinte, estimar sua origem étnica. Para tanto, usam-se as

freqüências alélicas que potencialmente conferem a cada sublinhagem

haplotípica um padrão característico de polimorfismo (Tarazona-Santos et

al. 2001).

A diversidade haplotípica existente é, sob o ponto de vista forense,

um ótimo identificador de patrilinhagens apesar de não o ser para

identificação individual em razão de que o haplótipo é herdado

inteiramente pelos descendentes masculinos. Estes dados podem ser

também úteis para verificação das relações genealógicas entre populações


98

e grupos étnicos. Por este motivo, existe um considerável interesse na

determinação dos haplogrupos, que em geral é feita através da

identificação dos marcadores binários que os caracterizam. Entretanto, o

processo de determinação do haplogrupo através da análise de SNP

(Nucleotídeo de Polimorfismo Único) algumas vezes pode ser um processo

demorado. Assim, existe interesse em se prognosticar o haplogrupo a

partir de um conjunto de marcadores de STR (Athey 2005). O estudo das

populações miscigenadas usando as STR-Y beneficia-se diretamente dos

bancos de dados existentes para a construção dos perfis haplotípicos das

populações, determinado pelo fluxo gênico masculino ao longo planeta.

A população brasileira resultou de um processo contínuo de

miscigenação, cuja intensidade deve ter variado ao longo do tempo em

decorrência da heterogeneidade dos grupos étnicos parentais e da taxa de

miscigenação (Parra et al. 2003). O Nordeste, uma das cinco regiões

geográficas do Brasil (Figura 1), foi a primeira área a ser ocupada pelos

portugueses ainda no século XVI (Garcia 1986), quando já era habitada

por populações nativas (Medeiros 1980). Entre 1532 e 1538 foram

introduzidas as primeiras levas de negros escravos africanos da cultura

Banto, provenientes de Angola, Congo e Moçambique. Em 1534, os

portugueses chegaram a Pernambuco, um dos estados da região, e a

partir de 1537 deram início a sua colonização. A sociedade pernambucana,

assim como toda a sociedade nordestina do período colonial, tinha como

principais características: o latifúndio (baseado na cultura da cana-de-

açúcar); o escravismo; e o patriarcado, na figura do senhor de engenho,

detentor absoluto da autoridade em seus domínios. O modelo sócio-

econômico adotado no período colonial garantiu a prosperidade econômica

para Pernambuco e foi determinante na composição étnica da população e

na sua mestiçagem. Os portugueses habituados ao contato com outros

povos, uniram-se às mulheres índias e negras desde o início do período

colonial (Ferreira 1987).


99

A família patriarcal, base da sociedade da região canavieira,

contribuiu para a perpetuação da patrilinhagem européia, uma vez que o

modelo familiar adotado previa um número elevado de filhos e a

submissão da mulher. Este último fator colaborou para a mestiçagem,

principalmente com as mulheres negras escravas, pois estas estavam

mais estreitamente relacionadas com o ambiente doméstico. Neste

contexto, definiu-se o perfil genético da população de Pernambuco, sendo

Portugal a principal referência genética masculina desta região (Carvalho-

Silva et al. 2001). Adicionalmente, deve-se ressaltar a presença holandesa

durante um quarto de século (1630-1654), cuja influência ainda se faz

notar em aspectos culturais, econômicos, urbanísticos e, presumidamente,

na composição genética da população (Ferreira 1987).

Este trabalho consistiu na análise dos polimorfismos dos locos de

microssatélites DYS19, DYS385a, DYD385b, DYS389I, DYS389II, DYS390,

DYS391, DYS392, DYS393, DYS437, DYS458 e DYS464a, DYS464b,

DYS464c e DYS464d, de 247 indivíduos não relacionados da população de

Pernambuco. Usou-se como base os haplótipos de Y-STR nas populações

de referência (europeus, africanos e ameríndios), levando-se em

consideração tanto aspectos históricos quanto os dados genéticos. A

abordagem estatística assumiu o modelo SMM - Stepwise Mutation Model

(Kimura e Ohta 1978). Desta forma foi possível estabelecer um método de

trabalho que se mostrou útil na determinação da contribuição genética das

três principais etnias formadoras da população de Pernambuco, assim

como na predição do haplogrupo de cada haplótipo.

Material e métodos

A Extração do DNA, a PCR e a tipagem dos dados foram realizados no

trabalho em publicação de Barros et al. (2006), do qual foram retirados os

haplotipos usados neste trabalho.


100

Análise de Dados: As freqüências relativas dos alelos, haplótipos e

diversidade haplotípica foram calculadas usando um software desenvolvido

para análise de dados. A análise comparativa entre populações de

variância molecular (AMOVA) entre as populações estudadas foi realizada

usando o software Arlequim 3.01 (Schneider et al. 2006).

Definição dos dados e terminologia. Foram analisados 247 haplótipos

do cromossomo Y de indivíduos não relacionados da população do Estado

de Pernambuco (Figura 1), e freqüências de haplótipos mínimos de 1413

homens, sendo 87 da população da Holanda, 984 de Portugal, 129

ameríndios e 213 africanos, disponíveis no banco de dados de haplótipos

de STR-Y (YHRD; http://www.ystr.org). Os haplótipos foram armazenados

em um banco de dados local e analisados com um aplicativo construído

especificamente para análise de STR-Y, denominado Y-STRCALC

(ferramenta de análise de haplótipos de STR do cromossomo Y). O

haplótipo mínimo foi estabelecido com os locos (DYS19, DYS385,

DYS389I, DYS39II, DYS390, DYS391, DYS392 e DYS393) segundo o

manual da International Society for Forensic Genetics – ISFG (Gusmão et

al. 2006), assumindo que este haplótipo deve ser significativamente

representativo, confiável e discriminante para a determinação dos

haplótipos mais freqüentes e modais para cada população. Os haplótipos

modais foram estabelecidos a partir das freqüências alélicas dos

haplótipos em cada população de referência: 1) europeus (Roewer et al.

2001; Roewer et al. 2005; Kayser et al. 2001; Kayser et al. 1997; Geada

et al. 2004; de Knijff et al. 1997; Carvalho et al. 2003; Gusmão et al.

2003); 2) ameríndios (Bortolini et al. 2003; Rodriguez-Delfin et al. 1997;

Zegura et al. 2004); e 3) africanos (Pereira et al. 2002; Alves et al. 2003;

Arroy-Pardo et al. 2004).


101

Análise das Freqüências. Foram calculadas as freqüências dos

haplótipos mínimos mais freqüentes dos portugueses, holandeses,

africanos e ameríndios na população de Pernambuco. Em seguida, foram

definidos grupos (clusters) destes haplótipos, a partir do cálculo das

distâncias genéticas com 0, ±1 e ± 2 passos seguindo o Stepwise

Mutation Model (SMM) (Kimura e Ohta 1978). As freqüências dos

haplótipos foram obtidas por contagem cumulativa do número de

ocorrências de cada haplótipo de referência em Pernambuco (Gusmão et

al. 2003).

Diagnóstico do Haplogrupo do Cromossomo Y. Os haplótipos de

Pernambuco foram submetidos ao cálculo de estimativa de haplogrupo. A

classificação dos haplótipos é geralmente estabelecida através de modelos

baseados em distâncias genéticas, enquanto que a predição dos

haplogrupos tem nas freqüências dos alelos a sua principal característica

(Athey 2005). Neste trabalho introduziu-se um peso para as taxas de

mutação, inversamente proporcional às médias destas taxas por loco.

Buscou-se inferir a partir da determinação da distância genética dos

haplótipos em relação ao modal do haplogrupo. Assim, valendo-se do

conjunto de publicações de referência e dos bancos de dados disponíveis,

foi determinado o haplótipo modal para os seguintes haplogrupos: E3a;

E3b; G; I; I1a; J; N; Q; R1a; e R1b, considerados como os mais prováveis

e suficientes para a caracterização das etnias formadoras da população

Pernambucana.

As distâncias genéticas dos haplótipos da população de Pernambuco

em relação ao modal de cada haplogrupo foram calculadas usando o

programa desenvolvido especificamente para este estudo. Adotaram-se os

valores 1 para diferença e 0 para igualdade em cada loco. Em seguida, foi

dividido o valor encontrado pelo inverso da taxa de mutação do loco

multiplicada por 1.000. Assim, a menor distância apontará o grupo ao qual

um dado haplótipo será incorporado, inferindo seu haplogrupo. Como


102

exemplo, considera-se o seguinte haplótipo mínimo (14,11-

14,14,30,24,11,13,13). Seja {Wi} um conjunto de n alelos representados

pelo número de repetições nos locos do haplótipo {Wi} =

{14,11,14,14,30,24,11,13,13} e {Xi} o conjunto dos alelos representados

pelos haplótipos modais de cada haplogrupo. Seja Mi a taxa de mutação

média calculada para cada Xi correspondente. O cálculo da distância D

será dado por:

D = ∑=

×n

i Mi1

3101para Xi ≠ Wi

Será inferido o haplogrupo com a menor distância calculada. O

haplótipo acima foi prognosticado como pertencendo ao haplogrupo R1b

considerando o seguinte: o haplótipo modal para o haplogrupo R1b, {Xi}

= {14,11,14,13,29,24,11,13,13} apresenta diferenças nos locos DYS389I

e DYS389II para o haplótipo {Wi} = {14,11,14,14,30,24,11,13,13}. O

valor para a taxa de mutação média para os locos DYS389I e DYS389II é

1.87 x 10-3 e 2.26 x 10-3, respectivamente (Kayser et al. 2000; Kurihara

et al. 2004; Dupuy et al. 2004; Ballard et al. 2005; Budowle et al. 2005;

Gusmão et al. 2005; Bianchi et al. 1998). Assim o somatório:

977.01026.2

1011087.1

1013

3

3

3

=××

+××

= −−D

resultará na menor distância D, calculada para o haplótipo Wi para

todos os haplótipos modais Xi, indicando que o haplótipo Wi pertence ao

haplogrupo R1b. Do mesmo modo, se analisarmos a distância D, para o

haplogrupo I, {Xi}= {15,14,14,12,29,22,10,11,14}, o somatório de todos

os Xi≠Wi, compreenderá oito locos, que certamente apresentará uma

distância maior que a calculada para o modal do haplogrupo R1b. O

programa calculará a distância para todos os haplogrupos modais e a

menor distância apontará o haplogrupo a ser inferido. Para a


103

determinação do escore, o programa aplica a fórmula Escore = 100 – (D ×

25), considerando que o ponto médio de mudança do grupo de haplótipos

vizinhos (cluster) para os haplogrupos se encontra a uma distância

aproximada com valor igual a quatro, o qual é considerado como

referência para indeterminação. Isto significa dizer que uma distância D =

0 terá um escore de 100 e uma distância de D = 4 terá escore 0, ou seja,

as distâncias iguais ou acima de 4 não são passíveis de inferência. No caso

do exemplo acima, a distância D = 0.977 terá um valor de aderência ≈

76.00.

Análise das Árvores Filogenéticas (Network). As árvores filogenéticas

baseadas no método Median-joining networks (Bandelt et al. 1999) foram

construídas usando o programa NETWORK4.2 (Schneider et al. 2006) com

os haplótipos mínimos não únicos de Pernambuco, considerando que a

árvore construída é capaz de mostrar a congruência entre a disposição

filogenética e o prognóstico dos haplogrupos. Para os cálculos do network,

as STR’s foram ponderadas de duas formas: 1) de acordo com a variância

do número de repetições em cada loco de forma que os maiores pesos

foram atribuídos aos locos menos variáveis. Os pesos foram definidos de

acordo com a variância das freqüências dos alelos de cada loco para a

amostra de Pernambuco. Os seguintes pesos foram adotados: variância de

0 a 0.09, peso 5; variância de 0.10 a 0.19, peso 4; variância de 0.20 a

0.49, peso 3; variância de 0.50 a 0.99, peso de 2; e variância > 1.00,

peso 1 (Qamar et al. 2002); 2) através do modelo que considera as taxas

de mutação médias para cada loco, atribuindo pesos maiores aos locos

com menor taxa de mutação, tal como foi aplicado para o prognóstico do

haplogrupo.


104

Resultados

Freqüências haplotípicas em Pernambuco. Foram identificados 183

haplótipos mínimos distintos (153 únicos), que apresentaram diversidade

haplotípica de 0.9951, poder de diferenciação de 0.7409 e probabilidade

de coincidência de 0.0049. Os haplótipos mínimos mais freqüentes foram

(14,11-14,13,29,24,11,13,13), (14,11-14,14,30,24,11,13,13) e (14,11-

14,13,29,24,11,13,12), cujas freqüências foram 0.061, 0.028 e 0.020,

respectivamente. O primeiro haplótipo acima foi considerado característico

desta população, pois além de ser o mais freqüente, apresentou-se

também como o haplótipo modal. Este haplótipo, que corresponde àquele

definido por Wilson et al. (2001) como sendo o AMH, exibiu em

Pernambuco freqüência maior que nas populações de referência na E

uropa (Portugal: 0.0459; Holanda: 0.0230). O AMH também se apresenta

como o mais freqüente em Portugal e em outras regiões do Brasil,

refletindo a semelhança entre estas populações. O segundo haplótipo mais

freqüente em Pernambuco teve freqüência 0.015 em Portugal e 0.023 na

Holanda enquanto que o terceiro apresentou freqüência de 0.001 em

Portugal e de 0.010 na Holanda. O haplótipo mais freqüente na população

da Holanda (14,11-14,13,29,23,11,13,13) calculado a partir dos dados

disponíveis pelo YHRD, que naquele país tem freqüência igual a 0.0459,

teve freqüência igual a 0.0193 em Portugal, 0.008 em Pernambuco e

0.005 em outras áreas do Brasil. Observou-se que o haplótipo modal

calculado (14,11-14,13,29,24,10,13,13) das outras regiões do Brasil

(Grattapaglia et al. 2004) e de Portugal (Roewer et al. 2001; Roewer et al.

2005; Kayser et al. 2001; Kayser et al. 1997; Geada et al. 2004; de Knijff

et al. 1997; Carvalho et al. 2003; Gusmão et al. 2003), que apresentaram

as freqüências no banco de dados YHRD, de 0.0151 e 0.0152,

respectivamente naquelas populações, não é o modal em Pernambuco

que, como visto, tem como haplótipo modal o mais freqüente. A diferença

entre os haplótipos modais de Portugal e Pernambuco consiste em uma


105

única variação no loco DYS391. As freqüências dos alelos 10 e 11 neste

loco mostraram-se muito semelhante nas populações (Portugal: 0.490 e

0.426; Brasil: 0.530 e 0.434; e Pernambuco: 0.466 e 0.490), como pôde

ser constatado através da análise pareada destas (FST = 0.006). A

distribuição das freqüências dos haplótipos modais de Portugal e

Pernambuco nas populações, por sua vez, mostrou-se notadamente

distinta (FST = 0.1463) e demonstrou que a diferença entre eles não deve

estar associada a este loco. A razão entre as freqüências dos haplótipos

modal e mais freqüente encontrados em Portugal, no Brasil e em

Pernambuco esteve relacionada com a prevalência dos haplótipos

dominantes quando ambos estão representados na população.

O haplótipo mínimo modal dos ameríndios (13,15-

17,13,31,23,10,14,13) calculados a partir dos trabalhos de Bortolini et al.

2003, Rodriguez-Delfin et al. 1997 e Zegura et al. 2004 não foi observado

na amostra de Pernambuco. Foi constatada uma única ocorrência do

haplótipo de referência africano (15,15-16,13,30,21,10,11,14) calculado a

partir dos trabalhos de Pereira et al. (2002), Alves et al. (2003) e Arroy-

Pardo et al. (2004). Embora tenha sido verificada a presença de um

haplótipo característico de Moçambique na população de Pernambuco, as

maiores freqüências dos haplótipos de africanos detectadas na população

(13,13-14,14,30,24,9,11,13) estão dispersas pela Europa, pelas Américas

e é bem característico de Zriba na Tunísia, onde aparece com a freqüência

de 0.61 (YHRD). Verificou-se na amostra o haplótipo (15,16-

18,14,31,21,11,11,13) que é encontrado na Guiné-bissau e este é muito

próximo (1 SMM) de haplótipos freqüentemente encontrados nas

populações de Angola e África do Sul (YHRD) (Tabela 1).

A análise AMOVA revelou não haver diferença entre as populações de

Pernambuco, Portugal e Holanda (Fst: 0.003) e, quando pareadas, as

maiores diferenças haplotípicas encontradas foram entre Pernambuco e

Holanda (FST: 0.004).


106

Expansão do agrupamento (clusters). A progressão das freqüências

dos haplótipos quando realizada a expansão dos clusters se mostrou

diferente para cada grupo de referência (Portugal, Holanda, África e

Ameríndio). Apesar disto, a ordem das freqüências dos clusters

permaneceu inalterada. A expansão para distâncias até ±2 (SMM)

abrangeu 63% da amostra da população. A projeção de crescimento das

freqüências nos clusters holandês e português foi maior que nos clusters

africanos e ameríndios. A média das freqüências acumuladas apresentou a

seguinte ordem decrescente dos clusters de referência: português,

holandês, africano e ameríndio (Tabela 2). Os haplótipos mínimos mais

freqüentes em Portugal e na Holanda são muito semelhantes, com

distância genética de 1 (SMM), enquanto que os haplótipos mais

freqüentes nas demais populações exibiram distâncias genéticas acima de

7 (SMM) entre elas. Esta proximidade entre as populações da Holanda e

de Portugal implicou na sobreposição de agrupamentos.

Inferência do Haplogrupo. Na população de Pernambuco 30 haplótipos

não únicos, representando 94 indivíduos, foram selecionados para a

predição dos haplogrupos segundo o método de Athey (2005), e o

software baseado na metodologia já descrita. A Tabela 3 mostra os

resultados obtidos através dos dois métodos. Foram identificados sete

haplogrupos e somente um haplótipo apresentou discordância entre os

dois métodos de prognóstico. Este haplótipo foi mantido na amostra como

referência para visualização do seu posicionamento na árvore segundo o

modelo Median-Joining (Bandelt et al. 1999). O coeficiente de correlação

de Pearson para os escores foi igual a 0.73. A participação das etnias

variou entre 0.818 e 0.862 para europeus, 0.117 e 0.166 para os

africanos e entre 0.020 e 0.024 para os ameríndios. Um dos testes

realizados utilizando o programa de prognóstico foi confrontar com

haplogrupos já prognosticados em outros bancos de dados. Com este

propósito foi acessado o banco de dados do YBase (Genetic Genealogy


107

Database) para verificar a concordância dos prognósticos. A Tabela 3

mostra os resultados obtidos nesta comparação. Somente três

haplogrupos não coincidiram e um deles foi no haplótipo prognosticado

como pertencente ao haplogrupo Q, o qual não está presente nas

amostras do Ybase. Outro não coincidente foi o haplótipo prognosticado

como E3b-I com o baixo valor de escore e uma terceira discordância

aconteceu no haplótipo prognosticado como J que o Ybase obteve

resultados indicando este haplótipo como pertencente ao haplogrupo I. A

média final dos scores obtidos com o Y-STRCALC foi próximo de 70

enquanto o de Athey foi próximo a 68.

Os dados mostram que a o prognóstico do haplótipo estendido não

modificou significativamente o resultado obtido com o prognóstico do

haplótipo mínimo, ou seja, o percentual de participação dos ameríndios

não variou e o percentual das demais etnias variou apenas 5% (Tabela 4).

Árvores Median-joining de haplótipos de Y-STR. Árvores Median-

joining foram construídas usando o software Network 4.200 (Bandelt et al.

1999) a partir dos haplótipos de Y-STR para examinar a disposição

filogenética das STR’s em relação aos haplogrupos. Uma árvore foi

construída usando como argumento de ponderação as taxas de mutação

média de cada loco, a exemplo do que foi feito para o prognóstico do

haplogrupo (Figura 2). As árvores foram construídas a partir dos

haplótipos que ocorreram ao menos 2 vezes na amostra e mostraram uma

disposição muito similar. Os haplogrupos prognosticados de dispuseram

em uma ordem filogenética e cronológica compatívis. Do topo da árvore

observa-se uma ramificação descendente por haplogrupo. O agrupamento

dos haplótipos prognosticados como R1b evidenciam a reunião dos

haplótipos em torno do mais frequente (modal). O tamanho dos braços

entre os haplogroupos E3b e E3a mostrou a diversidade dos haplótipos

para estas linhagens e a maior dispersão, notadamente o reflexo de sua

baixa freqüência na amostra. A incerteza do prognóstico do haplótipo


108

chamado E3a-I na árvore apresentada na Figura 2 o qual foi definido de

forma diferente pelos métodos aplicados é evidenciada pelo seu

posicionamento não ajudou a esclarecer esta ambigüidade.

Discussão

A colonização do Brasil começou pela região Nordeste e está

intimamente relacionada com a história do Estado de Pernambuco. Uma

característica marcante da colonização foi a ocorrência dos fluxos

migratórios determinados, tanto em relação à cronologia, quanto origem,

intensidade e finalidade, que foram parâmetros importantes para a

seleção das populações usadas como referência neste trabalho.

Historicamente, a população de Pernambuco se constitui basicamente de

descendentes de europeus vindos principalmente de Portugal e Holanda,

ameríndios e de africanos introduzidos na condição de escravos (Ferreira

1987).

Neste trabalho, observou-se que a contribuição genética dos

africanos foi maior do que a dos ameríndios. O número reduzido de

mulheres oriundas da Europa (Maior 1968) e o modelo social adotado no

período colonial foram fatores que contribuíram para o processo de

miscigenação entre europeus, nativos e africanos. O predomínio da

colonização portuguesa pôde ser constatado através da prevalência do

Haplótipo Modal do Atlântico (AMH) em Pernambuco, evidenciando o seu

papel como promotora do aumento demográfico e do processo de

miscigenação que bem define o povo brasileiro. Estes mestiços,

descendentes dos primeiros colonizadores, mantiveram a patrilinhagem

européia ao longo das gerações que se expressa na freqüência do AMH na

população atual (Tabela 1). A característica do haplótipo mais freqüente

de Pernambuco (14,11-14,13,29,24,11,13,13) de ser também o modal

reafirma a predominância absoluta da ancestralidade paterna portuguesa.


109

Este haplótipo possui freqüência acima das verificadas nas populações de

referência européias (Tabela 1), sendo significativamente maior do que as

observadas nas populações de Portugal, Holanda (YHRD) e em outras

regiões do Brasil (Grattapaglia et al. 2004). Este haplótipo é considerado

um dos mais significativos na Europa e corresponde ao Haplótipo Modal do

Atlântico (AMH) (Wilson et al. 2001) por ser o principal nas populações do

País de Gales, Bascos e Irlandêses, sugerindo que este deve ser uma

assinatura haplotípica européia do período paleolítico. Em contraste, o

segundo haplótipo mais freqüente em Portugal (14,11-

14,13,29,24,10,13,13) (YHRD) apresentou uma freqüência muito baixa

em Pernambuco (0.008) e é ausente na Holanda. A freqüência do AMH,

em geral, é cerca do dobro da freqüência observada para este haplótipo

(14,11-14,13,29,24,10,13,13) no Brasil, em Portugal, na Europa e em

outras áreas do mundo, mas não em Pernambuco, onde é cerca de seis

vezes maior. A freqüência do AMH na população de Pernambuco acima da

encontrada em Portugal, poderia ser explicada através do efeito do

fundador.

O haplótipo holandês tomado como referência (14,11-

14,13,29,23,11,13,13) (YHRD) tem freqüência de 0.046 naquela

população, 0.019 em Portugal, 0.010 no Brasil e 0.008 em Pernambuco.

Outro haplótipo freqüente na população holandesa (14,13-

14,12,28,22,10,11,13) (YHRD) apresentou as freqüências de 0.011 na

Holanda, 0.007 em Portugal, 0.010 no Brasil e 0.004 em Pernambuco.

Este resultado reforçou a idéia de um fluxo migratório independente da

população holandesa para o Brasil, já que a freqüência deste segundo

haplótipo no Brasil é semelhante à da Holanda e maior que em Portugal.

Esta idéia foi levantada por Carvalho-Silva et al. (2001) que analisaram

haplogrupos definidos por marcadores binários e observaram uma

freqüência relativamente alta no sul do Brasil (28%) de um haplogrupo

europeu, que apresentou um incremento na região Nordeste (18%), cuja

amostra foi tomada em Pernambuco e comparada com a freqüência em


110

Portugal (12%). Eles argumentaram que o incremento da freqüência deste

haplogrupo no Nordeste foi muito discreto e pode ser atribuída ao acaso,

mas observaram também que esta região esteve sob o domínio holandês

por quase três décadas no século XVII e que a freqüência do haplogrupo

em questão é de 32% na Holanda.

O haplótipo de referência africano (15-15,16-13-30-21-10-11-14)

foi encontrado em baixa freqüência em Pernambuco (0.004). Thomas et

al. (2000) descreveram um forte “efeito do fundador” para Y-STRs nos

indivíduos do sul da África de origem Bantu, reforçando a hipótese de que

um haplótipo considerado fundador foi também o mais freqüente em

outras populações que estiveram no caminho da migração Bantu (Pereira

et al. 2002). Moçambique foi uma colônia portuguesa de 1752 a 1975 e

desde 1493 estabeleceram relações mercantis. O colonialismo português

foi caracterizado pela migração de um baixo número de pessoas (exceção

do Brasil), predominantemente homens que intercruzaram com as

mulheres locais (Russell-Wood 1998). O haplótipo fundador hipotético

Bantu compreende sete STR’s dos quais cinco locos pertecem ao haplótipo

mínimo (DYS19=15, DYS390=21, DYS391=10, DYS392=11 e

DYS393=13), e está somente a 1 passo (SMM) do haplótipo de referência

africano calculado. É o mais freqüente em Angola (0.28), São Tomé e

Príncipe (0.10) enquanto em Moçambique ele possui a mesma freqüência

(0.10) do haplótipo (15,21,10,11,14). A grande diversidade de

haplogrupos africanos é compatível com o fato de que os escravos foram

trazidos para o Brasil de muitas áreas, principalmente do oeste africano,

mas também de Moçambique, no leste (Pena et al. 2000).

Apesar de terem representado uma parcela significativa da

população colonial, os homens africanos devem ter deixado um menor

número de descendentes em conseqüência da sua condição social (Pena et

al. 2000). Embora o efeito disto possa ser identificado na baixa proporção

de haplótipos africanos em relação aos europeus, não raro encontraremos

na população pernambucana, homens de patrilinhagens européias que


111

apresentam características fenotípicas semelhantes aos africanos e, com

menor probabilidade o inverso, já que os casamentos entre mulheres de

origem européia e homens de origem africana é um fenômeno mais

recente e incomum no período colonial.

O haplótipo mínimo de referência dos ameríndios (13,15-

17,13,31,23,10,14,13) não foi detectado na população de Pernambuco, à

semelhança do que já havia sido observado por Carvalho-Silva et al.

(2001) e Parra et al. (2003) em outras áreas do Brasil. Apesar disto,

reportando aos trabalhos de Bortolini et al. (2003), a ausência deste

haplótipo poderia ser explicada considerando que a contribuição masculina

dos ameríndios na determinação da composição genética da população

pernambucana deve ter sido muito discreta. Apesar de inexistente na

amostra de Pernambuco, há uma forte tendência para considerá-lo como

um haplótipo de referência. Este haplótipo foi definido considerando o

grupo parental (Q-M3) que foi detectado em todas as populações

ameríndias do sul, onde é marcadamente predominante, com a freqüência

média de 77%. O haplótipo mais freqüente (0.265) encontrado na

linhagem M3 do haplogrupo Q usando quatro locos do haplótipo mínimo

foi referenciado nos dados obtidos por Lell et al. (2002). Três locos

(DYS19, DYS390, and DYS391) dos haplótipos que foram empregados

neste trabalho, mostraram que o haplótipo característico correspondendo

aos alelos (13,24,10) tem uma ampla distribuição entre os nativos na

América do norte e central, podendo definir uma característica do

haplótipo ancestral da linhagem Q-M3 (Bortolini et al. 2003). Verificou-se

que o haplótipo modal não é o mais freqüente e o loco DYS390, que

determina esta diferença, possui as freqüências dos alelos para haplótipo

modal e mais freqüente muito próximas. Considerando que a distância de

um passo no loco DYS390 é a diferença para o haplótipo mínimo de

referência da população em estudo, qualquer ocorrência de ambos deverá

será expressa no cluster para ±1 (SMM). Outro estudo feito por Tarazona-

Santos et al. (2001), usando o polimorfismo bialélico de SNP (DYS199-T)


112

que define a linhagem M3, evidenciou que na amostra de 169 indivíduos

de diferentes populações de ameríndios do sul, os haplótipos mais

freqüentes encontrados usando os locos DYS19, DYS389I, DYS389II,

DYS390, DYS391 e DYS393 foram (13,16,10,25,10,15),

(13,17,10,24,10,13) e (13,16,10,24,10,13), que juntos representam 17%

dos haplótipos da amostra. Observou-se que os alelos DYS19=13,

DYS391=10 and DYS393=13 são característicos para estas populações. A

alta freqüência do haplótipo de referência ameríndio em suas

comunidades (0.16) deve ser o reflexo da baixa diversidade haplotípica

observada nesta etnia, quando comparadas a outras populações (Zegura

et al. 2004). Isto leva a considerar que os resultados encontrados

expressam o baixo número de patrilinhagens ameríndias na população

pernambucana, a exemplo do que já havia sido observado em outro

estudo (Pena et al. 2000). Historicamente, é possível especular que, à

semelhança do que aconteceu com os descendentes africanos, uma

grande parte dos homens mestiços nativos, possui patrilinhagem

européia, embora ainda não existam dados genéticos concretos acerca

deste tema.

Os resultados deste trabalho evidenciam uma forte tendência de um

quadro direcionado no Brasil envolvendo cruzamentos entre homens

europeus e mulheres africanas e ameríndias. Isto está em consonância

com a história conhecida sobre a população brasileira desde o século XVI

(Carvalho-silva et al. 2001). Estas observações nos permitiram inferir o

nível de contribuição de cada etnia na determinação da constituição

haplotípica masculina de Pernambuco. Também nos fez perceber que

Pernambuco apresentou um perfil haplotípico ligeiramente diferenciado em

relação às populações de outras regiões do Brasil, o qual está diretamente

relacionado à sua história e provavelmente ligado ao efeito do fundador e

ao fluxo migratório holandês, sugerido pelos resultados obtidos.

Considerando que a especificidade do haplótipo de referência pôde

dificultar o reconhecimento dos grupos étnicos diretamente, buscou-se


113

flexibilizar a detecção das linhagens haplotípicas daquelas populações na

população de Pernambuco. A ocorrência de eventos mutacionais nos locos

analisados resultaria numa maior diversidade de haplótipos vizinhos e

determinaria o surgimento de haplótipos que orbitariam em torno do

haplótipo de referência. Para avaliar esta possibilidade, adotou-se o

modelo de stepwise mutation e foram criados grupos de haplótipos com

distâncias genéticas ±1 e ±2, o que possibilitou um relaxamento no

critério de busca.

O agrupamento dos haplótipos de referência não alterou o nível de

percepção quanto à participação das populações de referência na

população de Pernambuco, confirmando a ordem definida a partir da

identificação das freqüências dos haplótipos de referência em Pernambuco

(Tabela 2). O efeito causado pela distribuição das freqüências vizinhas

entre as duas populações européias (Portugal e Holanda) não afetou a

ordem final. Os haplótipos mais comuns destas populações são bastante

semelhantes (1 SMM) e foram incorporados ao mesmo grupo. A

progressão das freqüências expressou o compartilhamento dos

agrupamentos europeus (Portugal e Holanda) e a tendência de

crescimento destas, em contraste com o pequeno crescimento nas

freqüências de ameríndios e africanos. Este resultado mostrou a maior

influência européia em detrimento da pequena contribuição das demais

etnias, como já havia sido sugerido na análise específica dos haplótipos de

referência.

Apesar de ter-se determinado a participação e a ordem, buscou-se

também quantificar a contribuição das três etnias, introduzindo um

modelo de agrupamento baseado no prognóstico dos haplogrupos.

Conforme esperado, a maioria dos haplótipos foi prognosticada como

pertencente ao haplogrupo R1b, tipicamente europeu, tendo o AMH obtido

o escore de valor 100. Por estarem geneticamente muito próximos, os

haplótipos de referência das populações de Portugal e Holanda não

permitiram a distinção dos indivíduos destas populações. Apesar da


114

existência de dois haplótipos de referência holandês na amostra de

Pernambuco sugerir a contribuição genética holandesa na sua composição,

não foi possível individualizá-la em relação à portuguesa.

O haplogrupo Q da sublinhagem M3 foi considerado o mais próximo

dos ameríndios brasileiros (Bortolini et al. 2003; Zegura et al. 2004). Um

prognóstico incerto pôde ser atribuído ao haplótipo de haplogrupo Q

conforme é observado na tabela 3. O escore (46) foi muito baixo levando a

suspeita de que não foi suficientemente preciso para considerá-lo um um

haplótipo ameríndio. No entanto este haplótipo tem os marcadores típicos

DYS390=23, DYS392=14 and DYS393=13 que apontam para o haplogrupo

prognosticado. Assumindo-se que esta baixa precisão e considerando a

probabilidade de 2% apenas de encontrar um haplótipo ameríndio na

amostra de 247 indivíduos, foram pesquisados outros haplótipos no

restante da amostra, que poderiam espressar mais precisamente a

presença de um haplótipo típico ameríndio. Então foi identificado o

haplótipo único (13,15-18,13,29,24,10,14,13), também prognosticado

como pertencente ao haplogrupo Q com um score de 67.

E3a e E3b são os haplótipos característicos dos africanos de origem

Banto e do norte da África (Cruciani et al. 2004). Como conseqüência dos

resultados, quanto ao grau de influência na formação das patrilinhagens da

população de Pernambuco, o posicionamento dos europeus é seguido por

africanos e por último pelos ameríndios.

Ao separar os haplótipos em haplogrupos prognosticados para

verificação de sua provável origem, foi permitido agrupá-los etnicamente e

assim estimar percentualmente a contribuição de cada um para a formação

da população pernambucana. Observou-se que, em média, a principal

contribuição foi de genes europeus (83%), seguido de genes africanos

(15%) e ameríndios (2%). A distribuição genotípica masculina não reflete o

alto grau de miscigenação que caracteriza a formação da população

pernambucana, atribuindo-se conseqüentemente às mulheres, o equilíbrio

da participação das diferentes etnias. Diferentemente dos resultados


115

obtidos através deste estudo com cromossomo Y e embora no Nordeste

tenha predominado as matrilinhagens africanas (44%), a análise de DNA

mitocondrial em populações de outras áreas do Brasil evidenciou uma

distribuição uniforme destas matrilinhagens entre as três etnias. Isto está

de acordo com o trabalho de Alves-Silva et al. (2000), que analizou 247

mtDNAs e encontrou a contribuição Ameríndia (33%) e Africana (28%) no

pool total de mtDNA de brasileiro brancos.

As árvores Median Joining construídas a partir dos haplótipos de STR-

Y mais freqüentes de Pernambuco apresentaram um padrão de

agrupamento semelhante ao obtido através da predição dos haplogrupos,

destacando-se o haplótipo que teve baixo valor de escore prognosticado

(Figura 2). Também foi observado que o arranjo dos haplogrupos coincidiu

com a inferência cronológica proposta pelo YCC (2002). A similaridade

observada entre as árvores construídas a partir da atribuição de pesos

diferenciados em função da variância e das taxas de mutação permitiu

verificar que os critérios de agrupamentos filogenéticos baseados em

STR’s obedeceram à ordem cronológica dos haplogrupos e seu

prognóstico. Desta forma verificou-se a adequação de ambos os critérios

de ponderação usados neste trabalho e reafirmou a relação existente

entre a variância e as taxas de mutação abordada por Zhivotovsky et al.

(2004). A escolha do critério de ponderação neste caso, não foi relevante

para o estudo filogenético, uma vez que não se buscou a determinação de

tempos para ancestralidade dado que a cronologia e a abordagem

histórica se encontram dentro do período de 500 anos. Os critérios

confirmaram similaridade entre os agrupamentos e a existência da relação

filogenética baseadas no prognóstico feito deste trabalho. No entanto, não

foi descartada a possibilidade de que em novos estudos envolvendo

eventos coalescentes, possa-se adotar alternativamente as taxas de

mutação por loco como critério para ponderação na construção de

networks.


116

Foi constatado que os haplótipos de Y-STR podem ser agrupados de

duas maneiras para o estudo da composição de uma população. Uma

expandindo o haplótipo de referência e a outra inferindo o haplogrupo. Os

resultados dos prognóticos levaram a concluir que o haplótipo conserva

certa informação que permite a construção de uma filogenia baseada nas

Y-STR’s. O agrupamento dos haplótipos seguindo o modelo de stepwise

mutation para os principais haplótipos das populações de referência

permitiu detectar representantes das populações européias, africanas,

indígenas na população de Pernambuco, estabelecendo esta ordem em

termos de participação nas patrilinhagens. A inferência do haplogrupo, a

partir das freqüências alélicas dos haplótipos ponderados através das

taxas de mutação para cada loco, apresentou similaridade com outros

métodos de inferência e também com os resultados em análises por

polimorfismos binários disponibilizadas em bancos de dados. A

quantificação das contribuições étnicas usando os hapotipos não únicos,

estendidos, ou toda a amostra não alterou os resultados

significativamente, sendo que, em média, a principal contribuição foi de

genes europeus (83%), seguido de genes africanos (15%) e ameríndios

(2%). Os resultados mostram também que além dos interesses forenses,

os haplótipos de STR são úteis para estudos populacionais, incluindo

aspectos históricos, étnicos e análise filogenética.


117

Tabela 1 - Haplótipo mais freqüente nas populações de referência e respectivas freqüências na população de

Pernambuco, Brasil.

População DYS19 DYS385 DYS389I DYS389II DYS390 DYS391 DYS392 DYS393 f0 f1 Fonte

Portugal 14 11-14 13 29 24 11 13 13 0,0457 0,0607 1

Holanda 14 11-14 13 29 23 11 13 13 0,0459 0,0081 1

Ameríndios 13 15-17 13 31 23 10 14 13 0,1666 0,0000 2

África 15 15-16 13 30 21 10 11 14 0,0632 0,0040 3

f0 = freqüência nas populações de referência ; f 1= freqüência na população de Pernambuco 1) Roewer et al. 2001; Roewer et al. 2005; Kayser et al. 2001; Kayser et al. 1997; Geada et al 2004; de Knijff et al. 1997;

Carvalho et al. 2003; Gusmão et al. 2003; 2) Bortolini et al. 2003; Rodriguez-Delfin et al. 1997; Zegura et al. 2004 3) Pereira et al. 2002; Alves et al. 2003; Arroy-Pardo et al. 2004


118

Tabela 2 – Freqüência acumulada do haplótipo de

referência e distância genética em Pernambuco

estimada pelo SMM .

Stepwise Mutation Model População

0 1 2

Portugal 0,061 0,194 0,340

Holanda 0,008 0,117 0,279

Ameríndios 0,000 0,000 0,004

África 0,004 0,008 0,008


119

Tabela 3 – Haplótipos não únicos na população de Pernambuco,

comparação com dados do Ybase, Freqüências, escore e

prognóstico segundo Athey (2005) e este estudo (Y-STRCALC).

Athey Y-STRCALC Haplótipo Ybase F Escore Haplogrupo Escore Haplogrupo

(14,11-14,13,29,24,11,13,13) 0 0,061 100 R1b 100 R1b (14,11-14,14,30,24,11,13,13) 0 0,028 79 R1b 76 R1b (14,11-14,13,29,24,11,13,12) 0 0,020 65 R1b 67 R1b (14,11-14,14,30,23,11,13,13) 0 0,016 73 R1b 63 R1b (14,11,14,13,28,24,11,13,13) 0 0,016 74 R1b 89 R1b (14,11-14,13,29,23,11,13,12) 0 0,016 61 R1b 56 R1b (14,11-15,13,29,24,11,13,13) 0 0,016 85 R1b 65 R1b (14,11-14,13,29,24,11,13,14) 0 0,012 77 R1b 67 R1b (14,12-14,13,29,24,11,13,13) 0 0,012 57 R1b 89 R1b (15,11-14,13,29,24,11,13,13) 0 0,012 73 R1b 85 R1b (14,14-14,12,29,23,10,11,12) - 0,012 56 J2 53 J (17,12-12,13,28,23,10,11,13) - 0,012 63 I 41 E3b (14,11-14,13,30,24,11,13,13) 0 0,008 83 R1b 89 R1b (14,11-14,13,29,23,11,13,13) 0 0,008 93 R1b 89 R1b (14,11-14,13,29,24,10,13,13) 0 0,008 93 R1b 93 R1b (14,11-14,13,29,25,11,13,13) 0 0,008 80 R1b 89 R1b (14,11-14,13,30,23,11,13,13) 0 0,008 77 R1b 78 R1b (14,11-14,13,29,23,11,13,14) 0 0,008 36 R1b 56 R1b (14,11-15,13,29,23,11,13,13) 0 0,008 79 R1b 78 R1b (14,11-14,13,29,25,10,13,13) 0 0,008 80 R1b 82 R1b (14,12-14,13,29,24,10,13,13) 0 0,008 69 R1b 82 R1b (15,11-14,13,28,23,11,13,13) 0 0,008 50 R1b 63 R1b (14,11-14,12,28,23,11,14,13) - 0,008 46 Q 31 Q (15,11-13,13,31,24,11,13,13) 1 0,008 38 R1b 63 R1b (14,11-14,12,27,24,12,13,14) 3 0,008 26 R1b 35 R1b (13,13-14,14,30,24,9, 11,13) 0 0,008 49 E3b 57 E3b (15,14-16,11,29,22,10,11,14) 2 0,008 68 G 75 G (14,16-17,13,31,21,11,11,13) 1 0,008 55 E3a 45 E3a (13,16-18,13,30,23,10,11,13) 1 0,008 84 E3b 89 E3b (15,16-18,14,31,21,11,11,13) 2 0,008 70 E3a 43 E3a F = freqüência; Athey (2005); Y-STRCALC = programa de cálculo de

prognóstico do haplogrupo; Ybase = diferenças para enquadramento de

haplótipos no banco de dados;


120

Tabela 4 - Composição da população de Pernambuco

prognosticada pelo programa Y-STRCALC a partir dos haplótipos

mínimo e estendido da população total e dos haplótipos

apresentados na Tabela 3.

Haplogrupos Haplótipo

Mínimoa

Haplótipo

Estendidoab

Haplótipo

Mínimo não únicosc

África E3a 0,093 0,097 0,074

E3b 0,065 0,069 0,043

Europa G 0,081 0,069 0,021

I 0,040 0,053

J 0,085 0,085 0,032

N 0,008 0,012

R1a 0,077 0,069

R1b 0,526 0,526 0,809

Ameríndios Q 0,024 0,02 0,021

Europa 0,818 0,814 0,862

África 0,158 0,166 0,117

Ameríndios 0,024 0,020 0,021

(a) n = 247; (b) Haplótipo mínimo (ISFG) mais os locos DYS447, DYS458

e DYS464; (c) n = 94


121

Figura 01: Mapa do brasil mostrando a região Nordeste e o Estado de

Pernambuco onde as amostras foram coletadas.


122

Figura 2 – Árvore Median-joining das STR’s dos 30 haplótipos mínimos

mais comuns e os respectivos haplogrupos prognosticados, representando

94 indivíduos da amostra de Pernambuco. (A) Ponderação baseada na

média das taxas de mutação por loco. (B) baseada na variância dos locos.

As cores indicam os grupos étnicos prognosticados: Listrado, preto e

branco são africanos, ameríndios e europeus respectivamente. O cículo

metade preto representa o haplótipo com baixo escore de prognóstico

(E3a-I) qua foi prognosticado diferente nos dois cálculos apresentados. O

tamanho dos braços são proporcionais às distâncias genéticas e os

círculos são proporcionais às freqüências.


123

Bancos de dados Eletrônicos disponíveis na internet

www.ysearch.org genetic genealogy database

www.ybase.org genetic genealogy database

https://home.comcast.net/~whitathey/predictorinstr.htm haplogroup predictor

http://www.fluxus-engineering.com/sharenet.htm

Referências

Alves-Silva J, Santos MS, Guimarães PEM, Ferreira ACS, Bandelt H-J, Pena

SDJ, Prado VF (2000) The Ancestry of Brazilian mtDNA lineages.

Am. J. Hum. Genet. 67:444–461

Alves C, Gusmão L, Barbosa J, Amorim A (2003) Evaluating the informative power

of Y-STRs: a comparative study using European and new African haplotype

data. Forensic Science International 134:126–133

Arroyo-Pardo E, Gusmâo L, Lopez-Parra AM , Baeza C, Mesa MS, Amorim A (2004)

Genetic variability of 16 Y-chromosome STRs in a sample from Equatorial

Guinea (Central Africa). Forensic Sci Int 149(1):109-13

Athey TW (2005) Haplogroup Prediction from Y-STR Values Using an Allele-

Frequency Approach. Journal of Genetic Genealogy 1:1-7

Ballard DJ, Phillips C, Wright G, Thacker CR, Robson C, Revoir AP, Court DS (2005)

A study of mutation rates and the characterisation of intermediate, null and

duplicated alleles for 13 Y chromosome STRs. Forensic Sci Int 155(1):65-70




124

Bianchi NO, Catanesi CI, Bailliet G, Martinez-Marignac VL, Bravi CM, Vidal-Rioja LB,

Herrera RJ, Lopez-Camelo JS (1998) Characterization of ancestral and derived

Y-chromosome haplotypes of New World native populations. Am J Hum Genet

63(6):1862-71

Bortolini MC, Salzano FM, Thomas MG, Stuart S, Nasanen SPK , Bau CHD, Hutz

MH, Layrisse Z, Petzl-Erler ML, Tsuneto LT, Hill K, Hurtado AM, Castro-de-

Guerra D, Torres MM, Groot H ,Michalski R, Nymadawa P, Bedoya G,

Bradman N, Labuda D , Ruiz-Linares A (2003), Y-Chromosome Evidence for

Differing Ancient Demographic Histories in the Americas Am. J. Hum. Genet.

73:524–539

Budowle B, Adamowicz M, Aranda XG, Barna C, Chakraborty R, Cheswick D, Dafoe

B, Eisenberg A, Frappier R, Gross AM, Ladd C, Lee HS, Milne SC, Meyers C,

Prinz M, Richard ML, Saldanha G, Tierney AA, Viculis L, Krenke BE (2005)

Twelve short tandem repeat loci Y chromosome haplotypes: genetic analysis on

populations residing in North America. Forensic Sci Int 150(1):1-15

Carvalho M, Anjos MJ, Andrade L, Lopes V, Santos MV, Gamero JJ, Real FC, Vide

MC (2003) Ychromosome STR haplotypes in two population samples:Azores

Islands and Central Portugal. Forensic Science International 134 :29–35

Carvalho-Silva DR, Santos FR, Rocha J and Pena SDJ (2001) The phylogeography

of brazilian Ychromosome lineages. Am J Hum Genet 68: 281286.

Corach D, Filgueira-Risso L, Marino M, Penacino G, Sala A, Routine Y-STR typing

in forensic casework. Forensic Sci. Int. 15 (2001) 131-135

Cruciani F, Fratta RL, Santolamazza P, Sellitto D, Pascone R, Moral P,

Watson E, Guida V, Colomb EB, Zaharova B, Lavinha J , Vona G,

Aman R, Calý`F, Akar N, Richards M, Torroni A, Novelletto A, Scozzari


125

R (2004) Phylogeographic Analysis of Haplogroup E3b (E-M215) Y

Chromosomes Reveals Multiple Migratory Events Within and Out Of

Africa Am. J. Hum. Genet. 74:1014–1022

de Knijff P, Kayser M, Caglià A, Corach D, Fretwell N, Gehrig C, Graziosi F,

Heidorn G, Herrmann S, Herzog B, Hidding M, Honda K, Jobling M, ,Krawczak

M., Leim K, Meuser S, Meyer E,. Oesterreich W, Pandya A, Parson W,

Penacino G, Perez-Lezaun A,·Piccinini A, Prinz M,.Schmitt C, Schneider PM,

Szibor R, Teifel-Greding J, Weichhold G, Roewer L (1997) Chromosome Y

microsatellites: population genetic and evolutionary aspects. Int J Legal Med

(1997) 110 : 134–140

Dupuy BM, Stenersen M, Egeland T, Olaisen B (2004) Y-chromosomal microsatellite

mutation rates: differences in mutation rate between and within loci. Hum Mutat

23(2):117-24

Ferreira OL (1987) História do Brasil, 12th edn. Ática, São Paulo Brazil

Garcia C (1986) O que é o Nordeste Brasileiro, 2nd edn. Brasiliense, São Paulo

Brasil

Geada H, Baptista J, Felgueiras M, Silva VS, Cruz C,Lucas I, Ribeiro T, Espinheira

R (2004) Portuguese population study with 16 Y-STR loci. International

Congress Series 1261:319– 321

Grattapaglia D, Kalupniek S, Guimarães CS, Ribeiro MA, Diener PS and Soares CN

(2004) Ychromosome STR haplotype diversity in brazilian populations. Forensic

Sci Int 149: 99-107.

Gusmão L, Sanchez-Diz P, Alves C, Beleza S, Lopes A, Carracedo A, Amorim A

(2003) Grouping of Y-STR haplotypes discloses European geographic clines.

Forensic Science International 134 :172–179


126

Gusmão L, Sánchez-Diz P, Calafell F, Martín P, Alonso CA, Álvarez-Fernández F,

Alves C, Borjas-Fajardo L, Bozzo WR, Bravo ML, Builes JJ, Capilla J, Carvalho

M, Castillo C, Catanesi CI, Corach D, Di Lonardo AM, Espinheira R, Fagundes

de Carvalho E, Farfán MJ, Figueiredo HP, Gomes I, Lojo MM, Marino M,

Pinheiro MF, Pontes ML, Prieto V, Ramos-Luis E, Riancho JA, Souza Góes AC,

Santapa OA, Sumita DR, Vallejo G, Vidal Rioja L, Vide MC, Vieira da Silva CI,

Whittle MR, Zabala W, Zarrabeitia MT, Alonso A, Carracedo A, Amorim A

(2005) Mutation rates at Y chromosome specific microsatellites. Human

Mutation 26(6): 520-528.

Gusmão L, Butler J, Carracedo A, Gil Pl, Kayser M, Mayr W, Morling N, Prinz M,

Roewer L, Tyler-Smith C (2006) DNA Commission of the International Society of

Forensic Genetics (ISFG): An update of the recommendations on the use of Y-

STRs in forensic analysis?. Forensic Science International 157:(2-3) 187-197

Jobling MA and Tyler-Smith C (2003) The Human Y Chromosome:an

evolutionary marker comes age. Nature Reviews. 4.


Herrmann S, Herzog B, Hidding M, Honda K, Jobling M, Krawczak M, Leim K,

Meuser S, Meyer E, Oesterreich W, Pandya A, Parson W, Penacino G, Perez-

Lezaun A, Piccinini A, Prinz M, Schmitt C, Schneider PM, Szibor R, Teifel-

Greding J, ·Weichhold G, de Knijff P, Roewer L (1997) Evaluation of Y-

chromosomal STRs: a multicenter study. Int J Legal Med (1997) 110 : 125–133

Kayser M, Roewer L, Hedman M, Henke L, Henke J, Brauer S, Krüger C, Krawczak

M, Nagy M, Dobosz T, Szibor R, de Knijff P, Stoneking M, Sajantila A (2000)

Characteristics and frequency of germline mutations at microsatellite loci from


127

the human Y chromosome, as revealed by direct observation in father/son pairs.

Am J Hum Genet66(5):1580-8

Kayser M, Krawczak M, Excoffier L, Dieltjes P, Corach D, Pascali V, Gehrig C,

Bernini LF, Jespersen J, Bakker E, Roewer L, de Knijff P (2001) An extensive

analysis of Y-chromosomal microsatellite haplotypes in globally dispersed

human populations. Am. J. Hum. Genet. 68 (4) 990–1018

Kimura M and Ohta T (1978) Stepwise mutation model and distribution of allelic

frequencies in a finite population. Proc. Nati. Acad. Scd. USA 75(6) 2868-4

Kurihara R, Yamamoto T, Uchihi R, Li SL, Yoshimoto T, Ohtaki H, Kamiyama K,

Katsumata Y (2004) Mutations in 14 Y-STR loci among Japanese father-son

haplotypes. Int J Legal Med 118(3):125-31

Lell JT, Sukernik RI, Starikovskaya YB, Su B, Jin L, Schurr TG, Underhill PA,

Wallace DC (2002) The dual origin and Siberian affinities of Native American Y

chromosomes. Am J Hum Genet 70:192–206

Medeiros T (1980) O negro na etnia do Rio Grande do Norte. Revista do Instituto

Histórico e Geográfico do Rio Grande do Norte 7:1909

Miller SA, Dykes DD and Olesky HF (1988) A simple salting-out procedure

for extract DNA from human nucleated cells. Nucleic Acids Res.

16:1255.

Pereira L, Gusmão L, Alves C, Amorim A, Prata MJ (2002) Bantu and European Y-

lineages in Sub-Saharan Africa. Ann. Hum. Genet: 66, 369±378

Parra FC, Amado RC, Lambertucci JR, Rocha J, Antunes C, Pena SDJ (2003) Color

and genomic ancestry in Brazilians. PNAS 100:177-182.

Pena SDJ, Carvalho-Silva DR, Alves-Silva J, Prado VF (2000) Retrato Molecular do

Brasil. Ciência Hoje 27: 16-25


128

Qamar R, Ayub Q, Mohyuddin A, Helgason A, Mazhar K, Mansoor A, Zerjal T,Tyler-

Smith C, Mehdi SQ (2002) Y-Chromosomal DNA Variation in Pakistan. Am. J.

Hum. Genet. 70:1107–1124


chromosome of South American Amerindians: a comparison with Blacks, hites,

and Japanese from Brazil. Ann. Hum. Genet.:61, 439±448

Roewer L, Krawczak M, Willuweit S, Nagy M, Alves C, Amorim A, Anslinger K,

Augustin C , Betz A, Bosh E, Caglia A, Carracedo A, Corach D, Dekairelle AF,

Dobosz T, Dupuy BM, Furedi S, Gehring C, Gusmao L, Henke J, Henke L,

Hidding M, Hohoff C, Hoste B, Jobling MA, Kargel HJ, de Knijff P, Lessig R,

Liebeherr E, Lorente M, Martinez-Jarreta B, Nievas P, Nowak M, Parson W,

Pascali VL, Penacino G, Ploski R, Rolf B, Sala A, Schmidt U, Schmitt C,

Schneider PM., Szibor R, Teifel-Greding J., Kayser M (2001) Online reference

database of European Y-chromosomal short tandem repeat (STR) haplotypes.

Forensic Sci. Int. 118 :106-113.

Roewer L, Croucher PJ, Willuweit S, Lu TT, Kayser M, Lessig R, Knijff P, Jobling MA,

Tyler-Smith C, Krawczak M (2005) Signature of recent historical events in the

European Y-chromosomal STR haplotype distribution. Hum Genet (2005) 116:

279–291

Russell-Wood, A. J. (1998) A sociedade portuguesa no ultramar em Francisco

Bethencourt e Kirti Chaudhuri (orgs.), História da Expansão Portuguesa: I,266-

281

Schneider S, Guillaume L, Excoffier L (2006) Arlequin Ver. 3.01, An integrated

software package for population genetic data analysis. University of Berne


129

Computational and Molecular Population Genetics Lab

http://cmpg.unibe.ch/software/arlequin3.

Tarazona-Santos E, Carvalho-Silva DR, Pettener D, Luiselli D, De Stefano GF,

Labarga CM, Rickards O,Tyler-Smith C, Pena SDJ, Santos FR (2001) Genetic

Differentiation in South Amerindians Is Related to Environmental and Cultural

Diversity: Evidence from the Y Chromosome. Am. J. Hum. Genet. 68:1485–

1496

The Y-chromosome consortium, A nomenclature system for the tree of human Y-

Chromosomal binary haplogroups, Genome Res. 12 (2002) 339–348.

Thomas MG, Parfitt T, Weiss DA, Skorecki K, Wilson JF, le Roux M, Bradman N,

Goldstein DB (2000) Y chromosomes traveling south: the Cohen modal

haplotype and the origins of the Lemba—the “Black Jews of Southern Africa.”

Am J Hum Genet 66:674–686

Wilson JF, Weiss DA, Richards M, Thomas MG, Bradman N, Goldstein DB (2001)

Genetic evidence for different male and female roles during cultural transitions

in the British Isles. Proc Natl Acad Sci USA 98:5078–5083

Zegura SL, Karafet TM, Zhivotovsky LA, Hammer MF (2004) High-Resolution SNPs

and Microsatellite Haplotypes Point to a Single Recent Entry of Native American

Y Chromosomes into the Americas. Mol. Biol. Evol. 21(1):164–175.

Zhivotovsky LA, Underhill PA, Cinnioglu C, Kayser M, Morar B, Kivisild T, Scozzari R,

Cruciani F, Destro-Bisol G, Spedini G, Chambers GK, Herrera RJ,Yong KK,

Gresham D, Tournev I, Feldman MW, Kalaydjieva L (2004) The Effective

Mutation Rate at Y Chromosome Short Tandem Repeats with Application to

Human Population-Divergence Time. Am. J. Hum. Genet. 74:000–000


130

5 – Conclusões

A população de Pernambuco apresenta um padrão haplotípico

masculino, em termos de variabilidade e diversidade e haplótipos mais

comuns, semelhante às populações do Nordeste, do Brasil e de

Portugal.

O haplótipo mais comum da população de Pernambuco é o haplótipo

modal e é o mesmo haplótipo mais freqüente em Portugal, na Europa e

no restante do Brasil. A freqüência deste haplótipo varia entre as

regiões, sendo em Pernambuco, maior que de outras regiões do Brasil

e de Portugal, evidenciando um “efeito do fundador”.

O agrupamento dos haplótipos seguindo o modelo de stepwise

mutation para os principais haplótipos das populações de referência

permitiu detectar representantes das populações européias, africanas,

indígenas na população de Pernambuco, estabelecendo esta ordem em

termos de participação nas patrilinhagens.

O prognóstico do haplogrupo, a partir das freqüências alélicas dos

haplótipos, ponderados através das taxas de mutação para cada loco,

apresentou similaridade com outros métodos de prognóstico e também

com os resultados em análises por polimorfismos binários

disponibilizadas em bancos de dados.

As árvores filogenéticas a partir de Y-STR’s de Pernambuco

apresentam um padrão de agrupamento semelhante ao do prognóstico

dos haplogrupos, tanto ponderadas através da variância das

freqüências, quanto por taxas de mutação.

A quantificação das contribuições étnicas usando os hapotipos não

únicos, estendidos, ou de toda a amostra não alterou os resultados

significativamente, sendo que em média, a principal contribuição foi de

genes europeus (83%), seguido de genes africanos (15%) e

ameríndios (2%).


131

6. Abstract

The use of microsatellites from the non-recombining region of Y

chromosome (NRY) is widespread in forensic and population genetic

studies. In this work the polymorphism analysis was made for 15 Y

chromosome microsatellites (minimal haplotype plus DYS447, DYS458 and

DYS464) from Pernambuco State - Brazil, consisting of a sample of 247

not related individuals and a set of haplotypes from other populations that

had historically participated in the population composition of this state.

The boarding statistics was made on the basis of the haplotype

frequencies assuming the Stepwise Mutation Model. It was possible to

establish a method that it showed useful in the determination of the

genetic contribution of the three main etnias of the population from

Pernambuco, as well as in the prediction of each haplotype haplogroup. In

a total of 247 different observed haplotypes, 183 distinct minimum

haplotypes (153 unique) were identified. They presented the haplotype

diversity of 0.9951, differentiation power of 0.7409 and the probability of

coincidence of 0.0049. The more common minimum haplotype of the

African population had frequency above of the amerindian’s one in the

analysis made with clusters of haplotypes. The prognostic method showed

efficient and compatible with the others existing ones, and was capable to

determine the haplogrupos and consequently, to quantify the contribution

of each ethnic group for this population as any other one. The Median

Joining phylogenetic trees, weighted using the STR mutation taxes mean,

showed very similar with those ones using the alelle frequencies variances

and they presented coherence in the distribution of the haplotypes in the

predicted haplogroups.

KKEEYY WWOORRDDSS:: Haplogruoup prediction, ethnic, microsatellites, Y chromosome haplotypes, DYS447, DYS458, DYS464 Pernambuco, Brasil.


132

7. Anexos


133

7.1. Anexo 1 IINNFFOORRMMAAÇÇÕÕEESS CCOOMMPPLLEEMMEENNTTAARREESS


134

7.1.1 Detalhamento das metodologias utilizadas

7.1.1.1 Obtenção da amostra

Foram analisados 247 haplótipos do cromossomo Y de indivíduos

não relacionados da população do estado de Pernambuco (Tabela 1),

genotipados a partir dos trabalhos realizados por Barros et al. (2006)* e

freqüências de haplótipos mínimos de 1413 homens, sendo 87 da

população da Holanda, 984 de Portugal, 129 ameríndios e 213 africanos,

disponíveis no banco de dados de haplótipos de STR-Y (YHRD;

http://www.ystr.org). Os haplótipos foram armazenados em um banco de

dados e analisados com Y-STRCALC, aplicativo construído especificamente

para análise de STR-Y. Estes haplótipos foram determinados a partir da

freqüência dos alelos em cada loco e os mais freqüentes, a partir da

freqüência do haplótipo em cada população de referência: europeus

(Roewer et al. 2001; Roewer et al. 2005; Kayser et al. 2001; Kayser et al.

1997; Geada et al. 2004; de Knijff et al.1997; Carvalho et al. 2003;

Gusmão et al. 2003), ameríndios (Bortolini et al. 2003; Rodriguez-Delfin

et al. 1997; Zegura et al., 2004) e africanos (Pereira et al., 2002; Alves et

al. 2003; Arroy-Pardo et al. 2005).

Extração do DNA: O DNA foi isolado de sangue periférico de células

mononucleadas usando o método de salting out de acordo com Miller et

al.(1988)

PCR: As reações de multiplex para o haplótipo mínimo foram feitas de

acordo com Corach et al. (2001). O triplex incluindo os locos DYS447,

DYS458 e DYS464 loci foi montado em uma reação de 25 µL contendo

100 ng de DNA, 5pmol de primers, 10mM dNTP, 10X PCR Buffer, 50 mM

MgCl2, 0,05% BSA, 0,75 U Taq DNA polymerase. Ciclagem térmica

estabelecida para o multiplex foi 94 oC por 2min, 30 ciclos de 94 oC por


135

30 s, 61 oC por 30 s, 72 oC por 30 s, e uma estensão final 72 oC por 7

min.

Tipagem: O produto da PCR foi tipado por eletroforese vertical usando

modelo SQ3 (Hoefer Pharmacia Biotech, San Francisco, CA). Os produtos

amplificados foram detectados em gel de policrilamida a 6% em nitrato de

prata e a identificação dos alelos realizada por comparação com

fragmentos amplificados “allelic ladders”, e confirmado usando Powerplex

Y® (Promega Corp., Madison, USA).

Análise de Dados: As freqüências relativas dos alelos e haplótipos e

diversidade haplotípica foram calculadas usando um software

desenvolvido (Y-STRCALC) para análise de dados. A análise comparativa

entre populações de variância molecular (AMOVA) entre as populações

estudadas foi realizada usando o software Arlequim 3.01 (Schneider et al.

2006).

7.1.1.2 Análise das freqüências

A freqüência alélica (pi) foi estimada segundo a fórmula,

na qual xi é o número de observações do alelo e n é o número total de

alelos. A freqüência haplotípica foi estimada do mesmo modo sendo xi o

número de ocorrências do haplótipo. A variância desta estimativa é dada

por:

nxp i

i =ˆ

1)ˆ1(ˆ

)ˆ(−−

=n

pppV iii


136

A diversidade gênica e a diversidade haplotípica foram calculadas

com a mesma fórmula, sendo que no cálculo da diversidade gênica são

considerados os alelos de um loco enquanto que a diversidade haplotípica

é calculada para a combinação de todos os locos na forma de haplótipo. A

diversidade haplotípica é definida como a probabilidade de que dois

haplótipos tomados ao acaso sejam diferentes (Nei 1987). Para o

cromossomo Y a diversidade haplotípica é numéricamente idêntica a dois

parâmetros usados em genética forense, o poder de discriminação (PD) e

a chance de exclusão (CE) (Bosch et al. 2002). A diversidade (D) e a sua

variância (V) são dadas pelas fórmulas:

Foram calculadas as freqüências dos haplótipos mínimos mais

freqüentes de portugueses, holandeses, africanos e ameríndios na

população de Pernambuco. Em seguida, foram definidos grupos (clusters)

destes haplótipos a partir do cálculo das distâncias genéticas com 0, ±1 e

± 2 seguindo o Stepwise Mutation Model (SMM) (Kimura e Ohta 1978). As

freqüências dos haplótipos de cada cluster foram obtidas por contagem

cumulativa do número de ocorrências de cada freqüência de referência em

Pernambuco. Para quantificar a contribuição genética de cada etnia na

formação da população de Pernambuco, foram usados os haplótipos

mínimo e estendido (mínimo + DYS447 + DYS458 + DYS464).

7.1.1.3 Prognóstico do Haplogrupo de Y

Os haplótipos de Pernambuco foram submetidos ao cálculo de

estimativa de haplogrupo. A classificação dos haplótipos é geralmente

estabelecida através de modelos baseados em distâncias genéticas,

enquanto que a predição dos haplogrupos tem nas freqüências dos alelos

a sua principal característica (Athey, 2005). Neste trabalho introduziu-se

um peso para as taxas de mutação, inversamente proporcional às médias

)1(1

ˆ1

2∑=

−−

=k

iip

nnD


137

das taxas por loco. Buscou-se prognosticar os haplótipos a partir da

determinação da distância genética dos mesmos em relação ao modal de

cada haplogrupo. Os haplótipos modais foram determinados a partir da

identificação dos alelos mais freqüentes de cada loco. Assim, valendo-se

do conjunto de publicações de referência e dos bancos de dados

disponíveis, foi determinado o haplótipo modal para os haplogrupos: R1b;

R1a; E3b; E3a; J; N;G;I; I1a e Q, considerados como os mais prováveis e

suficientes para a caracterização das etnias formadoras da população

Pernambucana.

As distâncias genéticas dos haplótipos da população de Pernambuco

em relação ao modal de cada haplogrupo foram calculadas usando o

programa Y-STRCALC, desenvolvido especificamente para este estudo.

Adotaram-se os valores 1 para diferença e 0 para igualdade em cada loco.

Em seguida, foi dividido o valor encontrado pelo inverso da taxa de

mutação do loco multiplicada por 1.000. Assim, a menor distância

apontará o cluster ao qual um dado haplótipo será incorporado,

prognosticando seu haplogrupo. Como exemplo, considera-se o seguinte

haplótipo mínimo (14,11-14,14,30,24,11,13,13). Seja {Wi} um conjunto

de n alelos representados pelo número de repetições nos locos do

haplótipo {Wi} = {14,11,14,14,30,24,11,13,13} e {Xi} o conjunto dos

alelos representados pelos haplótipos modais de cada haplogrupo. Seja Mi

a taxa de mutação média calculada para cada Xi correspondente. O

cálculo da distância D será dado por:

D = ∑=

×n

i Mi1

3101para Xi ≠ Wi

Será prognosticado o haplogrupo com a menor distância calculada. O

haplótipo acima foi prognosticado como pertencendo ao haplogrupo R1b

considerando o seguinte: o haplótipo modal para o haplogrupo R1b, {Xi}

= {14,11,14,13,29,24,11,13,13} apresenta diferenças nos locos DYS389I

e DYS389II para o haplótipo {Wi} = {14,11,14,14,30,24,11,13,13}. O

valor para a taxa de mutação média para os locos DYS389I e DYS389II é


138

1,87 x 10-3 e 2,26 x 10-3, respectivamente (Kayser et al. 2000, Kurihara

et al. 2004, Dupuy et al. 2004, Ballard et al. 2005, Budowle et al. 2005,

Gusmao et al. 2005 , Bianchi et al. 1998 , Dupuy et al. 2004). Assim o

somatório:

977,01026,2

1011087,1

1013

3

3

3

=××

+××

= −−D

resultará na menor distância D, calculada para o haplótipo Wi para todos

os haplótipos modais Xi, indicando que o haplótipo Wi pertence ao

haplogrupo R1b. Do mesmo modo, se analisarmos a distância D, para o

haplogrupo I, {Xi}= {15,14,14,12,29,22,10,11,14}, o somatório de todos

os Xi≠Wi, compreenderá oito locos, que certamente apresentará uma

distância maior que a calculada para o modal do haplogrupo R1b. O

programa calculará a distância para todos os haplogrupos modais e a

menor distância apontará o haplogrupo a ser prognosticado. Para a

determinação do escore, o programa Y-STRCALC aplica a fórmula Escore

= 100 – (D × 25), considerando que o ponto médio de mudança de cluster

para os haplogrupos se encontra a uma distância aproximada com valor

igual a quatro, o qual é considerado como referência para indeterminação.

Isto significa dizer que uma distância D = 0 terá um escore de 100 e uma

distância de D = 4 terá escore 0, ou seja, as distâncias iguais ou acima de

4 não são passíveis de prognóstico. No caso do exemplo acima, a

distância D = 0,977 terá um valor de escore ≈ 76.

7.1.1.4 Análise de Network

As árvores median-joining (Bandelt et al. 1999) foram construídas

usando o programa NETWORK 4.2 com os haplótipos mínimos não únicos

de Pernambuco. Para os cálculos do network, as STR’s foram ponderadas

de duas formas: uma de acordo com a variância do número de repetições

em cada loco, de forma que os maiores pesos forma atribuídos aos locos


139

menos variáveis, e um outro modo proposto neste trabalho, que considera

as taxas médias de mutação para cada loco, atribuindo pesos maiores aos

locos com menor taxa de mutação, tal como foi feito para o prognóstico

do haplogrupo.

7.1.1.5 Construção do Banco de dados

Foi construído um banco de dados com uso de entidades relacionais

(tabelas) de dados, usando a ferramenta de Banco de dados ORACLE® 8i e

linguagem PL-SQL para a armazenagem dos dados de STR. Foram

desenvolvidos programas de Banco (Storage procedures) e de aplicação

para ambiente Windows de manipulação dos dados e interface com os

usuários usando linguagem estruturada SQL e software Developer 6.0

com linguagem orientada a objeto, constituído pelos seguintes módulos e

funções:

Cadastro de haplótipos do Cromossomo Y (figura 1)

Número, freqüência relativa e absoluta no banco

Seleção por domínio, por “string” ou aritmética

Importação de dados gerados pela planilha excel

Pesquisa do Banco de Dados

Geração de tabela de amostra por seleção (figura 2)

Cálculo de freqüências, diversidade Haplotípica,

Probabilidade de coincidência e poder de discriminação

da amostra e do banco.

Análise do Banco de dados (figura 3)

Cálculo das freqüências haplotípicas, absoluta e relativa

Cálculo do modal e do antimodal

Calculo da distancia genética para o modal SMM

Inferência do haplogrupo

Relatório das freqüências alélicas da amostra

Pesquisa de origem haplótipo (figura 4)

Importação de dados


140

Verificação da origem de haplótipos através de

cruzamento com bancos de dados incorporados

Figura 1: Interface de cadastro de haplótipos do cromossomo Y na qual calcula-se e informa-se as freqüências relativas e absolutas, número de registros do banco número de haplótipos, diversidade haplotípica de poder de discriminação.


141

Figura 2: Interface de seleção de haplótipos do cromossomo Y do banco para análise através da qual é possível verificar os parâmetros básicos do banco e da amostra selecionada e informa os dados, freqüências relativas e absolutas, número de registros do banco número de haplótipos, diversidade haplotípica de poder de discriminação e probabilidade de coincidência.

Figura 3: Interface de análise haplótipos do cromossomo Y a partir da amostra selecionada do banco através da qual pode se calcular as distância genéticas para o haplótipo modal da amostra, fazer prognóstico de haplogrupo por diferentes métodos de cálculo verificar o anti-modal (alelos menos freqüentes por loco) freqüências relativas e absolutas e impressão das freqüências alélicas.


142

Figura 4: Interface de rastreamento de haplótipos do cromossomo Y em outros bancos de dados em função das menores distâncias genéticas a partir da amostra selecionada. 7.1.2. Detalhamento dos resultados

7.1.2.1. Análise de polimorfismo

Como resultado do estudo realizado por Barros et al. (2006)* Tabela

1, a análise de variabilidade alélica e haplotípica apresentada foi refeita e

confirmada com a utilização do programa Y-STRCALC. A Figura 5

apresenta graficamente as freqüências alélicas encontradas.

Dados da pesquisa:

Tamanho da amostra: 247 indivíduos não aparentados

Número de Haplótipos da amostra: 224

Diversidade Haplotípica: 0,9994


143

Poder de diferenciação: 0,9069

Probabilidade de coincidência de Haplótipos: 0,0006

Haplótipo mínimo modal de Pernambuco: • encontrado 15 vezes na amostra de PE (6,07%)

• na Europa corresponde a 2,96% na amostra de 4688

• taxa de mutação média de 2.8 x 103 Europa (Kayser et al.2001)*

Haplótipos estendidos mais freqüentes em Pernambuco: f = (0.0162) n = 4 Tabela 1:Lista dos 224 haplótipos do cromossomo Y dos 247 homens de Pernambuco., Freqüências absolutas e relativas. Ha DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS DYS nb Fc

19 385 389I 389II 390 391 392 393 447 458 464

001PE 15 15-15 13 29 23 11 12 14 26 15 13-14-15 1 0.0040

002PE 14 12-14 13 30 24 10 13 13 25 18 15-16-17 1 0.0040

003PE 13 16-16 13 32 24 10 11 13 26 18 14-15-16-17 1 0.0040

004PE 14 11-14 13 29 24 11 13 13 25 17 15-16-17 4 0.0162

005PE 15 14-16 11 29 22 10 11 14 22 17 12-13 2 0.0081

006PE 15 9-11 13 29 24 10 13 13 24 17 15-16-17 1 0.0040

007PE 15 11-13 13 31 24 11 13 13 25 18 15-16-17 1 0.0040

008PE 15 15-17 12 30 21 11 11 13 26 16 13-16-18 1 0.0040

009PE 15 16-18 14 31 21 11 11 13 26 16 14-16-18 1 0.0040

010PE 14 18-20 14 31 25 10 11 13 25 15 14-16-18 1 0.0040

011PE 14 11-14 12 27 24 12 13 14 24 17 15-16-17 1 0.0040

012PE 17 16-19 13 30 21 10 11 14 25 17 13-17-18 1 0.0040

013PE 13 13-14 14 30 24 9 11 13 25 18 14-16-17 1 0.0040

014PE 14 12-13 14 30 24 11 13 13 26 17 14-15-16-17 1 0.0040

015PE 15 13-13 13 29 26 10 11 12 24 20 13-15-16-17 1 0.0040

016PE 16 12-14 12 27 22 10 11 13 23 19 12-14 1 0.0040

017PE 13 13-15 13 28 23 10 13 13 27 17 13-15-16 1 0.0040

018PE 14 11-14 13 29 25 10 13 13 25 17 15-17 2 0.0081

019PE 15 16-16 13 31 21 11 11 13 25 17 13-16-17 1 0.0040

020PE 15 11-14 13 30 23 10 13 13 25 17 15-16-17 1 0.0040

021PE 17 12-12 13 28 23 10 11 13 24 18 11-14-15 1 0.0040

022PE 14 11-12 13 29 24 11 12 13 25 16 14-15-16-17 1 0.0040

023PE 14 11-14 13 29 23 11 13 12 25 17 14-15-17-18 1 0.0040


144

024PE 15 15-18 13 31 21 10 11 13 25 16 13-15-16 1 0.0040

025PE 14 11-11 12 29 25 11 13 13 24 16.2 15-16-17 1 0.0040

026PE 13 13-14 14 30 23 9 11 13 23 18 14-15-16-17 1 0.0040

027PE 15 11-14 13 29 23 11 13 13 26 17 15-16-17 1 0.0040

028PE 15 13-15 12 29 23 10 11 12 26 17 13-13-13-13 1 0.0040

029PE 14 11-14 13 29 24 11 13 14 24 16 15-16-18 2 0.0081

030PE 13 15-17 13 30 25 10 13 13 26 14 14-15-19 1 0.0040

031PE 14 11-14 14 30 24 11 13 13 25 17 15-16-17 1 0.0040

032PE 14 11-14 14 30 24 11 13 13 25 18 15-16-17 1 0.0040

033PE 14 11-14 13 30 24 11 13 13 25 19 15-16-17 1 0.0040

034PE 14 11-14 12 28 23 11 14 13 25 18 15-17 1 0.0040

035PE 16 11-14 13 30 25 10 11 14 24 15 12-15-16 1 0.0040

036PE 14 11-14 13 30 24 11 13 13 24 17 15-16-17 1 0.0040

037PE 15 11-15 13 29 24 10 13 13 26 18 15-16-17 1 0.0040

038PE 14 11-14 14 30 24 11 13 13 25 18 15-17 3 0.0121

039PE 14 11-14 13 28 24 11 13 13 26 17 15-17 1 0.0040

040PE 14 11-14 13 29 24 11 13 12 25 16 14-15-17-19 3 0.0121

041PE 14 11-11 13 29 25 11 13 13 25 16 15-16-17 1 0.0040

042PE 14 11-15 13 29 23 11 12 13 25 18 15-17 1 0.0040

043PE 14 16-18 13 30 24 10 11 13 25 17 16-16-16-16 1 0.0040

044PE 14 11-15 13 29 24 11 13 13 26 18 15-16-17-18 1 0.0040

045PE 14 13-15 14 31 23 10 11 12 25 18.2 12-13-15-16 1 0.0040

046PE 15 14-14 13 31 21 10 11 13 24 19 13-16-17 1 0.0040

047PE 14 14-14 12 29 23 10 11 12 23 15 12-14-15-16 3 0.0121

048PE 16 15-15 13 29 23 11 12 14 26 15 11-13-15 1 0.0040

049PE 14 11-14 13 29 23 10 13 14 25 15 14-16-17 1 0.0040

050PE 15 11-14 13 29 22 10 13 13 25 14 15-17 1 0.0040

051PE 14 14-14 13 29 23 11 13 13 25 18 15-16-17 1 0.0040

052PE 15 12-14 14 31 25 10 11 13 24 15 12-15-16 1 0.0040

053PE 14 11-14 13 29 23 11 13 12 25 17 14-15-16-18 1 0.0040

054PE 15 11-15 13 30 24 10 13 14 25 17 15-16-17 1 0.0040

055PE 15 12-16 12 30 22 10 11 14 23 17 12-13-14 1 0.0040

056PE 14 11-11 13 29 24 11 13 12 25 20 15-17-18 1 0.0040

057PE 13 14-14 14 30 24 9 11 13 23 17 14-16-17 1 0.0040

058PE 15 11-13 14 30 24 11 13 13 24 17 15-17-18 1 0.0040

059PE 14 11-14 13 29 24 11 13 12 25 17 15-16-17 1 0.0040

060PE 16 14-14 12 29 23 10 12 15 25 16 11-15 1 0.0040

061PE 15 11-14 14 30 23 10 13 13 25 17 15-16-17 1 0.0040

062PE 15 13-15 11 29 22 10 10 14 23 20 12-13-14 1 0.0040

063PE 14 11-14 13 29 24 11 13 13 25 17 15-16-19 2 0.0081

064PE 14 11-14 14 30 24 11 13 13 25 16 15-17 1 0.0040

065PE 14 11-14 13 29 23 11 13 14 24 17 15-17 2 0.0081

066PE 14 11-14 13 29 24 10 13 13 25 17 15-17 1 0.0040

067PE 14 12-12 13 29 24 11 13 13 25 18 15-15-15-15 1 0.0040


145

068PE 17 12-12 13 28 23 10 11 13 24 17 11-14-15 1 0.0040

069PE 14 13-18 12 29 23 10 14 13 27 16 14-15-16 1 0.0040

070PE 14 11-14 13 29 24 11 13 13 25 17 15-17 4 0.0162

071PE 14 12-14 13 29 24 12 13 13 25 17 12-15-17-18 1 0.0040

072PE 15 16-17 13 30 21 10 11 13 25 17 11-16-18 1 0.0040

073PE 16 14-15 12 28 22 10 11 14 23 16 12-13-14 1 0.0040

074PE 13 16-18 13 30 23 10 11 13 27 15 14-15.3-17 1 0.0040

075PE 15 11-13 13 31 24 11 13 13 26 18 14-15-17 1 0.0040

076PE 13 16-16 13 30 23 10 11 14 25 16 13-15-16 1 0.0040

077PE 14 12-14 13 29 24 11 13 13 25 17 15-16-17 1 0.0040

078PE 14 16-18 13 30 24 10 12 12 26 17 12-14.3-16-17 1 0.0040

079PE 14 10-14 13 29 25 11 13 13 25 18 15-17-18 1 0.0040

080PE 13 15-18 13 29 24 10 14 13 26 16 14-16-17 1 0.0040

081PE 15 16-18 12 30 21 10 11 13 25 15 16-19 1 0.0040

082PE 17 15-18 13 31 22 10 14 13 26 17 11-13-16 1 0.0040

083PE 15 11-14 13 29 24 11 13 13 26 18 15-16-17 1 0.0040

084PE 15 16-18 12 28 24 10 11 12 26 20 14-15-18 1 0.0040

085PE 14 11-14 13 28 24 11 13 13 25 17 15-17 1 0.0040

087PE 14 11-14 14 30 23 11 13 13 25 17 14-15-17 1 0.0040

088PE 15 14-20 13 29 23 10 11 12 26 16 13-16 1 0.0040

089PE 14 12-14 13 29 24 10 13 13 25 17 15-16-18 1 0.0040

091PE 15 16-17 13 30 21 10 11 15 27 15 14-15-17 1 0.0040

092PE 16 13-14 13 29 23 9 11 12 26 14 11-13-15 1 0.0040

093PE 16 14-17 12 28 24 10 11 13 28 17 13-15-16-17 1 0.0040

094PE 14 11-15 13 29 24 11 13 13 25 16 15-16-18 1 0.0040

095PE 15 14-16 14 31 23 10 12 14 26 16 12-14-15 1 0.0040

096PE 14 12-14 13 29 24 10 13 13 25 17 15-17 1 0.0040

097PE 15 15-18 13 30 21 10 11 13 25 17 13-16 1 0.0040

098PE 14 11-15 13 29 25 11 13 13 25 17 15-16-17 1 0.0040

099PE 14 11-14 13 29 24 10 13 13 25 17 15-16-17 1 0.0040

100PE 14 16-17 13 29 23 10 14 12 24 16 15-16 1 0.0040

101PE 14 11-14 13 29 23 11 13 13 25 17 15-17 1 0.0040

102PE 14 13-14 13 29 22 10 11 12 26 16 13-14-15-16 1 0.0040

103PE 14 13-15 12 28 23 10 11 14 22 15 12-14-15-16 1 0.0040

104PE 16 11-14 13 31 24 10 11 14 23 15 12-13-15-16 1 0.0040

105PE 15 14-14 13 30 24 10 12 15 26 17 11-14-16 1 0.0040

106PE 14 11-14 13 29 24 11 13 12 25 19 15-16-18 1 0.0040

107PE 14 11-13 13 29 24 11 14 12 25 16 15-16-19 1 0.0040

108PE 14 12-15 13 29 25 11 12 13 25 16 15-16-17 1 0.0040

109PE 14 11-11 13 29 24 11 12 13 26 16 15-16-17 1 0.0040

110PE 14 11-14 13 29 24 11 13 13 26 17 15-16-17 1 0.0040

111PE 14 11-14 13 29 24 11 13 13 24 17 15-17 1 0.0040

112PE 14 11-14 13 30 24 10 13 13 25 17 16-18 1 0.0040

114PE 14 11-14 13 29 24 11 13 14 25 16 15-17 1 0.0040


146

115PE 13 11-14 13 29 23 11 13 13 25 17 15-17 1 0.0040

116PE 13 17-17 12 29 24 10 11 13 27 14 14.3-16-17 1 0.0040

117PE 14 15-16 14 32 23 10 11 12 23 16 12-14-15 1 0.0040

118PE 14 14-14 12 29 23 11 11 13 23 15 12-14-15-16 1 0.0040

119PE 16 16-18 13 30 22 10 11 15 26 15 13-16-18 1 0.0040

120PE 14 11-14 13 29 24 11 13 13 26 16 15-16-17 2 0.0081

121PE 15 11-14 12 28 25 11 13 13 25 19 15-17 1 0.0040

122PE 14 11-14 13 29 24 11 14 13 25 18 15-16-17-18 1 0.0040

123PE 13 13-14 14 30 24 9 11 13 23 20 14-16-17 1 0.0040

124PE 14 14-16 13 26 23 10 13 13 26 18 11-13-16 1 0.0040

125PE 15 11-14 13 28 23 11 13 13 25 17 15-18 2 0.0081

126PE 14 11-14 13 29 23 11 13 12 25 17 14-15-18 1 0.0040

127PE 15 13-18 13 29 24 10 11 12 26 17 12-15-18 1 0.0040

128PE 15 11-14 13 30 24 11 13 14 25 17 15-16-17 1 0.0040

129PE 16 14-14 12 29 23 10 12 14 25 17 11-15 1 0.0040

130PE 14 11-14 13 28 24 11 13 13 25 17 15-16-17 1 0.0040

131PE 15 14-14 14 32 23 10 13 12 26 18 11-13-16 1 0.0040

132PE 15 15-15 12 29 22 10 10 14 23 20 12-13-14 1 0.0040

133PE 16 17-18 14 31 21 9 11 14 26 17 13-17-18 1 0.0040

134PE 14 11-14 13 29 23 11 13 12 24 18 15-17-18 1 0.0040

135PE 14 11-14 13 29 25 11 13 13 25 18 15-17 1 0.0040

136PE 14 11-14 13 30 25 11 13 13 26 17 15-17 1 0.0040

137PE 14 17-17 13 30 24 10 11 13 25 16 14-15.3-17 1 0.0040

138PE 15 11-11 14 32 24 10 11 13 26 17 15-16-17 1 0.0040

139PE 15 16-17 13 31 21 10 11 13 26 18 13-16-17 1 0.0040

140PE 13 16-16 13 30 23 10 11 13 25 16 13-15-17 1 0.0040

141PE 15 15-15 14 31 24 10 12 14 25 16 11-15 1 0.0040

142PE 15 13-14 14 30 22 11 11 14 23 18 12-13 1 0.0040

143PE 14 11-16 13 29 24 11 13 13 26 16 15-16-17 1 0.0040

144PE 14 11-15 14 30 25 11 13 13 25 16 15-17-18 1 0.0040

145PE 14 11-14 12 28 23 11 13 13 25 18 15-17 1 0.0040

146PE 15 11-13 13 29 25 11 13 13 25 17 15-16-17 1 0.0040

147PE 14 11-15 13 29 24 11 13 13 25 17 15-16-17 2 0.0081

148PE 15 12-12 13 32 23 10 11 23 26 16 16-18 1 0.0040

149PE 15 15-19 14 31 21 10 11 13 25 16 16-18 1 0.0040

150PE 14 11-14 14 30 24 11 13 13 25 18 14-15-16-17 1 0.0040

151PE 14 11-15 13 29 24 10 13 13 25 18 14-15-16 1 0.0040

152PE 15 14-16 13 30 21 10 11 14 27 21 12-15-16-17 1 0.0040

153PE 15 13-16 12 29 23 11 11 12 24 20 12-13-16-17 1 0.0040

154PE 14 11-14 14 30 23 11 13 13 25 17 15-17 2 0.0081

155PE 13 11-14 13 29 24 11 13 13 25 16 14-16-17 1 0.0040

156PE 14 11-14 12 28 24 11 13 13 25 16 15-17 1 0.0040

157PE 14 11-14 13 30 23 11 13 13 23 18 14-15-17-18 1 0.0040

158PE 14 11-14 12 28 24 10 13 13 25 19 15-16-17 1 0.0040


147

159PE 16 11-14 13 30 25 11 11 13 24 15 12-13-14-16 1 0.0040

160PE 14 11-14 13 28 24 10 13 13 24 16 15-17 1 0.0040

161PE 14 11-14 13 29 24 11 13 13 26 17 15-16-18 1 0.0040

162PE 14 11-14 13 30 23 11 13 13 25 19 15-16-17 1 0.0040

163PE 14 11-14 12 28 23 11 14 13 25 18 15-16-17 1 0.0040

164PE 15 11-14 14 30 24 11 13 13 25 17 15-16-17 1 0.0040

165PE 14 13-17 13 29 22 9 11 12 27 16 13-16-17 1 0.0040

166PE 14 11-13 13 30 25 10 13 13 26 17 15-17 1 0.0040

167PE 15 18-18 13 32 21 10 10 13 25 16 13-15-16-18 1 0.0040

168PE 15 16-18 14 31 21 11 11 13 25 17 16-18-19 1 0.0040

169PE 14 16-17 13 31 21 11 11 13 25 16 13-16-17 1 0.0040

170PE 15 16-19 13 31 21 10 11 13 25 16 13-16-17 1 0.0040

171PE 14 14-14 12 28 23 10 11 13 22 16 12-14-15 1 0.0040

172PE 16 14-15 12 30 22 10 12 14 23 17 12-13-14 1 0.0040

173PE 14 14-19 12 28 24 11 11 13 23 17 14-15 1 0.0040

174PE 15 17-18 13 31 23 10 12 15 24 17 15-15-15-15 1 0.0040

175PE 14 11-15 13 29 23 11 13 13 24 16 15-17-18 2 0.0081

176PE 17 12-13 13 28 23 10 11 13 26 17 11-14-16 1 0.0040

177PE 16 15-19 13 29 21 10 11 15 26 16 13-15-17 1 0.0040

178PE 15 13-15 12 28 21 10 11 14 23 17 13-14 1 0.0040

179PE 16 16-17 13 29 21 10 11 15 26 16 15-15-15-15 1 0.0040

180PE 14 13-14 13 29 22 10 11 13 23 16 12-14-16 1 0.0040

181PE 13 16-18 13 30 23 10 11 13 26 15 14-15.3-17 1 0.0040

182PE 14 15-18 13 30 24 10 11 13 25 17 16-16-16-16 1 0.0040

183PE 14 11-14 13 28 24 11 13 13 24 16 15-17 1 0.0040

184PE 17 12-12 13 28 23 10 11 13 25 16 11-14-15 1 0.0040

185PE 14 13-14 12 28 22 10 11 13 22 15 12-13-14-15 1 0.0040

186PE 14 16-17 13 31 21 11 11 13 25 17 13-16-17-19 1 0.0040

187PE 15 15-15 13 30 20 10 11 13 27 18 12-15-17 1 0.0040

188PE 15 11-14 13 29 24 11 13 13 26 16 15-17-17 1 0.0040

189PE 13 16-17 13 30 23 10 11 13 27 15 13.3-15.3-17-18 1 0.0040

190PE 14 10-15 13 29 24 11 13 13 25 18 16-17 1 0.0040

191PE 14 11-14 13 29 25 11 13 13 25 17 15-16-17 1 0.0040

192PE 14 11-14 14 31 24 11 13 13 25 18 15-16-17 1 0.0040

193PE 14 11-14 14 30 23 11 13 13 25 17 15-16-18 1 0.0040

194PE 14 13-15 13 30 22 10 11 12 26 15 12-16 1 0.0040

195PE 14 12-12 13 29 24 10 13 13 25 16 15-16-17 1 0.0040

196PE 14 11-13 13 29 24 11 13 13 25 17 15-16-17 1 0.0040

197PE 14 12-14 13 29 24 11 13 13 25 18 15-17 1 0.0040

198PE 14 12-14 14 30 25 11 13 13 25 17 15-16-17 1 0.0040

199PE 14 11-14 13 31 24 11 13 13 25 19 14-15-18 1 0.0040

200PE 15 11-14 13 29 24 11 13 13 25 16 15-16-17 1 0.0040

201PE 15 14-17 12 29 23 10 11 13 27 16 14-16-17-18 1 0.0040

202PE 14 14-14 13 29 25 10 11 12 24 19 13-15-16-17 1 0.0040


148

203PE 13 16-17 13 30 24 10 11 13 25 16 14-16-17-18 1 0.0040

204PE 15 14-15 13 32 21 10 11 13 25 18 13-16-18 1 0.0040

205PE 14 11-14 13 29 23 11 13 13 24 17 15-16-17-18 1 0.0040

206PE 13 13-14 13 29 24 9 11 13 23 19 14-16 1 0.0040

207PE 14 13-16 13 29 22 11 11 12 27 17 12-13-15-16 1 0.0040

208PE 15 16-18 13 30 21 10 11 13 25 16 13-15-16 1 0.0040

209PE 15 13-15 13 30 22 10 10 13 20 18 13-14-15 1 0.0040

210PE 14 13-18 13 29 23 11 11 12 26 18.2 12-14-16-17 1 0.0040

211PE 15 16-18 13 31 21 11 11 13 25 16 13-16-18 1 0.0040

212PE 15 11-13 13 29 24 11 13 13 25 17 13-15-16-17 1 0.0040

213PE 16 11-14 13 31 25 10 11 14 24 15 12-15-16 1 0.0040

214PE 15 15-15 12 29 22 10 11 14 22 16 13-14-15 1 0.0040

215PE 14 11-11 13 29 24 11 13 13 24 19 15-17 1 0.0040

216PE 14 12-14 13 29 24 11 13 13 25 16 15-17 1 0.0040

217PE 15 17-18 12 29 21 10 11 15 26 16 13-16-17 1 0.0040

218PE 14 13-16 13 30 23 10 11 12 25 18 12-14-16-17 1 0.0040

219PE 15 15-18 12 30 21 10 11 13 25 16 13-15-16-17 1 0.0040

220PE 14 13-17 12 29 23 10 11 13 22 15 12-14-15 1 0.0040

221PE 14 13-19 13 30 23 10 11 12 25 17.2 14-15-16-17 1 0.0040

222PE 16 15-19 13 30 21 10 11 13 25 15 13-16-18 1 0.0040

223PE 14 11-14 13 30 24 10 13 14 26 17 15-17 1 0.0040

224PE 15 15-16 13 30 21 10 11 14 26 18 12-15-16-18 1 0.0040

225PE 14 11-15 13 30 24 11 13 13 26 20 15-17-18 1 0.0040

226PE 17 17-18 14 31 21 10 11 13 27 15 12-16-17 1 0.0040

227PE 14 12-14 14 30 24 10 13 13 25 18 16-17 1 0.0040

a: H = haplótipo; b: n = número de indivíduos observados para cada haplótipo; c: F = freqüência para cada haplótipo.


149

Figura 5 Distribuição das freqüências alélicas de 11 locos de Y-STR, dos 247 indivíduos da amostra de Pernambuco. Para cada loco, a designação do alelo (em número de repetições) indicado no eixo das abcissas , e a freqüência observada (em %) no eixo das ordenadas.

DYS19

0

10

20

30

40

50

60

13 14 15 16 17

DYS385a

0

10

20

30

40

50

9 10 11 12 13 14 15 16 17 18

DYS385b

0

10

20

30

40

50

11 12 13 14 15 16 17 18 19 20

DYS389I

01020304050607080

11 12 13 14

DYS389II

0

10

20

30

40

50

26 27 28 29 30 31 32

DYS390

05

1015202530354045

20 21 22 23 24 25 26

DYS391

0

10

20

30

40

50

60

9 10 11 12

DYS392

0

10

20

30

40

50

10 11 12 13 14

DYS393

01020304050607080

12 13 14 15

DYS447

0

10

20

30

40

50

60

18 20 22 23 24 25 26 27 28

DYS458

05

10152025303540

14 15 16 16.2 17 17.2 18 18.2 19 20 21


150

7.1.2.2. Análise dos haplótipos de referência

O estudo comparativo das freqüências dos alelos mais comuns nas

populações foi importante na diferenciação das populações e na

determinação do haplótipo modal, permitindo a investigação das

prováveis “assinaturas genéticas”. A tabela 2 mostra as maiores

freqüências dos alelos nas regiões do Brasil enquanto a tabela 3 mostra

algumas populações usadas como referência neste estudo. Este resultado

mostrou que os haplótipos modais das populações do Brasil (Gratapaglia

et al. 2005), da Europa e de Portugal são diferentes, mas variam muito

pouco nas freqüências dos locos (DYS389II e DYS391), que são os

responsáveis por esta diferenciação, sendo descartada uma diferença

significativa entre modais nestas populações. Diferentemente, o loco

DYS392 é bastante discriminante para as populações ameríndias e

africanas, as quais apresentaram alelos diferentes em grande parte destes

haplótipos. A diferenciação das regiões de Portugal (central, norte e sul)

não foi constatada e desconsiderada para efeito deste estudo. A tabela 3

apresenta as freqüências dos haplótipos analisados separadamente por

região. Em seguida foi feita a verificação destas freqüências

representativas das populações de origem na população de Pernambuco.

Esta infomação foi coletada através da análise direta na amostra da

população usando o Y-STRCALC como pode ser verificado nos dados da

tabela 4. A tabela 5 mostra uma visão geral dos haplótipos de referência

e suas freqüências em diversas áreas geográficas para dar uma referência

das freqüências. Observa-se que esta tabela apresenta um haplótipo dos

países baixos (Leiden) que foi usado como uma referância típica das

populações daquela região, e que possui freqüência muito baixa em

Portugal. Isto foi feito na tentativa de estabelecer diferencial haplotípico

entre Portugal e Holanda na amostra de Pernambuco.


151

Tabela 2: Haplótipos mínimos modais nas regiões do Brasil indicando os locos (linha superior) os alelos em número de repetições e as freqüências dos alelos (parêntesis) que apresentaram diferenças (Grattapaglia et al. 2005).

REGIÃO DYS19 DYS385 DYS389I DYS389II DYS390 DYS391 DYS392 DYS393

NORTE

14

11-14

13

30 (0.600)

29 (0.200)

24

10 (0.600)

11 (0.400)

13

13

NORDESTE

14

11-14

13

29

24

11 (0.548)

10 (0.429)

13

13

CENTRO-OESTE

14

11-14

13

29

24

10 (0.583)

11 (0.354)

11

13

SUDESTE

14

11-14

13

29

24

10 (0.583)

11 (0.361)

11

13

SUL

14

11-14

13

29

24

10 (0.489)

11 (0.489)

13

13


152

Tabela 3: Alelos mais freqüentes por loco dos haplótipos mínimos de Y nas populações de Pernambuco, Europa, Brasil, Ameríndios, África e Portugal em duas regiões (Central e Açores). As freqüências aparecem entre parênteses, e os alelos, em número de repetições. Os quadros nos quais aparecem duas freqüências são aqueles que definem modalidade do loco, diferenciadores ou não, em razão da semelhança entre as freqüências.

POPULAÇÃO DYS 19

DYS 385

DYS 389I

DYS 389II

DYS 390

DYS 391

DYS 392

DYS 393

PE

14

(0.558)

11-14

(0.360)

13

(0.684)

30 (0.279)

29 (0.465)

24

(0.429)

11 (0.489)

10 (0.465)

13

(0.510)

13

(0.688)

EUROPA

14

(0.601)

11-14

(0.365)

13

(0.574)

30 (0.412)

29 (0.372)

24

(0.568)

11 (0.500)

10 (0.432)

13

(0.595)

13

(0.709)

BRASIL

14

(0.566)

11-14

(0.268)

13

(0.621)

30 (0.364)

29 (0.384)

24

(0.540)

11 (0.434)

10 (0.530)

13

(0.465)

13

(0.626)

AMERÍNDIOS

13 (0.440)

15 (0.380)

12-15

(0.180)

13

(0.810)

29 (0.440)

30 (0.370)

24

(0.630)

11 (0.500)

10 (0.440)

14

(0.560)

13

(0.870)

AFRICA

15

(0.417)

16-16 (0.167) 15-16

(0.158)

13

(0.563)

30 (0.371)

31 (0.309)

21

(0.674)

10

(0.777)

11

(0.877)

14

(0.586)

PORTUGAL CENTRAL

14

(0.582)

11-14

(0.305)

13

(0.645)

30 (0.286)

29 (0.461)

24

(0.538)

11 (0.402)

10 (0.495)

13

(0.475)

13

(0.684)

PORTUGAL AÇORES

14

(0.539)

11-14

(0.317)

13

(0.555)

30 (0.285)

29 (0.396)

24

(0.492)

11 (0.412)

10 (0.460)

13

(0.539)

13

(0.746)

Tabela 4: Haplótipo mais freqüente nas populações de referência e respectivas freqüências na população de Pernambuco, Brasil.

População DYS

19

DYS

385

DYS

389I

DYS

389II

DYS

390

DYS

391

DYS

392

DYS

393

f0 F1

Portugal 14 11-14 13 29 24 11 13 13 0.0457 0.0607

Holanda 14 11-14 13 29 23 11 13 13 0.0459 0.0081

Ameríndios 13 15-17 13 31 23 10 14 13 0.1666 0.0000

África 15 15-16 13 30 21 10 11 14 0.0632 0.0040

f0 = freqüência nas populações de referência ; f 1= freqüência na população de

Pernambuco;


153

Tabela 5 – Haplótipos mais freqüentes e modais no Brasi e Holanda/Strasburgo, e respectivas

freqüências em Pernambuco, Portugal Central, Portugal Sul, Europa e no mundo

Haplótipo Referência PE PT HOLANDA BRASIL EUROPA MUNDO (14-11,14-13-29-24-11-13-13) PORTUGAL 0,0669 0,0457 0,0229 0,0252 0,02960 0,02040 (14-11,14-13-29-23-11-13-13) HOLANDA 0,0081 0,0193 0,0459 0,0101 0,01280 0,00091 (14-13,14-12,28,22,10,11,13) LEIDEN 0,0040 0,0071 0,0114 0,0101 0,00987 0,00610 (15-15,16-13-30-21-10-11-14) AFRICA 0,0040 0,0000 0,0000 0,0000 0,00005 0,00034 (13,15,17-13-31-22-10-14-13) YANOMAMI 0,0000 0,0000 0,0000 0,0005 0,00000 0,00005

Tendo em conta que os haplótipos de referência poderiam não ser

específicamente detectados na amostra, foi feito um relaxamento na

busca permitindo o reconhecimento de haplótipos próximos com até dois

passos de distância genética SMM (Tabela 6). O gráfico 1 mostra o efeito

da sobreposição dos haplótipos holandês e português à medida que o

agrupamento se expandiu.

Tabela 6: Freqüência acumulada do haplótipo de referência e distância genética em Pernambuco estimada pelo SMM (Kimura e ohta 1978) .


0 1 2

Portugal 0,061 0,194 0,340

Holanda 0,008 0,117 0,279

Ameríndios 0,000 0,000 0,004

África 0,004 0,008 0,008


154

0,000

0,050

0,100

0,150

0,200

0,250

0,300

0,350

0,400

0 1 2

PORTUGALHOLANDAAFRICANATIVO

Gráfico 1: representação da freqüência acumulada do haplótipo de referência e distância genética em Pernambuco estimada pelo SMM (Kimura e ohta 1978) . Os números no eixo X representam as distâncias, e no eixo Y representam as freqüências.

7.1.2.3. Análise dos haplótipos modais

Os hapótipos modais usados como referência para o prognóstico do

haplogrupo foram calculados a partir dos alelos mais freqüentes de cada

loco de cada população. Uma rotina foi construída para realizar estes

cáculos dinamicamente ao momento em que são inseridos os valores

referentes à freqüência alélica de cada haplogrupo (figura 6). A tabela 7

mostra os haplótipos considerados modais para as populações de

Portugal, Europa e Brasil, destacando as diferenças encontradas no loco

DYS391. Na tabela 8 estão listados os haplótipos modais calculados a

partir do Y-STRCALC para os principais haplogrupos encontrados entre os

descendentes africanos, europeus e indígenas.


155

Figura 6: Interface de dados das freqüências modais dos haplótipos de referência e fontes bibliográficas . Tabela 7 - Haplótipos modais nas populações de Pernambuco ,Portugal Central, Portugal

Sul e Europa

LOCAL N DH DP DYS 19

DYS 385

DYS 389I

DYS 389II

DYS 390

DYS 391

DYS 392

DYS 393

f

PE 247 0.9994 0.9069 14 11-14 13 29 24 11 13 13 0.0669 PC 206 0.993 0.8592 14 11-14 13 29 24 10 13 13 0.0291 PS 214 0.9960 0.9766 14 11-14 13 29 24 11 13 13 0.0322 PA 63 0.9955 0.7937 14 11-14 13 29 24 10 13 13 0.0159 BRASIL 198 0.998 0.8686 14 11-14 13 29 24 10 13 13 0.0151 EUROPA 4688 0.9972 14 11-14 13 29 24 11 13 13 0.0296 Perrnambuco (PE), Portugal Central (PC), Portugal Sul (PS),BRASIL e EUROPA


156

Tabela 8 - Haplótipos modais nas populações de Pernambuco ,Portugal Central, Portugal

Sul e Europa

HAPLOGRUPO

DYS

19

DYS

385

DYS

389I

DYS

389II

DYS

390

DYS

391

DYS

392

DYS

393

E3a 15 16-17 13 30 21 10 11 13 E3b 13 16-18 13 30 24 10 11 13 G 15 14-14 12 29 22 10 11 14 I 14 13-14 12 28 22 10 11 13

I1a 14 13-14 12 28 22 10 11 13 J 14 13-17 13 30 23 10 11 12 N 13 11-13 13 30 22 11 14 14 Q 13 14-17 13 30 24 10 14 13

R1a 15 11-14 13 30 25 10 11 13 R1b 14 11-14 13 29 24 11 13 13

7.1.2.4. Análise dos haplogrupos e prognóstico

No prognóstico dos haplogrupos e também no ponderamento na

construção da árvore filogenética foram usadas as taxas de mutação

médias disponibilizadas no YHRD (tabela 9). O gráfico 2 mostra a curva

de variação das distâncias genéticas em passos (SMM) para o modal, o

qual foi usado como base para estimar o ponto de corte das distâncias

médias no ponto em mudam de haplogupo. Nota-se que os pontos

máximos ocorreram em aproximadamente 2, 4 e 8 poassos do modal. Foi

estimado que a distância média de indeterminação de prognóstico seria de

4 passos. Isto serviu como base para determinação do escore, no qual a

distãncia 0 correponde a 100% de probabilidade e a distância 4

corresponde a 0% (indeterminação) . A tabela 10 mostra os resultados de

prognóstico e os haplogrupos encontrados. O gráfico 3 mostra a curva de

correlação dos resultados do escore obtido por ambos os métodos

testados. O coeficiente de correlação de Pearson foi 0,73. A tabela 11

mostra os dados os resultados obtidos em termos de grupos étnicos para

o estado de Pernambuco.


157

Tabela 9: Taxa de mutação média usada no cálculo dos prognósticos do

haplogrupo (YHRD)

Loco DYS

19

DYS

385

DYS

389I

DYS

389II

DYS

390

DYS

391

DYS

392

DYS

393

Taxa de

Mutação

Média

(x 10-3)

1.68 2.24 1.87 2.26 2.27 3.51 0.61 0.75

Distâncias SMM

05

10152025303540

1 2 3 4 5 6 7 8 9 10 11 12 13

Nº de Diferenças

Hapl

ótip

os

Gráfico 2: Numero de haplótipos e respectivas distâncias para o modal, usado para determinar a distância média de mudança de haplogrupo. Para os pontos de pico no gráfico (2, 4 e 8) foram verificadso os haplgrupos e a mudança de haplogrupo acontece em média a cada 4 SMM.


158

Tabela 10: Haplótipos não únicos na população de Pernambuco, comparação com resultados do Ybase, Freqüências, escore e prognóstico segundo Athey (2005) e este estudo (Y-STRCALC).

Athey Y-STRCALC Haplótipo * F Escore Haplogrupo Escore Haplogrupo

(14,11-14,13,29,24,11,13,13) 0 0,061 100 R1b 100 R1b (14,11-14,14,30,24,11,13,13) 0 0,028 79 R1b 76 R1b (14,11-14,13,29,24,11,13,12) 0 0,020 65 R1b 67 R1b (14,11-14,14,30,23,11,13,13) 0 0,016 73 R1b 63 R1b (14,11,14,13,28,24,11,13,13) 0 0,016 74 R1b 89 R1b (14,11-14,13,29,23,11,13,12) 0 0,016 61 R1b 56 R1b (14,11-15,13,29,24,11,13,13) 0 0,016 85 R1b 65 R1b (14,11-14,13,29,24,11,13,14) 0 0,012 77 R1b 67 R1b (14,12-14,13,29,24,11,13,13) 0 0,012 57 R1b 89 R1b (15,11-14,13,29,24,11,13,13) 0 0,012 73 R1b 85 R1b (14,14-14,12,29,23,10,11,12) - 0,012 56 J2 53 J (17,12-12,13,28,23,10,11,13) - 0,012 63 I 41 E3b (14,11-14,13,30,24,11,13,13) 0 0,008 83 R1b 89 R1b (14,11-14,13,29,23,11,13,13) 0 0,008 93 R1b 89 R1b (14,11-14,13,29,24,10,13,13) 0 0,008 93 R1b 93 R1b (14,11-14,13,29,25,11,13,13) 0 0,008 80 R1b 89 R1b (14,11-14,13,30,23,11,13,13) 0 0,008 77 R1b 78 R1b (14,11-14,13,29,23,11,13,14) 0 0,008 36 R1b 56 R1b (14,11-15,13,29,23,11,13,13) 0 0,008 79 R1b 78 R1b (14,11-14,13,29,25,10,13,13) 0 0,008 80 R1b 82 R1b (14,12-14,13,29,24,10,13,13) 0 0,008 69 R1b 82 R1b (15,11-14,13,28,23,11,13,13) 0 0,008 50 R1b 63 R1b (14,11-14,12,28,23,11,14,13) - 0,008 46 Q 31 Q (15,11-13,13,31,24,11,13,13) 1 0,008 38 R1b 63 R1b (14,11-14,12,27,24,12,13,14) 3 0,008 26 R1b 35 R1b (13,13-14,14,30,24,9, 11,13) 0 0,008 49 E3b 57 E3b (15,14-16,11,29,22,10,11,14) 2 0,008 68 G 75 G (14,16-17,13,31,21,11,11,13) 1 0,008 55 E3a 45 E3a (13,16-18,13,30,23,10,11,13) 1 0,008 84 E3b 89 E3b (15,16-18,14,31,21,11,11,13) 2 0,008 70 E3a 43 E3a f = freqüência; Athey (2005); Y-STRCALC = programa de cálculo de prognóstico do haplogrupo; * = diferenças para enquadramento para haplótipos no banco de dados Ybase;


159

Correlação Scores

0

20

40

60

80

100

120

0 20 40 60 80 100 120

Score Y-STRCALC

Sco

re W

. Ath

ey

Gráfico 3: Correlação entre os escores encontrados segundo método de Athey (2005) e o algoritmo do progrmam Y-STRCALC. O índice de correlação de Pearson entre os dois resultados foi de 0.73

Tabela 11: - Composição da população de Pernambuco prognosticada pelo programa Y-STRCALC a partir dos haplótipos mínimo e estendido da população total e dos haplótipos apresentados na Tabela 3. Haplogrupos Haplótipo

Mínimoa

Haplótipo

Estendidoab

Haplótipo


África E3a 0,093 0,097 0,074

E3b 0,065 0,069 0,043

Europa G 0,081 0,069 0,021

I 0,040 0,053

J 0,085 0,085 0,032

N 0,008 0,012

R1a 0,077 0,069

R1b 0,526 0,526 0,809

Ameríndios Q 0,024 0,02 0,021

Europa 0,818 0,814 0,862

África 0,158 0,166 0,117

Ameríndios 0,024 0,020 0,021

(a) n = 247; (b) Haplótipo mínimo (ISFG) mais os locos DYS447, DYS458 e

DYS464; (c) n = 94


160

7.1.2.5. Análise usando o programa Network

As árvores de median-joining construídas foram poderadas usando as

varâncias das freqüências alélicas por loco da população de Pernambuco,

de acorro com os valores calculados e pelas as taxas de mutação média

disponibilizado no YHRD. O resultado é apresentado na figura 7.

Tabela 12: Variâncias calculadas a partir das freqüências alélicas para cada loco do

haplótipo mínimo da amostra da população de Pernambuco usando o Software Microsoft

Excel

Loco DYS

19

DYS

385a

DYS

385b

DYS

389I

DYS

389II

DYS

390

DYS

391

DYS

392

DYS

393

Varância das

freqüências 0,758 4,091 3,532 0,3434 1,000 1,4242 0,336 1,088 0,850


161

Figura 7 – Árvore Median-joining das STR’s dos 30 haplótipos mínimos mais comuns

encontrados em Pernambuco e o haplogrupo prognosticado pelo Y-STRCALC

representando 94 indivíduos da amostra, evidenciando a similaridade entre ambas. (A)

Árvore construída usando como critério de poderação a média das taxas de mutação por

loco. (B) Árvore construída usando como critério de poderação a variância de cada loco.

As cores indicam os grupos étnicos prognosticados: Listrado, preto e branco são

africanos, ameríndios e europeus respectivamente. O cículo metade preto representa o

haplótipo com baixo escore de prognóstico (E3a-I) que foi prognosticado diferente nos

dois cálculos apresentados (Athey e Y-STRCALC). O tamanho dos braços são

proporcionais às distâncias genéticas e os cículos são proporcionais às freqüências dos

haplótipos.


162

7.1.3. Resultados em Alagoas

A partir do método de trabaho aplicado para análise de Haplótipo de

Pernambuco, foi realizada a mesma análise no Y-STRCALC, utilizando os

mesmos parâmetros para o estado de Alagoas, os quais serão

apresentados resumidamente a seguir nas tabelas 13,14 e 15.

Tabela 13: Resultados computados para a amostra selecionada de Alagoas

Haplótipo Mínimo Haplótipo Estendido

Indivíduos da amostra 255 255

Haplótipos 190 230

Diversidade Haplotípica 0.9953 0.9996

Poder de Diferenciação 0.7451 0.9020

Probabilidade Coincidência 0.0047 0.0004

Haplótipo Mínimo Modal : (14,11-14,13,11,24,10,13,13)

Frequência = 0.196

Haplótipo mínimo mais freqüente: (14,11-14,13,11,24,11,13,13)

Freqüência = 0.627

Tabela 14: Freqüência acumulada do haplótipo de referência e distância genética em Alegoas estimada pelo SMM (Kimura e ohta 1978) .


0 1 2

Portugal 0,063 0,165 0,333

Holanda 0,004 0,109 0,243

Ameríndios 0,000 0,000 0,011

África 0,000 0,000 0,008


163

Tabela 15: - Composição da população de Alagoas prognosticada pelo programa Y-STRCALC a partir dos haplótipos mínimo e estendido da população total e dos haplótipos apresentados na Tabela 3. Haplogrupos Haplótipo

Mínimoa

Haplótipo

Estendidoab

Haplótipo


África E3a 0,093 0,062 0,000

E3b 0,050 0,090 0,106

Europa G 0,066 0,054 0,063

I 0,054 0,054 0,020

J 0,105 0,125 0,068

N 0,000 0,000 0,000

R1a 0,039 0,019 0,036

R1b 0,572 0,595 0,707

Ameríndios Q 0,027 0,023 0,000

Europa 0,834 0,847 0,894

África 0,142 0,152 0,106

Ameríndios 0,024 0,000 0,000

(a) n = 255; (b) Haplótipo mínimo (ISFG) mais os locos DYS447, DYS458 e

DYS464; (c) n = 101

Estes resultados mostram não haver diferenças significativas entre

Pernambuco e Alagoas na composição étnica masculina. Mostra ainda que

a população de Alagoas reflete o mesmo efeito do fundador verificado em

Pernambuco para o Haplótipo Modal do Atlântico. Uma característica

diferencial para os estados de Pernambuco e Alagoas observável foi a

freqüência do modal de Alagoas ser o dobro da apresenada em

Pernambuco. Embora as freqüências dos AMH estejam muito próximas, a

freqüência do alelo 11 no haplogrupo de referência R1b é cinco vezes

maior que o alelo 10 em Pernambuco enquanto que esta razão cai para

duas vezes em Alagoas.


164

Estes resultados sugerem que a influência do AMH em Pernambuco foi

maior que em Alagoas.

7.1.4 Perspectivas

Este trabalho faz parte do projeto de criação de um banco de dados

de haplótipos do cromossomo Y para todos os estados do nordeste. Para

isso é necessário que novas amostras da região Nordeste sejam

disponibilizadas. Este é o início de um trabalho de determinação de perfis

haplotípicos com intuito de auxiliar em diversos estudos, sejam estes

históricos, forenses ou antropológicos. A caracterização genética da

população poderá servir de base para o planejamento das políticas

públicas de saúde, uma vez existindo um perfil bemdefinido e confiável

de classificação das populações, com a estratificação dos dados precisa e

consistente. A concretização deste projeto fornecerá informações valiosas

sobre a população desta região. Vários serviços poderão ser desenvolvidos

a partir deste trabalho, vindo desde a simples detecção da ancestralidade

étnica paterna, até as possibilidade de correlação dos microssatélites com

aspectos clínicos, de modo os usuários poderão contemplar obter os dados

de forma combinada a fim de extrair a maior quantidade e qualidade das

informações.


165

7.1.5 Glossário de Termos tácnicos usados neste trabalho

ALELOS: Formas alternativas de um gene. Para polimorfismos de seqüência os alelos se referem ao nucleotídeo específico (A, T, G, C) encontrado em uma determinada posição no cromossomo. Para polimorfismos de inserção-deleção, dois alelos são possíveis, o alelo maior (L) e o alelo menor (S). Ver também POLIMORFISMO.

AUTOSSOMO: As células humanas contêm 46 cromossomos. Há 22 pares de autossomos, que são herdados dos dois genitores. Os outros dois cromossomos, ditos sexuais, são o cromossomo X e o cromossomo Y.

BASE: ver Nucleotídeo.

CARGA GENÉTICA: a diminuição do valor adaptativo médio de uma população devido à presença de genótipos que têm uma valor adaptativo menor que o máximo da população. Em outras palavras, a carga genética é uma medida de quanto custa (em termos de perda de alelos) a existência de seleção em uma população.

CROMOSSOMO: Estrutura encontrada nos núcleo das células constituído de DNA condensado em associação com proteínas. O genoma humano consiste de um conjunto de 23 cromossomos. Cada um de nós herdou um conjunto do pai e outro da mãe. Cada cromossomo contém uma única molécula de DNA – segmentos deste DNA são os genes.

CROMOSSOMO Y: A espécie humana possui dois cromossomos sexuais, chamados de X e Y. Os homens são XY e as mulheres são XX. O cromossomo Y é responsável pelas características masculinas e contém genes para a formação dos testículos e para a produção de espermatozóides. O cromossomo Y tem herança de pai para filho.

DERIVA GENÉTICA: nome dado à flutuação puramente randômica nas freqüências alélicas de uma população ao longo do tempo, devida a um efeito de amostragem.

DNA: Ácido desoxirribonucléico. O DNA (abreviatura do inglês, Deoxyribonucleic acid) é a molécula que armazena a informação genética e consiste de duas cadeias de nucleotídeos unidas pela interação das bases complementares Adenina e Timina e Citosina e Guanina.

DNA MITOCONDRIAL (mtDNA): Um DNA circular localizado na mitocôndria contendo informação genética diferente daquela encontrada no DNA nuclear. Cada mitocôndria contém múltiplas cópias deste pequeno DNA que tem apenas 16.569 pares de base de comprimento.

ELETROFLUOROGRAMA: O resultado de uma corrida eletroforética em um sequenciador automático fluorescente de DNA que mostra a seqüência de nucleotídeos.

EUCARIOTO: Um organismo cujas células contêm um núcleo com uma membrana nuclear. Todos os seres vivos, com exceção de bactérias, vírus e algumas algas são eucariotos.

MARCADORES GENÉTICOS: Locos polimórficos (que variam em pessoas normais) no DNA que fornecem informações aos geneticistas.

GENOMA: O DNA em um conjunto haplóide (23 cromossomos) humano. Uma célula humana contém dois genomas: um paterno e um materno.

HAPLOGRUPO: Um grupo de linhagens definido por mutações diagnósticas. Os haplogrupos do DNA mitocondrial humano são rotulados de A a Z. Os haplogrupos do cromossomo Y são agrupados por letras (A-R). A freqüência relativa dos haplogrupos varia de população para população. Alguns


166

haplogrupos do DNA mitocondrial e do cromossomo Y são específicos de determinadas regiões geográficas.

HAPLÓTIPO: Um subgrupo mais específico de um haplogrupo. Por exemplo, uma seqüência de DNA mitocondrial de um indivíduo específico e seqüências idênticas de DNA mitocondrial de outros indivíduos constituem um haplótipo. Indivíduos com o mesmo haplótipo têm relações genealógicas. Cada haplogrupo é constituído de muitos haplótipos.

INDEL: Mutação causada pela inserção ou deleção de um ou mais nucleotídeos.

LOCO (plural: locos): A posição de um gene ou de um marcador genético em um cromossomo.

MITOCÔNDRIA: Uma organela citoplasmática (fora do núcleo) responsável pela produção de energia na célula.

MUTAÇÃO: O processo de mudança genética na estrutura do genoma, geralmente causado por um erro na duplicação do DNA. Uma mutação pode ser uma troca de uma base por outra em determinada posição, ou uma adição ou deleção de base(s). A mutação pode ter conseqüências deletérias, benéficas ou neutras.

MUTAÇÃO PUNTUAL: Mutação causada pela troca de uma base por outra na seqüência do DNA.

NÚCLEO: A organela que contém o genoma humano, organizado em cromossomos, dentro do invólucro de uma membrana. Observe que o DNA mitocondrial está localizado nas mitocôndrias, fora do núcleo.

NUCLEOTÍDEO: Subunidades informacionais que quando unidas em cadeia constituem o DNA. Existem quatro subunidades diferentes: Adenina (A), Guanina (G), Timina (T) e Citosina (C). A Adenina e Timina se pareiam especificamente, assim como a Guanina e a Citosina. Os nucleotídeos também são chamados de bases.

PCR: Veja REAÇÃO EM CADEIA DA POLIMERASE.

POLIMORFISMO: Uma diferença na seqüência de DNA freqüente entre indivíduos normais ou populações.

POLIMORFISMO DE INSERÇÃO/DELEÇÃO: Polimorfismo criado por uma inserção ou deleção de uma ou mais bases. Ver INDEL.

POLIMORFISMO DE SEQÜÊNCIA: Veja SNP.

POSIÇÃO DE NUCLEOTÍDEO: A posição de um determinado polimorfismo em um genoma, geralmente medida em pares de base.

PROTEINASE: Uma enzima que destrói proteínas.

PURINA: Um tipo de nucleotídeo ou base que faz parte da molécula de DNA. As purinas são a Adenina (A) e a Guanina (G).

PIRIMIDINA: Um tipo de nucleotídeo ou base que faz parte da molécula de DNA. As pirimidinas são a Citosina (C) e a Timina (T).

REAÇÃO EM CADEIA DA POLIMERASE (PCR): Uma técnica poderosa que permite a replicação de um segmento de DNA no tubo de ensaio. O método faz uso de reagentes químicos para duplicar o DNA em um ciclo de temperatura. Vários ciclos podem ser automatizados em um “ciclador térmico” levando a um aumento exponencial do número de moléculas. Com 30 ciclos consegue-se uma amplificação teórica de um bilhão de vezes.

SEQÜÊNCIA DE REFERÊNCIA DE CAMBRIDGE (CRS): A sequência padrão de DNA mitocondrial humano (mtDNA), com a qual todas as outras sequëncias são comparadas. A CRS foi a primeira seqüência de mtDNA completamente estudada no homem e foi publicada em 1981.

SNP: Polimorfismo caracterizado pela troca de uma base por outra na seqüência do DNA.


167

7.1.5 Dados Suplementares

Tabela 16: - marcadores de mutação do cromossomo Y e respectivos primes (YCC 2002). Mutação Região/STS Tam. (bp) Sítio Mutação Forward Primer Reverse Primer

M2 DYS271 209 168 A->G aggcactggtcagaatgaag aatggaaaatacagctcccc M3 DYS199 241 181 C->T taatcagtctcctcccagca aaaattgtgaatctgaaatttaagg M4 DYS234 273 88 A->G tcctaggttatgattacagagcg acgtcttgtaaacatgacaagg M5 DYS214a 322 73 C->T gggtttatactgacctgccaatgtt ttattgggaactttcagggg M6 DYS198 218 37 T->C cactaccacatttctggttgg cgctgagtccattctttgag M7 DYS253 300 236 C->G actgtgagcgagctgaaaat gcagccttgtgaaccaatta M8 DYS263 267 137 G->T cccacccacttcagtatgaa aggctgacagacaagtccac M9 G10.35a 340 68 C->G gcagcatataaaactttcagg gcttgagcaaagttaggtttt M10 G10.10 343 156 T->C gcattgctataagttacctgc taataaaaattgggtcaccc M11 G10.37 222 44 A->G tctctctgtctgtctctccctcc gagcataaacaagaacttactgagc M12 DYS260a 309 286 G->T actaaaacaccattagaaacaaagg ctgagcaacatagtgacccc M13 G10.06 233 157 G->C tcctaacctggtggtctttc tgagccatgattttatccaac M14 G10.07 287 180 T->C agacggttagatcagttctctg tagataaaagcacattgacacc M15 G10.16 295 304 9 bp insertion acaaatcctgaacaatcgc tgcatgtggttaaaatttcc M16 DYS214b 266 38 C->A tgttatgtcatttgaacccag ccgtgtgttgctgggctgt M17 G10.47ª 333 68 4G->3G ctggtcataacactggaaatc tgaacctacaaatgtgaaact M18 G10.47b 333 62 2 bp insertion ctggtcataacactggaaatc tgaacctacaaatgtgaaactc M19 G10.47c 333 131 T->A ctggtcataacactggaaatc tgaacctacaaatgtgaaactc M20 G10.48 413 118 A->G gattgggtgtcttcagtgct cacacaacaaggcaccat M21 G10.43 415 357 A->T cttttatttctgactacaggg aacagcagatttgagcagg M22 DYS273 327 129 A->G agaagggtctgaaagcaggt gcctactacctggaggctt M23 G10.57ª 327 159 A->G tctctaacttctgtgagccac ggaaaaactaaactctaaatctct M25 B9.008b 340 121 G->C aaagcgagagattcaatccag ttttagcaagttaagtcaccagc M26 B9.005 321 68 G->A ccagtggtaaagttttattacaattt ttcacagtaagcaggcaatcc M27 G10.65 526 398 C->G cggaagtcaaagttatagttactgg cactgctgttctgtctaccaca M28 G10.33n 332 277 T->G gcttacttgggacacaggct agagaagttgtcatacgataatgg M30 G10.66ª 486 132 G->A gaaccagacaatacgaaatagaag tttagcggcttatctcattacc M31 G10.66b 486 71 G->C gaaccagacaatacgaaatagaag tttagcggcttatctcattacc M32 G10.68a 370 166 T->C ttgaaaaaatacagtggaac caagtgtttaaggatacaga M33 G10.68b 370 180 A->C ttgaaaaaatacagtggaac caagtgtttaaggatacaga M34 G10.69 372 131 G->T cacttcacatttgtttttagg agtcattatttagtcattccag M35 G10.72a 513 168 G->C taagcctaaagagcagtcagag agagggagcaatgaggaca M36 G10.82a 436 74 T->G agatcatcccaaaacaatcataa aaggctgaaatcaatccaatctg M37 G10.STS 84 422 203 C->T cagattggattgatttcagcctt agcatacaaaaaaaaaaaactgc M38 G10.73a 337 146 T->G cagtttttagagaataatgtcct ttaaagaaaagaaaagcagatg M39 G10.73a 337 236 C deletion cagtttttagagaataatgtcct ttaaagaaaagaaaagcagatg M42 B9.008a 340 297 A->T aaagcgagagattcaatccag ttttagcaagttaagtcaccagc M43 DYS260b 309 77 A->G actaaaacaccattagaaacaaagg ctgagcaacatagtgacccc M44 G10.87 389 263 G->C ctggcaccttctgatattttgag tgtgatttctatgtgtttgaggac M45 B9.12 352 109 G->A gctggcaagacacttctgag aatatgttcctgacaccttcc M47 G10.82b 436 395 G->A agatcatcccaaaacaatcataa aaggctgaaatcaatccaatctg M48 G10.79n 240 160 A->G aaacaatatgtatgctaattttgct tcaatgtaaatgttagtataaggatg M49 B9.15new a 354 229 T->C cggcaacagtgaggacagt tgcttcaggagatagaggctc M50 B9.15new b 354 175 T->C cggcaacagtgaggacagt tgcttcaggagatagaggctc M51 B9.16 339 33 G->A gagcctctatctcctgaagc tgactgctctgttgcgaca M52 G10.88 534 477 A->C actgtagcatggtcatctagggtg gacgaagcaaacatttcaagagag M54 B9.17 360 164 G->A cctcctctggtctgggttt tgtgtcaggactggttccat M55 B9.28 382 228 T->C cgtaggcgtttgacagcag cctttcttcgtaatcctccc M56 B9.29 399 39 A->T ccagaaactgaagtacaaatgc tctcattgctgcctctcttt M57 G10.85n 326 133 +1bp attgggaggaagtggtttctg gttctgtatcttttccattatttgc M58 G10.57b 327 224 G->A tctctaacttctgtgagccac ggaaaaactaaactctaaatctct M59 B9.15new c 354 179 A->C cggcaacagtgaggacagt tgcttcaggagatagaggctc M60 B9.34 388 242 +1bp gcactggcgttcatcatct atgttcattatggttcaggagg M61 G10.83new a 190 98 C->T attggattgatttcagccttc attttattttctgtgttccttgc M62 DYS260c 309 60 T->C actaaaacaccattagaaacaaagg ctgagcaacatagtgacccc M63 B9.22 308 43 G->A ctcttcccttggttcctattc ttaggcagaagcatccacc M64 B9.t23 325 279 A->G recurrent tatagaccctgactactcaagagaa ggtagccctttccagtctgt M65 B9.t26 436 152 A->T ttctgatgccagcttgttcg gctacgggattaaagtaaccttg M66 B9.41 415 135 A->C ctgtgtaacaccatcaagtgc acatcttctggagacatacttcc M67 B9.36new a 409 377 A->T ccatattctttatactttctacctgc gtcttttcacttgttcgtggac M68 B9.36new b 409 268 A->G ccatattctttatactttctacctgc gtcttttcacttgttcgtggac M69 B9.62a 257 222 T->C ggttatcatagcccactatactttg atctttattccctttgtcttgct


168

M70 B9.62b 257 45 A->C ggttatcatagcccactatactttg atctttattccctttgtcttgct M71 B9.6 3b 328 197 C->T ttgaattatagtcccttgcctc gcttcttttctgtgatggctg M72 B9.6 3a 328 157 A->G ttgaattatagtcccttgcctc gcttcttttctgtgatggctg M73 B9.47a 361 260 2bp deletion cagaataataggagaatttttggt attttccttattttctaagcagc M74 B9.50a 385 195 G->A atgctataataactaggtgttgaag aattcagcttttaccacttctgaa M75 B9.51 355 296 G->A gctaacaggagaaataaattacaga tattgaacagaggcatttgtga M76 G10.100a 493 339 T->G tagaagtagcagattgggagagg cctgataaaatgaaaaaaatggtc M77 G10.105 371 129 C->T cttttcttcccttagctgttcc gcaacaatgacaggtcaacc M78 B9.60a 301 197 C->T cttcaggcattattttttttggt atagtgttccttcacctttcctt M81 B9.58a 422 147 C->T acttaatttatagtttcaatccctca ttcatggagatgtctgtatctgg M82 B9.t18 328 179 -2bp ctgtactcctgggtagcctgt aagaacgattgaacacactaactc M83 B9. Alu01 503 120 C->T gggaaaggagttatccagaaa aatgacccatgcttacttagc M85 B9.67a 568 437 C->A aacagaattatcaggaaaaggttt gcaatatacgtttctgcttcca M86 B9.t25a 324 85 T->G tcccattatttgctatatttgct tttctcatttaacttttctgaccc M87 B9.t25b 324 277 T->C tcccattatttgctatatttgct tttctcatttaacttttctgaccc M88 B9.80 314 166 A->G attctagggtcaggcaactagg tgtttgttctattctatggtcttcc M89 B9.94 527 347 C->T agaagcagattgatgtcccact tccagttaggagatcccctca M90 B9.96 331 170 C->G tgatgtttcttcagtctttgagg aagatgaatcctgctaccacc M91 B9.87a 495 368 9T->8 T gagcttggactttaggacgg aaactttaaggcacttctggc M92 B9.G2 470 340 T->C ttgaatttcccagaattttgc ttcagaaactggttttgtgtcc M93 B9.93 504 459 C->T aacaaaacaaaacaaaaatactga ggttcacttgaagatagtttaggtta M94 B9.122 405 227 C->A cacatggagaacagagaaatgc cttgtgaaatgttgtgaaagtgg M95 B9.123 480 172 C->T gagtggaaatcaagatgccaag gggctttctgtaacctggaga M96 G3.05a 440 70 G->C gttgccctctcacagagcac aaggtcactggaaggattgc M97 G3.05b 440 355 T->G gttgccctctcacagagcac aaggtcactggaaggattgc M98 G3.04a 395 158 G->C gaatggggtgttacatggaga cctattatgagagacctgttttcc M99 G3.04b 395 96-98 1 bp deletion gaatggggtgttacatggaga cctattatgagagacctgttttcc M101 A8.05a 460 154 C->T tcacagcagcttcagcaaa cctttttggatcatggttctt M102 B9.101 480 301 G->C aaactgggacacttgtaatgaat gttttttgagtccttgtttattctt M103 B9.117new 463 259 C->T cagtaagtgaactcacacataattcc ccagttttatttcagtttcacagc M105 B9.6-7a 572 478 C->T gggaggcaacctaagaaag aggtgaacgcattctgtcat M106 B9.6-7b 572 411 A->G gggaggcaacctaagaaag aggtgaacgcattctgtcat M107 B9.112n 376 298 A->G caaaagcactcgggttcct ctttactcccacttatgcaacg M108 B9.113n 321 40 T->C agatggagccagcagaaag acacagatgaattgaatgatggt M109 G3.15 312 264 C->T gggtatcaaatgtcttcaacct gggaatttcctgctacttgc M110 B9.86n 389 241 T->C cagggaaggaccgtaaaagg aacctttactgcacatgataaacat M111 G3.19 393 188-189 2bp (TT) deletion aatcttctgcaaagggttcc cagctacaaaacaaaatactggac M112 G3.17a 445 286 G->A actttttccaacagttatttttga tatatttcttgatgatgagaccaat M113 G3. 17b 445 112 A->G actttttccaacagttatttttga tatatttcttgatgatgagaccaat M114 G3.23 434 387 T->C ttaccacacagttgagtagttctaaa caaataaaattggagcggtta M115 G3.22 413 201 C->T agtttacagtcacatcaatttgga tcctttttctaccatatctctgttt

M116.2 G3.25a 429 176 A->C, triallelic aagtatgacttatgaagtacgaagaa attcagttagattttacaatgagca M117 G3.25b 429 142-145 4bp deletion aagtatgacttatgaagtacgaagaa attcagttagattttacaatgagca M118 G3.29 478 109 A->T attctaagtttcacttcctgatcc tagttccctaaattacgctacctc M119 G3.32 330 224 A->C gaatgcttatgaatttcccaga ttcacacaatatacaagatgtattctt M120 B9.87b 495 224 T->C gagcttggactttaggacgg aaactttaaggcacttctggc M121 B9.87c 495 183-187 5 bp deletion gagcttggactttaggacgg aaactttaaggcacttctggc M122 G3.27a 393 73 T->C tggtaaactctacttagttgccttt cagcgaattagattttcttgc M123 G3.27b 393 161 G->A tggtaaactctacttagttgccttt cagcgaattagattttcttgc M124 G3.27c 393 246 C->T tggtaaactctacttagttgccttt cagcgaattagattttcttgc M125 B9.108a 367 301 T->C gccaccctcttatgcctct tcaggagttatgtgaggaccc M126 B9.108b 367 277-280 4 bp deletion gccaccctcttatgcctct tcaggagttatgtgaggaccc M127 G3.30 412 372 C->T tgaaaggaaatcagtgtaagagc tgtaaaggtgactgtagttcagca M128 G3. 17c 445 316-317 -2bp actttttccaacagttatttttga tatatttcttgatgatgagaccaat M129 A8.04 255 221 G->A aatggcttactacaaagaacatttc tacacggtctctaccaaagaaga M131 A8.14n 306 93-101 9 bp deletion cacacccagaatacaataatttt ctttttattctacaagtgtacattttc M132 B9.67b 568 482 G->T aacagaattatcaggaaaaggttt ttttacttgttcgtgtactttcaa M133 A8.08F-newR 211 116 1bp (T) deletion tgaaatggaaatcaataaactcagt ccttttctttttctttaacccttc M134 A8.08newF-R 232 54 -1bp agaatcatcaaacccagaagg tctttggcttctctttgaacag M135 A8.08F-newR 211 150 +1bp tgaaatggaaatcaataaactcagt ccttttctttttctttaacccttc M136 B9.61 339 196 C->T atgtgaagacaacactgtgtgg ttgtggtagtcttagttctcatgg M137 G3.27d 393 289 T->C tggtaaactctacttagttgccttt cagcgaattagattttcttgc M138 A8.17 442 291 C->T aacttccaaaactgtgaaaagatt gattaaagcagccccttcag M139 A8.28a 459 401 5G->4G ttactgataatgccatattgttttg ttctcagacaccaatggtcct M141 A8.30a 424 51 T->A catcttaaaatacatttcatagcttt gcttactattaggtctagcatcct M143 B9.50b 385 246 G->T atgctataataactaggtgttgaag aattcagcttttaccacttctgaa M144 B9.99 452 342 T->C agcacaagggtcacattgag aggacaaggctttttgttgtt M145 A8.05b 208 166 G->A ttcagcaagagtaagcaagagg cctttttggatcatggttctt M146 G3.04d 395 141 A->C gaatggggtgttacatggaga cctattatgagagacctgttttcc M147 G3.35 439 116 1 bp insertion (extra T) gtattctggggcaattttagg ttgatacaagaggttattttaagca


169

M148 B9.67c 568 314 A->G aacagaattatcaggaaaaggttt ttttacttgttcgtgtactttcaa M149 B9.67d 568 469 G->A aacagaattatcaggaaaaggttt ttttacttgttcgtgtactttcaa M150 B9.18 289 146 C->T gcagtggagatgaagtgagac cctactttccccctcttctg M151 B9.58b 422 209 G->A acttaatttatagtttcaatccctca ttcatggagatgtctgtatctgg M152 B9.13 287 101 C->T aagctattttggtttcctttca gccttgtgtgggtatgattg M153 A8.28c 459 427 T->A ttactgataatgccatattgttttg ttctcagacaccaatggtcct M154 B9.58c 422 252 T->C acttaatttatagtttcaatccctca ttcatggagatgtctgtatctgg M155 G10.57c 327 251 G->A tctctaacttctgtgagccac ggaaaaactaaactctaaatctct M156 A8.05c 208 147 A->G ttcagcaagagtaagcaagagg cctttttggatcatggttctt M157 B9.12b 352 176 A->C gctggcaagacacttctga aatatgttcctgacaccttcc M158 A8.08F-newR 211 77 G->A tgaaatggaaatcaataaactcagt ccttttctttttctttaacccttc M159 G10. 83new b 190 89 A->C attggattgatttcagccttc attttattttctgtgttccttgc M160 B9.47b 361 251 A->C cagaataataggagaatttttggt attttccttattttctaagcagc M161 A8.05d 460 111 C->A tcacagcagcttcagcaaa cctttttggatcatggttctt M163 G10.35b 340 168 A->C gcagcatataaaactttcagg aaaacctaactttgctcaagc M164 G10.100b 493 329 T->C tagaagtagcagattgggagagg cctgataaaatgaaaaaaatggtc M165 B9.008c 340 132 A->G aaagcgagagattcaatccag ttttagcaagttaagtcaccagc M166 G3.27e 393 53 G->A tggtaaactctacttagttgccttt cagcgaattagattttcttgc M168 DFFRY Ex01B site a 473 371 C->T agtttgaggtagaatactgtttgct aatctcataggtctctgactgttc M169 DFFRY Ex01B siteb 473 97 T->C agtttgaggtagaatactgtttgct ccagggccccgagggactctt M170 DFFRY Exon08 405 327 A->C tgcttcacacaaatgcgttt ccaattactttcaacatttaagacc M171 DFFRY Ex01B sitec 473 440 G->C agtttgaggtagaatactgtttgct ccagggccccgagggactctt M172 DFFRY Ex45 345 197 T->G ttgaagttacttttataatctaatgctt ataatttattactttacagtcacagtgg M173 DBY Ex08 417 191 A->C aagaaatgttgaactgaaagttgat aggtgtatctggcatccgtta M174 DffryEx38 348 219 T->C acatctcagatcgttgtttggt aaaaagccatgcaattacctg M175 UTY1 exon 07 444 84-88 -5bp ttgagcaagaaaaatagtaccca ctccattcttaactatctcaggga M178 G10.72b 514 220 T->C taagcctaaagagcagtcagag cagagggagcaatgaggaca M179 Dffry exon 07 426 316 C->T attatgcagaattaagatgaccag agacaggttcacatcactaatgg M180 Dffry exon 11 447 402 T->C acactactgtgctgtaatttgtgaa tggtaagatttctctacatgaacag M181 Dffry exon 12 294 130 T->C gcttttatttattctacttttgttttt aacaatgaccaattctttttcat M182 Dffry exon 13 364 38 C->T tattcaaagacttaaagcagtggtta ggaatcatcttgtaactaagttatcct M183 Dffry exon 19 427 324 A->C actgggtaaatatgactatgattgag ttccttttaacctattattactttcc M184 Dffry exon 23 305 62 G->A cactttattttagtctgtgtctttttc aaacttagtaacatctatttctcctct M185 Dffry exon 27 430 89 C->T ggagtacctatcactgaatgtgc gtcattcatttctgcttggaac M186 Dffry exon 30 365 62 1 bp deletion ttgcatttactgttctagagagttct gtacttactttaatgagattagcac M188 Dffry exon 31 401 185 C->T gtattccctttgaagaaacatattg aagtccatcacaagttaattttttc M189 Dffry exon 34 378 191 G->T actctcagcttatgtttgtcattg gcttttggtacactctgctttt M190 Dffry exon 44 346 73 A->G ctctgtcacaagtaaggaaatgat ctgtccattggtagccttttt M191 DBY exon 2 429 342 T->G ttgcatttgtcatggttggt gccaggataattttttgtattttc M192 DBY STS 02 457 202 C->T catgggctgctgacatttt aaatccttttggtttgtttgttt M193 DBY STS 03a 426 56 4 bp insertion gcctggatgaggaagtgag gccttctccatttttgacct M194 DBY STS 03b 426 101 T->C gcctggatgaggaagtgag gccttctccatttttgacct M195 DBY STS 06 515 430 A->G ccactcagctttcctcaggt cgttcgtttagtcataagatcg M196 DBY STS 07 445 330 C->G ttagacaacttactactttgatgtcct taaacattacatgagaaattgctgt M197 DBY exon 07 408 105 T->C tcagacagtttagttggttacttcc aagacacatcctcagctaatcttt M198 DBY STS 08 444 45 C->T tgaggtggaatgtatcagtatacc tgatttcaaggatttgttagtctt M199 DBY STS 08 444 404 1 bp insertion (extra G) tgaggtggaatgtatcagtatacc tgatttcaaggatttgttagtctt M200 DBY STS 09 429 318 G->A ggcttacacttgcagactttg ggagaaatgtacaagagtctaaacc M201 DBY exon 11&12 326 136 G->T tatgcatttgttgagtatatgtc gttctgaatgaaagttcaaacg M202 DBY exon 16 392 259 T->G ggaattgcagggtttaagc gccacccacctgtaatcc M203 UTY1 exon01 503 248 G->C gagtgccaagctgaggatga 2 sequnces for this primer M204 UTY1 ex 02 = Intron 1 286 234 T->G aaggggcgaagtattccag tgaagaggagtctgttagcctg M205 UTY Intron 2a 541 78 T->A gtataatactgtggttggaaagca ccaaactatgtgataataaatggg M206 UTY Intron 2b 541 31 T->G gtataatactgtggttggaaagca ccaaactatgtgataataaatggg M207 UTY1 ex03 = Intron 3a 423 79 A->G aggaaaaatcagaagtatccctg caaaattcaccaagaatccttg M208 UTY1 = Intron 3b 507 352 C->T ataaatacaaaatcacctgatggat ttaaacagcgaaattactaacaaaa M209 UTY1 = Intron 3c 550 471 A->G cactgtcttccacaatggttg aggtgattttgtatttatcttccc M210 UTY1 = Intron 3d 550 461 A->T cactgtcttccacaatggttg aggtgattttgtatttatcttccc M211 UTY1 = Intron 4a 538 381 C->T caattcactatttgaggaatcca gaagtctctgatttatttggcag M212 UTY1 ex05a 409 234 C->A tataatcaagttaccaattactggc ttttgtaacattgaatggcaaa M213 UTY1 ex05b=Intron 4c 409 290 T->C tataatcaagttaccaattactggc ttttgtaacattgaatggcaaa M214 UTY1 ex12 = Intron 11 460 404 T->C tattacaaaatatggaaacaaggc gaaatgccacttcactccag M215 UTY1 exon 14 386 163 A->G gtaaaactcagatatatacatcccatg aaaaaaaaagaatcactatcttaacg M216 UTY1 intron 18 557 54 C->T ctcaaccagtttttatgaagctag gagagtctgaactaatgtgtcttgt M217 UTY1 intron 17 461 219 A->C gcttatttttagtctctcttccat acctgttgaatgttacatttcttt M218 UTY1 intron 16 482 380 C->T ttgtgagtttttttccatcaatc tttattgacgatggtattagaagag M219 UTY1 intron 16 482 232 T->C ttgtgagtttttttccatcaatc tttattgacgatggtattagaagag M220 UTY1 intron 16 482 367 A->G ttgtgagtttttttccatcaatc tttattgacgatggtattagaagag M221 UTY1 intron 18 324 200 G->A gggaaatgtgaaaggaaaata ttaaacttttataacactgacagaaac M223 A8.05e 208 67 C->T ttcagcaagagtaagcaagagg cctttttggatcatggttctt


170

M224 B9.60b 301 193 T->C cttcaggcattattttttttggt atagtgttccttcacctttcctt YAP DYS287 599(Alu+) Alu- ->Alu+ caggggaagataaagaaata aagccactattagacaacct P1 DYS287 858 230 C->T aggagaagtgggagtaaga actgctaaaaggggatggat P2 DYS287 536 153 C->T gatgcaaatgagaaagaact ctaaaaactggagggagaaa P3 DYS287 536 397 G->A gatgcaaatgagaaagaact ctaaaaactggagggagaaa P4 DYS7 160 108 C->T tggtctcaggaagtttttgc gagagtcataatgccgacgt P5 DYS389 624 36 C->T aacccctgccacaaatacat tctggaacccctggagagatc P6 DYS265 122 83 G->C ctgaaggtggccatttctta ccatctggctcaatggttag P7 DYS194 327 60 T->C atgcctacaaaatgacac ccaacaatatgtcacaatctc P8 DYS190 661 461 G->A agggagatgagaagacac cgtggcatcttgtcatgtct P9 486 Ya5 475 319 C->A tgtggtaagtgtagtttcaa tctggactggaaacataa P14 DYS188 741 361 C->T tttcagagtttctctact tttttttttaatatgaggg P15 DYS221 191 138 C->T agagagttttctaacagggcg tgggaatcacttttgcaact P16 DYS211 169 105 A->T aggctccatctgtagcacac taaccttatagaccaaccccg P18 DYS194 697 208 C->T tggatctgattcacaggtag ccaacaatatgtcacaatctc P19 DYS190 661 478 T->G agggagatgagaagacac cgtggcatcttgtcatgtct P20 DYS194 697 158 C deletion tggatctgattcacaggtag ccaacaatatgtcacaatctc P21 DYS194 819 759 C->A tagccctttgtcttgattacag gtgctaggtccaaatatg P22 DYS257 369 169 G/A->A gcttcaggaacttgtcgg aggacccaattattgcacac P25 DYS194 327 79 C->A atgcctacaaaatgacac ccaacaatatgtcacaatctc P27 DYS257 369 115 G->A gcttcaggaacttgtcgg aggacccaattattgcacac P28 16E4 Ya5 519 410 C->T gaagcaatactctgaaaagt tttggagggacattattctc P29 ARSDP 684 534 A->C ggtgggctgtttgaaaaaga agccaaataccagtcgtcac P31 ARSDP 703 126 T->C taaggctgcgtgttccctat gcactgtcactgtggatgtt P33 DYS194 819 718 T->C tagccctttgtcttgattacag gtgctaggtccaaatatg P36 ARSDP 637 217 G->A tgaaggacagtaagtacaca taagtccattgatctacaga P37 ARSDP 447 135 T->C cgtctatggccttgaaga tccgaaaatgcagacttt P44 ARSDP 703 134 G->A taaggctgcgtgttccctat gcactgtcactgtggatgtt

SRY4064 SRY 612 258 G->A gcattttgttacccttctcaac tggcaagacttacgagatttc SRY9138 SRY 1,067 363 C->T tttaacattgacaggaccag gacaaccaagaagaggaacc

SRY10831a SRY 536 135 A->G ccacaacctctttcatc aataaaaatcccgtaaaata SRY10831b SRY 536 135 G->A ccacaacctctttcatc aataaaaatcccgtaaaata

92R7 92R7 722 504 G->A gacccgctgtagacctgact gcctatctacttcagtgatttct Tat RBF5 112 28 T->C gactctgagtgtagacttgtga gaaggtgccgtaaaagtgtgaa Apt 50f2/E 850 419 G->A tggattgcattcaacttcacttac ctgagttcaaatgctcgggtctc

LINE1 DYZ3 ~140 (LINE+) LINE- -> LINE+ gcacaatgtgcacatgtacccta tgatgtgtgcattcatctcatatat MSY2 DYS440 499/400 4->3 ctggctttggggacgtagta ctgcgctttatgagcatacg

SRY-2627 SRY 1242 299 C->T aggtcttttttgccttctta atgcacggtttcttttga SRY+465 SRY 148 52 C->T gccgaagaattgcagtttgc gttgatgggcggtaagtggc

47z DXYS5Y 381 291 G->C tgagtcaatgtcaatgaatc tagttacgccttg(g)cataac MEH1 50f2/E 687 330 C->G gtgcatctattgactctttcatgg caccaccatgtcccacagatttg MEH2 PCDHY intron 4 938 880 G->T attcataatatttgattcagaacag taccatgaaaattcataatccaca

50f2(P) 50f2/E 687 547 G->C caccaccatgtcccacagatttg gtgcatctattgactctttcatgg 12f2 DYS11 88 present->absent ctgactgatcaaaatgcttacagatc ggatcccttccttacaccttatac


171

Tabela 17: Tempo estimado de expansão e origens das linhagens das Y-STR no Norte da África

TMRCA [em 1000 anos] (95% IC) Linhagens Mutação Nº Cromossomos 30 Anos/ Geração 25 anos/ Geração

All 390 13.95 (8.08–24.67) 25.87 (20.47–30.99) E M145 237 9.70 (5.98–14.33) 19.66 (15.31–21.12) E3a M2 8 2.96 (1.83–4.25) 5.06 (3.01–7.61) E1 M33 3 3.38 (2.11–5.25) 5.6 (2.79–9.38) E3b1 M78 38 4.48 (3.01–6.16) 8.10 (5.42–10.71) E3b M35 165 8.26 (5.18–12.37) 14.33 (9.32–19.19) E3b2 M81 226 4.15 (2.84–5.97) 6.90 (5.91–8.19) F M89 152 9.77 (6.47–14..84) 19.05 (15.30–22.61) J 12f2 93 6.78 (4.38–11.10) 7.86 (6.63–9.13) J2 M172 14 3.67 (2.50–5.25) 4.98 (4.10–6.06) R M173 27 4.44 (3.04–6.62) 10.24 (8.54–12.94) I M170 2 2.83 (1.68–4.32) 5.29 (3.19–9.16) K M9 38 7.10 (4.38–11.1) 15.09 (11.56–18.16)


172

Tabela 18: Tempo estimado de expansão e origens das linhagens das Y-STR

Haplogrupo Linhagem Estado Ancestral Idade Origem

geográfica E* M96 / P29 SRY4064 37,000 E3* M96 / P29

SRY4064 DYS391p /P2 27,800

E3a* P2 M2 /P1 18,800 E3a1 M2 / P1 M116b E3b DYS391p M35 M215 29,200 E3b* P2 M35 (xvii) 14,900 E3b1* M35 M78 East Africa M215 25,500 Africa E3b1a M78 M148 E3b1b M215 M81 North Africa E3b1c M215 M123 E3b1c1 M35 M123 M34 Near East E3b1d M215 M35 M281 E3b1e M215 M35 V6 Eastern Africa E3b2* M35 M81 8,600 E3b2a M81 M107 E3b2b M81 M165 E3b3* M35 M215 M123 15,800 E3b3a* M123 M34 E3b3a1 M34 M136 E3b4 M35 M215 M281 18,800 F M168 / P9 M89 M213 P14 6,400/9000 Zagros (xvi) G* M89 M213 M201 9,500 Middle East 17,000 Middle East G1 M201 P20 G2* M201 P15 G2a* P15 P16 G2a1 P16 P17 P18 H M52 / M69 H1* M82 H1a M82 M36 H1b M82 M97 H1c M39 M138 I* M89/P14 M213 M170 / P19 22,000 Balkans 30,000 Central Asia 24,000 I1* M170/P19 P38 I1a* P38 P30 France I1a1 P38 P30 P40 I1a2 P39 P30 M21 I1a3 P38 P30 M72 I1b* P38 P37b (xiv) Balkans I1b1 P37b P41b I1b2* P37b M26 Iberia/France I1b2 9,000 Sardinia I1b2a M26 M161 I1c France J* M89 P14 M213 12f2.1 4,000/9,500

(vi) Zagros

14,800 19,300 Middle East 31,700 J1 12f2.1 M62 8,400 J2* 12f2.1 M172 3,600 Middle East 18,500


173

7/9,800 Fertile Crescent J2a M172 M47 840/2,160 J2b M172 M68 6,300 J2c M172 M137 J2d M172 M158 J2e* M172 M12 3,000 J2e1* M12 M102 S. Balkans 7,900 J2e1a M102 M99 J2f* M172 M67 4,700 11,600 J2f1 M67 M92 5,000 Aegean 8,800 J2f2 M67 M163/166 K* M9 K1 SRY9138 K2 M70 K3 M147 K4 M230 L M11 M20 M22

M61

M M4 M5 M106 M186 M189 P35

N LLY22g O M175 M214 P* M45 M74 40,000 S. Siberia P* P27 92R7 Q 92R7 P27 P36 MEH2 7,600 Altai R* 92R7 P27 M207 R1* M173 30,000 Central Asia S & W Asia R1a* SRY10831.2 3,700/6,300

(viii)

R1a1 7,500 R1a1* SRY10831.2 M17 15,000 Indo-Iranian R1a1a M17 M56 R1a1b M17 M157 R1a1c M17 M64.2 / M87 R1b* M173 P25 R1b1 P25 M18 R1b2 P25 M73 R1b3 M269 West Asia R1b3a M269 M37 R1b3b M269 M65 R1b3c M269 M126 R1b3d M269 M153 R1b3e M269 M160 R1b3f M269 SRY2627 R1b3g M269 M222 R2 M207 M124


174

7.1.6 Referências do Anexo

Alves C, Gusmão L, Barbosa J, Amorim A (2003) Evaluating the informative power of

Y-STRs: a comparative study using European and new African haplotype data..

Forensic Science International 134:126–133

Arroyo-Pardo E, Gusmâo L, Lopez-Parra AM , Baeza C, Mesa MS, Amorim A (2004)

Genetic variability of 16 Y-chromosome STRs in a sample from Equatorial

Guinea (Central Africa). Forensic Sci Int 149(1):109-13

Athey TW (2005) Haplogroup Prediction from Y-STR Values Using an Allele-

Frequency Approach. Journal of Genetic Genealogy 1:1-7



Barros JEXS, Maciel EMBB, Gomes AV,Martins AM, Silva RS, Maurício-da-

Silva L (2006) Human Y-chromosome STR haplotype diversity in

Pernambuco, Northeast Brazil( SUBMITTED TO FORENSIC SCIENCE

INTERNATIONAL)

Bortolini MC, Salzano FM, Thomas MG, Stuart S, Nasanen SPK , Bau CHD, Hutz

MH, Layrisse Z, Petzl-Erler ML, Tsuneto LT, Hill K, Hurtado AM, Castro-de-

Guerra D, Torres MM, Groot H ,Michalski R, Nymadawa P, Bedoya G,

Bradman N, Labuda D , Ruiz-Linares A (2003), Y-Chromosome Evidence for

Differing Ancient Demographic Histories in the Americas Am. J. Hum. Genet.

73:524–539

Carvalho M, Anjos MJ, Andrade L, Lopes V, Santos MV, Gamero JJ, Real FC, Vide

MC (2003) Ychromosome STR haplotypes in two population samples:Azores

Islands and Central Portugal. Forensic Science International 134 :29–35

Corach D, Filgueira-Risso L, Marino M, Penacino G, Sala A, Routine Y-STR typing

in forensic casework. Forensic Sci. Int. 15 (2001) 131-135

de Knijff P, Kayser M, Caglià A, Corach D, Fretwell N, Gehrig C, Graziosi F,

Heidorn G, Herrmann S, Herzog B, Hidding M, Honda K, Jobling M, ,Krawczak

M., Leim K, Meuser S, Meyer E,. Oesterreich W, Pandya A, Parson W,

Penacino G, Perez-Lezaun A,·Piccinini A, Prinz M,.Schmitt C, Schneider PM,

Szibor R, Teifel-Greding J, Weichhold G, Roewer L (1997) Chromosome Y


175

microsatellites: population genetic and evolutionary aspects. Int J Legal Med

110 : 134–140

Geada H, Baptista J, Felgueiras M, Silva VS, Cruz C,Lucas I, Ribeiro T, Espinheira

R (2004) Portuguese population study with 16 Y-STR loci. International

Congress Series 1261:319– 321

Gusmão L, Sanchez-Diz P, Alves C, Beleza S, Lopes A, Carracedo A, Amorim A

(2003) Grouping of Y-STR haplotypes discloses European geographic clines.

Forensic Science International 134 :172–179

Nei M. Molecular evolutionary genetics. New York: Columbia University

Press, 1987.


chromosome of South American Amerindians: a comparison with Blacks, hites,

and Japanese from Brazil. Ann. Hum. Genet.:61, 439±448

Zegura SL, Karafet TM, Zhivotovsky LA, Hammer MF (2004) High-Resolution SNPs

and Microsatellite Haplotypes Point to a Single Recent Entry of Native American

Y Chromosomes into the Americas. Mol. Biol. Evol. 21(1):164–175.

Bosch E, Calafell F, Santos FR, Perez-Lezaun A, Comas D, Benchemsi N,

Tyler-Smith C, Bertranpetit J (1999) Variation in Short Tandem

Repeats Is Deeply Structured by Genetic Background on the Human Y

Chromosome Am. J. Hum. Genet. 65:1623–1638, 1999

Kayser M and Sajantila A (2001) Mutations at Y-STR loci: implications

forpaternity testing and forensic analysis. Forensic Sci Int 118: 116-

121.


Herrmann S, Herzog B, Hidding M, Honda K, Jobling M, Krawczak M, Leim K,

Meuser S, Meyer E, Oesterreich W, Pandya A, Parson W, Penacino G, Perez-

Lezaun A, Piccinini A, Prinz M, Schmitt C, Schneider PM, Szibor R, Teifel-

Greding J, ·Weichhold G, de Knijff P, Roewer L (1997) Evaluation of Y-

chromosomal STRs: a multicenter study. Int J Legal Med (1997) 110 : 125–133

Kimura M and Ohta T (1978) Stepwise mutation model and distribution of allelic

frequencies in a finite population. Proc. Nati. Acad. Scd. USA 75(6) 2868-4


176

Miller SA, Dykes DD and Olesky HF (1988) A simple salting-out procedure

for extract DNA from human nucleated cells. Nucleic Acids Res.

16:1255.

Pereira L, Gusmão L, Alves C, Amorim A, Prata MJ (2002) Bantu and European Y-

lineages in Sub-Saharan Africa. Ann. Hum. Genet: 66, 369±378

Roewer L, Krawczak M, Willuweit S, Nagy M, Alves C, Amorim A, Anslinger K,

Augustin C , Betz A, Bosh E, Caglia A, Carracedo A, Corach D, Dekairelle AF,

Dobosz T, Dupuy BM, Furedi S, Gehring C, Gusmao L, Henke J, Henke L,

Hidding M, Hohoff C, Hoste B, Jobling MA, Kargel HJ, de Knijff P, Lessig R,

Liebeherr E, Lorente M, Martinez-Jarreta B, Nievas P, Nowak M, Parson W,

Pascali VL, Penacino G, Ploski R, Rolf B, Sala A, Schmidt U, Schmitt C,

Schneider PM., Szibor R, Teifel-Greding J., Kayser M (2001) Online reference

database of European Y-chromosomal short tandem repeat (STR) haplotypes.

Forensic Sci. Int. 118 :106-113.

Roewer L, Croucher PJ, Willuweit S, Lu TT, Kayser M, Lessig R, Knijff P, Jobling MA,

Tyler-Smith C, Krawczak M (2005) Signature of recent historical events in the

European Y-chromosomal STR haplotype distribution. Hum Genet (2005) 116:

279–291

Schneider S, Guillaume L, Excoffier L (2006) Arlequin Ver. 3.01, An integrated

software package for population genetic data analysis. University of Berne

Computational and Molecular Population Genetics Lab

http://cmpg.unibe.ch/software/arlequin3.


177

7.3. Anexo 2 IINNSSTTRRUUÇÇÕÕEESS PPAARRAA AAUUTTOORREESS

RREEVVIISSTTAA JJOOUURRNNAALL OOFF FFOORREENNSSIICC SSCCIIEENNCCEESS

ISSN 0022-1198

PA, U.S.A.


178

INFORMATION FOR AUTHORS The Journal of Forensic Sciences publishes original material in the following categories: Paper --- full-length research report Technical Note --- description of a technical aspect of a field or issue, report on a procedure or method, or work on validation of techniques or methodologies. Usually shorter than papers. Brief Communication --- very brief technical communication, shorter than a typical Technical Note. Brief

Communications should generally be no more than 4-5 manuscript pages, including references, figures and

tables.

Case Report --- usually brief description or analysis of an unusual case or a small series or cases Review --- full-length paper reviewing the state of the art or the published literature in a particular area of sufficiently broad interest to the readership Letter --- usually a discussion of a previously published item, or commentary on the Journal or an issue of interest to the Academy. Publication of letters is at the sole discretion of the Editor. Letters commenting on previously published items are ordinarily shared with the original authors to afford them an opportunity to respond to the commentary. Response to Letter --- usually author(s) response to a Letter commenting on their published work Editorial or Invited Commentary --- commentary, invited by the Editor Book Review --- review of a book or other publication of interest to the forensic sciences or closely related fields. Special Communication --- occasional communication of an editorial or newsworthy nature For the Record --- a summary of population genetic data published under the condition that the complete data set be available at a readily accessible world wide web site. Papers, technical notes, brief communications, case reports and reviews are subjected to full peer review. Previously published material is not acceptable. Material from previously published work must be quoted exactly and adequately referenced. Use of previously published figures, tables, etc., require the written permission of the copyright owner of the prior work. Manuscripts submitted as papers, technical notes, brief communications, case reports, or reviews, are accepted for consideration with the understanding that their essential contents, including text, tables and figures, have neither been previously published nor concurrently submitted to another journal. Work must not be submitted to another journal unless and until the Journal of Forensic Sciences formally declines to publish it. The above-discussed prohibitions do not apply to abstracts or summaries published in connection with professional meetings, or press reports resulting from formal or oral presentation. The Journal of Forensic Sciences reserves the right of first consideration for publication of any work accepted for presentation at an annual meeting of the American Academy of Forensic Sciences (AAFS), and authors must not submit their work elsewhere for a period of six months following the annual meeting at which the work was presented. If a manuscript has not been accepted for publication, or is not under active consideration by the Journal, at the end of the six-month period, the interest of the Journal in the manuscript automatically terminates. Upon acceptance for publication, manuscripts become the copyright property of the American Society for Testing and Materials (ASTM). Author(s) of manuscripts accepted for publication must complete a Paper Submittal Form that will be furnished by the Editor along with notification of full acceptance. This form must be signed by all authors, indicating complete understanding of the work and concurrence in it. Signature(s) of authors also serve to transfer copyright in the work to ASTM. It is understood that for certain work by employees of U.S. or foreign governments, whose manuscripts have been prepared as part of their official duties, copyright is not available in the United States. Acceptance of manuscripts submitted for publication is the responsibility of the Publications Committee of the AAFS, Editorial Board of the Journal of Forensic Sciences, and the editor, and occurs only after review of the manuscript in accordance with current operating rules. Review of submitted manuscripts may ordinarily be expected to be completed within 90 days. Authors, members of the Editorial Board, invited guest reviewers, the editor, and others involved in the publication process are expected to conform to established policies concerning confidentiality, conflicts of interest, release of accepted manuscripts prior to actual publication, and the protection of anonymity of patients


179

and victims [J Forensic Sci 1995; 40 (3-6), 1996; 41(1-6), 1997; 42(1-6), 1998;43(1-6), and in selected issues thereafter; and see below]. The Journal requires that authors submitting manuscripts for peer review (papers, technical notes, case reports, brief communications) have obtained required approval(s) for submission from authorized principals and/or internal reviews in their laboratories and/or organizations. Submission of Manuscripts The Journal of Forensic Sciences requirements for manuscripts are generally in accordance with the Uniform Requirements for Manuscripts Submitted to Biomedical Journals. These requirements may be found published in one of the following: (1) J Forensic Sci 1995 Mar-Nov;40(2-6), 1996 41, 1997; 42, 1998;43 and selected issues thereafter; (2) JAMA 1993 May 5;269:2282-6; (3) N Engl J Med 1991 Feb 7;324(6):424-8; (4) Can Med Assoc J 1991;144(6):673-80; (5) BMJ 1991 Feb 9;302(6772):338-41; or (6) Med J Aust 1991;155(3):197-200. The following integrates the Uniform Requirements for Manuscripts Submitted to Biomedical Journals as they apply to the Journal of Forensic Sciences with the specific requirements of this journal. Manuscripts must be written in English. An original and three complete copies should be sent to: Dr. Michael A. Peat, Editor, Journal of Forensic Sciences, 6700 Woodlands Parkway, Suite 230-308, The Woodlands, TX 77381,USA. An original and three complete copies of all tables and figures (including photographs and line drawings) must be included. Type the manuscript double-spaced, including title page, abstract, text, acknowledgments, references, tables, and legends. Each manuscript component should begin on a new page, in the following sequence: title page, abstract and key words, text, acknowledgments, references, tables (each table complete with title and footnotes on a separate page), and legends for illustrations. Illustrations must be good-quality, unmounted glossy prints, usually 127 x 173 mm (5 x 7 in.), but no larger than 203 x 254 mm (8 x 10 in.). Submit an original and three complete copies of manuscripts and illustrations in a heavy-paper envelope. The submitted manuscript should be accompanied by a cover letter, as described below, and permissions to reproduce previously published material or to use illustrations that may identify human subjects. Authors should keep copies of everything submitted. Manuscript submissions should be accompanied by a cover letter specifying the name, full mailing address and telephone/fax numbers and e-mail of the person who will act as corresponding author, and the category (paper, technical note, etc.) under which the item is submitted. The editor reserves the right to publish the manuscript in a category different from the one specified by the author(s) at submission. The cover letter should also specify, if applicable, information about possible duplicate publication problems, financial or other relationships that could give rise to conflicts of interest, and any other information the editor may need to make an informed decision in accordance with established policies and practices. The manuscript must be accompanied by copies of any permissions to reproduce published material, to reproduce illustrations or report sensitive personal information about identifiable persons, or to name persons for their contributions. If color artwork is submitted, and if the authors believe color art is necessary to the presentation of their work, the cover letter should indicate that one or more authors or their institutions are prepared to pay the substantial costs associated with color art reproduction. Only the corresponding author need sign the cover letter. The corresponding author's signature on the submission cover letter signifies: a) that all required approvals and/or reviews have been obtained from authorized principals in the laboratory and/or organization in which the work was performed The cover letter can also explicitly state that such approvals have been obtained. The editor reserves the right to request explicit, written approval of authorized laboratory and/or organization principals before the work is accepted by the journal for peer review. and b) that all authors have read the manuscript, concur in its contents, are qualified for authorship by the criteria stated in these requirements, and believe the submission to represent honest work. The editor reserves the right to request explicit, written clarification of individual author’s roles, their concurrence in the manuscript content, or any other issue that must be resolved prior to accepting the manuscript for peer review. The Journal does not accept submissions of manuscripts from third parties without the explicit, written permission of the author(s). PRIOR AND DUPLICATE PUBLICATION


180

As noted, this journal does not consider for publication a paper on work that has already been reported in a published paper or that is described in a paper submitted or accepted for publication elsewhere in print or in electronic media. This policy does not preclude consideration of a paper that has been rejected by another journal or of a complete report that follows publication of a preliminary report, usually in the form of an abstract. Nor does it prevent consideration of a paper that has been presented at a scientific meeting if not published in full in a proceedings or similar publication. Press reports of the meeting will not usually be considered as breaches of this rule, but such reports should not be amplified by additional data or copies of tables and illustrations. When submitting a paper, an author should always make a full statement to the editor about all submissions and previous reports might be regarded as prior or duplicate publication of the same or very similar work. Copies of such material should be included with the submitted paper to help the editor decide how to deal with the matter. Multiple publication-that is, the publication more than once of the same study, irrespective of whether the wording is the same-is rarely justified. Secondary publication in another language is one possible justification, providing the following conditions are met: (1) the editors of both journals concerned are fully informed; the editor concerned with secondary publication should have a photocopy, reprint, or manuscript of the primary version; (2) The priority of the primary publication is by a publication interval of at least 2 weeks; (3) The paper for secondary publication is written for a different group of readers and is not simply a translated version of the primary paper; an abbreviated version will often be sufficient; (4) The secondary version reflects faithfully the data and interpretations of the primary version; (5) A footnote on the title page of the secondary version informs readers, peers, and documenting agencies that the paper was edited, and is being published, for a national audience in parallel with a primary version based on the same data and interpretations. A suitable footnote might read as follows: "This article is based on a study first reported in the [title of journal, with full reference]." Multiple publication other than as defined above is unacceptable. If authors violate this rule, they may expect appropriate editorial action to be taken. PREPARATION OF MANUSCRIPT Type or print out the manuscript on white bond paper, 216 x 279 mm (8 1/2 X 11 in.), or ISO A4 (212 X 297 mm), with margins of at least 25 mm (1 in.). Type or print on only one side of the paper. Use doublespacing throughout, including title page, abstract, text, acknowledgments, references, individual tables, and legends. umber pages consecutively, beginning with the title page. Put the page number in the upper right-hand corner of each page. Title Page The title page should carry: (a) the title of the article, which should be concise but informative; (b) first name, middle initial, and last name of each author, with highest academic degree(s); (c) institutional affiliation, name of department(s) and/or institution(s) to which the work should be attributed; (d) official disclaimers, if any; (e) name and address of author responsible for correspondence about the manuscript; (f) source(s) of support in the form of grants, equipment, drugs, or all of these; (g) a statement of where the work has been presented orally or in poster form at professional meetings; and (h) a short running header of no more than 40 characters (count letters and spaces) placed near the bottom of the title page and identified. Institutional affiliations of authors should be numbered footnotes to the individual’s name and highest academic degree. If an author’s present address differs fro m the institution in which the work was done, and is attributed, indicate a “Present address” for that author. A footnote to the title of the manuscript (generally designated by a superscript *) should give statements about where the work has been presented at professional meetings, and should identify any sources of support. Authorship All persons designated as authors should qualify for authorship. The order of authorship should be a joint decision of the coauthors. Each author should have participated sufficiently in the work to take public responsibility for the content. Authorship credit should be based only on substantial contributions to a) conception and design, or analysis interpretation of data; and to b) drafting the article or revising it critically for important intellectual content; and on c) final approval of the version to be published. Conditions a), b), and c) must all be met. Participation solely in the acquisition of funding or the collection of data does not justify authorship. General supervision of the research group is not sufficient for authorship. Any part of an article critical to its main conclusions must be the responsibility of at least one author.


181

Editors may require authors to justify the assignment of authorship. Increasingly, multi-center trials or work are attributed to a corporate author. All members of the group who are named as authors, either in the authorship position below the title or in a footnote, should fully meet the criteria for authorship as defined in the Uniform Requirements. Group members who do not meet these criteria should be listed, with their permission, under Acknowledgments or in an appendix (see Acknowledgments). Abstract and Key Words The second page should carry an abstract of no more than 150 words. This journal uses unstructured abstracts. The abstract should briefly state the purposes of the study or investigation, basic procedures (selection of study subjects or laboratory animals; observational and analytical methods), main findings (give specific data and their statistical significance, if possible), and the principal conclusions. Emphasize new and important aspects of the study or observations. Below the abstract provide, and identify as such, 3 to 10 key words or short phrases that will assist indexers in cross-indexing the article and may be published with the abstract. Use terms from the medical subject headings (MeSH) list of Index Medicus; if suitable MeSH terms are not yet available for recently introduced terms, present terms may be used. The first key word is forensic science; the second and subsequent words should assist abstracters in properly categorizing the work so that it will be found in journal article data bases by interested researchers. Frequently, the second key word represents a subfield of forensic science, e.g. forensic anthropology, forensic pathology, or DNA typing. In manuscripts on DNA typing, every locus involved in the study should be listed as a separate key word. Do not use abbreviations for key words, e.g., polymerase chain reaction, not PCR; gas chromatography-mass spectrometry, not GCMS. Text The text of observational and experimental articles is usually-but not necessarily-divided into sections with headings. This journal does not use an “Introduction” heading. The introductory text begins on the first text page. Other typical headings include Methods (or Materials and Methods), Results, and Discussion. Long articles may need subheadings within the sections to clarify their content, especially the Results and Discussion sections. Other types of articles such as case reports or reviews are likely to need different headings and subheadings. Generally, avoid overuse of subheadings, especially in the Methods section. Introduction In this journal, the text component of the manuscript begins with an introduction, but we do not use the “Introduction” heading. State the purpose of the article. Summarize the rationale for the study or observation. Give only strictly pertinent references, and do not review referenced articles extensively. Do not include data or conclusions from the work being reported. Methods Describe your selection of the observational or experimental subjects (patients or laboratory animals, including controls) clearly. Identify the methods, apparatus (manufacturer's name and address in parentheses), and procedures in sufficient detail to allow other workers to reproduce the results. Give references to established methods, including statistical methods (see below); provide references and brief descriptions for methods, that have been published but are not well known; describe new or substantially modified methods, give reasons for using them, and evaluate their limitations. Identify precisely all drugs and chemicals used, including generic name(s), dose(s), and route(s) of administration. Generally avoid the overuse of subheadings in the Methods section. Describe the methods and materials in narrative style, not in the style of a laboratory procedure handout. Ethics When reporting experiments on human subjects, indicate whether the procedures followed were in accordance with the ethical standards of the responsible committee on human experimentation (institutional or regional) or with the Helsinki Declaration of 1975, as revised in 1983. Do not use patient's names, initials, or hospital numbers, especially in illustrative material. When reporting experiments on animals, indicate whether the institution's or the National Research Council's guide for, or any national law on, the care and use of laboratory animals was followed. Statistics Describe statistical methods with enough detail to enable a knowledgeable reader with access to the original data to verify the reported results. When possible, quantify findings and present them with appropriate indicators of measurement error or uncertainty (such as confidence intervals). Avoid sole reliance on statistical hypothesis testing, such as the use of P values, which fails to convey important quantitative information. Discuss eligibility of experimental subjects. Give details about randomization. Describe the methods for and success of any blinding of observations. Report treatment complications. Give numbers of observations. Report losses to observation (such as dropouts from a clinical trial). References for study design and statistical methods should be to standard works (with pages stated) when possible rather than to papers in which the designs or methods were originally reported. Specify any general-use computer programs used. Put a general description of methods in the Methods section. When data are summarized in the Results section, specify the statistical methods used to analyze them. Restrict tables and figures to those needed to explain the argument of the paper and to assess its support. Use graphs as an alternative to tables with many entries; do not duplicate data in graphs and tables.


182

Avoid non-technical uses of technical terms in statistics, such as "random" (which implies a randomizing device), "normal," "significant," "correlations," and "sample." Define statistical terms, abbreviations, and most symbols. Results Present your results in logical sequence in the text, tables, and illustrations. Do not repeat in the text all the data in the tables or illustrations; emphasize or summarize only important observations. Discussion Emphasize the new and important aspects of the study and the conclusions that follow from them. Do not repeat in detail data or other material given in the Introduction or the Results section. Include in the Discussion section the implications of the findings and their limitations, including implications for future research. Relate the observations to other relevant studies. Link the conclusions with the goals of the study but avoid unqualified statements and conclusions not completely supported by your data. Avoid claiming priority and alluding to work that has not been completed. State new hypotheses when warranted, but clearly label them as such. Recommendations, when appropriate, may be included. In shorter manuscripts, such as those intended to be Technical Notes or Brief Communications, the Results and Discussion sections should be combined. Acknowledgments The Acknowledgements section immediately precedes the Reference list. Here, specify contributions that need acknowledging but do not justify authorship, such as general support by a department chair or acknowledgments of technical help. Persons who have contributed intellectually to the paper but whose contributions do not justify authorship may be named and their function or contribution described---for example, "scientific adviser," "critical review of study proposal," "data collection," or "participation in clinical trial." Such persons must have given their permission to be named. Authors are responsible for obtaining written permission from persons acknowledged by name, because readers may infer their endorsement of the data and conclusions. Technical help should be acknowledged in a paragraph separate from those acknowledging other contributions. Acknowledgements of financial support should appear as footnotes to the title of the paper on the Title Page. References The heading of the reference list should be "References," and it should contain only published or in-press references cited by number in the test. Published abstracts (duly noted as being abstracts), printed manufacturers' protocols or instructions, and world wide web site URLs may be validly cited as references. Personal communications and submitted manuscripts are not valid references. Personal communications should be cited in the text, in parentheses, at the appropriate location. Number references consecutively in the order in which they are first mentioned in the text. Identify references in tables, and legends by Arabic numerals. References cited only in tables or legends should be numbered in accordance with a sequence established by the first identification in the text of the particular table or figure. Within the text, tables, or figures, cite references by Arabic numeral in parentheses. Within the reference list, number the references 1., 2., 3., etc. References in the reference list should be in accord with Uniform Requirements … style of the examples given below. This style is based with slight modifications on the formats used by the U.S. National Library of Medicine in Index Medicus. The titles of journals should be abbreviated according to the style used in Index Medicus. Consult List of Journals Indexed in Index Medicus, published annually as a separate publication by the library and as a list in the January issue of Index Medicus. The references must be verified by the author(s) against the original documents. Examples of correct forms of references are given below. Articles in Journals 1) Standard journal article (List all authors, but if the number exceeds six, give six followed by et al.) You CH, Lee KY, Chey RY, Menguy R. Electrogastrographic study of patients with unexplained nausea, bloating and vomiting. Gastroenterology 1980 Aug;79(2):311-4. As an option, if a journal carries continuous pagination throughout a volume, the month and issue number may be omitted. You CH, Lee KY, Chey RY, Menguy R. Electrogastrographic study of patients with unexplained nausea, bloating and vomiting. Gastroenterology 1980;79:311-4. Goate AM, Haynes AR, Owen MJ, Farrall M, James LA, Lai LY et al. Predisposing locus for Alzheimer's disease on chromosome 21. Lancet 1989;1:352-5.


183

2) Organization as author The Royal Marsden Hospital Bone-Marrow Transplantation Team. Failure of syngeneic bone-marrow graft without preconditioning in post-hepatitis marrow aplasia. Lancet 1977;2:742-4. 3) No author given Coffee drinking and cancer of the pancreas [editorial]. BMJ 1981;283:628. 4) Article not in English Massone L, Borghi S, Pestarino A, Piccini R, Gambini G. Localisations palmaires purpuriques de la dermatite herpetiforme. Ann Dermatol Venereol 1987;114:1545-7. 5) Volume with supplement Magni F, Rossoni G, Berti F. BN-52021 protects guinea-pig from heart anaphylaxis. Pharmacol Res Commun 1988;20 Suppl 5:75-8. 6) Issue with supplement Gardos G, Cole JO, Haskell D, Marby D, Paine SS, Moore R. The natural history of tardive dyskinesia. J Clin Psychopharmacol 1988;8(4 Suppl):31S-37S. 7) Volume with part Hanly C. Metaphysics and innateness: a psychoanalytic perspective. Int J Psychoanal 1988;69(Pt 3):389- 99. 8) Issue with part Edwards L, Meyskens F, Levine N. Effect of oral isotretinoin on dysplastic nevi. J Am Acad Dermatol 1989;20(2 Pt 1):257-60. 9) Issue with no volume Baumeister AA. Origins and control of stereotyped movements. Monogr Am Assoc Ment Defic 1978;(3):353-84. 10) No issue or volume Danoek K. Skiing in and through the history of medicine. Nord Medicinhist Arsb 1982;86-100. 11) Pagination in roman numerals Ronne Y. Ansvarsfallen Blodtransfusion till fel patient. Vardfacket 1989;13:XXXVI-XXVII. 12) Type of article indicated as needed Spargo PM, Manners JM. DDAVP and open heart surgery [letter]. Anaesthesia 1989;44:363-4. 13) Article containing retraction Shishido A. Retraction notice. Effect of platinum compounds on murine lymphocyte mitogenesis [Retraction of Alsabti EA, Ghalib ON, Salem MN. In: Jpn J Med Sci Biol 1979;32:53-65]. Jpn J Med Sci Biol 1980;33:235-7. 14) Article retracted Alsabti EA, Ghalib ON, Sale MN. Effect of platinum compounds on murine lymphocyte mitogenesis [Retracted by Shishido A. In: Jpn J Med Sci Biol 1980;33:235-7]. Jpn J Med Sci Biol 1979;32:53-65. 15) Article containing comment Piccoli A, Bossatti A. Early steroid therapy in IgA neuropathy: still an open question [comment] Nephron 1989;51:289-91. Comment on: Nephron 1988;48:12-7. 16) Article commented on Kobayashi Y, Fujii K, Hiki Y, Tateno S, Kurokawa A, Kamiyama M. Steroid therapy in IgA neuropathy: a retrospective study in heavy proteinuric cases [see comments]. Nephron 1988;48:12-7. Comment in: Nephron 1989;51:289-91. 17) Article with published erratum Schofield A. The CAGE questionnaire and psychological health [published erratum appears in Br J Addict 1989;84:701]. Br J Addict 1988;83;761-4. Books and Other Monographs 18) Personal author(s) Colson JH, Armour WJ. Sports injuries and their treatment. 2nd rev. ed. London: S. Paul, 1986 19) Editor(s), compiler as author Diener HC, Wilkinson M, editors. Drug-induced headache. New York: Springer-Verlag, 1988 20) Organization as author and publisher Virginia Law Foundation. The medical and legal implications of AIDS. Charlottesville: The Foundation, 1987.


184

21) Chapters in a book Weinstein L, Swartz MN. Pathologic properties of invading microorganisms. In: Sodeman WA Jr, Sodeman WA, editors. Pathologic physiology: mechanisms of disease. Philadelphia: Saunders, 1974;457- 72. 22) Conference proceedings Vivian VL, editor. Child abuse and neglect: a medical community response. Proceedings of the First AMA National Conference on Child Abuse and Neglect; 1984 Mar 30-31; Chicago. Chicago: American Medical Association, 1985. 23) Conference paper Harley NH. Comparing radon daughter dosimetric and risk models. In: Gammage RB, Kaye SV, editors. Indoor air and human health. Proceedings of the Seventh Life Sciences Symposium; 1984 Oct 29-31; Knoxville (TN). Chelsea (Ml): Lewis, 1985;69-78. 24) Scientific or technical report Akutsu T. Total heart replacement device. Bethesda (MD): National Institutes of Health, National Heart and Lung Institute; 1974 Apr. Report No.: NIH-NHLI-691 218514. 25) Dissertation Youssef NM. School adjustment of children with congenital heart disease [dissertation]. Pittsburgh (PA): Univ. of Pittsburgh, 1988. 26) Patent Harred JF, Knight AR, McIntyre JS, inventors. Dow Chemical Company, assignee. Epoxidation process. US patent 3,654,317. 972 Apr 4. Other Published Material 27) Newspaper article Rensberger B, Specter B. CFCs may be destroyed by natural process. The Washington Post 1989 Aug 7; Sect. A:2 (col. 5). 28) Audiovisual AIDS epidemic: the physician's role [videorecording]. Cleveland (OH): Academy of Medicine of Cleveland, 1987. 29) Computer file Renal system [computer program]. MS-DOS version. Edwardsville (KS): MediSim, 1988. 30) World Wide Web address or URL http://www.uocf.edu/pharmacy/depts/drugdose/barbitutuates/index.html 31) Legal material Toxic Substances Control Act: Hearing on S. 776 Before the Subcomm. on the Environment of the Senate Comm. on Commerce. 94th Cong., 1st Sess. 343 (1975). 32) Map Scotland [topographic map]. Washington: National Geographic Society (US), 1981. 33) Book of the Bible Ruth 3:1-18. The Holy Bible. Authorized King James version. New York: Oxford Univ. Press, 1972. 34) Dictionary and similar references Ectasia. Dorland's illustrated medical dictionary. 27th ed. Philadelphia: Saunders, 1988;527. 35) Classical material The Winter's Tale: act 5, scene 1, lines 13-16. The complete works of William Shakespeare. London: Rex, 1973. Unpublished Material 36) In press Lillywhite HD, Donald JA. Pulmonary blood flow regulation aquatic snake. Science. In press. Additional Information and Reprint Requests A section of the manuscript, immediately following the reference list, entitled Addition information and reprint requests:, should include the full name, title, and mailing address of the corresponding author. If reprints will not be available from the author(s), entitle this section: Additional Information - Reprints Not Available from Author.


185

Tables Type or print out each table double-spaced on a separate sheet. Do not submit tables as photographs. Number tables with Arabic numerals consecutively in the order of their first citation in the text and supply a brief title for each. Give each column a short or abbreviated heading. Place explanatory matter in footnotes, not in the heading. Explain in footnotes all nonstandard abbreviations that are used in each table. For footnotes use the following symbols, in this sequence: *,†,‡,§,((,¶,**,††,‡‡. Identify statistical measures of variations such as standard deviation and standard error of the mean. Do not use internal horizontal and vertical rules. Be sure each table is cited in the text. If you use data from another published or unpublished source, obtain permission and acknowledge fully. The use of too many tables in relation to the length of the text may produce difficulties in the layout of pages. The editor, upon accepting a paper, may recommend or even require as a condition of acceptance, that additional tables containing important backup data too extensive to publish be deposited with an archival service, such as the National Auxiliary Publication Service in the United States, or be made available by the authors, or be available at a web site. In that event an appropriate statement will be added to the text. Submit such tables for consideration with the paper. Illustrations (Figures) Submit an original and three complete sets of figures. Figures should be professionally drawn and photographed; freehand or typewritten lettering is unacceptable. Instead of original drawings, roentgenograms, and other material, send sharp, glossy, black-and-white photographic prints, usually 127 x 173 mm (5 x 7 in.), but no larger than 203 x 254 mm (8 x 10 in.). Letters, numbers, and symbols should beclear and even throughout, and of sufficient size that when reduced for publication each item will still be legible. Xerox copies of photographs and dot-matrix printer generated figures (including spectra, chromatograms, etc.) are not acceptable. Titles and detailed explanations belong in the legends for illustrations, not on the illustrations themselves. Each figure should have a label pasted on its back indicating the number of the figure, author's name, and top of the figure. Do not write on the back of figures or scratch or mar them by using paper clips. Do not bend figures or mount them on cardboard. Photomicrographs must have internal scale markers. Symbols, arrows, or letters used in the photomicrographs should contrast with the background. If photographs of persons are used, either the subjects must not be identifiable or their pictures must be accompanied by written permission to use the photograph. Figures should be numbered consecutively (in Arabic numerals) according to the order in which they have been first cited in the text. If a figure has been published, acknowledge the original source and submit written permission from the copyright holder to reproduce the material. Permission is required irrespective of authorship or publisher, except for documents in the public domain. This journal does not routinely publis h color photographs or other color artwork. If a color photograph (or other color artwork) is considered absolutely essential to the published presentation of the work, authors must be prepared to pay the substantial costs associated with color art reproduction and printing. The editor can provide authors with estimates of these costs in advance upon request. As a general rule, the editor will keep original figures and photographs in the manuscript file during revision(s). Artwork is typically sent back to authors only if it requires modification. If figures are added or deleted during the review / revision cycle(s), authors should clearly indicate to the editor what changes were made, and any changes to the figure numbering scheme. It is never a good idea to supply the editor with only one publication-quality set of figures and/or photographs. There is always a chance that these items can be lost in the mail. Legends for Illustrations Type or print out legends for illustrations double-spaced, starting on a separate page, with Arabic numerals corresponding to the illustrations. When symbols, arrows, numbers, or letters are used to identify parts of the illustrations, identify and explain each one clearly in the legend. Explain the internal scale and identify the method of staining in photomicrographs. UNITS OF MEASUREMENT Measurements of length, height, weight, and volume should be reported in metric units (meter, kilogram, or liter or their decimal multiples. Temperatures should be given in degrees Celsius. Blood pressures should be given in millimeters of mercury. All hematologic and clinical chemistry measurements should be reported in the metric system in terms of the International System of Units (SI). In some types of manuscripts (e.g. engineering), the use of non-metric units is permitted if they are the norm in that field or professional area. ABBREVIATIONS AND SYMBOLS Terms and nomenclature in all disciplines should be in accordance with the current standards and lists approved or adopted by appropriate national or international committees or organizations, such as the International


186

Anatomical Nomenclature Committee, I.U.P.A.C., I.U.B., the Enzyme Commission, the Committee on International Standardization of Gene Nomenclature (ISGN), etc. Use only standard abbreviations. Generally, avoid abbreviations in the title, abstract and key words. The full term for which an abbreviation stands should precede its first use in text unless it is a standard unit of measurement. Liter(s) is abbreviated L, not l. Micro should be abbreviated with (, not u. LETTERS TO THE EDITOR Submit Letters to the Editor in three copies. Letters concerning a previously published item should be entitled "Commentary On ... full title of published item ... J Forensic Sci ... citation ..." The citation should follow Uniform Requirements … style. Letters concerning other matters should begin with a brief descriptive title. The salutation "Sir:" should follow the title and precede the body of the letter. Responses to Letters should be entitled “Author’s Response.” The salutation "Sir:" should follow the title and precede the body of the letter. The name(s) and affiliation(s) of the writer(s) should appear at the end of Letters and Replies. SUBMISSION OF MANUSCRIPT COPY ON DISKETTE Do not submit manuscripts on diskettes initially. At a subsequent stage of the editorial and peer-review process, or following final acceptance, corresponding authors will be instructed to supply a disk (at their option) to the journal editor or to the ASTM editor. Manuscripts on disk are helpful to the copy editors, and we encourage authors to submit them at the appropriate time. The electronic version of the manuscript must correspond exactly with the finally accepted version of the paper manuscript. Diskette versions of Letters, Replies, or other items that are unlikely to require changes, may be submitted with the initial hard copy. REPRINTS Authors will have the opportunity to order reprints of their published work directly from ASTM, the publisher, after notification of full acceptance. The order form is generally included with the final page proofs that are sent to authors for approval prior to actual publication. Corresponding authors should attend to this matter during the publication process if they want reprints. It is generally difficult to supply reprints at a later time. POLICIES OF THE JOURNAL OF FORENSIC SCIENCES Confidentiality (adapted from the ICMJE Statement on Confidentiality) Manuscripts should be reviewed with due respect for authors' confidentiality. In submitting their manuscripts for review, authors entrust editors with the results of their scientific labor and creative effort, upon which their reputation and career may depend. Authors' rights may be violated by disclosure or by revelation of the confidential details of the review of their manuscript. Reviewers also have rights to confidentiality, which must be respected by the editor. Confidentiality may have to be breached if there are allegations of fraud or dishonesty but otherwise must be honored. The editor should not disclose information about manuscripts, including their receipt, their content, their status in the review process, their criticism by reviewers, or their ultimate fate. Such information should be provided only to authors themselves and reviewers. The editor makes clear to reviewers that manuscripts sent for review are privileged communications and are the private property of the authors. Therefore, reviewers and other people involved in the editorial process should respect the authors' rights by not publicly discussing the authors' work or appropriating their ideas before the manuscript is published. Reviewers are not allowed to make copies of the manuscript for their files and are prohibited from sharing it with others, except with the permission of the editor. The editor will not keep copies of rejected manuscripts. Reviewers’ identities are confidential, and will not be revealed to authors or to anyone else. Reviewers' comments may be shared with other reviewers of the same manuscript. Conflicts of Interest (adapted from the ICMJE Statement on Conflict of Interest) A conflict of interest for a given manuscript exists when a participant in the peer-review and publication process--author, reviewer, or editor--has ties to activities that could inappropriately influence his/her judgment, whether or not judgment is in fact affected. Financial relationships with industry (such as employment, consultancies, stock ownership, honoraria or expert testimony), either directly or through immediate family, are generally considered the most important conflicts of interest. However, conflicts can occur for other reasons, such as personal relationships, academic or research competition, and intellectual passion. Public trust in the peer-review process and the credibility of published work depend in part on how well conflict of interest is handled during writing, peer review, and editorial decision making. Bias can often be identified and eliminated by careful attention to the scientific methods and conclusions of the work. Financial relationships and their effects are less easily detected than other types of conflicts of interest. Participants in peer review should


187

disclose their conflicting interests, and the information should be made available so that others can judge their effects for themselves. Authors are responsible for recognizing and disclosing financial or other conflicts of interest that might bias their work when they submit a manuscript or letter. They should acknowledge in the manuscript all financial support for the work and other financial or personal connections to the work. Submission of manuscripts or commentary primarily for the purpose of bolstering an author’s position as an expert witness in legal proceedings is not acceptable. Reviewers should disclose to the editor any conflicts of interest that could bias their opinions of the manuscript, and they should disqualify themselves from specific manuscripts if they believe it to appropriate. The editor must be made aware of conflicts of interest to interpret the reviews and judge whether the reviewer should be disqualified. Reviewers must not use knowledge of the work gained during the review process, before publication of the work, to further their own interests. The editor should have no personal financial involvement in any of the issues that he/she may be called upon to judge. Published manuscripts and letters should include a description of all financial support and any conflict of interest that, in the editor's judgment, readers should know about. Protection of the Anonymity of Patients / Victims Detailed descriptions or photographs of individual patients or victims are sometimes central to documentation in a published item. Every effort must be made to protect the anonymity of such patients or victims and their families. Masking of the eyes in photographs may not be adequate protection. Changing data about a patient or victim is never an acceptable method of protecting anonymity. It is recognized that cases or situations forming the basis of items submitted to the Journal may be matters of public record as a result of public court proceedings, news reports, etc. For purposes of publication in the journal, however, emphasis should be placed on medical and/or scientific aspects and information that should form the basis for publication. No information that might violate the privacy of people should be included unless it can be justified as absolutely necessary to the medical and/or scientific presentation. Release of Full Text of Accepted Manuscripts Prior to Publication Requests for the release of accepted papers, technical notes, brief communications, or case reports prior to their actual publication are occasionally made by the media or by attorneys involved in courtroom proceedings. The full release of accepted, but as yet unpublished, peer-reviewed items by authors is not permitted, except by permission of the editor and the publisher. "Full release" means a complete copy of the manuscript, or any other type of reproduction of the complete work including all data. This prohibition does not, and is not intended to, apply to short summaries (even in the form or brief news releases), or brief abstracts for or from meeting presentations. Requests for the pre-publication release of accepted items will be carefully considered, and generally honored for legitimate reasons in accordance with the procedure specified below. Authors must obtain the permission of the editor and of ASTM, and must provide the editor with a legitimate reason for early release. Requests should be made in writing to the editor, and provide the reasons for the request. If the approvals of the editor and of ASTM are forthcoming, ASTM will produce, for a one-time fee (approximately the same as the cost of reprints), the copies that are to be released. Because many manuscripts go through several iterations of modification, correction, and revision, this procedure helps insure that the actually accepted version of the work, as it will appear in print, is released.

Documents

ANÁLISE GENÉTICO-HISTÓRICA DE HAPLÓTIPOS … · freqüentes por loco), freqüências relativas e absolutas e impressão das freqüências alélicas. 141 . 8 Figura 4: Interface