Estrutura e Evolução dos Genomas Embrapa

Embed Size (px)

Citation preview

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    1/111

    Ana Maria Costa Csar MartinsGenomas

    EstruturaeevoluodosGe

    nomas

    Cerrados

    .

    . . .

    . .

    Ministrio daAgricultura, Pecuria

    e Abastecimento

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    2/111

    Genomas

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    3/111

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    4/111

    Genomas

    Empresa Brasileira de Pesquisa AgropecuriaEmbrapa Cerrados

    Ministrio da Agricultura, Pecuria e Abastecimento

    Embrapa Cerrados

    Planaltina, DF

    2009

    Ana Maria Costa Csar Martins

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    5/111

    Exemplares desta publicao podem ser adquiridos na:

    Embrapa CerradosBR 020, Km 18, Rodovia Braslia/Fortaleza

    Caixa Postal 08223CEP 73310-970 Planaltina-DF

    Fone (61) 3388-9898 Fax (61) 3388-9879

    [email protected]

    Embrapa Informao TecnolgicaParque Estao Biolgica PqEB s/n. Plano Piloto

    CEP 70707-901 Braslia-DFFone (61) 3448-4236 Fax (61) 3340-2753

    [email protected]

    Coordenao editorialFernanda Vidigal Cabral de Miranda

    Equipe de revisoFernanda Vidigal Cabral de Miranda

    Francisca Elijani do Nascimento

    Jussara Flores de Oliveira Arbus

    Normalizao bibliogrfca

    Shirley da Luz Soares de Arajo

    Capa, projeto grfco e diagramao

    Fabiano Bastos

    1a edio

    1a impresso (2009): 500 exemplares

    Todos os direitos reservados.

    A reproduo no-autorizada desta publicao, no todo ou

    em parte, constitui violao dos direitos autorais (Lei n 9.610).

    Dados Internacionais de Catalogao na Publicao - CIP

    Embrapa Cerrados

    C 937e Costa, Ana Maria.

    Estrutra e evoluo dos genomas/Ana Maria Costa, Cesar

    Martins. Planaltina, DF : Embrapa Cerrados; Braslia, DF : EmbrapaInormao Tecnolgica, 2009.

    110 p. : il. color.

    ISBN 978-85-7075-043-3

    1. Gentica. 2. Genoma. 3. Evoluo. I. Martins, C. II. Ttulo.

    572.86

    Embrapa 2009

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    6/111

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    7/111

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    8/111

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    9/111

    atividades exigem constantes esoros para selecionar e recuperar alinhagem original.

    O livro Estrutura e Evoluo de Genomas az um apanhado geraldos esoros para se conhecer o material gentico, apresenta concei

    tos bsicos de biologia molecular e sintetiza os conhecimentos gerados nos projetos genomas quanto estrutura e organizao cromossmica das espcies. Finalizando, apresenta e discute os mecanismosmoleculares que promovem variabilidade e diversidade biolgica.

    Os assuntos apresentados contribuem para o entendimento dadinamicidade dos processos evolutivos importantes aos programasde conservao e melhoramento gentico.

    Jos Robson Bezerra Sereno

    CheeGeral da Embrapa Cerrados

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    10/111

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    11/111

    Genoma eucarionte 32

    Genoma das organelas 37

    Genoma dos cloroplastos e mitocndrias 37

    Genoma mitocondrial de tripanossomatdeos 39

    Organizao Estrutural e Instabilidade do Material Gentico 43

    Elementos repetitivos 46

    Elementos repetitivos mveis longos 50

    Elementos repetitivos mveis curtos 54

    Instabilidade de sequncias 57

    Repeties do tipo satlites 57

    Instabilidade de insertos clonados 59

    Instabilidade e estruturas noB 62

    Evoluo do Genoma 69

    Mutao intragnica 71

    Embaralhamento de xons 72

    A transerncia horizontal de genes 74

    ranserncia horizontal de genes e caractersticas estruturais

    do genoma 74

    ranserncia horizontal de genes de sequncias deminicrculos de kDNA de Trypanosoma cruzi para o genomada clula hospedeira 78

    Duplicao gnica: a maior ora da evoluo 80

    Consideraes Finais 85

    Reerncias Bibliogrcas 87

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    12/111

    A palavra genoma oi cunhada por Hans Winkler, em 1920,como uma conjugao de gene e cromossomo. No entanto, o con

    ceito geral de genoma pode ser atribudo ao sculo IV, antes da EraCrist, quando Aristteles apontou os primeiros conceitos em relao hereditariedade. Embora os trabalhos de Mendel, no naldo sculo XIV, tenham propiciado grandes contribuies no campoda hereditariedade, essa rea mostravase, ainda, bastante abstrata.Com o avano dos mtodos cientcos e das tecnologias, a hereditariedade passou a ser associada s estruturas presentes no ncleodas clulas chamadas cromossomos nal do sculo XIX e incio do

    sculo XX) e nalmente com os polmeros de nucleotdeos duplata chamados de DNA (meados do sculo XX), que ormam os cromossomos.

    Anteriormente ao advento do sequenciamento de molculas deDNA, os cromossomos orneceram as primeiras noes detalhadas

    O Genoma e

    sua HistriaAna Maria CostaCsar Martins

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    13/111

    12 Estrutra e evoluo dos genomas

    sobre a organizao sica do genoma. Mesmo aps avanos signicativos obtidos por meio do sequenciamento completo de genomas,os cromossomos continuam sendo a base para a compreenso dogenoma, j que possibilitam integrar diversos tipos de inormaes

    na gerao de mapas genticos sicos detalhados das espcies.As primeiras evidncias da existncia do DNA, no ncleo dasclulas, oram obtidas pelo jovem cientista suio Friedrich Miescher,em 1869. Miescher, aos 25 anos de idade, identicou uma substnciarica em soro que no se enquadrava como nenhuma das substncias proteicas conhecidas at aquele momento. A essa substncia eledeu o nome de nuclena. Embora alguns anos mais tarde WaltherFlemming (1889) tenha cunhado a palavra cromatina e Wilhelm

    Waldeyer (1888) o termo cromossomo, nenhuma relao clara haviasido eita entre cromatina/cromossomo e nuclena. Em 1889, RichardAltman obteve amostras de nuclena livres de protena e cunhouuma denominao mais apropriada para a substncia: cido nuclei-co. Aps esse perodo, a composio das molculas de cido nucleico oi deduzida e, por volta de 1930, a nuclena se tornou o cidonucleico desoxirribose e, posteriormente, cido desoxirribonucleico.At aquele momento, existiam questionamentos acerca da molcu

    la que carregava a inormao hereditria. As primeiras evidnciasde que o DNA era o material gentico oram obtidas por Avery,MacLeod e MacCarty, em 1944. A partir desse momento, importantes descobertas ocorreram nos anos seguintes, incluindo as primeiras hipteses sobre a estrutura do DNA e as descobertas quelevaram sntese de Watson e Crick, em 1953, sobre a estrutura doDNA e a subsequente decirao do cdigo gentico. A histria dosestudos em genoma acompanham os avanos recentes em genticae biologia molecular. Ao contrrio de outras reas como a sica,matemtica e losoa, essa rea muito recente e vem se desenvol

    vendo de orma muito dinmica (Fig. 1). Dessa orma, a genmicacomo cincia existe desde os primeiros estudos bsicos sobre estrutura cromossmica, chegando aos avanos recentes relacionados ao

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    14/111

    13O genoma e sua histria

    sequenciamento de genomas inteiros. Assim, o genoma pode serentendido como o complemento gnico completo (no sentido degentipo ou o DNA total presente no lote cromossmico haplide.

    Conhecimento

    Tempo

    1880

    1940

    Matemtica

    Filosoa

    Fsica

    Gentic

    a

    Biologia

    Molecul

    ar

    Fig. 1. Avanos no conhecimento, ao longo do tempo, nas dierentes reas da cincia e da losoa.

    Por volta de 1950, diversos trabalhos comearam a utilizar a terminologia classes de DNA como reerncia ao contedo de DNAde clulas diplides (Classe I) e haplides (Classe IC). Uma ormaderivada utilizada com base nesses trabalhos para denir a quantidade de DNA em um ncleo haplide oi o valorC. Uma vezque o DNA o material hereditrio, poderamos considerar que as

    variaes detectadas no tamanho do genoma estariam reetindo variaes no nmero de genes. No entanto, essa considerao passou a

    perder sua validade a partir das comparaes que comearam a sereitas entre espcies.

    Em 1951, Mirsky e Ris publicaram um trabalho sobre o contedode DNA das clulas de uma ampla gama de organismos animais,mostrando um verdadeiro paradoxo (paradoxo do valorC), uma

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    15/111

    14 Estrutra e evoluo dos genomas

    vez que o aumento da complexidade no estava correlacionado comaumento no genoma e do nmero de genes. No entanto, com a descoberta de que grande parte do DNA eucaritico representadapor sequncias nocodicaroras, o paradoxo do valorC parecia

    parcialmente resolvido. Entretanto, essa questo oi, ainda, tema dedebates que persistiram durante a segunda metade do sculo XX,envolvendo diversos aspectos relacionados evoluo do genoma.

    Diversos trabalhos de R Gregory, publicados nos anos subsequentes a 2000, enatizam que a evoluo do tamanho do genoma mais bem denida como um complexo quebracabea denominado Enigma do ValorC. Para compreender esse enigma, precisamos responder a dierentes e independentes questes que norteiam

    diversos aspectos da biologia das espcies, tais como: (1) variaodo tamanho do genoma nas dierentes taxas; (2) quantidade, tipoe distribuio de DNA nocodicador nos dierentes organismos;3 mecanismos de perda e ganho de DNA ao longo do tempo; e 4uno do DNA nocodicador.

    As ltimas dcadas do sculo XX representaram um perodoparticularmente excitante para a biologia. Novos mtodos de anlises de protenas, DNA e RNA levaram a uma exploso de inorma

    es que permitiram aos cientistas estudar os organismos, as clulase suas molculas de orma mais detalhada. Essas novas tecnologiastm permitido no somente decirar as inormaes, mas, tambm,a orma com que os componentes moleculares interagem, ormandoclulas e organismos complexos e uncionais.

    At o incio dos anos de 1970, o DNA era uma molcula dicilde ser analisada bioquimicamente. Hoje, graas ao desenvolvimentodas tecnologias de manipulao do DNA, ela uma das molculasmais ceis de ser estudada. Regies especcas do DNA podem seracilmente isoladas, propagadas em nmero inimaginvel de vezese sequncias nucleotdicas de milhes de pares de bases podem serconhecidas em questo de horas. O desenvolvimento de trs tecnologias em particular, a restrio enzimtica e a reao em cadeia da

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    16/111

    15O genoma e sua histria

    polimerase (Polymerase Chain Reaction PCR) e o sequenciamentodo DNA possibilitou avanos signicativos na manipulao e noconhecimento do genoma.

    Em 1962, W. Arber orneceu as primeiras evidncias da existn

    cia das nucleases de restrio, que so enzimas bacterianas de clivagem de DNA que reconhecem sequncias curtas de bases e azemum corte na dupla hlice do DNA. Sua uno na clula bacteriana cortar e destruir DNAs virais estranhos que possam ter entradona clula. Um aspecto importante que as enzimas de restrio noclivam aleatoriamente o DNA e sim em sequnciasalvoespeccas,o que az delas uma erramenta poderosa na manipulao do DNA.Qualquer molcula de DNA, de vrus a humanos, contm stiosalvo

    de enzimas de restrio, distribudos aleatoriamente de orma queragmentos de DNA de tamanhos adequados possam ser produzidos para clonagem. Os stios de restrio no possuem relevnciauncional, uma vez que a maioria dos organismos no possui enzimas de restrio.

    Em 1985, K. B. Mullis e colaboradores inventaram a PCR, tecnologia que permite uma rpida e eciente amplicao de regies especcas do genoma. Precisamente, essa reao possibilita que uma

    regio selecionada do genoma seja amplicada milhes de vezes,permitindo seu isolamento do resto do genoma. Dessa orma, osconhecimentos gerados, nos ltimos 50 anos, permitiram avanossignicativos no esclarecimento da organizao estrutural e uncional dos genomas.

    Grande parte dos genomas que oram completamente sequenciados utilizou o mtodo de Sanger (SANGER et al., 1977), que possibilita a determinao da sequncia nucleotdica ordenada de umragmento de DNA. Embora esse mtodo tenha sido melhorado aolongo das ltimas dcadas, seus princpios continuam os mesmos.Nessa tcnica, o DNA a ser sequenciado desnaturado inicialmente em tas simples por aquecimento, com posterior anelamento deuma sequncia de iniciadores marcado com soro radioativo (P32)

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    17/111

    16 Estrutra e evoluo dos genomas

    no nal da extremidade 3 de uma das tas simples. Essa soluo dividida em quatro amostras correspondendo s quatro bases doDNA. DNA polimerase e desoxinucleotdeos (dAP, dCP, dGP,dP so adicionados a cada amostra, sendo posteriormente adi

    cionada a cada uma das amostras dideoxinucleotdeos correspondendo s quatro bases ddAP, ddCP, ddGP, ddP. Dessa orma, so montadas quatro reaes idnticas, exceto pela presena dedideoxinucleotdeos de Adeninas na primeira reao, dideoxinucleotdeos de iminas, na segunda reao, e assim sucessivamente.

    Os dideoxinucleotdeos so estruturalmente similares aos nucleotdeos normais, exceto pela presena de um hidrognio no carbono3 do acar, em vez de um grupo hidroxila. Esse nucleotdeo mo

    dicado, quando incorporado na cadeia de DNA nascente, impedea incorporao de um prximo nucleotdeo e consequentementeinterrompe a sntese da ta de DNA. Dessa orma, ao nal de cadareao se orma uma coleo de milhares de molculas terminando no mesmo nucleotdeo. Quando essas molculas so separadaspor eletroorese, possvel identicar a posio na ta de DNA dosdideoxinucleotdeos especcos daquela reao. A anlise conjuntadas reaes contendo dideoxinucleotdeos para as quatro bases per

    mite a leitura ordenada da sequncia de bases do DNA.Na dcada de 1980, iniciativas comearam a ser discutidas para osequenciamento de diversos genomas de espcies modelo, incluindohumanos. No incio da dcada de 1990, o desenvolvimento de dideoxinucleotdeos marcados com corantes, assim como o desenvol

    vimento das mquinas de sequenciamento por capilaridade, permitiram um aumento considervel da capacidade de sequenciamento.

    O primeiro genoma completamente sequenciado oi do bacteriago phiX174, com 5.375 pares de base (pb) contendo 9 genes(SANGER et al., 1977). O sequenciamento desse genoma viral representou um passo signicativo, pois indicava que genomas maiscomplexos poderiam tambm ser sequenciados.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    18/111

    17O genoma e sua histria

    O primeiro eucarionte sequenciado oi o ungo Saccharomycescerevisiae, com 13 milhes de pb, cujo genoma oi somente determinado quase vinte anos aps o primeiro sequenciamento realizado (GOFFEAU et al., 1996). Nos anos seguintes, os avanos

    continuaram e o primeiro animal a ter seu genoma sequenciadooi o nematdeo Caenorhabditis elegans com 100 milhes pb HEC. ELEGANS SEQUENCING CONSORIUM, 1998); a primeiraplanta sequenciada oiArabidopsis thaliana com 157 milhes de pbHEARABIDOPSIS GENOME INIIAIVE, 2000.

    A idia de sequenciamento do genoma humano comeou a serdiscutida por volta de 1985 e o primeiro rascunho da sequncia nucleotdica do genoma humano saiu em 2001 (INERNAIONAL

    HUMAN GENOME SEQUENCING CONSORIUM, 2001;VENER et al., 2001). Embora o sequenciamento completo dediversos genomas tenha sido divulgado, incluindo o genoma humano, muitas incorrees ainda existem, principalmente relacionadasao correto posicionamento no genoma de determinados segmentossequenciados. Alm disso, o correto arranjo e o posicionamento dagrande quantidade de sequncias repetitivas de DNA presentes nogenoma representam, ainda, um desao para os sistemas atuais de

    montagem da sequncia nucleotdica ordenada do genoma.Aps 30 anos de avanos, existiam, em outubro de 2007, maisde 600 genomas sequenciados que cobrem mais de 180 espcies. Amaior parte dos dados desses organismos sequenciados pode seracessada on-line por meio dos seguintes stios na internet:

    http://www.genomenewsnetwork.org/resources/sequenced_genomes/genome_guide_p1.shtml

    http://cmr.tigr.org/tigrscripts/CMR/CmrHomePage.cgi http://www.ncbi.nlm.nih.gov/sites/entrez?db=Genome http://www.genomesonline.org/

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    19/111

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    20/111

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    21/111

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    22/111

    21Uma viso geral dos genomas: de vrus a humanos

    ou segmentada, j que a base da nomenclatura viral est no tipode genoma que possui. Em seguida, sero apresentados dierentesgrupos virais com base na estrutura do seu cido nucleico.

    Vrus de DNAApresentam seu material gentico na orma de ta dupla (dsDNA)

    ou ta simples ssDNA.Como exemplos de vrus de DNA ta dupla podem ser citados

    os vrus da varola, herpes, hepatite B, citomegalovrus, adenovrus e alguns bacteriagos. De acordo com o ICV, existem 22amlias de vrus que possuem dsDNA (Poxviridae, Iridoviridae,Herpesviridae, Adenoviridae, Polyomaviridae, Papillomaviridae,

    Asarviridae, Myoviridae, Siphoviridae, Podoviridae, ectioviridae,Corticoviridae, Plasmaviridae, Lipothrixviridae, Rudiviridae,Fuselloviridae, Guttaviridae, Phycodnaviridae, Polydnaviridae,Ascoviridae, Baculoviridae, Nimaviridae. Seus genomas variam de5 quilos de base (kb) a 375 kb e inectam bactrias, arqueobactrias,amebas, micoplasmas, algas, ungos, invertebrados e vertebrados.Interessantemente, no se conhece vrus de dsDNA que inectaplantas.

    Existem cinco amlias de vrus de ssDNA (Inoviridae,Microviridae, Geminiviridae, Circoviridae, Parvoviridae). Comoexemplo de vrus de DNA ta simples, existem os bacteriagosphiX174 e o vrus AAV Adenoassociated virus. Seus genomas

    variam de 1,7 kb a 8,5 kb e podem inectar bactrias, micoplasmas,spiroplasmas, plantas, invertebrados e vertebrados.

    Durante a ineco, a maioria dos vrus dsDNA de vertebradosestimula a replicao do DNA da clula hospedeira, ou, pelo menos,

    os estgios iniciais de replicao do DNA, para preparar um ambienteadequado para a replicao do seu prprio DNA. Esse ambienteavorvel inclui a presena de atores celulares requeridos para areplicao do DNA, assim como, aumento celular da quantidade de

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    23/111

    22 Estrutra e evoluo dos genomas

    substrados requeridos para a sntese de DNA. Alm disso, algunsvrus causam prolierao celular, ao menos no incio da ineco.Por isso, muitos vrus so conhecidos como causadores de tumoresem humanos e em outros animais.

    Vrus de RNA fta simples positiva

    Os vrus de RNA ta simples positiva [ssRNA(+)] compreendemum grupo extenso ormado por muitas amlias virais. Entre esses

    vrus, esto os causadores de diversas doenas em humanos comoa encealite, a hepatite, a poliartrite, a ebreamarela, a dengue, apoliomielite e a gripe. Existem sete amlias de vrus ssRNA(+)que inectam humanos, dos quais alguns tambm inectam outros

    vertebrados, causando importantes patogenias em animais domsticos. A maioria dos vrus que inectam plantas possui genoma comssRNA(+) e classicada em nove amlias e alguns gneros nodenidos. Outras amlias de vrus ssRNA(+) incluem duas amliasque inectam bactrias.

    O genoma dos vrus ssRNA(+) contm Open Read Frames ORFse codica diversas classes de protenas como helicase, proteasepapanalike e RNA polimerase. Um exemplo de organizao ge

    nmica dos vrus ssRNA(+) pode ser obtido por meio da anlise demembros da amlia Picornaviridae. O genoma dessa amlia viralcontm uma nica molcula de RNA de cerca de 7.5 kb que possuiuma ORF que traduzida em uma nica e longa poliprotena. Essapoliprotena clivada por uma ou mais proteinases codicadas pelo

    vrus ormando 25 dierentes polipeptdeos.

    Vrus de RNA fta simples negativa

    Sete amlias de vrus possuem seus genomas na orma deRNA ita simples negativa [ssRNA()] e provocam srias epidemias em humanos como raiva, encealite, ineces do tratorespiratrio e ebre hemorrgica. Vrus pertencentes s amlias

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    24/111

    23Uma viso geral dos genomas: de vrus a humanos

    Paramyxoviridae, Rhabdoviridae, Filoviridae e Bornaviridae possuem seus genomas na orma de RNA no segmentados e organizados de orma similar. Essas amlias so agrupadas na ordemMononegavirales. As outras trs amlias de vrus ssRNA(),

    que incluemArenaviridae, Bunyaviridae e Orthhomyxoviridae, possuem genomas segmentados com dois, trs e seis a oito segmentos,respectivamente. Independentemente de o genoma ser segmentado ou no, os vrus ssRNA() possuem um conjunto similar degenes. Nos vrus da ordemMononegavirales, a ordem dos genesest conservada em todos os membros da amlia. Nos vrus comgenomas segmentados, os genes podem ser ordenados por meiodo alinhamento dos segmentos.

    Para todos os vrus ssRNA, o primeiro evento na ineco asntese de RNAm a partir do genoma pela RNA polimerase presenteno nucleocapsdeo, uma vez que essa polimerase necessria paraa produo do RNAm e as protenas traduzidas requeridas para areplicao do genoma, o genoma nu dos vrus ssRNA(), no soinecciosos. Mltiplos RNAs mensageiros so produzidos dos genomas ssRNA e a maioria dos RNAm traduzida em um nicopolipeptdeo. No entanto, alguns poucos genes produzem RNAs

    mensageiros que so traduzidos em mais de um produto. Produtosmltiplos podem ser produzidos com base em um mesmo gene pormeio do uso de traduo alternativa dos cdons da iniciao, durantea traduo de um RNAm. Ao contrrio dos vrus ssRNA(+), os vrusssRNA() no produzem poliprotenas que requerem processamentopor proteases codicadas pelo prprio vrus. A replicao do genomassRNA() requer a produo de uma cpia complementar do genoma,chamada de antigenoma ou RNA vruscomplementar (vcRNA). Osgenomas de todos os vrus ssRNA possuem sequncias terminaisinvertidas que podem ter papel na circularizao do genoma dealguns desses vrus. A circularizao do genoma pode ser requeridapara a replicao do genoma ou a mesma para a sntese de RNAm.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    25/111

    24 Estrutra e evoluo dos genomas

    Vrus de RNA fta dupla

    A maioria dos vrus contendo RNA ta dupla (dsRNA) pertence amlia Reoviridae e possue 10, 11 ou 12 segmentos de dsRNAno seu genoma, tatalizando 16 kb a 27 kb. Esse grupo de vrus

    inecta um amplo espectro de organismos incluindo vertebrados,invertebrados, plantas e ungos. Vrios deles vrus so importantesagentes patognicos em humanos. A amlia Reoviridae possui 12gneros, dos quais o Orthoreovirus bastante estudado, j que inecta muitas espcies de mameros, incluindo humanos. O genomados Orthoreovirus consiste de dez segmentos de dsRNA que variade tamanho de 1,2 kb a 3,9 kb e somam 23.5 kb. Os dez segmentosso agrupados em trs classes chamadas L para grande, M para

    mdio e S para pequeno, e so responsveis pela produo de 11ou 12 protenas distintas.

    Vrus de transcrio reversa

    Duas amlias de vrus animais utilizam transcriptase reversa(R) na replicao do seu genoma: Retroviridae e Hepadnaviridae.Alm disso, dois gneros de vrus de plantas, com ciclos de vida si

    milares amlia Hepadnaviridae tambm utilizam R. Nesses vrus,a inormao gentica no genoma alterna entre o estado de RNA eDNA. A R, codicada pelo genoma viral, converte o genoma deRNA dos retrovrus, ou uma cpia de RNA do genoma de DNA doshepadnavrus, em DNA duplata. No ncleo da clula inectada, aRNA polimerase celular transcreve o DNA do genoma do hepadna

    vrus ou a cpia de DNA do retrovrus produzindo RNA a ser transcrito pela R. Os hepadnavrus e os vrus de plantas transcrevem,

    reversamente, o RNA em DNA durante o empacotamento. Dessaorma, a replicao do genoma dos retrovrus ocorre no sentidoRNADNARNA, enquanto a replicao do genoma dos hepadnavrus ocorre no sentido DNARNADNA. Uma caractersticainteressante da transcrio reversa a destruio do molde de RNA

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    26/111

    25Uma viso geral dos genomas: de vrus a humanos

    no processo de converso para DNA. A R possui, associada a ela,uma atividade RNase H que degrada a ta de RNA de uma molculahbrida RNADNA. Essa atividade essencial para a produo deuma cpia de DNA duplata a partir do RNA viral pela R.

    Particularmente no que se reere aos retrovrus, aps a ineco,a cpia de dsDNA integrada no cromossomo da clula hospedeira e passa a ser chamada de provrus. Somente o DNA integrado estvel e e ecientemente transcrito pela maquinaria da clulahospedeira, sendo a integrao requerida para produzir a ineco.Entretanto, durante a ineco de hepadnavrus, o DNA no integrado no genoma hospedeiro. Ao contrrio disso, o DNA mantidono ncleo como epissomos noreplicativos estveis e so eciente

    mente transcritos pela maquinaria da clula hospedeira.Supese que retrovrus tenham evoludo pela aquisio de genes, lhes permitindo deixarem a clula e se tornarem inecciosos(por exemplo, genes que cocam as protenas que ormam o envelope). possvel, tambm, que eventos contrrios tenham ocorrido,em que retrovrus deram origem aos retrotransposons.

    Genoma bacteriano

    radicionalmente, a terminologia bactria tem sido utilizadacomo reerncia a procariontes de orma geral. No entanto, recentemente, tornase claro que os procariontes compreendem dois grupos distintos, denominados de Arqueobactria e Eubactria, quedivergiram muito cedo na histria evolutiva do planeta. Em nvelmolecular, as arqueobactrias so mais parecidas com os eucariotos,apresentando uma maquinaria de replicaao, transcrio e traduo

    semelhante.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    27/111

    26 Estrutra e evoluo dos genomas

    Estrutura do genoma bacteriano

    Acreditase que as bactrias mantenham caractersticas das primeiras ormas de vida que existiram na terra e que representem oshabitantes mais antigos do planeta. As dimenses micromtricas da

    clula bacteriana ornecem uma congurao estvel para o metabolismo celular e replicao do DNA. Alm disso, sua habilidade decrescer e se dividir sob uma ampla diversidade de condies ambientais revelam sua capacidade de adaptarse e alterar a biosera.

    A principal caracterstica que dierencia as clulas eucariticasdas clulas procariontes diz respeito presena de um envelope ouenvoltrio que delimita o contedo de DNA no ncleo das clulaseucariticas, que est ausente nos procariontes, e organelas mem

    branosas. Alm disso, as clulas procariontes so simples e pequenase vivem, em sua maior parte, como indivduos unicelulares. Essasclulas so protegidas por uma parede celular que reveste externamente a membrana plasmtica, que, por sua vez, delimita um compartimento citoplasmtico nico contendo DNA, RNA, protenas emuitas outras molculas vitais.

    A maioria dos genomas bacterianos consiste de uma nica molcula circular de DNA, embora molculas lineares de DNA tenham

    sido encontradas em algumas espcies comoAgrobacterium tumefa-ciens, Rhodobacter capsulatus, Brucella melitensis e Rhizobium spp.Nos cromossomos bacterianos circulares, o DNA no existe emum crculo aberto relaxado. Os 3 a 4 milhes de pares de bases doDNA encontrados em um genoma bacteriano tpico equivale a cercade 1.000 vezes o tamanho da bactria. O DNA bacteriano encontrase extremamente compactado, por meio da ormao de complexoscom vrias protenas, no est ligado a protenas histonas como o

    DNA eucaritico (discutido mais adiante nesta obra). Na microscopia eletrnica, o DNA bacteriano requentemente apresentasecomo um aglomerado distinto, o nucleoide, que connado a umaregio denida do citoplasma. Se uma bactria rompida suavemente, seu DNA se espalha em uma srie de alas torcidas. As alas

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    28/111

    27Uma viso geral dos genomas: de vrus a humanos

    so presas umas s outras por protenas. Alm do DNA do nucleoide, muitas bactrias possuem DNA adicional sob a orma de pequenas molculas circulares chamadas plasmdeos, que se replicamindependentemente do cromossomo.

    Evoluo e dinmica do genoma bacteriano

    O genoma bacteriano possui capacidade signicativa de sorermudanas, embora se mantenha relativamente constante. Essesestados opostos ornecem mecanismos essenciais para algumasalteraes e tambm para a manuteno de certa constncia nogenoma bacteriano. O tamanho do genoma bacteriano, dentro deum gnero, permanece praticamente constante, com potencial para

    pequenas mudanas na ordem dos genes. No entanto, uma ormadas clulas bacterianas para alterar o tamanho dos seus genomas perder ou adquirir um ou mais plasmdeos. Os genomas bacterianos podem variar de 1 a 9 milhes de pares de bases (abela 1).Essa amplitude por causa da diversidade evolutiva das dierentesespcies de bactrias. Os genomas de Escherichiacoli e Salmonellatyphimurium (ambos microorganismos Gramnegativos) possuemcerca de 4 milhes de pares de bases. Isso equivalente ao peso

    molecular de 3 x 109 Daltons e comprimento de cerca de 1,5 mm.Os cromossomos de E.coli e S. typhimurium, tambm, possuempropriedades comuns, uma molcula nica, contnua, empacotadae helicoidizada negativamente, permitindo que sua estrutura nucleotdica orme curvaturas em sequncias especcas de DNA.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    29/111

    28 Estrutra e evoluo dos genomas

    Tabela 1. Espcies de bactrias e caractersticas dos seus genomassequenciados.

    EspciesTamanho do

    genoma em Mb

    Nmero

    de genes

    Bactria

    Mycoplasma genitalium 0,58 468

    Mycoplasma pneumoniae 0,82 687

    Rickettsia prowazekii 1,11 834

    Treponema pallidum 1,14 1.041

    Aquiex aeolicus 1,55 1.544

    Helicobacter pylori 1,67 1.590

    Methanobacterium thermoautotrophicum 1,75 1.013

    Haemophilus infuenzae 1,83 1.740Thermotoga maritima 1,87 1.877

    Synechocystis sp 3,57 3.168

    Bacillus subtilis 4,21 4.099

    Mycobacterium tuberculosis 4,45 4.402

    Escherichia coli 4,64 4.289

    Myxococcus xanthus 9,20 7.380

    Arqueobactrias

    Methanococcus jannaschii 1,66 1.750

    Archaeoglobus ulgidus 2,17 2.493

    Nanoarchaeum equitans 0,49 552

    Fonte: www.ncbi.nlm.nih.gov

    Diversos trabalhos sobre evoluo e tamanho do genoma bacteriano tm mostrado que o tamanho do genoma no est distribudonas mdias aritmticas de 3.812 kb para as bactrias Gramnegativase 3.115 kb para as bactrias Grampositivas. Outro aspecto evidente

    que o tamanho do genoma pode variar grandemente entre dierentes cepas (LAWRENCE; HENDRICKSON, 2005). Isso ocorre,por exemplo, com Pseudomonas aeruginosa, cujos tamanhos dosgenomas podem variar de 4.100 kb a 5.400 kb, 5.460 kb a 5.900 kb ede 2.200 kb a 2.800 kb, dependendo da cepa analisada REVORS,

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    30/111

    29Uma viso geral dos genomas: de vrus a humanos

    1996. Adicionalmente, dierenas na mdia do tamanho dos genomas podem variar dependendo se orem utilizados tamanhos de genomas Gramnegativos ou Grampositivos nos clculos e a presenaou ausncia de plasmdios, especialmente megaplasmdios como

    ocorrem em Rhizobium spp. Bactrias relacionadas possuem tamanhos similares do seu genoma com pequenas variaes no contedode G + C guanina + citosina em dierentes partes do genoma. Emadio, as bactrias apresentam uma ampla variao do contedo G+ C de 23 % a 72 %.

    possvel que bactrias com genomas grandes sejam resultado da duplicao do tamanho do cromossomo durante a evoluo.Adicionalmente, a maior parte dos cromossomos bacterianos tem

    cado estvel durante milhes a bilhes de anos de evoluo. Asbactrias possuem sequncias de DNA que, normalmente, no soexpressas, mas esto sujeitas a eeitos mutacionais que podem tornlas uncionais. Os plasmdeos representam umpoolsignicantede diversidade de inormao gentica. Os plasmdeos variam emtamanho de 1 kb a 400 kb, dos quais os de maior tamanho podemrepresentar 10 % ou mais do genoma da bactria, dependendodo tamanho do cromossomo da bactria hospedeira. Por sua vez,

    a ocorrncia de plasmdeos pode variar em espcies particulares.Populaes naturais de Pseudomonas contm plasmdeos de tamanhos diversos o que ajuda na determinao de entipos similaresou dierentes. Os plasmdeos promovem transerncia de inormao gentica entre bactrias pertencentes a uma mesma unidadetaxonmica ou mesmo para bactrias pertencentes a dierentesgrupos. Essa engenharia gentica in vivo, promovida pelas bactrias, tem permitido mudanas acentuadas no tamanho do genoma.Outro aspecto signicativo o dierente nmero de cpias dos plasmdeos que podem existir nas bactrias.

    As clulas bacterianas mantm uma constncia relativa do seugenoma ao mesmo tempo em que sorem mudanas por mecanismos de recombinao gentica, adquirindo e perdendo plasmdeos

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    31/111

    30 Estrutra e evoluo dos genomas

    e transposons (material gentico capaz de promover sua mobilizao dentro do genoma e realizando transduo e deleo/inserode DNA (DOBRIND; HACKER, 2001). Esses mecanismos originam ormas variantes e uma diversidade acentuada nas populaes

    de bactrias. Exposies a condies severas de estresse levam a delees e amplicaes contguas, conhecidas por tandem, muito comuns nos genomas bacterianos. A alta complexidade genmica dasbactrias de vida livre, em comparao complexidade genmicareduzida nas bactrias parasitas intracelulares, sugere que o contedo genmico reete o estilo de vida das bactrias, como resultado deprocessos de otimizao genmica (DOBRIND; HACKER, 2001).

    A anlise dos genomas sequenciados de bactrias mostrou que

    quase todo seu DNA (85 % a 90 %) codica para RNA estruturaisou protenas. Dessa orma, o tamanho do genoma bacteriano proporcional ao nmero de genes. Embora no se saiba a uno detodos esses genes, cerca de 60 % deles apresentam homologia entreas dierentes espcies. Esses genes esto envolvidos com metabolismo, estrutura celular, transporte e regulao da expresso gnica,mecanismos esses essenciais na estrutura e uno bsica da clula.O nmero de genes pode variar de 500 a 1.200, entre as bactrias

    parasitas intracelulares obrigatrias, 1.500 a 7.500, entre as bactriasde vida livre, e 1.500 a 2.700 entre as arqueobactrias abela 1.

    Organizao dos genes bacterianos

    Nas bactrias, existe uma equivalncia exata entre um trecho especco de DNA de um gene e o nmero de aminocidos na protena codicada por esse gene. De acordo com o cdigo gentico, trsnucleotdeos do DNA gnico so necessrios para codicar cada

    aminocido do polipeptdeo da protena. Dessa orma, um genebacteriano consiste de uma sequncia de DNA que transcrita emuma molcula de RNA (RNA mensageiro RNAm) que ser traduzida na sequncia de aminocidos de um polipeptdeo (Fig. 2).

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    32/111

    31Uma viso geral dos genomas: de vrus a humanos

    Os genes bacterianos esto requentemente organizados em blocosdenominados de clusters que incluem genes que codicam protenascujas unes esto relacionadas. Isso ocorre, por exemplo, com osgenes codicadores de enzimas que participam de uma via meta

    blica especca. Esses clusters gnicos representam uma unidadetranscricional nica, operon, responsvel pela sntese de um RNAmpolicistrnico, que codicar as dierentes protenas de unes relacionadas LEWIN, 2004.

    DNA

    RNAmTranscrio

    Traduo

    Protena

    Procarionte Eucarionte

    Ncleo

    Citoplasma

    DNA

    AAAAAA

    Exportao

    Traduo

    Protena

    AAAAA

    AAAAA

    Processamento do RNA

    RNAmprimrio

    Sequncialder

    Transcrio

    - Adio de sequncia lider 5- Adio de cauda poli-A

    xon ntron

    Fig. 2. Estrutura organizacional e uncional dos genes procariontese eucariontes.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    33/111

    32 Estrutra e evoluo dos genomas

    Genoma eucarionte

    Ao contrrio dos procariontes, a presena de um ambiente individualizado representado pelo ncleo permite a compartimentali

    zao de diversas unes gnicas nos eucariontes.No nal da dcada de 1970, oi descoberto que o RNAm dos

    eucariontes e de seus vrus era menor que o DNA genmico doqual haviam sido transcritos (BERGER et al., 1977; CHOW et al.,1977). Os genomas eucariontes contm genes interrompidos queconsistem de sequncias alternadas denominadas de xons (que semantm no RNAm nal), interespaadas por sequncias denominadas de ntrons que so removidas do RNAm imaturo. Os genes

    eucariticos so transcritos individualmente, cada qual produzindoum RNAm com inormao para apenas uma cadeia polipeptdica(RNAm monocistrnico). Existe apenas uma exceo geral a essaregra: no genoma do nematdeo C. elegans, ~15 % dos genes estoorganizadas em unidades policistrnicas (um RNAm que codica

    vrias cadeias polipeptdicas.Independente do tamanho do genoma, os procariontes em geral

    apresentam uma densidade mdia de 900 genes por Mb de DNA

    genmico, enquanto o genoma dos mameros apresenta uma densidade de 11 genes por Mb (PAHY, 2003). Essas caractersticasrepresentam consequncias organizacionais da presena de genesinterrompidos e de grande quantidade de sequncias de DNA nocodicadores DNAs repetitivos no genoma dos eucariontes.

    A expresso dos genes interrompidos requer um passo adicional que no ocorre nos genes no interrompidos dos procariontes.O RNAm ormado representa uma cpia exata da sequncia gen

    mica e apenas um precursor utilizado para a sntese da protena.Primeiramente, os ntrons so removidos do transcrito primrio,produzindo uma molcula de RNA composta apenas de uma sriede xons. Alm dessa modicao denominada de processamento,um grupo metilguanosina adicionado extremidade 5 da mo

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    34/111

    33Uma viso geral dos genomas: de vrus a humanos

    lcula e uma cauda de aproximadamente 150 a 200 adenosinas A adicionada na extremidade 3 do RNAm Fig. 2. A proporo degenes interrompidos baixa em ungos e aumenta consideravelmente nos eucariontes mais complexos. Em Saccharomices cerevisiae, a

    grande maioria dos genes (> 96 %) no interrompida. No existemgenes em S. cerevisiae com mais de 4 xons. Em insetos e mameros,a situao inversa: poucos genes apresentam sequncias codicadoras no interrompidas (6 % em mameros). Aproximadamente50 % dos genes de mameros possuem mais de 10 ntrons. Umaconsequncia desse padro de organizao reete no tamanho dosgenes. A mdia de tamanho de um gene de ungo de 1,4 kb e pouqussimos genes so maiores do que 5 kb.

    Grande parte dos genes dos organismos est presente em mais deuma cpia, o que az com que o nmero de dierentes tipos de genesseja menor do que o nmero total de genes. A presena de genesduplicados extremamente comum nos eucariontes e representaum aspecto importante para a evoluo do genoma (discutido noitem Duplicao Gnica: a maior ora da evoluo, nesta obra). Aduplicao gnica permite que as novas cpias do gene assumamunes mais especializadas ou mesmo possibilita a origem de no

    vos genes com unes totalmente distintas daquelas dos genes deorigem. A duplicao gnica permitiu a origem de novos genes quepassaram a dividir as unes celulares, permitindo, assim, um ganho de complexidade organizacional das clulas, tecidos e organismos. Em bactrias, a maior parte dos genes est presente na ormade cpia nica, enquanto, nos eucariontes superiores, a maioria dosgenes est organizada em amlias com um grande nmero de cpiasabela 2.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    35/111

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    36/111

    35Uma viso geral dos genomas: de vrus a humanos

    lmeros dos cromossomos, enquanto os DNAs repetitivos dispersosso encontrados como unidades isoladas ou agrupamentos distribudos ao longo do genoma. Embora extensivamente estudados nasltimas dcadas, as oras moleculares que governam a evoluo dos

    DNAs repetitivos no genoma so ainda muito discutidas (Fig. 3).GENOMA

    cloroplasto

    codificadorcodificador

    xons transposons

    no-codificador

    sequnciassimples

    sequnciasrepetitiva

    mitocondrial

    no-codificador

    pseudogenes ntrons DNA extragnico minissatlite microssatlitesatlite

    nuclear

    dispersastandemfamlias gnicas comgrande n de cpias

    citoplasmtico

    Fig. 3. Organizao do genoma dos eucariontes.

    O genoma dos eucariontes unicelulares apresenta a mesma escala de tamanho dos maiores genomas de bactrias (abela 3). Oseucariontes multicelulares apresentam um nmero maior de genes,mas no existe uma correlao exata com as variaes no tamanhodos genomas. Os ungos S. cerevisiae e S. pombe possuem genomas de 13,4 Mb e 12,5 Mb, com aproximadamente 6.000 e 5.000genes, respectivamente. O genoma do nematdeo C. elegans possui~18.500 genes e 97 Mb. O genoma da mosca de rutas Drosophila

    melanogasterpossui um genoma maior 165 Mb do que C. elegans,mas um nmero menor de genes (13.600). A razo pela qual a moscaderutas, organismo muito mais complexo, possuir apenas 70 %do nmero de genes do nematdeo no est bem compreendida.Isso mostra uma correlao entre o nmero de genes e a complexi

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    37/111

    36 Estrutra e evoluo dos genomas

    dade dos organismos. A plantaA. thaliana possui cerca de 25.000genes e um tamanho de genoma intermedirio entre o nematdeo ea mosca das rutas. Mostrando tambm uma tendncia das plantaspossurem um nmero maior de genes, provavelmente por causa

    dos eventos de duplicaes genmicas ancestrais mais comuns nessegrupo do que entre os animais.

    Tabela 3. Espcies eucariontes e caractersticas dos seus genomassequenciados.

    EspciesTamanho do

    genoma em Mb

    Nmero

    de genes

    Plasmodium alciparum 22,9 5.268

    Sacharomyces cerevisiae 13,5 6.034Sacharomyces pombe 12,5 4.929

    Caenorhabditis elegans 97 18.424

    Ciona intestinalis 160 16.000

    Drosophila melanogaster 165 13.601

    Anopheles gambiae 278 13.683

    Arabidopsis thaliana 119 25.498

    Rattus norvegicus 2.800 30.000

    Takiugu rubripes 400 30.000Homo sapiens 3.000 30.000

    Fonte: www.ncbi.nlm.nih.gov

    Um exemplo bastante interessante de complexidade e diversidade organizacional de genomas ocorre no peixe baiacu Takiugu ru-bripes, que possui o menor genoma dos vertebrados, com aproximadamente 390 Mb. Embora extremamente compacto, o genoma dessaespcie apresenta o mesmo nmero de genes quando comparado

    com o genoma humano, que quase oito vezes maior (abela 3).O sequenciamento do genoma do baiacu mostrou uma alta densidade gnica e genes com ntrons bastante reduzidos em tamanhoquando comparados com humanos. Enquanto o genoma humano

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    38/111

    37Uma viso geral dos genomas: de vrus a humanos

    possui apenas 3 % de sequncias codicadoras de protenas, o genoma do baiacu possui 17 %.

    Anlises dos genomas dos baiacus Takifugu rubripes e Tetraodonnigroviridis mostraram ainda uma quantidade reduzida de sequn

    cias repetitivas de DNA do tipo retrotransposons, quando comparados com humanos e camundongos. No entanto, esses peixes apresentam uma alta diversidade de classes de elementos transponveisno encontrada nos mameros. Essa diversidade de retrotransposons oi tambm observada no peixe Danio rerio (paulistinha) e nooi perdida aps a compactao do genoma nos baiacus (VOLFFet al., 2003. Acreditase que a alta diversidade de sequncias repetitivas de DNA presente nos peixes tenha representado um papel

    signicativo na radiao das espcies, o que levou a alta diversidadede espcies presentes neste grupo.

    Genoma das organelas

    Genoma dos cloroplastos e mitocndrias

    Os cloroplastos e mitocndias so organelas celulares portadoras

    de material gentico prprio. Acreditase que tenham se originado nos endossimbiontes ancestrais e que evoluram em organelas.Os cloroplastos provavelmente se originaram de endossimbiontesdo grupo das cianobactrias, enquanto as mitocndrias, de parentes das alaprotobactrias, grupo das riquetsias e semelhantesEMELYANOV, 2001, 2003; GRAY, 2001; BARBROOK et al., 2006,KUROIWA, et al., 2006; KHACHANE et al., 2007.

    Em virtude das suas origens, o material gentico dessas organe

    las normalmente composto por um nico cromossomo circularcom replicao semelhante aos seus ancestrais: do tipo anis FtsZMIYAGISHIMA, 2006 no caso dos cloroplastos, e do tipo MD nocaso das mitocndrias KUROIWA et al., 2006.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    39/111

    38 Estrutra e evoluo dos genomas

    Nas ltimas duas dcadas, muitos genomas de mitocndrias ecloroplastos oram sequenciados e analisados em termos de estrutura, regies nocodicadoras, presena de intros, contedo de genes, RNA ribossomais RNAr e contedo de RNA transportadores

    (EMELYANOV, 2001; 2003; GRAY, 2001; KHACHANE et al., 2007).Desses estudos, observouse que os genomas mitocondriais variam signicativamente no tamanho e na organizao estrutural,principalmente em relao extenso das regies no codantese presena de ntrons (EMELYANOV, 2001; 2003; GRAY, 2001;KHACHANE et al., 2007. Por exemplo, os genomas mitocondriaisde angiospermas so os maiores e mais complexos quando comparados com as demais mitocndrias. Contudo, o contedo gnico das

    mitocndrias e dos cloroplastos parece no variar, signicativamente, nas espcies analisadas BARBROOK et al., 2006.Nos cloroplastos, a estrutura e contedo gnico so altamente

    conservados, principalmente nos das plantas superiores. J os plastdeos das algas so mais variveis e contm uma srie de genes emcpia nica que esto ausentes nos cloroplastos das plantas superiores. Os genomas dos plastdeos codicam protenas envolvidasna transcrio e traduo, alm daquelas responsveis pelo aparato

    otossinttico BARBROOK et al., 2006.Em termos evolutivos, vericase uma ntida diminuio notamanho e complexidade dos genomas de mitocndrias e cloroplastos em relao aos seus provveis ancestrais GRAY et al., 2001;BARBROOK et al., 2006; KHACHANE et al., 2007. Alm da reduo no tamanho dos genomas, observase tambm uma reduo nospercentuais de C + G nesses genomas (KHACHANE et al., 2007).Observase que muitos genes oram transeridos das organelas parao ncleo dos hospedeiros, ou mesmo excludos do genoma GRAYet al., 2001; BARBROOK et al., 2006; KHACHANE et al., 2007). Porexemplo, os genes relacionados diviso dos cloroplastos e mitocndria oram transeridos para o ncleo da clula (MIYAGISHIMA,2006; KUROIWA, et al., 2006). O gene FtsZ oi duplicado e mo

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    40/111

    39Uma viso geral dos genomas: de vrus a humanos

    dicado, surgindo uma nova amlia de protenas envolvidas naregulao da diviso cloroplastidial (MIYAGISHIMA, 2006).

    Uma caracterstica dos genomas mitocondriais de tripanossomatdeos a presena de genes que realizam modicaes nos RNAm

    mitocondriais num processo chamado de edio. Esse mecanismo,detalhado no tpico seguinte, gera variabilidade nos transcritos pelasubstituio de bases, em geral, C para U e, em menor requncia, deU para C, com o auxlio de RNA guias (RNAg) e enzimas especcas. At recentemente, acreditavase que a edio osse um mecanismo restrito a essa amlia, contudo identicaramse, emArabidosisthaliana,aproximadamente 450 genes de enzimas participantes doprocesso, despertanto a ateno dos pesquisadores para o assunto

    SHIKANAI, 2006.

    Genoma mitocondrial de tripanossomatdeos

    O cinetoplasto uma mitocndria dos protozorios da amliakinetoplastidae. Est presente em cpia nica e contm o DNA mitocondrial do cinetoplasto kDNA. O kDNA representa 10 % a 25 %do DNA total dos kinetoplastidea (EIXEIRA et al., 2006) e estpeculiarmente arranjado, ormando uma estrutura complexa, com

    posta de pequenos segmentos de DNA circular catenados minicrculos) e de segmentos crculares maiores (maxicrculos) (SHAPIRO;ENGLUND, 1995.

    Os maxicrculos esto presentes na organela em nmero de 25 a100, conorme o tripanossomatdeo. Em termos de sequncia de bases do DNA, observase que cada molcula de maxicrculo apresenta um alto grau de homogeneidade entre si e carregam inormaespara a biognese mitocondrial. Os genes presentes nessas molculas,

    dierentemente de outros eucariotos, codicam RNA mensageirosque apresentam discrepncias nas ases de leitura, quando comparados s sequncias das suas protenas correspondentes, sugerindoparticipao de mecanismos de processamentos pstranscricio

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    41/111

    40 Estrutra e evoluo dos genomas

    nais caractersticos para se tornarem ativos (BENNE et al., 1986;FEAGIN et al., 1988.

    Os minicrculos variam em quantidade e tamanho entre os cinetoplastideos. Por exemplo, em Trypanosoma brucei, essas molculas

    variam entre 0,5 kb a 2,9 kb e esto presentes em mais de 10.000cpias por organela. No Trypanosoma cruzi, a grande maioria dosminicrculos est na aixa de tamanho entre 1,4 kb a 1,5 kb, e composta por quatro regies variveis semelhantes entre si, intercaladas, a cada 90 na molcula circular, por regies conservadas comaproximadamente 120 pb (SIMPSON, 1997). A heterogeneidadeentre minicrculos de tripanosomatdeos observada tanto interespcie, como intraespcie. Em T. brucei, estimase a existncia de

    300 classes de minicrculos dierentes, enquanto, em Trypanosomaequiperdum, todos os minicrculos apresentam alta homogeneidadena sequncia de bases do DNA. J o T. cruzi mostra um grau intermedirio entre os dois citados RIOU; YO, 1977. Em decorrnciade sua alta complexidade, a caracterizao de esquizodemas permiteidenticar isolados do parasita (MOREL et al., 1980; SURM, 1989;SIMPSON, 1997.

    O processo de edio oi descrito pela primeira vez por Blum

    et al. 1990, em T. brucei. A princpio, acreditavase que os RNAgseram codiicados pelos maxicrculos, porm Sturm e Simpson1990 mostraram que provinham da transcrio dos minicrculos.Os RNAgs so normalmente pequenos, em torno de 50 a 70 bases,e possuem uma cauda de uridina (poliU) na extremidade 3OHda molcula.

    O processo de edio promove modicaes nas sequncias debases dos RNA mensageiros imaturos (prRNAms), por meio dainsero, ou, em alguns casos, pela remoo de resduos uridinilados da molcula, como dito anteriormente. O mecanismo propostopara o processo prev a existncia de uma molcula de RNAg, comsequncia complementar em sua extremidade 5ostado ao prRNAm. Inicialmente, haveria o pareamento de 4 a 15 bases da regio

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    42/111

    41Uma viso geral dos genomas: de vrus a humanos

    complementar, que teria a nalidade de manter as tas unidas. Asbases no pareadas da extremidade 3OH do RNAg teriam a unode direcionar a edio (BLUM et al., 1990; HAJDUK et al., 1993;SEIWER, 1996. Vrios estudos sugerem que a estrutura secund

    ria do prRNAm a ser editado j seria suciente para expor o stioonde ocorreria a clivagem para a insero dos resduos uridinilados PILLER et al., 1995a, 1995b, 1996. Porm, existem transcritoscuja exposio do stio mediada pelo RNAg (KABLE et al., 1996;SEIWER et al., 1996; ALDER; HAJDUK, 1997). Aps a clivagemdo prRNAm, as enzimas uridilil transerase e (ou) terminal uridilil exonuclease ariam, respectivamente, a adio ou remoo dasuridinas de acordo com as inormaes contidas no RNAg. Findo o

    processo, as tas do RNA mensageiro maduro seriam religadas pelaRNA ligase mitocondrial CRUZREYES; SOLLNERWEBB, 1996;KABLE et al., 1996; SEIWER et al., 1996; ADLER; HAJDUK, 1997).

    Por meio da edio, o RNAm pode receber cdigos de iniciaoe de terminao, podem ocorrer mudanas das ases de leitura ouaumento do RNAm, o que, supostamente, permitiria uma maiorvariabilidade de transcritos (ALDER; HAJDUK, 1994; SEIWER,1996). Esse processo est presente em vrios tripanosomatdeos:

    Herpetomonas, Crithidia, Leishmania, e cinetoplastdeos correlacionados, tais como o ripanoplasma (SCO, 1995), e, inclusive,no T. cruzi VILA; SIMPSON, 1997.

    Tertulien et al. (1991; 1994) identicaram transcritos obtidoscom base em um banco de DNA complementar (cDNA) de T. cruzi,que correspondiam a sequncias de minicrculos, mas, sem as caractersticas tpicas de um RNAg. A uno desses transcritos aindano est bem denida, e sugere que os minicrculos sejam potencialmente capazes de codicar pequenos peptdeos.

    A quantidade de DNA, presente no cinetoplasto, varia em unodo estgio de desenvolvimento do parasita. Essa peculiaridade conhecida por descinetoplastidizao, e se caracteriza pela perda parcial ou total do kDNA (VICKERMAN; PRESON, 1976). O en

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    43/111

    42 Estrutra e evoluo dos genomas

    meno oi detectado, em condies naturais, nas ormas sanguneasdas espcies T. equiperdum T. evansi e T. brucei e recentemente nasormas sanguneas de T. cruzi. Mas pode ocorrer em consequnciaao tratamento com drogas, tais como brometo de etdio, acriavina,

    diamidinas e compostos relacionados. Nesse caso, as drogas atuariam ao nvel da enzima topoisomerase II, essencial para o processode replicao do kDNA.

    Em adio, Lee et al. (1992a, 1992b, 1993) relataram um novoenmeno conhecido como transcinetoplastidizao, em que variantes de Leishmania leishmania mexicana, resistentes a arseniato e tunicamicina, apresentaram uma alterao na sequncia dosmaxicrculos, bem como uma signicativa mudana na populao

    de minicrculos. Durante o enmeno, classes, antes pouco representadas, passam a ser majoritrias, enquanto as inicialmente bemrepresentadas, minoritrias. So necessrias 15 geraes do parasitapara que o evento se complete e populaes intermedirias so observadas no decorrer do processo LEE et al., 1994. Embora no seconheam os mecanismos de regulao que levam a expanso ouperda de determinados kDNAs, acreditase que esse material gentico de extrema importncia na adaptao do parasita s dierentes

    condies do meio ambiente.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    44/111

    Os mecanismos de recombinao so undamentais para a gerao da variabilidade e diversidade gentica. Esses mecanismos po

    dem ser agrupados genericamente em trs grandes categorias: (1)Recombinao homloga recombinao que ocorre com a participao de grandes regies de similaridade, normalmente entre cromtides irms de cromossomos homlogos; (2) recombinao stioespecca mediada por pequenas regies de identidade no localda recombinao; (3) recombinao nohomloga sem similaridade de sequncias no ponto da recombinao LEWIN, 2004.

    Basicamente, as ezimas que participam desses processos identi

    cam sequncias e (ou) estruturas caractersticas no DNA que, aoreconheclas, desencadeiam uma sequncia de eventos que culminam nos rearranjos do material gentico.

    Grande parte das mutaes e aberraes cromossmicas decorreu das recombinaes stioespeccas e nohomlogas. Essas

    Organizao Estruturale Instabilidade do

    Material GenticoAna Maria Costa

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    45/111

    44 Estrutra e evoluo dos genomas

    ormas de recombinaes esto presentes na incorporao de DNAsexgenos no genoma incorporao de vrus, retrovrus, DNAs obtidos por transormao, elementos de transposio) e no reparo deestruturas consideradas anormais pela clula, como as quebras da

    ta simples ou ta dupla do DNA, regies com pareamento de basesincorreto provenientes da recombinao homloga, estruturas dotipo ala, grampo, entre outras LEWIN, 2004.

    Ao longo do tempo, os eventos recombinativos promovem modicaes signicativas no contedo e distribuio dos genes noscromossomos contribuindo para evoluo dos genomas (Fig. 4). NaFig. 5, est ilustrada a complexidade dos eventos de recombinaoque contriburam para a ormao dos cromossomosdeA. thaliana,

    enmeno evidenciado aps o sequenciamento e anlise do genomadessa planta HE ARABIDOPSIS GENOME INIAIVE, 2000.Apesar do assunto ter recebido muita ateno nas ltimas d

    cadas, ainda existem muitas lacunas do conhecimento para serempreenchidas por causa da complexidade do enmeno.

    Como ser discutido adiante, atualmente observase que o ocoprincipal de grande parte das pesquisas no tema est voltado para aidenticao das enzimas participantes do processo. Acreditase que

    o resultado da recombinao mudaria conorme o perl enzimticono momento do evento, e, de acordo com o contexto celular, poderia ocorrer perdas (deleo), ampliaes (duplicao ou inserode DNA da clula ou de outro organismo) ou rearranjos diversosnas tas de DNA (inverso ou translocao de segmentos dentro doprprio cromossomo.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    46/111

    45Organizao estrutural e instabilidade do material gentico

    Ancestral comum

    Deleo

    Inverso Variante 1a

    Variante 1b

    Expanso

    Variante 2a

    Variante 2bDeleo

    Distanciamento

    gentico

    Fig. 4. Representao das mudanas na composio e na estruturado DNA de um cromossomo, ao longo do tempo, em consequnciade dierentes eventos recombinativos.

    5Mb 10Mb 15Mb 20Mb 25Mb 30Mb

    5Mb 10Mb 15Mb 20Mb 25Mb 30Mb

    Fig. 5. Distribuio e arranjo das repeties de segmentos de DNA

    no genoma deArabidospis thaliana

    . As cores semelhantes, destacadas do cinza, mostram repeties de segmentos cromossmicos presentes na orma direta (trapzios) ou invertidas (cones). Em preto,observamse as regies centromricas de cada cromossomo (HEARABIDOPSIS GENOME INIIAIVE, 2000.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    47/111

    46 Estrutra e evoluo dos genomas

    Uma das questes mais intrigantes, que tem despertado a ateno da pesquisa, o que torna uma determinada regio genmicaalvo preerencial de modicaes na sequncia de DNA em relaoa outras. Regies que so constantemente associadas a eventos de

    recombinao, ou que, quando clonadas, passam a ser denominadasde "instveis".Acreditase que alteraes na estrutura tipo B do DNA (dupla

    hlice, invertida e complementar passo direito), como predita porWatson e Crick (1953), poderiam ser reconhecidas pelas enzimasdos complexos de recombinao e desencadearem o enmeno.

    De concreto, vericase uma correlao direta entre os stios derecombinao e a alterao da estrutura local do DNA provocada

    pela presena de elementos repetitivos e pela distribuio de basesnuma ordem peculiar. Alguns trabalhos mostram que a clonagemde determinadas repeties gera recombinao stioespecca. Essetema ser aproundado no tpico Instabilidade de sequncias.

    Elementos repetitivos

    Em consequncia do Projeto Genoma, sabese hoje que ape

    nas 3 % do material gentico haplide de uma clula mamera composto por sequncias que codicam para cadeias polipeptdicas (exons), o restante compreende as chamadas regies nocodicadoras, onde esto distribudas as diversas repeties, de origem

    viral ou noviral, agrupadas genericamente em satlites, minissatlites microssatlites, telmeros, sequncias repetitivas curtas, entreelas, Sines short interspersed elements, ALU e MIR, e longas, taiscomo Line (long interspersed elements), L1 e L2 LR (long terminal

    repeats) (LEWIN, 1994; BERNARDI, 1995; KAZAZIAN; MORAN,1998, INERNAIONAL HUMAN GENOME SEQUENCINGCONSORIUM, 2001; KIM, et al., 2004; HAN et al., 2007). Nos grupos de sequncias repetitivas, curtas e longas, encontramse os ele

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    48/111

    47Organizao estrutural e instabilidade do material gentico

    mentos transponveis (elementos mveis), as sequncias interruptoras de genes (ntrons) e os provrus tanto de origem viral como retro

    viral BERNARDI, 1995; FAWCE, et al., 2006; HAN et al., 2007.Os elementos mveis, curtos e longos, so agrupados em duas

    categorias de acordo com a existncia ou no de um intermediriode RNA durante o processo de mobilidade no genoma. Na primeira categoria, esto as sequncias com capacidade de transposiodireta, tais como elementos transponveis de origem viral, sequncias IS, n, e muitos ntrons, que se mobilizam por mecanismosde recombinao nohomloga replicativa ou noreplicativa. Asegunda categoria compreende os elementos de origem retroviral etransposons que se locomovem via mecanismo de retrotransposio

    (FINNEGAN, 1983; WEISS et al., 1985; VARMUS, 1988; LEWIN,2004). De acordo com a similaridade de sequncias os dierenteselementos mveis podem, ainda, ser agrupados em superamlias,amlias e subamlias dentro de cada categoria HAN et al., 2007.

    A grande maioria das partculas mveis apresenta, em sua estrutura, as inormaes necessrias para promover a sua expanso, outranserncia de um ponto do genoma para outro. Contudo, algumas amlias necessitam da expresso de enzimas de outros elemen

    tos mveis ativos para se transporem, como no caso dos Sines, quese movimentam por retrotransposio com o auxlio da maquinaria de outros retrotransposons HAN et al., 2007; FAWCE, et al.,2006; GU, et al., 2007.

    Existe uma orte correlao entre as sequncias de bases dasrepeties que interrompem sequncias gnicas, os ntrons, e assequncias que compe o grupo dos elementos mveis no genoma. Essa semelhana levou a especulao de que os ntrons e os

    elementos mveis poderiam estar evolutivamente correlacionadosLAMBOWIZ, 1989; CAVALIERSMIH, 1991; HICKEY, 1992.

    As inseres de elementos mveis no genoma, dependendo danatureza do elemento repetitivo, podem alterar a expresso gnica

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    49/111

    48 Estrutra e evoluo dos genomas

    (DEININGER et al., 2003); se rico em regies CG, como no casodos elementos Alu, podem introduzir novas ilhas CpG (LANDERet al., 2001, gerar delees HAN et al., 2005, criar novos genes ouamlias gnicas XING et al., 2006.

    As sequncias repetitivas semelhantes, mveis ou no mveis,podem estar arranjadas prximas umas das outras ormando estruturas simples ou complexas, genericamente classicadas quanto ssuas orientaes na ta de DNA. Desse modo, duas repeties prximas, estando na mesma orientao, ormam uma estrutura simplesdenominada de repetio direta. Igualmente, duas repeties comsequncias invertidas entre si, ou invertidas e complementares, soclassicadas no grupo das repeties invertidas, ou no grupo das pa

    lindrmicas, respectivamente. Essas sequncias podem estar ligadasumas s outras, ormando estruturas complexas, tambm conhecidas por tandens. Estruturas simples ou complexas so encontradas tanto dentro, como ora de regies transcritas (LEWIN, 2004).

    Conorme a organizao das repeties e da natureza da sequncia em termos de composio e distribuio das bases, o DNA podeassumir localmente estruturas dierentes das preditas por Watsone Crick (1953), ou seja, pode ormar estruturas dierentes das do

    tipo B (dupla hlice invertida e complementar de passo direito) eormar ala, grampos, estruturas cruciormes, estruturas do tipo Z,curvas e dobramentos, estruturas triplas ou tipo H, qudruplas outetraplex (WANG et al., 2006; KMIEC et al., 1985; SEINMEZ,1986, LINIAL; SHLOMAI, 1987; KIYAMA; KIYAMA 1996;GABRIELIAN et al., 1996; GABRIELIAN; PONGOR, 1996;VLAHOVICEK; PONGOR, 2000; KIYAMA et al., 1999; WANG;VASQUEZ, 2004; KAUSHIK et al., 2007; COSA, 2008), que po

    dem ser reconhecidas pelos mecanismos de recombinao celulare propiciar rearranjos diversos no material gentico demonstradasem dierentes tipos de estudos (LEACH; SAHL, 1983; WYMAN,et al., 1985; 1986; MEIMA, et al., 1997; SRADER; HOWELL, 1997;

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    50/111

    49Organizao estrutural e instabilidade do material gentico

    SONG et al., 2001; KOUPRINA et al., 2003; LAN; MUGUIRA,2005; GRINDLEY et al., 2006; DU et al., 2007; WELLS, 2007;COSA, 2008.

    Estruturas repetidas invertidas e diretas no mveis so encon

    tradas anqueando muitos elementos transponveis ativos e inativos. Os tamanhos das estruturas invertidas variam signicativamente de elemento para elemento, podendo apresentar de 9 pb a maisde 200 pb (LEWIN, 2004; DOAK et al., 1997; BENIO; WALBO,1997). As repeties diretas so resultantes da duplicao do stio deentrada da integrao. So sequncias normalmente pequenas entre3 a 12 bases. Acreditase que as enzimas envolvidas reconheam assequncias do stio de entrada e direcionem o evento de transposi

    o, a exemplo do que acontece na integrao do ago (LEWIN,2004; BELFOR; PERLMANS, 1995; BENIO; WALBO, 1997).

    No genoma, esto presentes milhares de estruturas que possuemcapacidade de transposio, porm a maioria encontrase inativa.Muitas inseres novas, com base em estruturas transgnicas, sosilenciadas pouco tempo depois de sua integrao. Acreditase queo silenciamento seja o resultado das discrepncias entre a composio de CG do elemento inserido e o ambiente do isochore receptor.

    Observase tambm que elementos integrados em regies pobresem CG so mais requentemente inativados que os inseridos emregies mais ricas em CG BERNANRDI, 1995.

    Como h uma coincidncia entre os stios inativos e o grau demetilao, vrios pesquisadores sugeriram que a metilao poderiaser responsvel pelo controle da transposio ao nvel de transcrio(BESOR; YCKO, 1996; YOLDER et al., 1997). ONeill et al. (1998)mostraram a associao entre a diminuio da metilao e ativao

    de retroelementos, correlacionando o silenciamento estabilidadedo genoma.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    51/111

    50 Estrutra e evoluo dos genomas

    Elementos repetitivos mveis longos

    Entre os elementos repetitivos longos de origem viral, os maisrequentes em mameros so os LR long terminal repeats e Lineslong interspersed elements).

    Os LR caracterizamse por apresentarem longas regies repetidas nas extremidades de suas sequncias integradas, com tamanhoentre 250 pb a 1.400 pb, anqueadas pela duplicao de 4 a 6 basescorrespondentes ao stio de entrada no genoma. Esses elementos,durante o processo de mobilizao, so transcritos pela RNA polimerase II. A ta de RNAm gerada no apresenta cauda poliadenilada, e requentemente possui ntrons, que so removidos antes dea ta ser traduzida. De um modo geral, os retroelementos possuem

    as inormaes necessrias para promover a sua retrotransposio(transcriptase reversa e (ou) integrase), mas, ao contrrio dos retrovrus, os genes do envelope viral esto ausentes, ou deectivos(LEWIN, 2004). Dentro desse grupo esto os elementos Ty (emlevedura), copia (em drosophila), IAP(em roedores) e THE1 (emhumanos LEWIN, 2004.

    O segundo grupo de elementos mveis longos em mameroscompreende a amlia Line. Inicialmente, esses elementos oram

    classicados no grupo dos retroelementos de origem noviral, emdecorrncia da presena de sequncias poliadeniladas terminais eausncia de LR. Entretanto, as anlises das ases abertas de leitura mostraram alta identidade com enzimas retrovirais responsveis pela retrotransposio (LEWIN, 2004). A estrutura dos Linecompreende duas ases abertas de leitura. A primeira codica umaprotena semelhante gag com stio de ligao com RNA e propriedade chapernica para cidos nucleicos (HOHJOH; SINGER,

    1996; KOLOSHA; MARIN, 1997; MARIN; BUSHMAN, 2001;MARIN et al., 2005), e a segunda ase aberta, uma protena dotipo polimerase com atividade endodesoxirribonuclease (endonuclease e transcriptase reversa MAHIAS et al., 1991; FENG et al.,1996. As anlises in silico dos stios de integrao de Line sugerem

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    52/111

    51Organizao estrutural e instabilidade do material gentico

    a participao do mecanismo de reparo de duplata do DNA natransposio desses elementos ICHIYANAGI; OKADA, 2006.

    ratase de uma amlia com pelo menos 11 classes (MALIK;EICKBUSH, 1999). Line de dierentes categorias oram encontra

    dos em um grande nmero de genomas eucariotos ARKHIPOVA;MESELSON, 2000; compilado de RepBase em http://www.girinst.org/repbase/index.html.

    Em mameros, o elemento Line1 o mais requente. Aproximadamente 17 % do genoma humano so compostos por esse tipo derepetio, o que corresponde a 100 mil cpias, variando entre 50 mila 100 mil cpias nos demais genomas (HWU, et al., 1986; SMIH,1996; HAN et al., 2007). Dessas, apenas 3.500 cpias possuem a

    sequncia Line1 completa, das quais 95 % restantes encontramse truncadas na sua poro 5 osato ou rearranjados FANNING;SINGER, 1987; DOMBROSKI et al., 1993.

    Em razo do grande nmero de cpias presentes no genoma, oselementos repetitivos so tidos como stios preerenciais para mediar recombinao homloga desigual FANNING, SINGER, 1987;BURWINKEL; KILIMANN, 1998.

    Esses elementos no so completamente idnticos, variam em

    tamanho podendo atingir mais de 7 kb, sendo o consenso na ordemde 6 kb. Muitos elementos Line1 completos acumularam cdigosde terminao da traduo em suas sequncias de DNA, o que impede a sntese das protenas responsveis pela sua locomoo, sendoraros os elementos capazes de se transpor a outros stios no genoma.Acreditase que apenas 20 a 40 elementos possam estar ativos no genoma humano SASSAMAN, 1997. Desses, pelo menos sete j oram clonados e apresentaram atividade de retrotransposio em clulas mameras, o que tem permitido ampliar as inormaes sobreo mecanismo de transposio desse elemento (MORAN et al., 1996;SASSAMAN et al., 1997; HOHJOH; SINGER, 1997; MIKI, 1998).

    De acordo com Miki (1998), parece existir uma divergnciaevolucionria entre o elemento Line1 murino e o Line1 humano.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    53/111

    52 Estrutra e evoluo dos genomas

    Essas amlias apresentam identidade em torno de 60 %. O Line1murino compe a amlia IAP. O elemento Line1 murino anqueado por repeties diretas sugestivas do stio de entrada no genoma,enquanto o Line1 primata apresenta repeties do tipo CpG na

    regio prxima a extremidade 5 osato. Na regio 5 ostato, queantecede a ase aberta de leitura 1, tambm denominada de ORF1(open reading frame) do elemento murino, dierentemente do humano, observamse repeties com aproximadamente 200 pb denominada de monmeros, que possui atividade promotora e ativadora datranscrio GOODIER et al., 2001.

    Nos elementos Line1 completos, a extremidade 5 osato apresenta uma regio de aproximadamente 1 kb, contendo vrios cdi

    gos sinalizadores para nal de traduo (stopcodons) em todasas ases de leituras (rames). Woodcock et al. (1996) mostraramque essa regio codica dois RNA pequenos, um de 305 nucleotdeos e outro de 275 nucleotdeos, cuja uno ainda desconhecida. Seguemse a essa regio duas ases abertas de leitura (ORF),a primeira, com 1kb (ORF 1) e a outra, de 4kb (ORF 2), intercaladas por uma pequena sequncia que no codica protena. A regio correspondente extremidade 3 OH no traduzida e possui

    uma sequncia terminal rica em A (FANNING; SINGER, 1987;LANKINEN et al., 1996.; MCGLYNN et al., 2001.O mecanismo de transposio dos elementos Line1 ainda no

    est esclarecido. Sabese que so transcritos pela RNA polimeraseII. Contudo, Kurose et al. (1995) mostraram a dependncia da regio promotora do Line1 humano pela RNA polimerase III, compossvel participao de atores associados a RNA polimerase II. AsORF codicam para protenas relacionadas a mobilidade do elemento (KOLOSHA; MARIN, 1997; HOHJOH; SINGER, 1997),das quais a primeira codica para uma protena tipo gag e segundacarrega inormaes para transcriptase reversa, endonuclease AP, euma possvel RNAe H, como nos demais elementos dessa amlia. Oproduto da ORF 2 tem localizao predominantemente citoplasm

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    54/111

    53Organizao estrutural e instabilidade do material gentico

    tica, contudo a perda da regio carboxiterminal direciona a protenapara o nuclolo GOODIER et al., 2004.

    A gerao de uma nova cpia de Line1 no genoma requer a ruptura e o reparo da ta de DNA alvo. Acreditase que, semelhana

    das retrotransposies de elementos LR R2Bm (LUAN et al., 1993;COS et al., 2001), a ruptura no stioalvo geraria uma extremidadelivre que atuaria como primer para a sntese da ta de DNA complementar ao RNA do elemento de transposio. No caso dos Line1,identicouse no genoma a sequncia alvo 5 /A 3 comoponto preerencial de integrao (GILBER et al., 2002; SYMERet al., 2002; COS et al., 2002; GILBER et al., 2005.

    Farkash et al. (2006a e b), com base nas observaes in silico de

    Zingler et al. (2005), que mostravam a existncia de pequenos trechos de identidade entre os stios de insero e as extremidades 5dos ragmentos de Line1 de tamanho menores, no encontrada nas

    junes ragmentos maiores de Line1, postularam uma segunda viade transposio com participao de endonucleases do mecanismode reparo do DNA.

    Inseres recentes de Line1 oram associadas a doenas tantoem murinos, como em humanos. A integrao da amlia IAP (Line

    1 murino) oi identicada nas regies codicadoras dos genes cFos, em plasmocitomas de camundongos, na extremidade 5 osatodo gene cmyc, no gene Fu murino, e no gene reeler(AKAHARAet al., 1996; MIKI, 1998). Em humanos, oi descrita pela primeiravez por Kazazian et al. (1988), interrompendo e exon 14 do atorde coagulao VIII, e posteriormente vrias outras mutaes oramassociadas integrao de novo desse elemento MIKI, 1998.

    Belgnaoui et al. (2006) demonstraram que a ativao de Line1na clula gera mltiplas quebras na duplata do DNA em clulastumorais, resultando em apoptose.

    Segundo Bernardi (1995), os Line estariam localizados preerencialmente em regies ricas em A e com baixa concentrao gnica.Contrariamente, Ostertag e Kazazian (2005) sugerem que, apesar da

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    55/111

    54 Estrutra e evoluo dos genomas

    aparente aleatoriedade na distribuio desses elementos no genoma,inseres recentes tenderiam a ocorrer em regies prximas a genesque estariam sendo expressos. O enmeno seria evidente em culturas de clulas neuronais e in vivo, sendo possvel notar mudanas

    nos padres de expresso gnica em uno da entrada do elemento.Babushok et al. (2006), por meio de estudos com murinos transgnicos, tambm demonstraram uma tendncia de direcionamento dasnovas inseres de Line1 para as regies intergnicas.

    Fragmentos de Line1 degenerados esto presentes nas regiesestruturais silenciosas, regulatrias, e em regies transcritas demuitos genes, compondo principalmente ntrons. Esse elemento encontrado azendo parte da estrutura genmica do complexo de

    histocompatibilidade principal (MHC) (emb X87344), cadeia dos receptores de lincitos gb L36092, atores de coagulao gbM22333 e gb M64554), receptores para interleucinas (emb X67285),atores do complemento, e genes para globina (gb UO1317), entre outros (KAZAZIAN et al.,1988; MIKI, 1998; KAZAZIAN;MORAN, 1998.

    Elementos repetitivos mveis curtos

    As principais caractersticas dos retroelementos no virais so:ausncia de LRs; transcrio via RNA polimerase II ou III; duplicaes de 7 pb a 21 pb nas extremidades; presena de poliadenilao na extremidade 3 OH; ausncia ou poucos ntrons (LEWIN,2004; BLINOV 1998). Considerados inicialmente como elementosestruturais sem uno, sabese hoje que muitos participam de stiosregulatrios, a exemplo das ilhas de CpG e stios recombinativos(CHRISMANN et al., 1991; CRAIG; BICKMORE, 1994; RUBIN

    et al., 1994; BERNARDI, 1995; MIGHELL et al., 1997; GRAFF et al.,1997; BLINOV et al., 1998. Nesta categoria, encontramse os Sinesshort interspersed elements.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    56/111

    55Organizao estrutural e instabilidade do material gentico

    As sequncias repetitivas do tipo Sine movimentamse por retrotransposio com o auxlio de outros elementos mveis ativos,

    j que no codicam as enzimas necessrias para a sua prpria mobilizao, e so transcritos por intermdio de um promotor interno

    para RNA polimerase III MAHIAS et al., 1991; WALLACE et al.,1991; BELFOR; PERLMANS, 1995; FAWCE et al., 2006; GUet al., 2007.

    Em geral, possuem tamanho entre 100 pb a 500 pb (YASUI et al.,2001; FAWCE et al., 2006; GU et al., 2007). Em termos evolutivos,os Sines contriburam signicativamente para a histria evolucionria da maioria das espcies eucariticas (FAWCE et al., 2006).Em vertebrados, compe duas superamlias CoreSine e V Sine

    (KAZAZIAN et al., 2004, GILBER; LABUDA, 1999; OGIWARA,2002; FAWCE et al., 2006). Em plantas, sua distribuio maislimitada, sendo encontradas amlias de Sines do tipo AU (YASUIet al., 2001; FAWCE et al., 2006.

    Entre os Sines, as sequncias do tipo Alu so as mais presentes no genoma primata. Esses elementos representam 5 % a 10 %do genoma primata o que corresponde a pelo menos 1 cpia acada 3 kb a 6 kb. Sua distribuio no randmica e normalmen

    te so encontrados no genoma, prximos uns aos outros (HWUet al., 1986; MOYZIZ et al., 1989; PIMAN; SCHIMENI, 1998;BLINOV et al., 1998). Por exemplo, o gene Bat2 do lcus HLA classeII possui 42 repeties de Alu, o que corresponde a 1,9 repeties acada 1 kb MIGHELL et al., 1997.

    O elemento Alu, em murinos, um monmero com aproximadamente 150 pb e conhecido como elemento B (B1 e B2).Acreditase que os monmeros tenham um ancestral comum, homlogo partcula 7SL de RNA nuclear. A estrutura dimrica exclusiva de primatas e estimase que tenha surgido a 65 milhes deanos (BLINOV et al., 1998), mas a orma monomrica tambm estpresente ZUCMANROSSI et al., 1997.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    57/111

    56 Estrutra e evoluo dos genomas

    A amlia Alu composta por vrias subamlias que apresentamidentidade da ordem de 70 % a 75 % (DEININGER et al., 1992).Descrevemse inseres antigas e recentes desse elemento, existindosubamlias espcieespeccas, a exemplo de alguns tipos de Alu

    caractersticos de determinados grupos de primatas DEININGERet al., 1992; FAWCE et al., 2006.O Alu dimrico possui aproximadamente 280 pb, composto

    por dois monmeros ligados por uma regio rica em A, sendo odireito 31 pb maior que o esquerdo. Apesar das dierenas estruturais entre a amlia B e Alu, ambos possuem dois stios promotores(A e B) para RNA polimerase III e cauda poli A (BLINOV, 1998).Recombinao homloga desigual entre elementos Alu requente

    e no randmica, ocorrendo preerencialmente entre as regies A eB nos Alus dimricos KASS et al., 1995.No Alu primata, os stios de ligao polimerase esto no brao

    esquerdo e os monmeros esto ligados por uma sequncia poli A(MIGHELL et al., 1997). Em elementos de origem recente, possvelobservar pequenas regies repetidas diretas nos ancos (WALLACEet al., 1991.

    O conjunto das inormaes sugere que esses elementos tenham

    origem retrotransponvel (MIGHELL et al., 1997; MIKI, 1998).Como esses elementos no possuem as enzimas necessrias parapromoverem sua prpria retrotransposio, contam com o auxlio de outros elementos ativos, tais como, Line1 MAHIAS et al.,1991, LANDER et al., 2001; DEWANNIEUX et al., 2003; HULMEet al., 2007). Desse mecanismo, sabese que a protena codicada pela ORF 2 dos elementos Line1 requerida no processo, e atransposio pode ser bloqueada pela protena APOBEC3G, umacitidina deaminase que inibe a ineco pelo vrus HIV, de ormaindependente da expresso da protena da ORF 1 do elemento Line1 HULME et al., 2007.

    Cpias simples de Alu ou regies ricas em Alu so normalmenteencontradas em regies com altos contedos de C/G, em regies

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    58/111

    57Organizao estrutural e instabilidade do material gentico

    prximas a ilhas CpG, e anqueando genes (GRAFF et al., 1997),ntrons e espaos intergnicos, mas no oi demonstrada a presena,at o momento, em regies codicadoras de RNA (BLINOV et al.,1998). Existem controvrsias quanto aos motivos dessa distribui

    o, se essas regies seriam stios preerenciais de integrao, ouse haveria uma seleo positiva para regies CG ou negativa paraas entradas em A/ (GROVER et al., 2003; GROVER et al., 2004;JURKA 2004; HACKENBERG et al., 2005; CORDAUX et al., 2006).Contudo, estudos com populaes antigas e recentes de Alu sugerem que a entrada desses elementos no genoma seria randmica emtermos de distribuio de C/G, havendo uma seleo positiva paraos elementos inseridos em regies ricas nessas bases (BELLE; EYRE

    WALKER, 2002; CORDAUX et al., 2006; GU et al., 2007.A princpio acreditavase que a uno desses elementos osseapenas estrutural MIGHELL et al., 1997. Porm, vrios trabalhosindicam que os elementos Alu possam atuar na regulao da expresso gnica. Rubin et al. (1994) sugerem uncionalidade das sequncias Alu em virtude da variao no seu padro de metilaoem dierentes tecidos. Graf et al. (1997) propem a participao dassequncias Alu no processo de metilao de novo das regies CpG

    prximas. Lander et al. (2001) mostram que os elementos Alu podem introduzir a ormao de novas ilhas CpG. Blinov et al. 1998,com base na potencialidade de os Alus ormarem estruturas triplex,sugerem que as sequncias Alu comporiam um cdigo espacial ormado pelas combinaes das dierentes repeties completas e truncadas, diretas e invertidas.

    Instabilidade de sequncias

    Repeties do tipo satlites

    odos os organismos eucariotos possuem pequenas sequncias repetidas mltiplas vezes (AUZ; SCHLOERER, 1994).

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    59/111

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    60/111

    59Organizao estrutural e instabilidade do material gentico

    cao geraria a expanso das repeties na ta nascente (KOKOSKAet al., 1998; MARCADIER; PEARSON, 2003). Apesar de outras teorias serem plausveis, em comum a maioria teria uma etapa ondese ormam quebras na duplata do DNA por endonucleases do

    reparo (MARCADIER; PEARSON, 2003; PEARSON et al., 2005).Vrias mutaes que aetam o reparo de estruturas secundriastm como consequncia a elevao da requncia de mutaes emsatlites. Em leveduras, a protena Msh2 juntamente com a Msh3ou Msh6 e MutL, homloga a Mlh1 e Pms1 corrigem a ormaode alas com at 14 nucleotdios. Alas maiores so corrigidas porum mecanismo de reparo no usual, que envolve os genes Msh2e Rad1 (KIRKPARICK; PEES, 1997). Aparentemente, outras

    protenas, alm das que participam do reparo, esto envolvidasna estabilidade dessas regies. Mutaes no gene rad27 (FEN1de mameros), responsvel pela atividade 53 exonuclesica,atuam na remoo da regio ribonucleotdica dos ragmentos deOkaski e, na DNA polimerase (pol3-t), promovem aumento nainstabilidade de satlites (KOKOSKA et al., 1998). Em humanos,haveria a participao do complexo Mre11Rad50NBS1 no reparo dessas alas (PAUL; GELLER, 1999). Haveria, tambm, a

    participao de outras enzimas especcas (CONSANINOUet al., 2001) e de helicases (KAMAHLOEB et al., 2001).Sequncias repetitivas simples quando clonadas tendem a sorerdelees ou inverso das repeties (MARCADIER; PEARSON,2003). Prximo aos stios de quebra e juno da regio que soreu a deleo ou inverso, observamse, normalmente, estruturas do DNA do tipo noB (WOJCIECHOWSKA et al., 2005).

    Instabilidade de insertos clonadosObservase que alguns segmentos de DNAs quando clonados

    propiciam o rearranjo do vetor. As anlises desses ragmentos mostraram que a instabilidade estaria correlacionada a presena de se

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    61/111

    60 Estrutra e evoluo dos genomas

    quncias repetidas diretas, invertidas e invertidas complementares,repeties do tipo microssatlite e minissatlite, todas potencialmente capazes de promover estruturas noB no DNA (LEACH;SAHL, 1983; WYMAN, et al., 1985, 1986; MEIMA, et al., 1997;

    RINH; SINDEN,1993; SRADER; HOWELL, 1997; SONGet al., 2001; KUPRINA et al., 2003; BACOLLA et al., 2004; LAN;MUGUIRA, 2005; WOJCIECHOWSKA et al., 2005; GRINDLEYet al., 2006; WANG; VASQUEZ, 2006; WOJCIECHOWSKA et al.,2006; DU et al., 2007; WELLS, 2007.

    Os rearranjos podem ser complexos e resultar em perdas, duplicaes, inverses, translocaes de DNAs, com ou sem a presena deregies de identidade nos stios recombinativos (LEACH; SAHL,

    1983; WYMAN et al., 1985; 1986; MEIMA et al., 1997; SRADER;HOWELL, 1997, LEEM et al., 2004). Em alguns casos, observaseo comprometimento de sequncias do vetor, inviabilizando a suamultiplicao LEACH; SAHL, 1983; WYMAN et al., 1985; 1986;MEIMA et al., 1997; SRADER; HOWELL, 1997, LEEM et al., 2004).

    Leem et al. (2004), em um trabalho que envolveu sobreposies de sequncias clonadas em vetores bacterianos e de leveduras, identicaram que as regies de instabilidade de quatro genes

    eram constitudas principalmente por grandes blocos de microssatlite e minissatlite e alta densidade de repeties do tipo Alu.Outras sequncias, tambm identicadas como altamente instveisem vetores bacterianos, oram as LineS repeties invertidas longas, sequncias ricas em A e sequncias com estruturas do tipoZDNA (HAGAN; WARREN, 1982; SCHROH; HO, 1995; KANG;COX, 1996; RAZIN et al., 2001). Em leveduras, tanto o tamanho dasregies repetitivas como a distncia entre elas estimulam a recombinao (LOBACHEV et al., 1998). J a presena de origem de replicao orte entre as repeties diminui a recombinao, sugerindo quea origem orte rompa a estrutura secundria que seria importanteno avorecimento dos rearranjos.

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    62/111

    61Organizao estrutural e instabilidade do material gentico

    Insertos ricos em CG clonados em plasmdios do tipo YACs podem ser instveis em leveduras, indicando a participao de estruturas peculiares no mecanismo recombinativo BERNANRDI, 1995.

    Plasmdios que se mantm em grande nmero de cpias na clu

    la hospedeira, independente de presena de insertos, podem sorerrecombinao, mesmo em hospedeiras decientes para esse tipo demecanismo. Os produtos intermedirios da recombinao ormamestruturas do tipo caudacabea, onde dois ou mais plasmdios cam ligados entre si, podendo posteriormente ser resolvidos ormamonomrica. Observase que 95 % dos plasmdios mantidos emE. coli esto na orma monomrica, e 5 %, na orma de dmeros,trmeros ou tetrmeros BOE; OLKERNIELSEN, 1997.

    Esses segmentos, eventualmente, so estabilizados quando alinhagem hospedeira deciente para enzimas do mecanismo dereparo e salvaguardas do DNA (LEACH; SAHL, 1983; WYMANet al., 1985; 1986; MEIMA et al., 1997; SRADER; HOWELL, 1997;KOUPRINA et al., 2003; LEEM et al., 2004; INERNAIONALHUMAN GENOME SEQUENCING CONSORIUM, 2004; LAN;MUGUIRA, 2005.

    rinh e Sinden 1993 assinalaram a inuncia da estrutura pri

    mria e secundria de insertos com dierentes repeties diretas naestabilidade de plasmdios. Esses autores concluram que as repeties so capazes de ormar estruturas que podem ser removidas ouamplicadas, mesmo em bactrias hospedeiras decientes em RecA,principal enzima responsvel pela recombinao. Outra observao a de que o nmero, o tamanho, a distncia entre as repeties e apresena de palndromos inuenciam na requncia dos rearranjosque resultam em perdas. Duplicaes e inverses ocorreriam a umataxa elevada, quando no houvesse uma repetio direta ou invertida no seguimento contido entre duas repeties diretas.

    Vetores contendo palndromos superiores a 30 pb, instveis emplasmdios, oram mantidos com sucesso em ago , utilizando hos

  • 8/7/2019 Estrutura e Evoluo dos Genomas Embrapa

    63/111

    62 Estrutra e evoluo dos genomas

    pedeiros decientes para o gene recBC exonuclease V e sbcB exonuclease I LEACH; SAHL, 1983.

    Repeties superiores a 300 pb mantiveramse estveis quandoclonadas em ago no hospedeiro E. colirecA+ decientes para recB,

    recC, e sbcB ou recD (WYMAN et al., 1985; 1986). Vericouse tambm que a utilizao de vetores com stios chi, e ou genegam uncional pode, eventualmente, estabilizar sequncias com problemasde clonagem WYMAN et al., 1986.

    Apesar do grande nmero de vetores e linhagens hospedeirasgeradas para acomodar segmentos instveis, a noclonabilidadeainda representa obstculo para o conhecimento pleno dos genomas tidos como completos (KOUPRINA et al., 2003; LEEM et al.,

    2004; INERNAIONAL HUMAN GENOME SEQUENCINGCONSORIUM, 2004; LAN; MUGUIRA, 2005). Estimase que 1 %das sequncias eucariticas so de dicil clonagem e as regies reconhecidas como instveis permanecem nos rascunhos dos bancosgenmicos at sua plena elucidao LEEM et al., 2004.

    Instabili