Upload
dinhhanh
View
220
Download
2
Embed Size (px)
Citation preview
i
PREÂMBULO
O estudo da base molecular da vida só muito lentamente pôde progredir comparativamente ao das
outras ciências, devido, por um lado, à ausência ou à imperfeição das técnicas de análise e de medida,
mas fundamentalmente à complexidade dos sistemas biológicos. Não será todavia por isso que o
progressivo desvendar dos mecanismos que regem a organização máxima da matéria deixa de ser um dos
capítulos mais apaixonantes da História da Ciência moderna.
Foi há cerca de 50 anos que WATSON e CRICK dobraram um dos cabos mais decisivos da história
da ciência moderna, ao publicarem a estrutura do ácido desoxirribonucleico (DNA). Desde então,
milhares de cientistas e investigadores têm-se interessado pelos diferentes aspectos da estrutura e da
função do DNA, com o fim de compreenderem como a informação genética está contida na molécula de
DNA, e como ela é tratada de maneira tão ordenada e precisa durante os processos biológicos. A
conjugação de todos estes trabalhos de pesquisa levou à acumulação de um volume enorme de
informações e de conhecimentos em genética molecular e ao desenvolvimento de uma metodologia nova,
a engenharia genética.
A engenharia genética ou seja, a pesquisa sobre o DNA recombinante baseia-se num conjunto de
técnicas que conferem a possibilidade, até há pouco apanágio exclusivo da química relativamente a
pequenas moléculas, de romper e formar ligações covalentes de maneira específica e controlada em
moléculas de DNA. O material genético pode hoje ser modificado, mutado, transferido, detectado ou
sintetizado com as finalidades mais diversas tanto aplicadas como fundamentais.
A possibilidade de criar combinações novas, não naturais, a partir de material genético de diferentes
origens e de as introduzir em organismos hospedeiros que as perpetuam e multiplicam, deu uma
dimensão nova à biotecnologia, dotou-a do refinamento próprio à engenharia genética. À exploração
empírica dos fenómenos biológicos contrapõe-se, hoje, a construção racional de sistemas biológicos
artificiais elaborados por manipulação genética no laboratório de investigação, antes de serem explorados
industrialmente ou na produção agrícola. É neste contexto que deve ser considerada a engenharia
genética, não como uma nova disciplina em si, mas antes como um instrumento de investigação poderoso
que tem contribuído para um melhor conhecimento e aprofundamento do conceito de gene.
Esta disciplina não só permite compreender melhor os mecanismos fundamentais da vida, mas
também, pela manipulação dos organismos mais diversos, produzir substâncias úteis para a medicina, a
agricultura e a indústria em geral.
É de salientar que os extraordinários progressos realizados em engenharia genética só foram
possíveis graças aos resultados da investigação fundamental obtidos nos campos da genética, da biologia
ii
celular, da enzimologia, da virologia, da imunologia, da química dos ácidos nucleicos e das proteínas, da
cristalografia e que só a interacção das diferentes competências no seio desta área multidisciplinar
permite abordar nas melhores condições a tecnologia da clonagem de genes.
A racionalidade e os conhecimentos humanos tendo os seus limites, a nova era industrial e agrícola em
que entrámos não é destituída da ameaças e só poderá beneficiar as populações humanas a longo termo se
a exploração dos recursos biológicos respeitar os grandes equilíbrios naturais, os ciclos biológicos e
preservar a riqueza do património biológico terrestre já amplamente enfraquecidos. O mecanismo que o
homem é agora capaz de manipular é o estado superior da complexidade da matéria e é também o mais
frágil. Como corolário, o impacto da acção do homem na natureza passou a ser directo e profundo. As
consequências poderão ser catastróficas ou positivas e só dependem de nós. As ciências da vida ao
desembocarem no domínio das aplicações, a pequena ou a grande escala, tocaram a ecologia e a ética,
dimensões que não podem deixar de estar intimamente associadas à formação científica que têm por
missão ministrar.
iii
ÍNDICE 1.OS INSTRUMENTOS DE BASE 2 1.a.As enzimas, suas actividades e utilizações 2
Endonucleases de restrição e metilases 2 Outras endonucleases 8 Exonucleases e polimerases 9 Fosfatases 12 Ligação de fragmentos de DNA 13
1.b.A sequenciação de DNA 15 1. Método químico ou de Maxam & Gilbert 15 2. Método de terminação de cadeia ou de Sanger 17 3. Utilização da PCR em sequenciação 22 4. Sequenciação "automática" 24 5. Sequenciação multiplex 27 6. Outras tendências 28 7. Sequenciação de oligonucleotídeos 30 8. Chromosome walking 32 1.c.Síntese química de DNA 32
I. Princípios da síntese química de DNA 33 1) Preparação dos blocos de base para a síntese 34 2) Desprotecção selectiva 40 3) Reacções de condensação 42
4) Construção da cadeia oligodesoxinucleotídica 43 5) Desprotecção 46
Rendimentos 48 6) Isolamento, purificação e caracterização 49
2.VECTORES DE CLONAGEM 50 a. Os plasmídeos 50
Concepção de um vector plasmídico 52 b. Bacteriófagos 52
Empacotamento in vitro 54 c. Cosmídeos 55 d. O fago M13 56
Conclusões 57 3. MUTAGÉNESE DIRIGIDA 53 Eliminações 53 Inserções 54 Substituições 54 Mutagénese dirigida com oligonucleotídeos sintéticos 56 Selecção e identificação dos mutantes 59 Aplicações da mutagénese dirigida 60 4. A TRANSFORMAÇÃO BACTERIANA 63 5. BANCO DE CLONES DE cDNA 63 Esquema de construção de um banco de clones de cDNA 64 6. BANCOS GENÓMICOS 66 7. MÉTODOS DE DETECÇÃO E DE ANÁLISE DE CLONES 67
a) Hibridação in situ entre o DNA dos clones recombinantes e uma sonda de DNA radioactiva 67 b) Carta de restrição 67 c) Sequenciação dos nucleotídeos do inserto nos clones positivos por hibridação 68
d) Selecção do mensageiro específico por hibridação com o DNA recombinante e tradução in vitro 68
iv
e) Southern blotting 68
f) Escolha das sondas de DNA sintéticas 68
8. A SÍNTESE QUÍMICA DE GENES 72 9. SISTEMAS DE EXPRESSÃO: ORGANISMOS HOSPEDEIROS - VECTORES 74 a. Expressão em E. coli 74
Vectores de expressão em E. coli 74 1) Construção de vectores de expressão 76
2) Vectores baseados no promotor PL de λ 77
3) λgt11 - vector de expressão derivado do fago λ 79
Identificação das placas produtoras 79 Limitações da produção na bactéria 80 Produção da hormona de crescimento humana (hGH) 81 Hormonas de crescimento animais 85 Produção de insulina humana 86
b. Expressão em Bacillus subtilis 88 c. Expressão na levedura 90
Os vectores de expressão de S. cerevisiae 91 Exemplos de vectores de expressão para produção de proteínas exógenas em leveduras 92 1) A integração dirigida 95 2) O isolamento de alelos mutantes 96 3) Regulação da expressão dos genes na levedura 96 4) Um intrão codifica para uma proteína reguladora 97 5) Estrutura do gene da ferromona de levedura (MFα) 99
d. Expressão nos fungos filamentosos 100 e. Expressão em células de mamíferos 103
Transferência de genes nas células de mamíferos (transfecção) 104 Co-transformação 106 Micro-injecção 106 Isolamento dos genes transferidos 106 Clonagem de oncogenes humanos 107 Vectores virais utilizados para transfectar as células de mamíferos 108 Vector SV40 108 a) Substituição da região tardia de SV40 108
b) Substituição da região precoce de SV40 109
Vector vaivém derivado de SV40 109 Vector BPV (Bovine Papilloma Virus) 110 Vectores derivados de retrovírus 110
f. Introdução de genes estrangeiros em óvulos fertilizados. Animais transgénicos 112 Expressão do DNA estrangeiro nos animais transgénicos 113 A utilização dos retrovírus 115 Conclusões e resumo 115 g. Expressão em células de insectos 116 Construção dum vector de transferência do baculovírus 118 Actividade biológica das proteínas recombinantes 119 10. ENGENHARIA GENÉTICA DE PLANTAS 120 Agrobacterium tumefaciens 120 O plasmídeo Ti como vector 123 Expressão controlada pela luz e específica de órgão, dum gene de trigo em plantas de tabaco 126 Plantas transgénicas 127 a) Resistência a herbicidas 127 b) Resistência a insectos 128 c) Resistência a vírus 130 d) Produtoras de péptidos 133 As plantas monocotiledóneas 134
v
11. O DNA RECOMBINANTE E O DIAGNÓSTICO EM MEDICINA 136 a. Alterações cromossómicas 136 b. Cartografia dos cromossomas humanos 137 c. Mapeamento do genoma humano por RFLP 139 d. Anomalias monogénicas e multifactoriais 141 e. O diagnóstico de defeitos genéticos 142 1) RFLP (Restriction Fragment Length Polymorphism) 143 2) Diagnóstico de mutações identificadas 144 ß-talassemias 144
a) Mutações sem sentido e frame shift 145 b) Mutações que afectam a transcrição 145 c) Mutações que afectam a maturação do RNA 146 d) Utilização dos oligonucleotídeos sintéticos 146 e) Anemia falciforme 148
A deficiência hereditária de αααα1-antitripsina 148 f. Detecção de mutações somáticas 150 g. Amplificação enzimática de DNA (PCR) 152 1) Detecção da anemia falciforme e da hemoglobina C por PCR 154 2) Detecção de doenças infecciosas por PCR 155 Detecção de HPVs 156 Detecção de HIV 158 12.REGULAMENTAÇÃO SOBRE A UTILIZAÇÃO DE ORGANISMOS RECOMBINANTES E A PROTECÇÃO CONTRA
OS RISCOS BIOLÓGICOS 161 ANEXO Directivas do Conselho da CEE 163
1
METODOLOGIA DO DNA RECOMBINANTE
A tecnologia do DNA recombinante representa na realidade, um ramo da engenharia
genética considerada no seu sentido lato. Ela diz respeito à recombinação in vitro do material
genético por meio de enzimas. Estas manipulações in vitro só adquirem realmente um sentido
quando o DNA recombinante é introduzido num hospedeiro biológico, onde pode ser mantido e
propagado indefinidamente. Uma experiência típica de clonagem requer no mínimo
a) um DNA objecto duma pesquisa;
b) um vector de clonagem;
c) enzimas de restrição;
d) DNA ligase;
e) células procariotas ou eucariotas que servem de hospedeiro biológico
(Fig. 1.II.).
Depois da introdução no hospedeiro, as moléculas recombinantes têm que ser isoladas e
caracterizadas. Foi através deste processo de caracterização, que o conhecimento do gene foi
progredindo. O processo de clonagem em si, só fornece um meio de isolar e de identificar
rapidamente os genes de interesse.
Neste capítulo passaremos em revista os diversos métodos utilizados para clonar um gene.
2
1. OS INSTRUMENTOS DE BASE
1.a.As enzimas, suas actividades e utilizações
Endonucleases de restrição e metilases
Sempre que um bacteriófago λ se desenvolve numa estirpe de Escherichia coli C, os
fagos resultantes da lise deste hospedeiro multiplicam-se muito mal noutra estirpe, de tipo K.
Diz-se que o fago é "restrito" pela segunda estirpe bacteriana. Por outro lado, os fagos que
escaparam à restrição são capazes de crescer normalmente se forem utilizados para re-
infectarem a estirpe K. No entanto, se estes mesmos fagos passarem primeiro por E. coli C,
ficam de novo restritos por E. coli K (Fig. 2.II). Portanto, a eficácia com a qual um fago se
multiplica num hospedeiro depende da estirpe na qual ele se multiplicou anteriormente. Esta
modificação não hereditária, conferida ao fago pela segunda estirpe (K) e que lhe permite
voltar a multiplicar-se nesta estirpe sem ser de novo restrito, chama-se modificação.
Os fagos restritos adsorvem-se sobre os hospedeiros restritores e injectam o seu DNA
normalmente. No entanto, este DNA é rapidamente degradado depois da injecção. A enzima
responsável por esta degradação é uma endonuclease, também chamada endonuclease de
restrição ou enzima de restrição. O hospedeiro restritor tem evidentemente que proteger o seu
DNA dos efeitos das enzimas de restrição que ele próprio contém; esta protecção é
assegurada pela modificação do DNA. Mais precisamente, as modificações resultam da
metilação (por metilases) de certas bases num número reduzido de locais do DNA, que
constituem as sequências de reconhecimento para a enzima de restrição. É, pois,
compreensível a razão pela qual um fago que escapa à restrição num dado hospedeiro, pode
em seguida re-infectar eficazmente o mesmo hospedeiro: o DNA do fago ter-se-á replicado
em presença da metilase de modificação e será protegido, assim como o DNA do hospedeiro,
contra os efeitos de restrição.
Os processos de restrição e de modificação existem em todos os sistemas nos quais o
DNA é transferido duma bactéria para outra. A conjugação, a transformação, a transdução e a
transfecção estão todas submetidas ao sistema de restrição-modificação. Os genes que
especificam os sistemas res-mod podem residir no cromossoma do hospedeiro, ou podem
estar localizados num plasmídeo ou num profago.
As endonucleases de restrição classificam-se em 3 categorias. As pertencentes à classe I
são constituídas por 3 subunidades e requerem como cofactores ATP, Mg2+ e S-
adenosilmetionina. Possuem simultaneamente actividades de endonuclease e de metilase
situadas em subunidades diferentes. Os sítios específicos de reconhecimento, longos de 15
3
pares de base, são complexos, situando-se a cerca de 1000 pares de bases de distância do sítio
de clivagem ou de metilação. Esta categoria é pouco interessante em tecnologia genética
porque o local de clivagem não é específico.
As endonucleases de restrição de classe III, constituídas por 2 subunidades têm ATP e
Mg2+ como cofactores obrigatórios, mas não necessariamente a S-adenosilometionina. A
região de clivagem situa-se de 5 a 10 ou de 25 a 27 pares de bases a jusante do sítio de
reconhecimento.
As do primeiro tipo clivam em geral sequências não palindrómicas, dando origem a
populações heterogéneas com extremidades 5' protuberantes, enquanto que as do segundo
tipo clivam o DNA em sítios fixos.
As endonucleases de restrição de classe II são constituídas por uma única subunidade
activa e requerem unicamente Mg2+ como cofactor.
Os locais de clivagem situam-se em geral dentro das sequências de reconhecimento
compostas de 4 a 8 bases. A clivagem dá origem a extremidades 5' ou 3' protuberantes ou a
extremidades rombas ("blunt-end").
Estas enzimas foram isoladas a partir de mais de 200 estirpes bacterianas representando
quase todos os grupos de procariotas. Esta diversidade de enzimas torna indispensável a
utilização duma nomenclatura apropriada. Cada enzima é representada por um código de 3
letras derivado do nome do género e da espécie da bactéria donde a enzima foi isolada. Hae
por exemplo, significa que a enzima foi isolada de Haemophilus aegyptiens.
A maioria das sequências de reconhecimento conhecidas é palindrómica, i.é., possui um
eixo de simetria de rotação. Por exemplo a sequência de reconhecimento de EcoRI
5'-GAATTC-3'
3'-CTTAAG-5'
lê-se da mesma maneira nas duas direcções sobre as cadeias opostas.
O arranjo simétrico dos locais de clivagem tem duas consequências importantes:
1) os cortes em posições desviadas em relação a cada uma das cadeias produzem
extremidades monocatenárias que são complementares em orientação anti-paralela, mas
idênticas em orientação paralela;
2) as extremidades de uma molécula de DNA criadas por uma enzima dada, com uma dada
sequência de reconhecimento, podem formar pares de bases complementares com
qualquer outra molécula de DNA que possua extremidades idênticas:
4
5'...G pApApTpTp C...3 ' EcoRI 5'... GOH3' + 5'pApApTpTpC... 3'
3'...C pTpTpApAp G...5' 3'... CpTpTpApAp5' 3'HOG 5'
fragmento A (corte 1)
5'... GOH
3'... CpTpTpApAp
B
5'... GOHpA p A p T p T p C... 3'
3'... C p T p T p A p Ap HOG....5'
A
pApApTpTpC... 3'
HOG...5'
fragmento B (corte 2)
Esta associação entre bases complementares pode ser completamente estabilizada, pela
formação das ligações covalentes entre as extremidades 3'OH e 5'-fosfato de cada uma das
cadeias de DNA. Esta reacção de ligação é realizada com uma enzima específica, uma ligase,
que tem, como veremos mais adiante, uma utilização importante em metodologia de DNA
recombinante.
Deve ser, no entanto, referido que nem todas as sequências reconhecidas são simétricas.
Devido à existência de ambiguidades nos seus locais de reconhecimento, várias enzimas
reconhecem até 4 sequências alvo diferentes. A digestão duma molécula de DNA com este
tipo de enzima, pode originar extremidades não idênticas que não podem ser recombinadas
ao acaso.
Por exemplo, EcoRII reconhece as sequências seguintes:
CCAGG CCTGG
GGTCC GGACC
e
5
Várias enzimas denominadas isoesquizómeras possuem sítios de reconhecimento
idênticos. HindIII e HsuI por exemplo, partilham as mesmas sequências de reconhecimento e
de clivagem AAGCTT. Outras isoesquizómeras tais como SmaI (CCCGGG) e Xma I
(CCCGGG) possuem a mesma sequência de reconhecimento mas clivam em sítios diferentes
indicados por .Outras enzimas, denominadas isocaudómeras, podem diferir pelo seu sítio de
reconhecimento, mas originar extremidades complementares.
Por exemplo, as digestões por BamHI (GGATCC), BglII (AGATCT), Bc1I (TGATCA) e
Sau3A ( GATC) conduzem às extremidades coesivas 5'-GATC-3'. Todos os fragmentos de
DNA formados por clivagem com qualquer combinação destas enzimas, recombinam-se
entre eles. Assim, os fragmentos formados por digestão BamHI e BglII podem recombinar-se
entre eles, mas neste caso a sequência recombinante 5'-GGATCT-3' é resistente à digestão
por qualquer destas duas enzimas porque as bases externas da sequência hexanucleotídica de
reconhecimento de BamHI e de BglII diferem (G/C e T/A respectivamente).
BamHI Bg II 5'... G GATCT...3' 3'... CCTAG A...5'
5'...GGATCT...3' 3'...CCTAGA...5' não reconhecida por BamHI nem por BglII
mas sim por MboI/Sau3A/DpnI
No entanto, as moléculas originais e as recombinantes podem ser clivadas por outras
enzimas tais como DpnI, Sau3A e MboI e podem ser facilmente distinguidas. Estas enzimas
reconhecem a sequência tetranucleotídica 5'-GATC-3' central e não são influenciadas pelas
bases que a ladeiam.
As endonucleases de restrição têm certas propriedades particulares:
1) Actividade parasita conhecida por "star" que é uma alteração na especificidade da
sequência reconhecida, em condições de pH ou iónicas particulares. Por exemplo, um
aumento do pH, um abaixamento da concentração em NaCl, ou a substituição do Mg por Mn
alteram a especificidade de EcoRI que passa a reconhecer a sequência tetranucleotídica 5'-
AATT-3' que ocorre mais frequentemente. Esta nova especificidade é denominada EcoRI*
(Eco star).
6
2) Sequências na vizinhança de sequências de reconhecimento podem influenciar a
actividade duma enzima, privilegiando a clivagem de certos sítios em relação a outros de
mesma especificidade.
Por exemplo, a actividade de EcoRI pode variar no plasmídeo pBR322 ao ponto de atingir
diferenças de velocidade de 56x, em função da localização do sítio em relação a certas
sequências.
3) A temperatura é outro factor que influencia o desenrolar da clivagem. Certos pequenos
fragmentos oligonucleotídicos desnaturam-se quando a temperatura da reacção enzimática é
superior à sua temperatura de dissociação.
Certas enzimas têm a sua actividade óptima de funcionamento a temperaturas elevadas
(65-79°C), tais como TaqI, Tth111I, Tth111II isoladas de organismos termófilos.
4) Quando o sítio de reconhecimento de certas enzimas se situa perto de uma extremidade
da molécula de DNA a actividade diminui.
Quando dois sítios idênticos ficam demasiados próximos só um deles é clivado, porque
após a primeira clivagem o segundo sítio fica perto duma extremidade da molécula. Esta
propriedade está relacionada com o fenómeno de dissociação mencionado em 3).
5) A probabilidade de uma sequência de restrição estar representada num local com n pares
de bases, numa molécula de DNA, composta de 50 % de AT e de 50 % de CG é
nP4
1=
em que n é o número de bases que comporta o sítio.
Uma sequência tetranucleotídica dada aparecerá num DNA em média cada 44=256 pares
de base e uma hexanucleotídica cada 46=4096 pares de base. Se for conhecida a composição
em GC de um DNA e o seu comprimento, é possível prever o número de vezes que uma
sequência de restrição, de composição e comprimento dados, aparece representada.
Os diferentes fragmentos formados por digestão com uma enzima de restrição podem ser
separados por electroforese em gel de agarose ou de poliacrilamida (Fig. 3.II.). Os
fragmentos correm no gel em função do comprimento e podem ser visualizados por
coloração com o brometo de etídio, que se intercala entre as duas cadeias do DNA.
A utilização de várias enzimas isoladamente, ou em combinação, permite estabelecer a
carta de restrição duma molécula de DNA (Fig.4.II. e 5.II.). A carta indica as posições em
que uma enzima particular cliva o DNA. A distância entre os locais de clivagem expressa-se
em pares de bases (medida em relação a um padrão de referência).
7
As metilases, ou enzimas de modificação, protegem o DNA de um organismo da
actividade endonucleásica ao nível das sequências reconhecidas pela(s) enzima(s) de
restrição própria(s) ao organismo. Estas enzimas, que possuem actividades de metilase e
ausência de actividade de restrição, são a dam metilase, e a dcm metilase que fixam o grupo
CH3 (m de metilo) em posição N6 da adenina e em posição C5 da citosina respectivamente,
no interior dos sítios de restrição.
Dam-DNA adenina metilase GAmTC
Dcm-DNA citosina metilase CCm A/TGG
NHCH3
N
N
N
N
N6-metiladenina
N
N
CH3
NH2
O
C5-metilcitosina
Enquanto que certas enzimas de restrição reconhecem unicamente sequências alvo não
metiladas, os seus isoesquizómeros clivam tanto os sítios metilados como os não metilados.
HpaII (C/CGG), por exemplo, cliva o tetranucleotídeo não metilado, enquanto que o
isoesquizómero MspI cliva a mesma sequência não metilada ou metilada (CCmGG).
As células de eucariotas contêm habitualmente citosinas metiladas em proporção que
pode atingir 10 %. Se bem que de menor importância que no DNA de eucariotas, a metilação
da adenina é altamente relevante no DNA dos procariotas. A metilação dos resíduos adenina
pode ser testada por enzimas, tais como Sau3A ( GATC), MboI ( GATC) e DpnI (GATC).
Enquanto que Sau3A cliva tanto 5'-GATC-3' como 5'-GAmTC-3', MboI cliva unicamente a
sequência não metilada e DpnI cliva exclusivamente 5'-GAmTC-3'. Uma sequência hemi-
metilada, i.é. uma sequência metilada só numa cadeia é resistente à DpnI. Sempre que for
necessário clivar DNA de procariotas em qualquer local possível, este DNA tem que ser
preparado a partir de estirpes de E.coli que são dam-.
Se bem que a maior parte das estirpes de E.coli possua actividades de restrição e de
metilação, certas estirpes utilizadas em engenharia genética possuem uma, ou outra, ou
nenhuma destas actividades.
Ex.: EcoK12 possui actividades de metilase e de restrição
8
MM294 possui modificação mas não restrição
RRI não possui nem uma nem outra
Outras endonucleases [para além das que possuem outra(s) actividade(s)]
α) Desoxi- (Fig. 6.II.)
Desoxirribonuclease I (DNase I) (pâncreas bovino).
Actividade: endonuclease, cadeia dupla ou cadeia simples. Com Mg++ ataca cada cadeia
independentemente e não gera obrigatoriamente extremidades rombas.
Com Mn++ cliva as duas cadeias no mesmo sítio e gera fragmentos com extremidades
rombas ou só com um ou dois nucleotídeos protuberantes.
Utilização: - na introdução de nicks ao acaso em DNA bicatenário a fim de o preparar
para a marcação radioactiva por nick translation;
- na introdução dum nick em DNA circular a fim de o preparar para a mutagénese
mediada por bissulfito (secção 3);
- na criação de clones ao acaso para sequenciação em vectores de bacteriófago M13;
- na análise de complexos proteína-DNA.
ß) Ribonucleases
Ribonuclease A (pâncreas bovino)(Fig. 7.II.).
Actividade: endonuclease - ataca o RNA em 3' de bases pirimidínicas e cliva o fosfato
em 5' do nucleotídeo adjacente. Dá origem à formação de nucleotídeos pirimidínicos-3'P e de
oligonucleotídeos com pirimidinas-3'P.
Utilização: - na remoção de regiões não hibridadas de RNA nos híbridos DNA-RNA;
- no mapeamento de mutações singulares em DNA ou em RNA (desemparelhamentos de
um par de bases entre RNA e DNA são reconhecidos e clivados pela RNase A).
Ribonuclease T1 (Aspergillus oryzae)(Fig. 8.II.)
Actividade: endonuclease - ataca o RNA em 3' da guanosina e cliva o 5'-fosfato do
nucleotídeo adjacente. Dá origem a guanosinas ou a oligonucleotídeos com guanosina-3'P.
Utilização: - na remoção de regiões não hibridadas de RNA em híbridos DNA-RNA.
9
Exonucleases e polimerases
α) DNA polimerase I (E. coli) (Fig. 9.II.)
Actividades: exonuclease 5' → 3' e 3 '→ 5'
polimerase 5' → 3'
reacção de troca
Utilização: - marcação de DNA por nick-translation.
- Na marcação de DNA com extremidades 3' protuberantes.
ß) Fragmento de Klenow da DNA polimerase de E.coli (Fig. 10.II.)
Actividades: exonuclease 3' → 5'
polimerase 5' → 3'
reacção de troca
Utilização: - preenchimento das extremidades 3' retraídas formadas por digestão de DNA
com enzimas de restrição;
- marcação de DNA por preenchimento das extremidades 3' retraídas, com nucleotídeos
trifosfatos 32P;
- marcação terminal de DNA com extremidades 3' protuberantes;
- síntese da segunda cadeia de cDNA em clonagem de cDNA;
- síntese da segunda cadeia de DNA a partir de matrizes monocatenárias em mutagénese in
vitro;
- sequenciação de DNA pelo método dos didesoxinucleotídeos (terminação de cadeia).
γ) T4 DNA polimerase (Fig. 11.II.)
Actividades: exonuclease 3' → 5'
polimerase 5' → 3'
Utilização: - como o fragmento de Klenow, é utilizada na marcação de DNA por
preenchimento de extremidades 3' retraídas;
- na marcação das extremidades de fragmentos de DNA, rombas ou protuberantes em 3'
(reacção de troca);
10
- na marcação de fragmentos de DNA para uso como sondas de hibridação por digestão
parcial de DNA bicatenário utilizando actividade exonuclease 3'→5' seguida por reacção de
preenchimento, utilizando a actividade polimerásica e [α32P]dNTP;
- na conversão de extremidades protuberantes (5' ou 3') de DNA bicatenário, em
extremidades rombas;
- na extensão do iniciador (primer) oligonucletídico mutagénico hibridado à matriz de
DNA monocatenário, em mutagénese in vitro.
δ) Taq polimerase (Thermus aquaticus)(Fig. 12.II)
Actividade: polimerase 5' → 3'
Utilização: - na amplificação in vitro de sequências específicas de DNA por reacção em
cadeia (Polymerase Chain Reaction-PCR);
- na sequenciação de DNA
ε) RNA polimerases dependentes de DNA de bacteriófagos SP6, T3 e T7 (Fig. 13.II)
Actividade : RNA polimerase 5' → 3'
Utilização: - na síntese de RNA monocatenário para utilização como sondas de
hibridação, como mRNAs funcionais em sistemas de tradução in vitro, ou como substratos
em reacções de splicing in vitro. Cada uma destas três polimerases possui um grau elevado de
especificidade para com o seu promotor.
- No caso do sistema de transcrição do bacteriófago T7, para expressão de genes
clonados em bactérias.
ζ) Poli(A) polimerase (Fig. 14.II)
Actividade: polimerisa AMP (derivado de ATP) na extremidade 3'-OH livre do RNA.
Utilização: - preparação de poli (A)- RNA para clonagem;
- marcação da extremidade 3' de RNA com [α-32P]ATP para preparar sondas de
hibridação.
η) Reverse transcriptase (transcritase reversa) (Fig. 15.II.)
(vírus aviano de mieloblastose)
Actividades : polimerase 5' → 3' DNA.
A matriz tanto pode ser o DNA como o RNA.
Exorribonuclease 5' → 3' e 3' → 5' (RNase H)
Degrada especificamente o RNA em híbridos DNA-RNA.
11
Utilização: - síntese de cDNA para clonagem (1a e 2a cadeia) ou para sondas de
hibridação;
- marcação de extremidades de fragmentos de DNA protuberantes em 5' (reacção de
preenchimento).
- Também pode ser utilizada em sequenciação de DNA pelo método de terminação de
cadeia com os didesoxirribonucleotídeos.
θ) Nuclease Bal 31 (Fig. 16.II.)
Actividades: exo e endonuclease 5' → 3' e 3' → 5'
Utilização: - remoção de nucleotídeos das extremidades de DNA bicatenário de maneira controlada. O DNA encurtado pode ser ligado a adaptadores (linkers) ou a vectores com T4
ligase;
- construção de mapas de sítios de restrição;
- mapeamento de estruturas secundárias do DNA, por exemplo junções entre B-DNA e
Z-DNA, ou sítios de modificação em DNA bicatenário;
- remoção de nucleotídeos de RNA bicatenário para preparação de RNAs recombinantes.
ι) Nuclease S1 (Fig. 17.II.)
Actividade: nuclease específica de DNA monocatenário ou RNA;
utilização: - análise de estrutura de híbridos DNA-RNA;
- remoção de extremidades livres (tails) de fragmentos de DNA para produzir
extremidades rombas;
- abertura do gancho formado durante a síntese de cDNA bicatenário;
- na análise da estrutura dos híbridos RNA-DNA.
κ) Mung-bean nuclease
Actividade : nuclease específica de cadeia simples semelhante à nuclease S1 mas mais
suave.
Utilização: - converter extremidades protuberantes de DNA em extremidades rombas.
λ) Exonuclease VII (Fig. 18.II.)
Actividades: exonucleásica sobre cadeia simples de DNA, 3' → 5' e 5' → 3';
dispensa Mg++ e trabalha em presença de EDTA.
Utilização: - recuperação de cDNA inserido em vectores plasmídicos por "tailing" dA-
dT;
12
- construção de mapas dos intrões e dos exões.
µ) Exonuclease III (Fig. 19.II.)
Actividades: exonuclease 3' → 5' de DNA bicatenário com extremidades 3'OH retraídas.
-3' fosfatase.
Utilização: - Preparação de DNA linear como molde para a DNA polimerase (p.ex. na
sequenciação pelo método dos didesoxi; vd. secção sequenciação);
-preparação de sondas específicas de uma cadeia;
-remoção de sequências das extremidades de fragmentos de DNA, criando eliminações
unidireccionais a partir da extremidade 3'OH retraída;
-degradação preferencial da cadeia parental não tiofosfatada, no método de mutagénese
específica pontual que recorre a derivados tiofosfato (vd. secção 3)
ν) Exonuclease λ (Fig. 20.II)
Actividade: exonuclease 5' → 3' em cadeia dupla de DNA com um fosfato em 5'.
Utilização: -na modificação da extremidade 5'-fosfato dos DNAs substratos ulteriores
doutras enzimas (ex.: remoção da extremidade 5'-protuberante do DNA antes do "tailing"
com a terminal transferase).
Fosfatases
Fosfatase alcalina - CAP (intestino de vitela), BAP (bactéria) (Fig. 21.II.)
Actividades: catalisa a remoção dos fosfatos em 5' do DNA bicatenário ou
monocatenário, do RNA e de trifosfatos dos desoxirribonucleotídeos e dos ribonucleotídeos.
Utilização: -eliminação dos grupos fosfato em 5' do DNA ou do RNA para permitir a
marcação com 32P em 5' pela T4 polinucleotídeo kinase e [γ32P]ATP, numa reacção de
troca;
- remoção do fosfato em 5' do DNA a fim de impedir a auto ligação.
T4 polinucleotídeo Kinase (Fig. 22.II.)
Actividades: catalisa a transferência de fosfato γ de ATP para a extremidade 5'OH do
DNA mono ou bicatenário e do RNA por reacção de fosforilação de 5'OH ou de troca com
5'P.
Utilização: - marcação da extremidade 5' do DNA para a sequenciação pela técnica de
Maxam-Gilbert;
13
- fosforilação de oligonucleotídeos sintéticos, ou de outro DNA, para ligação;
- marcação de oligonucleotídeos para serem utilizados como sondas de hibridação;
Ligação de fragmentos de DNA
Existem dois métodos que permitem estabelecer ligações covalentes de DNA in vitro. O
primeiro utiliza uma enzima que intervém na replicação do DNA, a que já nos referimos
anteriormente, a DNA ligase (extraída de E.coli ou de células infectadas pelo fago T4). A
enzima derivada do fago T4 é até capaz de realizar a ligação entre moléculas de DNA com
extremidades rombas, reacção que é estimulada pela RNA ligase de T4.
T4 DNA ligase (Fig. 23.II.)
Actividade: ligação de extremidades coesivas e de extremidades rombas.
Utilização: -catalisa a ligação covalente de moléculas de DNA com extremidades
coesivas complementares;
- ligação covalente de extremidades rombas em moléculas de DNA bicatenário, umas
com as outras, ou com adaptadores ("linkers") sintéticos (observação: a T4 ligase é mais
eficaz nas ligações de extremidades rombas).
T4 RNA ligase (Fig. 24.II)
Actividade: catalisa a ligação covalente de extremidades 5' fosforiladas de DNA
monocatenário ou de RNA, a extremidades 3'OH de DNA monocatenário ou de RNA.
Utilização: -marcação radioactiva das extremidades 3' de RNA (pequenas moléculas tais
como os pNps são substratos eficazes);
- síntese de oligodesoxirribonucleotídeos.
O segundo método utiliza uma enzima que é capaz de adicionar extremidades coesivas
aos fragmentos de DNA. Quando por vezes é necessário ligar fragmentos de DNA
desprovidos de extremidades coesivas complementares, recorre-se a uma enzima que permite
adicionar, in vitro, sequências homopoliméricas complementares, aos fragmentos de DNA. O
método baseia-se na utilização duma enzima isolada de timo de vitelo, a terminal
desoxirribonucleotidiltransferase (terminal transferase). Em presença de um nucleotídeo
trifosfato, a enzima adiciona este nucleotídeo de maneira repetida às extremidades 3' do
DNA.
14
Pode-se, por exemplo, adicionar extremidades poli (A) em 3' dum fragmento de DNA e
extremidades poli (T) em 3' dum outro fragmento de DNA. Ao misturarem-se, estes dois
fragmentos hibridar-se-ão por emparelhamento entre bases complementares A/T e a junção
covalente dos fragmentos emparelhados pode ser efectuada pela enzima DNA ligase.
Terminal desoxirribonucleotidiltransferase (timo de vitelo) (Fig. 25.II.)
Actividade: catalisa a adição de desoxirribonucleotídeos às extremidades 3'-OH das
moléculas de DNA monocatenárias ou 3' protuberantes (Mg++), ou às extremidades rombas
ou 3'OH recessivas (Co++).
Utilização: -adição de caudas (tailing) homopoliméricas complementares a vectores e a
cDNA;
-marcação das extremidades 3'OH de DNA com [α-32P]-3'-desoxirribonucleosídeo ou
com 3'-ribonucleosídeo. A marcação com ribonucleosídeos realiza-se polimerizando com [α-32P]rNTP em presença de Co++ efectuando em seguida um tratamento alcalino.
15
1.b.A sequenciação de DNA
Dois grandes métodos baseados em princípios inteiramente diferentes foram
desenvolvidos para sequenciar longos fragmentos de DNA. Os pequenos fragmentos
oligonucleotídicos são um caso particular que será tratado separadamente.
Um destes métodos é baseado num processo de clivagem química específica e controlada
e o outro na síntese enzimática de fragmentos de DNA interrompidos pela adição controlada
de análogos dos desoxirribonucleotídeos trifosfatos (dNTP), as cordicepinas ou
didesoxirribonucleotídeos. O primeiro método é conhecido pelo nome dos seus autores,
Maxam & Gilbert, ou método químico, e o segundo por método dos didesoxi, ou de
terminação de cadeia, ou ainda de Sanger, nome do seu autor.
1. Método químico ou de Maxam & Gilbert
O princípio do método químico, de Maxam & Gilbert, baseia-se na clivagem duma
cadeia de DNA, induzida por uma reacção química de modificação, específica de cada uma
das 4 bases. Três etapas sucessivas estão implicadas na clivagem específica ao nível de uma,
ou duas das 4 bases (Fig. 26.II.):
1) Modificação da base
2) Remoção da base modificada do ciclo furanôsico
3) Clivagem da cadeia de DNA ao nível deste açúcar.
As etapas 2 e 3 têm a propriedade de serem dependentes da etapa precedente, i.é., o
DNA só será clivado ao nível dum açúcar desprovido da base e somente uma base
modificada de maneira adequada poderá ser removida do ciclo furanôsico que lhe
corresponde. A especificidade reside na primeira reacção. As reacções seguintes têm que ser
quantitativas. Por consequência, os reagentes de modificação que reagem com as bases são
absolutamente fundamentais, porque são eles que determinam o sítio de clivagem do DNA.
O sulfato de dimetilo e a hidrazina são dois reagentes que correspondem aos critérios
exigidos e conhecidos desde há muito tempo pelas suas propriedades de modificação e de
abertura dos ciclos das bases, tornando o DNA vulnerável à clivagem. As Fig. 27.II. e Fig.
28.II. detalham estas reacções. A primeira exemplifica as reacções da guanina: metilação do
azoto 7 com o sulfato de dimetilo, que introduz uma carga positiva na parte N7-C8-N9
imidazólica do ciclo púrico. Quando C8 é atacado por NaOH, a ligação C8-N9 rompe-se. Em
seguida a piperidina remove o ciclo aberto da 7-metilguanina e catalisa a eliminação ß dos
dois fosfatos do açúcar. Um mecanismo semelhante passa-se com a adenina.
16
A segunda figura exemplifica as reacções duma timina. A hidrazina ataca a timina nos
C4 e C6 abrindo o ciclo pirimidínico e ciclisando com C4-C5-C6 para formar um ciclo de 5
membros. A continuação da reacção com a hidrazina remove este novo ciclo pirazolona e o
fragmento ureico N1-C2-N3 da timina, enquanto que os açúcares do esqueleto do DNA
ganham a forma de hidrazona. Em seguida, a piperidina reage com todos estes glicosídeos e
como precedentemente catalisa a eliminação ß dos 2 fosfatos do açúcar. A citosina reage de
maneira semelhante.
Modulando estas reacções pela natureza e concentração da base, o pH, a temperatura, é
possível favorecer a clivagem no sítio de uma ou outra base púrica, ou de uma ou outra base
pirimidínica. Consideremos por exemplo, um fragmento de DNA marcado em 5' com 32P e
submetido às reacções que conduzem à clivagem, parcial mas específica, ao nível das
guaninas. As condições experimentais serão escolhidas de maneira a que cada molécula de
DNA não sofra mais duma clivagem. Neste caso, os fragmentos indicados na Fig. 29.II.,
marcados em 5' com 32P serão formados em proporções idênticas. Se o fragmento de DNA
for submetido separadamente a 4 séries de reacções, cada uma específica de uma base e as 4
séries de fragmentos forem analisadas em paralelo num gel de electroforese e este for em
seguida submetido a uma autorradiografia, a sua sequência pode ser lida seguindo o "padrão"
das bandas na película (Fig. 30.II.).
Uma característica essencial deste método é a necessidade de se dispor de um fragmento
de DNA especificamente marcado numa das suas extremidades, 5' ou 3'. Em geral estes
fragmentos são formados por clivagem com endonucleases de restrição e preenchimento das
extremidades protuberantes com uma polimerase e α32P-ATP. Antes de sequenciar o
fragmento de DNA, é necessário separar as duas extremidades marcadas. Uma maneira de
proceder consiste em digerir o fragmento com uma endonuclease de restrição, que dê origem
à formação de dois fragmentos bicatenários de comprimento diferente que possam ser
separados num gel de electroforese (Fig. 31.II.).
A quantidade de DNA que deve ser utilizada depende do comprimento do fragmento e
do número de reacções que se pretende efectuar, assim que da habilidade do experimentador.
É necessário pelo menos 1 picomole para a marcação. Por exemplo, no caso do pBR322
linearizado, de peso molecular de 2.6106 Da, 1 picomole corresponde a 2,6 µg de DNA. Se a
actividade específica de 32P-dNTP utilizada na marcação for de 1000 Ci/mmol, 1 mci (+ 106
cpm) poderá ser teoricamente incorporada por nucleotídeo adicionado. Depois das etapas de
precipitação sobejarão 105 cpm para colocar no PAGE (PAGE-polyacrilamide gel
eletrophoresis) de separação. A resolução do gel, a sua capacidade para separar fragmentos
de comprimento N dos de comprimento N + 1 depende da natureza do gel, do seu
comprimento e composição. Um gel convencional é composto de 8 % de acrilamida, 8M de
17
ureia, tem 0,2-0,3 mm de espessura e 40 cm de comprimento. Obtém-se uma resolução
satisfatória de 200 nucleotídeos (Fig. 30.II.) Se não se puderem separar 200 nucleotídeos
numa corrida única aplicam-se alíquotas das 4 reacções de clivagem (ou mais) a tempos
diferentes. Na figura, as mesmas amostras aplicadas nos corredores da esquerda (I) foram
aplicadas no gel 2 horas mais tarde, à direita. As moléculas mais pequenas separam-se nos
corredores contendo as últimas alíquotas a serem aplicadas e que correram durante menos
tempo. Começa-se a leitura nos corredores de direita. Na figura, as setas indicam os pontos
que delimitam a zona de sobreposição. Existe equipamento que permite realizar géis mais
compridos e ler um maior número de bases duma vez. A utilização de dNTP marcados com 35S melhora, por sua vez, notavelmente a resolução.
A Fig. 5.3 (Sequenciação de DNA, método de Maxam and Gilbert) ilustra e resume o
princípio do método.
Uma variante importante, que poderia ser potencialmente explorada na sequenciação
automática, é o método em fase sólida. Neste método, o DNA marcado com o 32P é
imobilizado por adsorção num papel de troca iónica (p. ex., DEAE). Todas as reacções e
lavagens são efectuadas em suporte sólido. As vantagens, em relação ao método em solução,
são a rapidez e a simplicidade. As liofilizações e as precipitações são em grande parte
substituídas por simples lavagens rápidas.
2. Método de terminação de cadeia ou de Sanger
Neste método, começa-se por hibridar um iniciador (primer) oligonucleotídico,
complementar do DNA numa região próxima da que se pretende sequenciar. O iniciador é,
em seguida, prolongado (em presença de dNTPs, um dos quais está marcado em posição α
com 32P, ou com 35S) com uma polimerase que utiliza o DNA alvo da sequenciação como
molde.
A cada uma das quatro misturas de reacção realizadas em paralelo, adiciona-se um
didesoxirribonucleotídeo trifosfato correspondente a cada uma das quatro bases, em
concentrações e proporções bem definidas em relação aos dNTP. Obtém-se assim 4
populações de fragmentos, tendo todos a mesma extremidade 5' e terminando com um
didesoxirribonucleotídeo idêntico, no seio de cada população: ddA, ddT, ddC ou ddG (Fig.
32.II.). Os didesoxirribonucleotídeos não possuem os grupos hidroxílicos em 3' e em 2'.
18
Como o grupo 3'OH é necessário para a formação de ligações fosfodiéster, a presença de
ddNTPs provoca a terminação da cadeia. As reacções de síntese são paradas adicionando
formamida que impede as cadeias de DNA de se hibridarem.
Antigamente recorria-se a uma digestão por uma endonuclease que cortasse num sítio
dando origem a fragmentos mais curtos, que serviam de iniciadores. De cerca de 250 em 250
nucleotídeos era necessário recorrer a um novo iniciador. Esta condição obrigatória, e a
necessidade de dispor de DNA monocatenário, eram considerados nos tempos da infância do
método, como inconvenientes sérios. Hoje, se bem que o princípio na base do método não
tenha mudado, a estratégia de clonagem do DNA que se pretende sequenciar, no fago M13,
de DNA circular monocatenário ou em derivados e a possibilidade de recorrer facilmente,
graças aos progressos realizados na síntese química de DNA, a iniciadores oligonucleotídicos
sintéticos, levou à adopção generalizada deste método.
A Fig. 5.4 (Sequenciação de DNA, método d Sanger) ilustra e resume o princípio do
método.
Com a finalidade de o tornar de utilização mais prática, o M13 foi modificado em várias
etapas a partir da sua forma replicativa bicatenária (RF) (Fig. 33.II.). O primeiro derivado é o
mp1, que possui na região intergénica não essencial, representada a preto, uma inserção
composta da região do gene lacI que codifica a porção C-terminal do repressor, a região
reguladora completa promotor-operador e os codões correspondentes aos primeiros 146
aminoácidos da região N-terminal do gene da ß-galactosidase, lac Z.
O derivado mp2 resulta duma simples substituição dum dG em dA, com o fim de criar
um sítio EcoRI (Fig. 34.II.). Esta substituição, que converte o 5o codão do ácido aspártico em
codão de asparagina não tem consequências na actividade do péptido que é assegurada pelos
primeiros 146 aminoácidos da ß-galactosidase. Para tornar o vector mais prático, inseriu-se
no sítio EcoRI um poli adaptador comportando vários sítios de restrição, nas duas orientações
possíveis. Estas construções correspondem aos vectores M13mp8 e M13mp9. A introdução
de aminoácidos suplementares, resultante desta inserção, não interfere com a actividade
complementar que o péptido α assegura a uma ß-galactosidase enzimaticamente inactiva,
O B
H H
O
Estrutura geral dum ddNTP
P O P O P
O O O
OOO
O
19
produzida por um epissoma F do hospedeiro E. coli Lac- (o epissoma comporta o operão lac
com uma eliminação M15 no gene de lac Z, correspondente aos aminoácidos 11-41). Esta
complementação pode ser detectada por um teste corado, que se baseia na hidrólise do 5-
bromo-4-cloro-3-indolil-ß-D-galactosídeo (Xgal) pela ß-galactosidase, produzindo o 5-
bromo-4-cloro-indigo azul, visível nas placas de agar contendo Xgal, em que forem
cultivadas as bactérias infectadas pelo fago em presença de isopropiltiogalactosídeo (IPTG),
indutor gratuito do operão lactose.
A perda da complementação α, depois da clonagem do DNA estrangeiro no seio do
polilinker, serve para identificar rapidamente as bactérias que produzem o vector
recombinante. Isto não tem, no entanto, valor absoluto, porque podem existir situações em
que a clonagem não anula a produção de um péptido que complemente a ß-galactosidase
inactiva. Só as inserções do DNA estrangeiro, que destruam a fase de leitura aberta do
péptido α, ou que introduzam codões de fim de leitura, conduzem sempre à formação de
placas brancas.
Têm sido bastante utilizados os vectores M13mp18 e M13mp19, que provêm de
construções realizadas para aumentar o número de sítios de restrição utilizáveis.
O iniciador utilizado na sequenciação é universal; a sua extremidade 3' está situada na
vizinhança da inserção CTGGCC.....
CH3
CH3
IPTG
O
CH2OHHO
OH
OHH
S CH O
CH2OHHO
OH
OHH
O
N
Cl
Br
H
Xgal
N N
Br Br
ClClO O
H H
5',5'-dibromo-4,4'-dicloroindigo
20
As duas cadeias dum inserto, com extremidades coesivas diferentes, podem ser
sequenciadas, uma no mp18 e outra no mp19, pois estas construções contêm o polilinker em
sentidos opostos. Se o fragmento inserido tem extremidades idênticas, obtêm-se as duas
orientações no mesmo vector.
Insertos maiores que 300 a 400 nucleotídeos dificilmente podem ser sequenciados com
um só iniciador. No entanto, a informação obtida sobre a sequência lida o mais longe
possível no inserto, permitirá deduzir a sequência de um segundo iniciador, que servirá para
sequenciar uma nova série de 300 nucleotídeos. Esta estratégia permite a sequenciação de
insertos de mais de 2000 nucleotídeos, graças à síntese química rápida dos iniciadores
oligonucleotídicos. Insertos muito maiores conduzem a um crescimento muito reduzido das
células infectadas.
O DNA de grande comprimento, como por exemplo DNA de vírus de 8000 pares de
bases pode ser sequenciado por este método, utilizando a técnica do shot-gun. Fragmentos de
restrição do DNA são clonados ao acaso nos vectores M13, sem controlo da sua orientação
no genoma. Os fragmentos clonados são sequenciados a partir do iniciador universal e a
informação reunida é em seguida processada num programa computorizado, a fim de
identificar as sequências que se sobrepõem. Para preencher as lacunas é preciso recorrer a
estratégias de sub-clonagem não aleatórias (Fig. 35A.II.). O fragmento de DNA a sub-clonar
para ser sequenciado subsequentemente, é clonado num vector M13mp. O DNA com o
inserto em ambas as orientações é tratado com DNAseI em condições que provocam
linearização em posições ao acaso. A fim de obter uma série de fragmentos contendo o DNA
de M13 intacto (necessário para haver transformação e formar placas de lise), mas
comportando insertos de comprimento variável, estendendo-se do sítio Z até ao sítio Y do
outro lado do inserto, a mistura de fragmentos linearizados é digerida com a enzima X. Após
tratamento com polietilenoglicol (PGE), que precipita unicamente grandes fragmentos de
DNA, estes fragmentos são de novo suspendidos e ligados, para formarem moléculas
circulares de DNA. Entre estas moléculas encontram-se as que foram cortadas com DNAseI
dentro do inserto e que perderam o sítio Y (1, 2 e 3). As que não foram cortadas inicialmente
com DNAseI (esquema de reacção à esquerda na figura 35A.II.), ou que foram cortadas
dentro do segmento de DNA de M13 (molécula 4 na via reaccional da direita), ainda contêm
o sítio Y. Após digestão da mistura de reacção total com a enzima Y, estas últimas moléculas
serão linearizadas, enquanto que as primeiras, com a série de insertos começando no sítio Z,
permanecerão circulares. A eficácia da transformação, ou transfecção, com o DNA linear é
baixa, comparada com a do DNA circular. Assim, unicamente as moléculas de interesse
formarão placas após transformação. Como todos os insertos possuem uma terminação
comum (Z), a sequenciação dos diferentes clones, a partir dum iniciador da síntese
(polimerização) no sítio X, deve eventualmente cobrir todo o inserto.
21
Outra abordagem para sequenciar um longo fragmento de DNA consiste em criar uma
família de clones M13, contendo cada um, um sub-fragmento do gene. Isto pode ser realizado
preparando eliminações ordenadas, como ilustrado na Fig. 35B.II. A cadeia de DNA
bicatenária, comportando o inserto completo é aberta numa extremidade deste, com uma
enzima de restrição. O inserto é em seguida digerido com uma exonuclease. Porções da
mistura de reacção de digestão são removidas a diferentes tempos, antes da ligação ser
completa, de maneira a parar a reacção. Formam-se populações de moléculas com
comprimentos diminuindo progressivamente. As moléculas com eliminações são de novo
circularizadas com DNA ligase, colocando o sítio de ligação perto do iniciador universal
(USP, Universal Sequencing Primer), que fica adjacente da nova extremidade criada pela
digestão pela exonuclease. Otém-se uma colecção de clones, nos quais a região de hibridação
do iniciador universal está bem situada para sequenciar diferentes porções do inserto. Ao
sequenciar esta colecção de clones com um único iniciador pode-se obter um elevado número
de sequências que se sobrepõem e assim determinar a sequência total do gene.
Existe uma variante em fase sólida do método de sequenciação de Sanger, que se baseia
na imobilização de um plasmídeo contendo o inserto que se quer sequenciar (Fig. 36.II.). Este
é linearizado com uma enzima de restrição A, e as extremidades protuberantes são
preenchidas por uma polimerase com os 4 nucleotídeos trifosfatos, dos quais um é um
derivado contendo biotina, por exemplo a 11-bio-dUTP comercial. Depois de uma segunda
digestão com uma outra enzima de restrição B, a mistura é passada numa coluna de avidina-
agarose. A avidina, ao complexar fortemente a biotina, assegura a imobilização do DNA
biotinilado. As cadeias não biotiniladas são em seguida eliminadas por desnaturação e
lavagem. O DNA biotinilado monocatenário imobilizado servirá de molde para a hibridação
com um iniciador de sequenciação e para as reacções de polimerização. Os oligómeros são
eliminados, depois de desnaturados, deixando as cadeias matrizes disponíveis para a reacção
de sequenciação seguinte.
O método de sequenciação de terminação de cadeia pode ser aplicado à sequenciação de
DNA bicatenário, clonado por exemplo, no pBR322 ou em derivados da família pUC (vd.
secção 9.). Na prática, as moléculas recombinantes na forma circular fechada são
completamente desnaturadas a pH fortemente básico (NaOH). A re-naturação em estrutura
inicial é difícil a este pH (>12); forma-se uma rede de moléculas híbridas que expõem uma
proporção suficiente de DNA monocatenário. A utilização da sequenase (variante genética da
DNA polimerase do bacteriófago T7), em vez do fragmento de Klenow da DNA polimerase
I, foi, sem dúvida, um factor de sucesso na sequenciação de DNA pelo método dos didesoxi,
incluindo o bicatenário. A actividade exonucleásica 3'→5' da forma nativa foi removida por
manipulação genética in vitro. A enzima possui elevada processividade e actividade
específica, e uma boa estabilidade.
22
Certas sequências de DNA, em particular as que contêm pares de dG e dC simétricos,
não são completamente desnaturadas durante a electroforese. Sempre que este fenómeno
ocorre, o padrão da separação dos fragmentos de DNA é interrompido; as bandas
apresentam-se menos espaçadas que normalmente (fenómeno de compressão) e a informação
sobre a sequência é, por consequência, perdida. Uma maneira de eliminar este artefacto
recorre à incorporação dos análogos da dGTP, o trifosfato de 7-desaza-2'-desoxiguanosina (7-
desaza-dGTP), ou o trifosfato de desoxiinosina (dITP), que formam estruturas secundárias
mais fáceis de desnaturar. Ambos são reconhecidos pela sequenase.
3. Utilização da PCR em sequenciação
Um progresso importante foi realizado nesta área com a introdução da técnica da
amplificação enzimática pela reacção de polimerização em cadeia (Polymerase Chain
Reaction, PCR), para a sequenciação de DNA.
Este método permite amplificar in vitro, fragmentos específicos de DNA, facilitando a
acumulação da informação para a sequenciação de DNA. É baseado na utilização de dois
oligonucleotídeos iniciadores da polimerização catalisada pela DNA polimerase, sobre as
cadeias complementares de DNA, dentro da região compreendida entre os dois
oligonucleotídeos (vd. secção 11.g para mais detalhes). Efectuando ciclos repetidos de
desnaturação das cadeias complementares de DNA, de annealing dos iniciadores
oligonucleotídicos com as referidas cadeias e de síntese de DNA com a polimerase, obtém-se
um incremento exponencial dum fragmento discreto de DNA (fig37.II.A). Um inconveniente
do método inicial da PCR era a limitação dos fragmentos amplificados à região confinada
entre os dois iniciadores. Existe actualmente uma variante (PCR invertida), em que os
oligonucleotídeos são iniciadores da síntese de DNA em direcções que divergem da região
compreendida entre eles. Após digestão por uma enzima de restrição, auto-recircularização e
O N
N
N
O
H
NH2
OH
OPO N
NN
N
OH
OP
7-desaza-dGTP dITP
23
ligação com uma ligase do fragmento de DNA alvo, a PCR com iniciadores invertidos dará
origem a um fragmento linear contendo regiões de sequências desconhecidas divergindo dos
iniciadores.
A utilização mais evidente da PCR em sequenciação, é na preparação das matrizes de
DNA; existe uma variedade grande de métodos para diferentes aplicações. No entanto, a Taq
polimerase utilizada na reacção de amplificação é uma enzima ideal para sequenciação, que
pode assim ser efectuada directamente subsequentemente à amplificação, sem que sejam
necessárias modificações significativas em relação aos componentes reaccionais.
Habitualmente, a quantidade de matriz de DNA necessária para sequenciação obtém-se
inserindo o DNA alvo em vectores bacterianos ou virais e multiplicando os insertos em
células hospedeiras. Todavia, as matrizes para sequenciação podem-se obter mais
eficazmente que com os métodos dependentes de células, a partir de alvos genómicos ou de
insertos de DNA clonados em vectores bacterianos ou virais, recorrendo à amplificação por
PCR dos insertos clonados. Mesmo a partir de sequências completamente desconhecidas é
possível recorrer à amplificação, utilizando oligonucleotídeos iniciadores, no interior, ou
próximos, do poli-linker do vector de clonagem. Desta maneira não é necessário fazer
culturas repetidas e purificações das matrizes de sequenciação a partir de bactérias ou de
vírus.
Um problema inerente à sequenciação directa pelo método da PCR resulta da re-
associação rápida das duas cadeias de DNA linear amplificadas, após desnaturação, que
bloqueia a extensão do complexo iniciador oligonucleotídeo-matriz de DNA, ou impede o
annealing desta com o oligonucleotídeo. Vários métodos podem ser utilizados para contornar
este inconveniente e obter preferencialmente uma mono cadeia matriz para sequenciação.
1) O DNA bicatenário gerado por PCR é utilizado como matriz de sequenciação
directamente, ou após separação por electroforese e purificação a partir do gel, a fim de
remover o DNA não amplificado, os iniciadores e os dNTPs. Em seguida, um dos
oligonucleotídeos iniciadores é utilizado para iniciar a reacção de sequenciação. O DNA
desnaturado pode ser arrefecido rapidamente em neve carbónica, a fim de retardar a re-
associação das cadeias.
2) Quando os produtos da PCR são de comprimento superior a 500 pb, o DNA
bicatenário pode ser desnaturado e as cadeias monocatenárias separadas por electroforese.
Este método é apropriado para DNA de grande comprimento, cujas cadeias monocatenárias
são difíceis de obter por outros métodos.
3) O DNA monocatenário pode ser produzido directamente por PCR utilizando uma
proporção molar assimétrica dos dois iniciadores oligonucleotídicos, ou ainda recorrendo a
uma segunda reacção de PCR utilizando um excesso dum dos iniciadores e um fragmento
24
alvo, proveniente duma PCR simétrica, separado por electroforese e purificado a partir de gel
electroforético (Fig. 37.II.B).
4) Uma alternativa para produzir DNA monocatenário por PCR sem diminuir a eficácia
da amplificação, (como pode ser o caso do método assimétrico), recorre ao bloqueamento
dum dos iniciadores da PCR. Um excesso de um terceiro oligonucleotídeo complementar de
um dos iniciadores da PCR é adicionado durante a reacção de amplificação. O terceiro
oligonucleotídeo retira da competição as moléculas duma das cadeias acabada de ser
sintetizada, impedindo-as de se complexarem com o iniciador bloqueado. A PCR é assim
transformada a dada altura numa reacção de extensão de mono cadeia (Fig. 37.II.C).
5) Uma abordagem completamente diferente recorre à combinação da PCR com a
transcrição reversa, utilizando uma sequência promotora de fago, específica da enzima,
ligada a um dos iniciadores da PCR. Inicialmente a PCR é efectuada de maneira equilibrada,
simétrica, a fim de produzir DNA bicatenário. A reacção de transcrição é efectuada num
segundo tempo e dará origem a um incremento suplementar do número de cópias da cadeia
monocatenária desejada (RNA), devido ao reconhecimento específico da sequência
promotora pela transcritase do fago. Este transcrito é em seguida sequenciado recorrendo à
transcritase reversa (Fig. 37.II.D).
A Taq polimerase é uma enzima adequada para a sequenciação de DNA porque possui
uma elevada processividade e incorpora em proporção excelente; além disso incorpora o
análogo 7-desazaguanosina, utilizado para resolver a compressão das sequências de DNA
ricas em C-G. Para além destas propriedades, que compartilha com a T7 DNA polimerase,
funciona a 55-75°C, condição que pode ser útil para resolver estruturas secundárias
eventualmente presentes no DNA e que podem dificultar a aquisição da informação de
sequenciação.
4. Sequenciação "automática"
O princípio utilizado nos sistemas ditos "automáticos", actualmente disponíveis no
mercado é o do método de terminação de cadeia de Sanger. As suas características principais
são o sistema de detecção não radioactivo e o processamento da informação, que é
automatizado.
Foram desenvolvidos dois sistemas que se baseiam na derivatização química de
desoxirribonucleotídeos, modificados por grupos fluorescentes que são incorporados nos
fragmentos de DNA sintetizados pela polimerase. Cada um deles recorre a uma série
particular de 4 grupos fluorescentes.
25
Num dos sistemas, os grupos fluorescentes são a fluoresceína, o nitrobenzoxadiazolo, a
tetrametilrodamina e o Texas Red (Fig. 38.II.). Os espectros destes compostos apresentam
máximos de absorvência a comprimentos de onda diferentes. Cada um destes grupos
fluorescentes está ligado quimicamente ao nucleotídeo modificado em 5' do iniciador
universal. Obtêm-se 4 iniciadores que diferem unicamente pela natureza da entidade química
fluorescente fixa na sua extremidade 5'. Se se utilizar cada um destes iniciadores em cada
uma das reacções de polimerização em que intervém um dos quatro
didesoxirribonucleotídeos, associa-se um grupo fluorescente a um terminador de cadeia. A
mistura dos produtos das 4 reacções é separada por electroforese, num corredor único duma
coluna de gel de poliacrilamida, ou num gel com vários corredores. As bandas fluorescentes
são excitadas por um laser e detectadas perto da base do gel durante a electroforese. A
informação é transferida directamente para um computador, que identifica cada uma das
bandas coradas, em tempo real, à medida que elas passam, em função do comprimento de
onda do máximo de absorvência. A sequência temporal dos diferentes grupos fluorescentes
representa a sequência do DNA (Fig. 39.II.).
Os dados sobre os comprimentos de onda são continuamente recolhidos e armazenados
num computador, durante a corrida electroforética e, em seguida, analisados para fornecerem
a sequência final.
No segundo sistema os grupos fluorescentes estão ligados à parte básica dos trifosfatos
dos derivados didesoxirribonucleotídeos (Fig. 40.II.). Os grupos trifosfatos asseguram a
incorporação, sem que o grupo fluorescente impeça aparentemente o reconhecimento da base
complementar e o reconhecimento pela polimerase; a ausência de grupo hidroxílico em 3'
termina a polimerização. Cada um dos quatro didesoxirribonucleotídeos é modificado com
um grupo fluorescente absorvendo a um comprimento de onda diferente, permitindo, como
no primeiro sistema, uma detecção diferencial.
O laser é necessário como fonte de excitação, a fim de se obter uma sensibilidade
máxima a partir de cada banda de DNA.
A figura 41.II mostra a informação bruta, a informação processada e um detalhe
ampliado, entre os nucleotídeos 89 e 110 de um gráfico de análise. Este processamento da
informação, que torna a diagrama mais claro e de mais fácil interpretação, é de momento
indispensável, por 3 razões fundamentais:
1) Os espectros de emissão dos diferentes corantes sobrepõem-se parcialmente. Os picos
correspondendo à presença de um só corante são, por isso, detectados por mais de um canal.
É, portanto, necessário determinar as diferentes proporções dos 4 grupos fluorescentes
presentes no gel a cada instante.
26
2) Uma segunda complicação provém do facto de os grupos fluorescentes influenciarem a
mobilidade dos fragmentos de DNA. Por exemplo, a fluoresceína e a rodamina diminuem a
mobilidade dos fragmentos de DNA de uma base e o Texas Red de 1 base e 1/4. É, portanto,
necessário fazer a correcção.
3) Uma terceira complicação é inerente ao método enzimático, que dá por vezes origem a
variações de intensidade das bandas ou a regiões de leitura difícil, devido à existência de
estruturas secundárias no seio do DNA.
Foram desenvolvidos três outros sistemas que utilizam cada um, um só marcador
fluorescente e quatro corredores electroforéticos. Esta modificação evita os problemas
associados à mobilidade diferencial dos fragmentos, causada pelos 4 diferentes marcadores
químicos e a sobreposição dos espectros de emissão dos múltiplos grupos fluorescentes.
Qualquer deles lê a sequência em bases de DNA de maneira contínua e em tempo real, e
possui uma sensibilidade entre 1 e 50 10-18 moles por banda, próxima da obtida com a
autorradiografia convencional.
Os marcadores químicos fluorescentes encontram-se no iniciador do M13, utilizado na
sequenciação pelo método dos didesoxirribonucleotídeos. Num dos sistemas o marcador é
introduzido na extremidade 5' dum derivado sulfídrico do iniciador, por reacção com a
iodoacetamida fluoresceína de estrutura representada na figura 42.A.II. O feixe de excitação
laser atravessa o interior do gel em linha recta, no sentido da largura (lateralmente),
controlando continuamente os quatro corredores (disposição que elimina a necessidade de
movimentos de "scanner" e aumenta a sensibilidade). Um gel de 20 a 30 cm de comprimento
é suficiente para efectuar a leitura de 300-400 bases em 5 horas.
Nos dois outros sistemas, os iniciadores são marcados com o isotiocianato de
fluoresceína (FITC), introduzido em 5'-OH, ou num fosfato internucleotídico (Fig. 42.B.II),
ou em posição C5 da base desoxiuridina, segundo o caso, por reacção com derivados
oligonucleotídicos alquilaminados nas posições referidas. Num dos sistemas, dois grupos
fluorescentes foram introduzidos no mesmo iniciador utilizando os derivados aminados em
C5 de duas desoxiuridinas diferentes, com a finalidade de aumentar a sensibilidade da
detecção e sem que haja interferências com a actividade biológica (Fig. 42.C.II.).
As Fig. 43.II. e 44.II. ilustram esquematicamente a disposição da aparelhagem de
irradiação de excitação laser, de filtração, de irradiação emitida e de análise computorizada
dos dados. A irradiação de excitação é lateral num dos sistemas (Fig. 43.II.) e orientada num
ângulo, que minimiza os reflexos do vidro do gel e optimiza a energia transmitida às bandas,
no sistema que utiliza a bi-marcação fluorescente (Fig. 44.II.). Este último processo introduz
uma focalização do feixe laser que aumenta a resolução das bandas separadas por espaços
muito curtos e um sistema de scanning horizontal do gel que permite a criação duma imagem
27
bidimensional (Fig. 45.II.). Este sistema permite sequenciar com óptima resolução 500-600
bases duma única aplicação, em gel de 30 cm correndo 4 amostras (16 poços)
simultaneamente, com uma percentagem média de erro de 0,83 %.
5. Sequenciação multiplex
A necessidade crescente da determinação de sequências de DNA e nomeadamente o
projecto de sequenciação da totalidade do genoma humano (3 biliões de bases), levaram ao
desenvolvimento de técnicas mais elaboradas e rápidas. Uma actividade intensa foi sido
desenvolvida na pesquisa dedicada a este tema.
Os princípios básicos da sequenciação, do método enzimático de terminação de cadeia
de Sanger e do método de clivagem química de Maxam & Gilbert, continuaram a ser
aplicados, apesar das variações e aperfeiçoamentos introduzidos. Um exemplo dos
desenvolvimentos realizados nas técnicas de sequenciação de DNA baseia-se em métodos
que recorrem à hibridação de DNA-DNA. O sistema "multiplex" de sequenciação tira partido
da possibilidade de aplicar, num corredor electroforético, uma multiplicidade de amostras
correspondentes a uma clivagem específica, ao nível de uma base (método de Maxam &
Gilbert) efectuada simultaneamente com múltiplos fragmentos de DNA, cuja sequência
individual se deseja determinar. O padrão individual das bandas correspondentes a cada
fragmento é decifrado por hibridação com sondas específicas marcadas radioactivamente.
A Fig. 46.II. esquematiza as diferentes etapas deste método. Uma mistura de fragmentos
de DNA (de 900 a 1500 pb, provenientes por exemplo, do fraccionamento por vibração
ultrassónica, de DNA genómico) é clonada separadamente em 20 vectores, que foram
construídos especialmente para o sistema multiplex. Estes 20 vectores plasmídicos diferem
unicamente pela sequência de dois fragmentos, que flanqueiam o sítio de restrição utilizado
para a clonagem do DNA que se pretende sequenciar. Os 40 fragmentos correspondentes
foram sintetizados quimicamente, com sequências suficientemente diferentes para permitirem
a identificação fácil de cada um dos 20 vectores, por hibridação com uma sonda
complementar (Fig. 47.II.). As 20 misturas de clonagem são levadas a transformar
separadamente uma estirpe de E. coli e os 20 bancos de DNA resultantes são amplificados,
utilizando a resistência à tetraciclina como marcador de selecção. Os plasmídeos que contêm
um inserto único são seleccionados por electroforese em gel de agarose, purificados e levados
a transformar separadamente a mesma estirpe bacteriana. Os transformantes são plaqueados
em 20 placas (1 cultura de transformante por placa) formando cerca de 100 colónias por
placa. São em seguida constituídos grupos de 20 colónias, uma de cada placa, de maneira a
que cada um dos vectores plasmídicos, especificamente rotulado com as sequências
oligonucleotídicas sintéticas, se encontre representado uma vez em cada grupo. Misturando
28
várias colónias desta maneira, obtêm-se várias séries de grupos, compostos cada um de 20
colónias, comportando, portanto, 20 clones de fragmentos de DNA, um por plasmídeo
diferente. Cada um destes grupos de colónias misturadas é cultivado separadamente e os
plasmídeos de cada cultura são purificados e cortados pela enzima de restrição NotI. O DNA
proveniente de cada grupo é submetido separadamente a quatro reacções químicas de
clivagem de base e os fragmentos resultantes são fraccionados electroforeticamente como já
foi descrito antes.
Esta técnica tem a particularidade de recorrer à aplicação de amostras provenientes de 12
séries de reacções, utilizando portanto 48 corredores num só gel (Fig. 48.II.). Os fragmentos
fraccionados são transferidos electricamente do gel para uma membrana de nylon, onde são
fixos por reacção induzida pela luz U.V.. Como cada série de reacção faz intervir um grupo
de 20 fragmentos de DNA, provenientes dos 20 bancos iniciais, é possível ler numa só
membrana, portanto a partir dum único gel, 240 sequências de DNA. Com efeito, cada
oligonucleotídeo marcado radioactivamente com 32P e complementar da sequência que
rotula cada um dos vectores plasmáticos, revela, após hibridação e autorradiografia, o padrão
de clivagem do DNA clonado em cada um destes plasmídeos. Isto é possível porque a
membrana em nylon retém fortemente os fragmentos de DNA, permitindo pelo menos 50
hibridações, intercaladas por 50 operações de desnaturação, sem perca de sensibilidade ou de
resolução, mantendo a especificidade das hibridações.
6. Outras tendências
Para acelerar a velocidade de sequenciação do DNA de várias ordens de grandeza, pode-
se teoricamente recorrer à combinação de várias técnicas existentes: à sequenciação
multiespectral, à fotoquímica dos grupos fluorescentes, à sequenciação multiplex, à
transferência (blotting) directa e automática do resultado da eletroforese para membranas e às
técnicas de figuração electrónica.
A proposta de sequenciação pelo método multiespectral-multiplex ambiciona
desenvolver um sistema capaz de processar um milhão de bases por gel de sequenciação.
A primeira etapa no sentido da automatização do sistema multiplex visa a transferência
directa do gel de sequenciação para uma membrana. Já utilizado para o blotting de proteínas,
este dispositivo compreende uma matriz para imobilização (nitrocelulose ou nylon)
incorporada numa correia transportadora, que se move ao longo do fundo do gel. Os
fragmentos de DNA fraccionados são sequencialmente transferidos para a matriz,
preservando a informação espacial. Uma das vantagens deste sistema é o aumento da
resolução espacial entre os fragmentos de maior comprimento, porque a separação em função
29
do tempo, mediada pela correia móvel, é linear, ao contrário do fraccionamento em função da
distância, cuja relação é logarítmica, o que provoca a compressão das bandas. Este sistema
permite resolver e manter uma resolução linear até aproximadamente 600 nucleotídeos num
gel de 5 % de poliacrilamida.
A proposta multiespectral-multiplex recorre a 50 séries diferentes de sondas, destinadas a
serem hibridadas com um número igual de iniciadores de sequenciação do M13, de
sequências complementares à das sondas. Estas séries de sondas e de iniciadores serão
utilizadas para a determinação de 2000 famílias de sequências (50 ciclos multiplex x 40
corredores electroforéticos) por gel. Não são necessários vectores especiais porque a sonda
fluorescente é dirigida para o iniciador de sequenciação e não para o vector (Fig. 49.II.).
Cada família de bandas de sequenciação será lida a quatro comprimentos de onda específicas,
por um sistema de detecção em que a resolução é função do tempo. Só são necessárias 160
reacções separadas de sequenciação pelo método dos didesoxinucleotídeos para as 2000
famílias de sequências, porque todas as reacções A, G, C e T podem ser agrupadas num
corredor dado (4 bases x 40 corredores = 160 reacções).
As seis etapas esquematizadas na Fig. 50.II. incluem:
1) Preparação para sequenciação de 2000 fragmentos de DNA monocatenário (no M13
mp18, por exemplo). Este DNA é preparado a partir do fago, sem necessidade de vectores ou
métodos especiais.
2) Divisão dos 2000 fragmentos de DNA em 40 grupos de 50 fragmentos cada. Os 50
fragmentos de cada grupo (totalizando 40 x 4 = 160 reacções de terminação de cadeia com os
didesoxinucleotídeos) serão aplicados num só corredor de electroforese. São portanto
necessários 40 corredores (por gel) para a sequenciação multiespectral-multiplex de 2000
cadeias de DNA. Como a sequenciação é tetracromática, cada família de sequências será lida
a partir de um corredor, por ciclo.
3) Quatro iniciadores diferentes de sequenciação serão utilizados para cada fragmento de
DNA (um para cada uma das reacções de terminação com os didesoxinucleotídeos A, C, G e
T). É necessária uma série única de 4 iniciadores oligonucleotídicos para cada grupo de
fragmentos de DNA (4 x 50). São, portanto, necessários 200 oligonucleotídeos únicos. A
mesma série de iniciadores pode ser utilizada para cada um dos grupos. Estes 200
oligonucleotídeos serão as sequências alvo das hibridações da sequenciação multiplex.
4) As reacções dos didesoxinucleotídeos A, C, G e T serão agrupadas para cada grupo, o
que reduz o número total de reacções, de 8000 (2000 x 4) da sequenciação convencional,
para 160 (4 tipos de reacção por cada corredor).
30
5) Durante a electroforese recorrer-se-á em simultâneo à transferência directa para uma
matriz de imobilização.
6) Cada família de sequências será lida hibridando uma série de 4 sondas fluorescentes
diferentes (multiespectrais) por ciclo. No total, há 50 séries de 4 sondas multiespectrais. O
factor 50 corresponde ao número de fragmentos multiplex aplicados em cada corredor e o
factor 4 corresponde às 4 bases do DNA.
Após figuração electrónica de um blot (membrana depois de ter recebido a transferência)
a quatro comprimentos de onda, uma família de sequências será lida em cada corredor. A
membrana será lavada, de novo hibridada e a sua figuração representada electronicamente
num total de 50 vezes, até fornecer a sequência das 2000 famílias.
Como o DNA alvo das sondas fluorescentes é monocatenário, será possível utilizar
condições de hibridação suaves, depois da transferência do gel desnaturante.
Espera-se poder processar rapidamente 1 milhão de bases por gel, após os
desenvolvimentos necessários para a automatização do sistema multiespectral-multiplex.
7. Sequenciação de oligonucleotídeos
O método de Maxam & Gilbert pode-se aplicar à sequenciação de fragmentos de DNA
de pequeno comprimento (4 a 40 nucleotídeos). São no entanto necessárias modificações
experimentais em relação às utilizadas com grandes fragmentos. A percentagem de
modificação e, portanto, de clivagem dos grandes fragmentos de DNA, necessária para a
análise da sequência, é relativamente baixa (1-2 %). Se se utilizarem estas mesmas condições
com os oligonucleotídeos, a maior parte das moléculas de DNA permanecem não
modificadas. Para obter resultados satisfatórios são necessárias de uma maneira geral
condições reaccionais mais vigorosas, prolongando o tempo das reacções ou aumentando a
temperatura, ou ambos. Outras modificações de detalhe incluem o método de separação do
excesso de [γ32P]-ATP do oligonucleotídeo marcado, por cromatografia de Sephadex, ou
papel de DEAE celulose. A variante em fase sólida, na qual o oligonucleotídeo é imobilizado
num suporte apropriado para trocas iónicas, também é eficaz.
Um outro método muito útil e que permite simultaneamente controlar a pureza dos
oligonucleotídeos é o método do Wandering spot. Baseia-se nas diferenças de mobilidade dos
fragmentos de degradação sequencial e parcial do oligonucleotídeo, num cromatograma
bidimensional que se obtém por electroforese de alta voltagem (1a dimensão) e
homocromatografia (2a dimensão). O oligonucleotídeo que se pretende sequenciar é marcado
na sua extremidade 5', com a T4 polinucleotídeo kinase e [γ32]-ATP e em seguida é
hidrolisado com a fosfodiesterase de veneno de serpente, enzima que digere o DNA de 3' em
31
5'. Se a digestão é controlada temporalmente, podem-se obter fragmentos de todos os
comprimentos marcados em 5' em quantidades equivalentes (Fig. 51.II.). A mistura é em
seguida submetida a uma electroforese de alta voltagem, numa tira de acetato de celulose, a
pH 3,5. A este pH, a diferença de protonação das 4 bases heterocíclicas é máxima (Fig.
52.II.). A diferença de mobilidade electroforética de 2 oligonucleotídeos com n e n-1
nucleotídeos depende da natureza do nucleotídeo clivado na extremidade 3' do fragmento.
Para identificar os produtos de degradação sequencial é necessário efectuar, depois da
electroforese, uma homocromatografia que os separa em função do comprimento. O material
é transferido da banda de acetato de celulose para a linha de base duma placa de camada fina
de DEAE celulose. A separação efectua-se em função da carga do fosfato em meio básico,
portanto em função do comprimento, sendo os mais compridos os mais retidos.
O efeito combinado da electroforese e da homocromatografia na mobilidade, aparece na
impressão bidimensional, ilustrada na Fig. 53.II., exemplificada com um octâmero.
Utilizando as regras representadas nas figuras pode-se deduzir a sequência a partir do
fingerprint. pdG corre conjuntamente com o xilenocianol e é identificado sem ambiguidade.
Variações mais ou menos importantes em relação às regras surgem por vezes, pelo que é
aconselhável prudência na interpretação dos resultados. Para além de 20 nucleotídeos é muito
difícil interpretar os resultados, devido à sobreposição das bandas. Pode-se, no entanto, obter
informação sobre sequências de fragmentos maiores, recorrendo à marcação do
oligonucleotídeo em 3' pela desoxirribonucleotidiltransferase com [α32P]-dNTPs, digerindo
o oligonucleotídeo de 5' em 3' pela diesterase de baço de vitela e analisando os fragmentos
pelo método acima descrito. Sobrepondo os resultados das duas análises, de 5' em 3' e de 3
em 5' obter-se-á informação complementar.
Um outro método muito rápido e preciso e que se aplica aos oligonucleotídeos de
pequeno comprimento, de 1 a menos 15 nucleotídeos, é a espectrometria de massa por
bombardeamento atómico rápido, conhecido por FAB (Fast Atomic Bombardment).
Resumidamente, uma amostra de oligonucleotídeo de cerca de 10 nmol é submetida a um
bombardeamento de átomos neutros de xénon, que provoca uma fragmentação do
oligonucleotídeo em partículas de carga negativa. Estes fragmentos, em geral de carga -1, são
acelerados e separados num campo magnético em função da massa, para uma carga idêntica.
Do registo do padrão de fragmentação resulta um espectro de massa como o exemplificado
na Fig. 54.II. As fragmentações ocorrem preferencialmente nos locais indicados. No entanto,
como a ligação entre o átomo de oxigénio em 3' e o átomo de carbono secundário do ciclo
furanôsico é mais lábil que a ligação entre o átomo de oxigénio em 5' ligado ao carbono
primário, o registo dos iões correspondentes aos 5'-fosfatos aparece mais intenso que o dos
3'-fosfatos.
32
Na prática, classificam-se os iões em 5'-fosfato ou em 3'-fosfato, segundo a intensidade a
partir do sinal correspondente a (M-H)-. As diferenças exactas das massas, entre os picos
vizinhos da mesma família de fragmentação, são determinadas por contagem e permitem a
determinação exacta da sequência oligonucleotídica correspondente. A sequência completa
das bases do oligonucleotídeo pode então ser lida 2 vezes, partindo da extremidade 5' ou da
extremidade 3'.
As limitações deste método são o preço do equipamento e o comprimento limitado do
oligonucleotídeo que é possível sequenciar.
8. Chromosome walking
O chromosome walking não é propriamente um método de sequenciação. É antes um
método para fazer uma carta, o mapeamento duma região muita vasta de DNA, em geral mais
longa que os insertos habituais obtidos quando se prepara um banco genómico (20-45 kb).
Um passo desta marcha (walking) consiste no escrutínio do banco com uma sonda conhecida
e na identificação de clones que apresentam uma sobreposição com a sonda. Os insertos que
se sobrepõem são mapeados e os que se localizam nas extremidades são utilizados como
sondas para escrutinar o banco e identificar outros clones, cujo DNA se estende mais para a
esquerda e a direita (Fig. 55.II.). Estas etapas são repetidas até se percorrer todo o gene, ou a
região do cromossoma que se pretende estudar: a sonda 1 identifica os clones λ1 e λ2. A
sonda 2, derivada de λ2, é utilizada para identificar o clone λ3. Uma sonda derivada da
extremidade 3' de λ3 servirá para identificar λ4 e assim de seguida. A mesma estratégia pode
ser utilizada para marchar na direcção 5'.
Em vez de marchar pode ser necessário saltar (jumping), o que acontece sempre que há
rearranjos. A parte B da figura ilustra este género de ocorrência. A parte central do DNA está
invertida em relação à situação em A. A sonda 4 identificará neste caso, um novo clone 5,
que cobre a região A e uma região suplementar do cromossoma, que fica na vizinhança de A
depois do rearranjo. A sonda 5, tirada da extremidade 3' do inserto λ5, pode ser utilizada para
continuar a avançar no estabelecimento do mapa.
1.c.Síntese química de DNA
Há cerca de 25 anos, a síntese química de pequenos fragmentos de DNA
(oligonucleotídeos) era um domínio esotérico, apanágio de alguns químicos especializados.
Calculava-se, em 1975, que seriam necessários 20 anos para sintetizar um gene de 100
nucleotídeos segundo um esquema optimizado por computador. Actualmente, é possível
realizar este trabalho em algumas horas. Esta proeza técnica, só é possível graças ao
33
desenvolvimento acelerado das técnicas de síntese química, catalisado pelo advento das
técnicas da Engenharia Genética. O alargamento contínuo do campo de aplicação dos
fragmentos sintéticos de DNA, assim como o aspecto fundamental do estudo estrutural de
certas sequências particulares, constituíram estímulos poderosos para os químicos orgânicos,
cujos esforços conduziram ao ajustamento e ao aperfeiçoamento das técnicas de síntese.
O domínio das aplicações dos oligonucleotídeos sintéticos, ou de análogos, pode ser
assim resumido:
Síntese total ou parcial de genes
Construções (adaptadores, mutagénese...)
Iniciadores para polimerases e transcritases
DNA (ex., diagnóstico..)
Sondas de hibridação para escrutinar RNA (ex., Northern...)
bancos genómicos
bancos de cDNA
Mutagénese dirigida localisada
Determinação de estruturas de DNA e de RNA
Mecanismos de interacção DNA-proteína
Inibição de tradução
transcrição
Apresentamos neste sub capítulo um resumo histórico geral da química que esteve, ou
está na base da síntese de DNA.
I. Princípios da síntese química de DNA
A síntese química em solução de um oligodesoxinucleotídeo comporta as seguintes
etapas:
1) Preparação dos quatro desoxinucleotídeos: timidina, desoxicitidina, desoxiadenosina e
desoxiguanosina, completamente protegidos. Estes são os blocos fundamentais para a síntese.
34
2) Desprotecção selectiva de dois desoxinucleotídeos a condensar, de maneira a libertar em
cada um dos blocos, unicamente as funções implicadas na formação da ligação
internucleotídica.
3) Condensação dos compostos assim gerados para formar um dímero inteiramente
protegido.
4) Extensão da cadeia de DNA repetindo as reacções das etapas 2 e 3 até à obtenção de um
oligodesoxirribonucleotídeo completamente protegido.
5) Desprotecção sequencial e controlada do oligodesoxirribonucleotídeo.
6) Isolamento, purificação e caracterização.
Quando a extensão da cadeia desoxirribonucleotídica é realizada em fase sólida, são
necessárias algumas etapas suplementares:
i) funcionalização de um polímero insolúvel;
ii) fixação do primeiro desoxirribonucleotídeo protegido da cadeia
oligodesoxirribonucleotídica a sintetizar, sobre a função do suporte sólido;
iii) clivagem da cadeia de DNA do suporte sólido.
1) Preparação dos blocos de base para a síntese
As substâncias de base na síntese de DNA são os quatro desoxirribonucleosídeos:
timidina, desoxicitidina, desoxiadenosina e desoxiguanosina; (obtidos por degradação de
ADN de origem natural) (Fig. 56.II.).
Na molécula desoxinucleosídica podem-se distinguir três centros que vão ser objecto de
três transformações distintas: as bases e as funções hidroxílicas, em posição 5' e em posição
3'.
a) Protecção das funções aminas exocíclicas
As bases que possuem funções aminas primárias (a timidina não possui) têm que ser
protegidas. Esta protecção é permanente, visto que o centro aminado não está implicado nas
reacções de extensão oligomérica. Portanto, os grupos protectores devem ser estáveis ao
longo de todas as etapas de síntese. No entanto, eles devem poder ser retirados no fim da
síntese em condições que preservem a integridade da molécula final. Os grupos que, nas
estratégias de síntese mais utilizadas, melhor satisfizeram estas condições, são o grupo
benzoilo para a desoxicitidina e a desoxiadenosina e o grupo isobutanoilo para a
desoxiguanosina. A sua introdução tem de ser selectiva, a fim de não bloquear os grupos
hidroxílicos do ciclo desoxirribofuranosilo. Estes grupos são objecto de uma protecção
35
transitória, que pode ser especificamente removida após acilação dos grupos aminados (ex.,
Fig. 57.II.).
Uma protecção suplementar original foi introduzida por várias equipas, destinada a
proteger a função lactâmica da desoxiguanosina, fonte de reacções secundárias durante as
reacções de condensação e de fosforilação.
Timidina
1'O N
N
O
O
H
HO
OH
2'3'4'
5'
1'O N
N
OHO
OH
2'3'4'
5'
Desoxicitidina
NH2
NH2
Desoxiadenosina
1'OHO
OH
2'3'4'
5'N
N
N
O
Desoxiguanosina
1'OHO
OH
2'3'4'
5'N
N
N
N
NH2
H
Fig. 56.II
36
NH2
Desoxicitidina
1'O N
N
OHO
OH
2'3'4'
5' ClSi(CH3)3
NH2
1'O N
N
O O
O
2'3'4'
5'Si
Si
O
Cl
O
SiO
Si 5'
4'3' 2'
O N
N
OO1'
NH
NH4OH dil.
O
O
5'
4'
3' 2'
N
N
OO1'
NH
HO
H
Fig. 57.II
b) Transformação dos grupos hidroxílicos
Das funções hidroxílicas em posição 5' e 3', uma tem de ser protegida por um grupo
protector transitório, a outra fosforilada. A escolha do centro a fosforilar depende da
estratégia adoptada. A estratégia que consiste em fosforilar a posição 3' deu os melhores
resultados e tem sido utilizada nos métodos gerais de fosfatotriéster e de fosfitotriéster.
α) A protecção do grupo hidroxílico em posição 5' tem de ser temporária. Ela tem de ser
removida antes de cada etapa de condensação, durante a extensão da cadeia
desoxirribonucleotídica. O grupo protector deve neste caso possuir as propriedades seguintes:
i) poder ser introduzido selectivamente em posição 5' deixando intacta a função
hidroxílica em posição 3';
ii) poder ser retirado em condições suaves que não dêem lugar a nenhuma reacção
secundária;
37
iii) ser estável em todas as etapas de síntese, de desprotecção e de purificação que se seguem
à sua introdução;
iv) eventualmente, facilitar, pela sua introdução, a purificação dos intermediários de
síntese.
Entre outros grupos introduzidos com bons resultados o 4,4'-dimetoxitritilo é um dos
mais correntemente adoptados. É introduzido através do seu cloreto, tirando-se beneficio da
sua selectividade pela posição 5', devido a factores estéricos. (ex., Fig. 58.II.).
Fig. 58.II
O grupo 4,4-dimetoxitritilo pode ser quantitativa e rapidamente retirado em condições de
baixa acidez (ex., ácido dicloroacético, brometo de zinco) sem ruptura, ou com ruptura
insignificante da ligação glicosídica; esta reacção conduz à formação do catião dimetoxitritilo
de cor laranja, cuja absorvência pode ser medida espectrofotometricamente. Esta medida é
particularmente útil na síntese em fase sólida, pois ela é a única indicação da eficácia das
reacções de condensação durante a construção da cadeia oligonucleotídica.
ß) A fosforilação em posição 3' dos nucleosídeos protegidos na bases e no grupo hidroxílico
em 5' pode conduzir, segundo a estratégia escolhida, a um bloco completamente protegido,
ou a uma espécie fosforilada activa, capaz de reagir directamente com outro bloco
desoxinucleotídico desprotegido em posição 5' para formar a ligação internucleotídica.
Numerosos agentes de fosforilação têm sido utilizados em síntese de
oligodesoxirribonucleotídeos, sobretudo na metodologia do fosfatotriéster (Fig. 59.II.).
OCH3
OCH 3
OCH 3
OCH 3
O
Cl
H
+
O
H N
1 ' O O
OH
2 ' 3 ' 4 '
5 ' N
N
N C C
N
Desoxiadenosina protegida na base
1 ' O HO
OH
2 ' 3 ' 4 '
5 ' N
N
N
38
+1'
ODMTO
OH
2'3'4'
5'Bp
P
O
X
XR1YR2Z1'
ODMTO
O
2'3'4'
5'Bp
P
O
XR1Y
1'O HO
OR
2'3'4'
5'Bp
1'ODMTO
O
2'3'4'
5'Bp
P
O
ZR2R1Y
1'ODMTO
O
2'3'4'
5'Bp
P
O
R1Y O
1'O
OR
2'3'4'
5'Bp
Bp = base protegidaDMT = DimetoxitritiloZ,Y = N, O, SR1 = arilo, 2-etiloarilo, 2-etilotoarilo, arilo substituídoR2 = alquilo, alquilo substituído...X = triazolo, oxibenzotriazolo, cloro...
Fig. 59.II
Um dos substituintes do átomo de fósforo protege de maneira permanente o anião
fosfato, responsável pelos fracos rendimentos das reacções de condensação, assim como das
dificuldades crescentes de purificação e de solubilidade com o comprimento dos oligómeros,
surgidas na metodologia inicial dos fosfatodiéster. O outro substituinte tem um papel de
protecção temporária destinada a ser substituída pela ligação fosfato internucleotídica.
O grupo protector permanente deve possuir uma estabilidade total durante as reacções de
remoção dos grupos protectores temporários e durante as reacções de condensação. Não deve
interferir negativamente com o rendimento e a eficácia destas últimas. Ele tem, no entanto,
que ser retirado especificamente no fim da síntese sem provocar a ruptura concorrente das
ligações internucleotídicas. O grupo protector transitório deve ser suficientemente estável
para permitir o isolamento, a purificação e o armazenamento dos blocos desoxinucleotídicos
completamente protegidos. A sua remoção deve ser específica e rápida em condições que
preservem os grupos protectores permanentes e o grupo protector temporário em posição 5'.
39
Os grupos ortoclorofenilo (R = o-ClC6H4 com Y = O) permanente e o cianoetilo (R =
CH2CH2CN com Z = O) temporário (Fig. 59.II.) são exemplos de grupos muito utilizados na
metodologia do fosfatotriéster (ex., Fig. 60.II.).
+
NN
N
P
O
O
ClN
NN
HOCH2CH2CN
1'O N
N
O
O
H
DMTO
OH
2'3'4'
5'
P
O
O
ClN
NN
DMTO1'
O N
N
O
O
H
O
2'3'4'
5'
Et3N
H2O
P
O
O
Cl
DMTO1'
O N
N
O
O
H
O
2'3'4'
5'
OCH2CH2CNP
O
O
Cl
DMTO1'
O N
N
O
O
H
O
2'3'4'
5'
O-H+ Et3N
Fig. 60.II
O grupo protector permanente na metodologia do fosfitotriéster é, actualmente, o
cianoetilo, que veio substituir o grupo metilo, inicialmente utilizado. O terceiro substituinte
do átomo do fósforo é um grupo azodialquilo, introduzido em substituição de um átomo de
cloro, o qual confere uma reactividade particularmente forte ao intermediário fosfocloridrito
(utilizado durante o desenvolvimento inicial do método), que o torna instável e de emprego
pouco cómodo.
Os compostos clorodiisopropilaminofosforoamidito (ou morfolino, entre parênteses)
possuem um bom compromisso de reactividade-estabilidade (Fig. 61.II.).
40
O
1'O
OH
2'3'4'
5'N
N
N
N
N
H
HC
O
DMTO
O
1'O
O
2'3'4'
5'N
N
N
N
N
H
HC
O
DMTO+
P
Cl
NNCCH2CH2O
NCCH2CH2OP
N
N O
N O
Fig. 61.II
O método do fostitotriéster é o correntemente utilizado em síntese em fase sólida, em
rotina, num processo inteiramente automatizado de elongação da cadeia oligonucleotídica.
É importante sublinhar que o sucesso da síntese química de DNA se baseia sobretudo na
preparação destes blocos de base, isto é, na escolha dos diferentes grupos protectores, no
rendimento das diferentes reacções e na pureza dos desoxinucleotídeos completamente
protegidos.
2) Desprotecção selectiva
Para poder condensar dois desoxinucleotídeos pelo método do fosfatotriéster, é
necessário libertar separadamente, por um lado a função fosfato e por outro o grupo
hidroxílico 5', das suas protecções temporárias. Por exemplo, o grupo dimetoxitritilo é
retirado em condições ácidas suaves e o grupo cianoetilo em condições básicas suaves (Fig.
62.II.).
41
Fig 62.II
(MSNT)
Base (Et3N)
Ácido(TCA, ZnBr)
P
O
O
Cl
DMTO1'
O
O
2'3'4'
5'
OCH2CH2CN
Bp
P
O
O
Cl
HO1'
O
O
2'3'4'
5'
OCH2CH2CN
Bp
S
O
O
NN
N NO2
P
O
O
Cl
DMTO1'
O
O
2'3'4'
5'
O HNEt3
Bp
P
O
O
Cl
DMTO1'
O
O
2'3'4'
5'
O
Bp
P
O
O
Cl
1'
O
O
2'3'4'
5'
OCH2CH2CN
Bp
42
3) Reacções de condensação
A reacção de condensação necessita evidentemente da formação de espécies activas,
capazes de reagir com bons rendimentos, sem formação de produtos secundários.
A activação do fosfatodiéster é frequentemente realizada pela acção conjugada de um
cloreto de arilosulfonilo e de uma amina heterocíclica, ou de uma sulfonamida (p ex., o
mesitilenonitrotriazolo-MSNT), preparada antecipadamente a partir deste tipo de compostos
(Fig. 62.II.).
A activação dos fosforoamiditos é realizada por um agente de protonação, ácido fraco
(ex.: tetrazolo pKa = 4,9) que acelera a ruptura da ligação do grupo dialquilamina e favorece
o ataque pela função hidroxílica que vai estabelecer a ligação internucleotídica. Não é, por
isso, possível, dentro desta metodologia, eliminar o grupo dimetoxitritilo em presença do
grupo fosforoamidito. A reacção de condensação tem que ser seguida, neste método, pela
oxidação do fosfito triéster em fosfato, o que se realiza correntemente pelo iodo aquoso (Fig.
63.II.).
NCCH2CH2OP
N
O
1'O HO
OR
2'3'4'
5'Bp
+
NN
NN
H
I2H2O
NCCH2CH2O P
DMTO1'
O
O
2'3'4'
5'Bp
1'O O
OR
2'3'4'
5'Bp
O
DMTO1'
O
2'3'
5'Bp
4'
NCCH2CH2OP
DMTO1'
O
O
2'3'4'
5'Bp
1'O O
OR
2'3'4'
5'Bp
Fig. 63.II
43
4) Construção da cadeia oligodesoxinucleotídica
a) Em solução
Na síntese em solução e pela metodologia do fosfatotriéster a extensão da cadeia
polinucleotídica pode fazer-se de maneira alternada no sentido 3'→ 5' ou 5'→ 3', visto que se
pode desproteger o grupo hidroxílico na extremidade 5', ou o triesterfosfato na posição 3' do
oligómero em construção. Dois oligómeros podem igualmente ser condensados um com o
outro. Devido à sensibilidade dos fosforoamiditos às condições ligeiramente ácidas, esta
flexibilidade própria aos triesterfosfatos, não se aplica ao método do fosfitotriéster, que não
foi desenvolvido em solução.
A síntese em solução permite a detecção de reacções secundárias de maneira mais
directa que a síntese em fase sólida. Ela permite a identificação e a compreensão da origem
dos produtos parasitas e portanto possibilita a intervenção sobre os parâmetros correctores
(Fig. 64.II.).
b) Em fase sólida
A extensão da cadeia de DNA em fase sólida realiza-se numa só direcção (em geral 3'→
5'), a partir de um desoxirribonucleosídeo fixo, por uma das funções hidroxílicas, a um
suporte sólido. A fixação efectua-se em geral através da formação de uma ligação amida entre um 2'-desoxi-3'-succinilorribonucleosídeo e um polímero insolúvel aminado (P-NH2)
(Fig. 65.II.).
44
ClPh
Bp
DMTO
Bp
P
O
O
O
OPOCE
OClPh
NEt3 1. TCA 2. cromatog
ClPh
Bp
DMTO
Bp
P
O
O
O
OPO
OClPhClPh
Bp
O
Bp
P
O
O
O
OPOCE
OClPh
H
1. MSNT2.cromatog
ClPh
Bp
DMTO
Bp
P
O
O
O
OPO
OClPhClPh
Bp Bp
P
O
O
O
OPOCE
OClPh
1. MSNT2.cromatog
ClPh
Bp
DMTO
Bp
P
O
O
O
OPO
OClPhClPh
Bp Bp
P
O
O
O
OPOCE
OClPh
ClPh
Bp
DMTO
Bp
P
O
O
O
OPOCE
OClPh
ClPh
Bp
DMTO
Bp
P
O
O
O
OPO
OClPh
NEt3 1. TCA 2. cromatog
ClPh
Bp
O
Bp
P
O
O
O
OPOCE
OClPh
H
1. TCA 2. cromatog
ClPh
HO
Bp
P
O
O
O
P
OClPh
Bp Bp
ClPh
Bp
P
O
O
O
OPOCE
OClPh
MSNT
NEt3
ClPh
DMTO
Bp
P
O
O
O
P
OClPh
Bp Bp
ClPh
Bp
P
O
O
O
OPO
OClPh
ClPh
DMTO
Bp
P
O
O
O
P
OClPh
Bp Bp
P
ClPh
Bp
P
O
O
O
OClPh ClPh
Bp
P
O
O
O
P
OClPh
Bp Bp
ClPh
Bp
P
O
O
O
OPOCE
OClPh
DMT = dimetoxitritiloBp = citosina, adenina, guanina protegidas ou timinaClPh =2-clorofenilTCA = ácido tricloroacéticoMSNT = mesitilenosulfonil-3-nitrotriazolo
Fig 64.II
45
O+
O
O
H2N
DCC
ONH
Bp = citosina, adenina, guanina protegidas ou timina
= polímero insolúvel
Fig. 65.II
DMTO O Bp
OH
PDMTO O Bp
O
C O
CH2
CH2
CO2H
DMTO O Bp
O
C O
CH2
CH2
C P
P
O poliestirenodivinilbenzeno, a resina composta polidimetilacrilamida-kieselguhr, a
sílica, as esferas de vidro de porosidade controlada, a celulose, o co-polímero teflon-
poliestireno são exemplos de polímeros insolúveis que podem ser utilizados.
A extensão da cadeia polinucleotídica em fase sólida consiste na repetição de um ciclo que
compreende essencialmente:
a) a reacção de desprotecção do grupo hidroxílico em 5' do primeiro nucleosídeo (ou de
cadeia em crescimento) fixo no polímero insolúvel;
b) a reacção de condensação entre a função hidroxílica libertada e a espécie nucleotídica
introduzida em solução e activada in situ no átomo de fósforo em posição 3'.
Com o método do fosfitotriéster, uma terceira reacção, que consiste na oxidação do
fosfito em fosfato, é, como já acima foi referido, necessária. Uma reacção suplementar é por
vezes efectuada (caping). Ela visa o bloqueamento da ligeira percentagem dos grupos
hidroxílicos que não reagiram na reacção de condensação a fim de os desactivar para as
reacções ulteriores. Os reagentes em excesso, os subprodutos e os solventes das reacções e de
lavagem são eliminados por simples filtração do suporte sólido (Fig. 66.II.).
repetição
n vezes
OO
OC(CH 2)2CNH PP
O
OR
BpBpBp
DMT
Bp
P
O
OR
P
O
OR
POC(CH 2)2CNH
O O
DMT = dimetoxitritiloBp = citosina, adenina, guanina protegidas ou timinaR = grupo protector do fosfatoP = polímero insolúvel
Bp
P
O
OR
Bp
DMT DMT
1) Desprotecção 5'OH
2) Condensação
3) capping4) oxidação
Bp
OO
OC(CH 2)2CNH P
Bp
DMT P
OR
N
Fig. 66.II
46
O isolamento do produto ligado ao polímero insolúvel é, por consequência, simples e
rápido, em relação aos métodos convencionais em solução. O conjunto das operações presta-
se bem à automatização.
Uma desvantagem da fase sólida é a cinética desfavorável. Para conseguir reacções
completas dentro de tempos razoáveis, é indispensável utilizar excessos importantes de
reagentes, cuja pureza é portanto crítica. Vestígios de impurezas reactivas podem inibir
completamente a reacção de condensação.
Em fase sólida a acumulação de produtos indesejáveis é inevitável, visto não haver
purificação em nenhuma etapa da extensão do fragmento de DNA. Uma maneira de
minimizar este inconveniente consiste em utilizar dímeros ou trímeros, preparados em
solução, estratégia que diminui de um factor 2 ou 3 o número de reacções efectuadas no
polímero insolúvel.
O comprimento do fragmento de DNA que é possível obter por síntese química depende
evidentemente do rendimento da etapa de condensação, que tem que ser mantido o mais alto
possível (> 99 %).
Do ponto de vista das vantagens e inconvenientes, o método do cianoetilofosforamidito,
pela alta velocidade da reacção de condensação e sobretudo pela possibilidade de obter
produtos de reacção praticamente isentos de produtos secundários (altos rendimentos) foi
universalmente adoptado nos sintetizadores automáticos. O polímero insolúvel que melhores
resultados tem dado é constituído por esferas de vidro de porosidade controlada e
alquiloaminadas.
5) Desprotecção
A desprotecção do fragmento de DNA é uma operação delicada que deve preservar a
integridade do edifício molecular. Reacções incompletas, ou uma degradação parcial,
conduzem a uma mistura complexa de produtos.
A desprotecção compõe-se de 3 etapas distintas:
I) transformação dos grupos triesterfosfatos em diesterfosfatos;
II) desprotecção das bases;
III) desprotecção da função OH terminal em 5'.
I) A desprotecção dos grupos fosfatos é uma fonte possível de ruptura internucleotídica.
Esta pode ser minimizada utilizando reagentes selectivos antes de desproteger as bases.
Se a extensão da cadeia de DNA for realizada pelo método do fosfatotriéster em fase
sólida, a clivagem do suporte insolúvel efectua-se com o mesmo reagente de desprotecção
dos grupos fosfatos clorofenilados, por exemplo com o 2-nitrofenilcarbaldoximato de
47
tetrametilguanidina. O grupo metilo utilizado no começo do método do fosfitotriéster era
deslocado por ataque nucleofilico pelo anião tiofenalato, antes da clivagem do suporte sólido.
Esta é efectuada em condições suaves. O grupo cianoetilo, utilizado actualmente, é removido
em condições ainda mais suaves e sem necessidade de fazer intervir um reagente
suplementar: por NH4OH à temperatura ambiente.
II) As aminas exocíclicas das bases são desaciladas por amonólise a 50°C. Este tratamento
provoca uma ruptura, que não é desprezível, das ligações fosfatos internucleotídicas quando o
fosfato está na forma de triéster; esta é a razão pela qual se converte antecipadamente e
selectivamente o fosfatotriéster em fosfatodiéster.
III) O grupo protector da função hidroxílica em posição 5' é o último a ser retirado (pelo
ácido acético 80 % no caso do grupo dimetroxitritilo). É conservado até ao fim para impedir
a formação de triésteres fosfóricos cíclicos que conduzem a estruturas
oligodesoxirribonucleotídicas com ligações 5'→ 5, durante as primeiras etapas de
desprotecção. Devido ao seu carácter hidrófobo, o grupo dimetoxitritilo protector da função
5'OH facilita o isolamento do produto por cromatografia de sílica em fase inversa (Fig.
67.II.).
DMT
Bp Bp
P
O
OR
Bp
P
O
OR
POC(CH2)2CNH
O O
n
Desprotecção dosfosfatos eClivagem OH
O O
Desprotecçãodas bases
DMT
Bp Bp
P
O
Bp
P
O
n
B
P
O
B
P
O
B
O
DMTOH
n
Desprotecçãodo grupo 5'OH
B
P
O
B
P
O
B
O
HOOH
n
DMT = dimetoxitritiloBp = citosina, adenina, guanina protegidas ou timinaR = grupo protector do fosfatoP = polímero insolúvel
Fig 67.II
48
RENDIMENTOS
Nº de etapas Rendimento/etapa Rendimento final n ν νn x 100
10 90% 35% 10 95% 60% 10 99% 90% 20 90% 12% 20 95% 36% 20 99% 82% 30 90% 4,2% 30 95% 21,4% 30 99% 74% 50 90% 0,5% 50 95% 7,7% 50 99% 60% 100 90% 0,0026% 100 95% 0,59% 100 99% 36%
49
6) Isolamento, purificação e caracterização
Os métodos de isolamento e de purificação correntemente utilizados são a cromatografia
de DEAE-celulose, de Sefadex, de camada fina de sílica, a cromatografia liquida a alta
pressão (HPLC), com coluna de sílica de fase inversa, ou de troca catiónica e a electroforese
preparativa em gel de poliacrilamida, ou capilar.
A caracterização do produto isolado e marcado numa das extremidades com um
radioisótopo pode ser efectuada pelo método de sequenciação de DNA de Maxam & Gilbert.
É, no entanto, necessário um reajustamento das condições das reacções aos fragmentos de
pequeno comprimento. Um outro método, conhecido pelo nome de Wandering spot, baseia-
se na análise a duas dimensões (electroforese em acetato de celulose, seguida de
cromatografia em camada fina de DEAE-celulose) dos fragmentos de oligonucleotídeo
sintético marcado numa extremidade, obtidos por digestão parcial com uma exonuclease.
Este método restringe-se a fragmentos de comprimento inferior a 20 nucleotídeos (vd. secção
"Sequenciação").
As aplicações dos oligodesoxirribonucleotídeos de sequência definida abrangem quase
todos os aspectos da investigação que implicam a recombinação de DNA, tanto no que diz
respeito à construção, à identificação e à caracterização de clones bacterianos particulares,
como à manipulação do DNA clonado com o fim de modificar a sua estrutura.
Nos campos da amplificação de DNA, da determinação de sequências de DNA, do
estudo das interacções proteína-DNA, ou da análise estrutural do DNA, os
oligodesoxirribonucleotídeos sintéticos têm-se revelado um instrumento extremamente útil e
indispensável.
50
2. VECTORES DE CLONAGEM
A utilização de novas moléculas de DNA formadas por engenharia genética depende da
sua separação e da sua propagação. Para isso é necessário introduzi-las em células
(bacterianas, por exemplo) de tal maneira que elas possam ser replicadas, preservadas e
recuperadas à vontade. Para o realizar recorre-se à utilização de vectores particulares, cujo
DNA pode ser unido por ligação ao DNA que se deseja introduzir no hospedeiro biológico e
que podem depois ser levados a infectar eficazmente esse hospedeiro. Assim que a molécula
recombinante se encontra no hospedeiro, pode-se replicar e propagar de maneira permanente.
Portanto, em princípio, segmentos de DNA de qualquer origem podem ser clonados e
preparados em quantidade a partir de cultura de células, contendo aquele DNA.
Quatro tipos de vectores podem ser utilizados para clonar um fragmento de DNA e
propagá-lo na bactéria E. coli.
a) plasmídeos
b) bacteriófago λ
c) cosmídeos
d) bacteriófago M13
e) sistemas de vectores bacterianos de elevada capacidade
Se bem que diferentes em comprimento e em estrutura, estes 5 tipos de vectores
compartilham um certo número de propriedades:
1) replicam-se de maneira autónoma na bactéria;
2) podem ser facilmente separados do DNA do hospedeiro e purificados;
3) contêm regiões de DNA não essenciais à sua propagação no hospedeiro, nos quais
um DNA estrangeiro pode ser inserido.
a) Os plasmídeos
Os plasmídeos são moléculas de DNA circular bicatenário capazes de se replicar na
bactéria de maneira independente do cromossoma do hospedeiro. Os plasmídeos estão
distribuídos nos procariotas de maneira muito ampla; variam de massa molecular de + 106 a
mais de 200 106 daltons. Conferem um certo número de fenótipos ao hospedeiro que os
contém (Tabela 1.II).
Os plasmídeos podem-se agrupar segundo duas categorias principais, os plasmídeos
conjugantes e os não conjugantes. Estes últimos são destituídos de uma série de genes (tra)
51
que conduzem à conjugação bacteriana. As funções de transferência (tra) incluem um cluster
de 12 genes, pelo menos, que são responsáveis, entre outras coisas, pela síntese de pili e de
outros componentes de superfície celular. Estes pili permitem o contacto físico -um pré-
requisito para a conjugação- entre as células doadoras e as receptoras.
Independentemente destas funções, todos os plasmídeos possuem regiões específicas,
responsáveis pela sua replicação autónoma (rep), que inclui uma origem de replicação (ori).
Dado todos os genes e sequências de DNA num plasmídeo, estarem habitualmente
organizados em clusters funcionais, é possível desenhar uma estrutura geral dos plasmídeos
(Fig. 68. II A).
Os mecanismos que regulam o número de cópias dos plasmídeos são da maior
importância para a sua manutenção na bactéria. O número de cópias é, ou estritamente
controlado por, e correlacionado com, o número de moléculas de DNA cromossómico (i. é., é
dificilmente superior a um) ou relaxado (i. é., uma célula bacteriana pode conter múltiplas
cópias dum plasmídeo). Assim, uma categoria de plasmídeos mantém-se no hospedeiro em
número elevado de cópias (plasmídeo relaxado) e outra em pequeno número de cópias
(plasmídeo restritivo). Com algumas excepções, os plasmídeos restritivos possuem uma
massa molecular relativamente elevada e são conjugativos, enquanto que os relaxados são
normalmente não-conjugativos e têm uma massa molecular baixa.
Os plasmídeos que se replicam sob controlo restrito requerem biossíntese proteica activa,
mas não DNA polimerase I para a sua replicação; os plasmídeos relaxados, contudo,
necessitam duma DNA polimerase I funcional (produto do gene polA), mas replicam-se sem
biossíntese proteica de novo. Muitos dos plasmídeos multicópia apresentam um
comportamento pouco usual: são capazes de continuar a replicação, mesmo na presença dum
inibidor da biossíntese de proteínas. Praticamente, quando se interrompe a síntese proteica do
hospedeiro com um antibiótico (p. ex., cloranfenicol), bloqueia-se também a replicação do
seu DNA. No entanto, a do plasmídeo relaxado continua e podem-se obter vários milhares de
cópias deste plasmídeo por célula (amplificação). Assim, os plasmídeos relaxados podem-se
replicar mesmo se a replicação do DNA do hospedeiro estiver interrompida. Como a
amplificação afecta simultaneamente os insertos de DNA recombinante na molécula de
plasmídeo, os plasmídeos multicópia relaxados desempenham um papel central na tecnologia
do gene. Inversamente, a replicação dos plasmídeos restritivos está ligada de maneira
dependente à do DNA do hospedeiro.
O número de cópias de plasmídeos é controlado geneticamente e pode ser alterado por
mutagénese, de maneira a tornar a replicação do plasmídeo sensível à temperatura e, ou
cessa, após uma elevação da temperatura, ou, pelo contrário, torna o plasmídeo relaxado.
52
Concepção de um vector plasmídico
1. Um vector plasmídico deve ser o mais pequeno possível em relação ao DNA
cromossómico. Esta propriedade facilita a manipulação do vector e aumenta as possibilidades
de transformação eficaz do hospedeiro bacteriano.
2. O vector deve estar bem caracterizado em relação aos genes que contém, no que respeita
à sua carta de restrição e à sua sequência em bases.
3. O vector deve poder replicar-se de maneira autónoma (relaxado) e propagar-se
eficazmente no hospedeiro, de maneira a poder obter-se facilmente grandes quantidades de
DNA do vector e do DNA que nele tiver sido inserido.
4. O vector deve comportar um marcador de selecção que permita distinguir as células
transformadas pelo vector das que não o são.
Habitualmente este marcador é uma resistência a um antibiótico, mediada por um gene
que codifica para uma enzima de modificação de antibiótico (Tcr, Apr, Kanr, Cmr, ...).
5. O vector ideal deve conter um marcador genético adicional, que pode ser inactivado por
inserção do DNA que se quer clonar. A inactivação insercional deste marcador genético
permite distinguir as células que contêm um plasmídeo recombinante, das que contêm o
plasmídeo original (Fig. 68.II.B.).
6. O vector deve conter o maior número possível de sítios de restrição únicos, localizados
num dos marcadores genéticos. Esta propriedade confere um máximo de flexibilidade em
termos de clonagem. Evidentemente que estes sítios de restrição não podem existir nas zonas
do plasmídeo essenciais para a sua replicação.
O plasmídeo pBR322 desenvolvido por Bolivar et al. (1979) tem em conta estas
exigências (Fig. 69.II.).
Neste vector, a replicação é do tipo relaxado e os genes de resistência Tr e Apr podem
servir, um e outro, de marcadores para a selecção ou para a inactivação insercional (Fig. 70.II
e Fig. 71.II).
Os vectores de tipo plasmídico são preciosos, na medida em que não há praticamente
nenhum limite imposto ao comprimento do fragmento de DNA que pode ser inserido neles.
No entanto, em certos casos pode ser mais vantajoso utilizar vectores fágicos.
b) Bacteriófagos
A transformação de E. coli pelo DNA de um fago manifesta-se pela produção de
partículas fágicas que resultam da replicação e da expressão do DNA absorvido. O genoma
53
do fago pode ser utilizado de maneira similar aos plasmídeos como vector para os fragmentos
de DNA.
Uma das vantagens dos vectores fágicos sobre os plasmídeos resulta da grande
experiência bioquímica e genética existente sobre estes fagos. Com os fagos não lisantes
pode-se, nomeadamente, tirar partido dos sistemas de regulação próprios, para optimizar a
expressão dos genes clonados, assim como a acumulação dos seus produtos nas células
infectadas.
Outra vantagem resulta da possibilidade de escrutinar e caracterizar vários milhares de
placas fágicas de lise, p.ex., por hibridação DNA-DNA, numa placa de Petri. Além disso,
existe disponível um sistema de empacotamento in vitro, que permite empacotar o DNA em
cabeças fágicas vazias. A infectividade do DNA recombinante é aumentada várias ordens de
grandeza, quando comparada com a de preparações de DNA puro.
Ao contrário do que acontece com os vectores do tipo plasmídico, o comprimento da
inserção do DNA estrangeiro é limitado no caso da utilização dos vectores fágicos. Pode-se
evidentemente suprimir regiões não essenciais do DNA fágico, mas apesar disso, o
comprimento do DNA tem que permanecer dentro dos limites impostos pelo seu
empacotamento no invólucro do fago. O sistema de empacotamento in vitro permite tirar
partido desta limitação, impondo uma selecção do tamanho do DNA empacotado, de tal
maneira que, em condições apropriadas, só as moléculas de DNA recombinante serão
empacotadas.
Finalmente, milhões de partículas virais clonadas independentemente, constituídas na
forma de banco genómico, representando a informação genética completa dum organismo
complexo, podem ser armazenadas num número reduzido de mililitros de meio de cultura.
O escrutínio dos fagos recombinantes numa população mista, baseia-se essencialmente
na morfologia das placas, ou na sua cor sobre um tapete de bactérias indicadoras e ainda na
hibridação DNA-DNA com uma sonda marcada.
Lembramos que o fago λ contém uma molécula de DNA linear com 45 kbases,
comportando extremidades coesivas. Estas extremidades coesivas naturais associam-se para
formar o sítio cos. Na Fig. 72.II. os genes da esquerda codificam para as proteínas da cabeça
e da cauda do fago; os genes centrais estão implicados na recombinação e na lisogenia e
podem ser considerados como não essenciais ao desenvolvimento lítico do fago. Os genes da
direita conduzem nomeadamente à lise. Um esquema simplificado do desenvolvimento
fágico está representado na Fig. 73.II.
O DNA de λ possui numerosos sítios de clivagem para quase todas as enzimas de
restrição correntes e como tal não é apropriado para vector de DNA. Foi, portanto, preciso
54
construir derivados do DNA selvagem, nos quais existe um só sítio de restrição permitindo a
inserção de um fragmento de DNA exogéneo (vectores de inserção), ou nos quais, um par de
sítios de restrição flanqueia um fragmento de DNA não essencial, que pode ser excisado e
substituído por um fragmento de DNA estrangeiro (vectores de substituição).
O conteúdo em DNA das partículas fágicas está submetido a limites quantitativos. Por
um lado, um conteúdo inferior a 75 % da capacidade normal dos invólucros proteicos (cerca
de 45 kb) não será empacotado correctamente e não conduzirá à formação de partículas
fágicas viáveis. Por outro lado, um excesso de DNA (>105 % do conteúdo normal) levará a
um empacotamento defeituoso. Estes limites são impostos por um sistema de clivagem
específico dos sítios cos, sistema composto de nucleases localizadas na base de cabeça do
fago. Muitos derivados de λ do tipo substituição, contêm também eliminações de algumas
kbases nas regiões não essenciais. Deste modo, sempre que se substitui um fragmento de
DNA do fago, pode-se inserir um fragmento maior de DNA estrangeiro (até 22 kbases em
certos casos) (Fig. 74.II.).
A clonagem que utiliza os bacteriófagos λ requer várias etapas:
1) O DNA do vector é digerido com as enzimas de restrição apropriadas e as extremidades
esquerda e direita do DNA de λ são separadas da região não essencial.
2) As extremidades são ligadas em presença de fragmentos de DNA estrangeiro que
possuam extremidades compatíveis com as das extremidades.
3) O DNA recombinante é empacotado in vitro no invólucro proteico. As partículas fágicas
assim formadas são utilizadas para infectar o hospedeiro bacteriano apropriado.
4) Os fagos recombinantes contendo as sequências de DNA clonadas são a seguir
identificados por diferentes processos.
Empacotamento in vitro
O empacotamento de DNA recombinante λ nos invólucros de fago in vitro, permite que
ele seja introduzido no hospedeiro bacteriano pelo processo normal da infecção fágica com
um rendimento muito elevado (± 106 placas de lise por µg de DNA recombinante).
Uma série de acontecimentos particulares que se desenrolam durante o empacotamento
do DNA no hospedeiro podem ser reproduzidos in vitro (Fig. 75.II.). O DNA do fago, na
forma de concatâmero (forma produzida após replicação), constitui o substrato da reacção de
empacotamento. Na presença de precursores da cabeça (essencialmente produto do gene E) e
do produto do gene A, o DNA concatâmero é clivado em monómeros nos sítios cos e
empacotado. O produto do gene D é em seguida incorporado para formar as cabeças fágicas
55
completas. Finalmente, os produtos doutros genes, tais como W e FII e estruturas da cauda
unidas independentemente, juntam-se às cabeças para formar partículas fágicas maduras.
Para efectuar o empacotamento in vitro, coloca-se o DNA recombinante em presença de
concentrações elevadas de precursores da cabeça, da cauda e de proteínas de empacotamento.
Esta operação é realizada na prática num lisado misto, derivado de duas estirpes bacterianas
lisogénicas, que foram induzidas antecipadamente. Uma das estirpes contém uma mutação
sem sentido no gene D de λ, que bloqueia a etapa de maturação das cabeças dos fagos. A
estirpe acumula pois, os precursores das cabeças fágicas. A segunda estirpe tem uma mutação
sem sentido no gene E de λ, que impede a formação das cabeças fágicas. No lisado misto, a
complementação genética permite a formação de cabeças normais e o empacotamento do
DNA recombinante.
c) Cosmídeos
O sistema de clonagem no DNA de λ possui limitações respeitantes ao tamanho máximo
do fragmento que se quer clonar (de 15 a 25 kbases). Para clonar fragmentos de DNA de
tamanho superior (até 40 kbases), é preciso recorrer aos vectores do tipo cosmídeo. São
plasmídeos que contêm um fragmento de DNA de λ, incluindo o sítio cos. Estes vectores são
utilizados em combinação com o sistema de empacotamento in vitro. Após o empacotamento,
a partícula é levada a infectar um hospedeiro apropriado. O DNA injectado circulariza-se
como o DNA fágico, mas replica-se como um plasmídeo, sem haver expressão das funções
fágicas. As células que contêm os cosmídeos são então seleccionadas com base na resistência
a um antibiótico (Fig. 76.II.).
Os sítios cos foram clonados no gene Amp do plasmídeo pBR322, tendo sido mantido o
gene de resistência à tetraciclina. O DNA que se pretende clonar é primeiro clivado em
fragmentos de + 35 a 40 kbases e ligado aos sítios cos presentes no plasmídeo (o plasmídeo
foi previamente clivado com uma enzima similar à que foi utilizada para cortar o DNA).
Cada um dos fragmentos clonados comportará pois, um sítio cos a cada extremidade, visto
ser a ligação efectuada em condições que dão origem a concatâmeros, DNA-cosmídeo-DNA-
cosmídeo ...
Quando o extracto do empacotamento in vitro é adicionado, os sítios cos são
reconhecidos, o DNA clonado é clivado em fragmentos de + 45 kbases flanqueados de sítios
cos (conteúdo óptimo das cabeças de λ) e estes fragmentos são em seguida empacotados,
originando partículas fágicas. Estas partículas não são evidentemente fagos viáveis, mas
podem ser utilizadas para infectar E. coli e são seleccionadas com base na resistência à
tetraciclina.
56
Assim que se encontra no interior da bactéria, o híbrido DNA-Cos comporta-se como um
plasmídeo. Os cosmídeos combinam as propriedades dos plasmídeos e dos fagos e têm
diversas vantagens sobre estes dois tipos de vectores. A capacidade de um vector cosmídeo é
superior à de um vector λ. A selecção do comprimento (complemento normal da cabeça do
fago) elimina o barulho de fundo próprio aos cosmídeos sem inserto ou aos que contêm
insertos demasiado pequenos (< 75 % do conteúdo normal da cabeça λ). A infecciosidade do
DNA plasmídico empacotado nas cabeças fágicas é pelo menos 3 vezes superior à do DNA
plasmídico puro.
d) O fago M13
O fago M13 é um fago filamentoso que contém uma molécula de DNA circular
monocatenário (cadeia +). O DNA de M13 injectado na bactéria replica-se de maneira a
formar uma molécula bicatenária (+/-), que se amplifica até atingir 300 cópias por célula
(forma replicativa, RF). Esta forma replicativa pode ser isolada e utilizada como vector de
clonagem.
Assim que a forma replicativa se acumula na bactéria, a síntese de M13 torna-se
assimétrica e conduz à síntese em excesso de uma das duas cadeias de DNA (+), que será
finalmente incorporada nas partículas fágicas maduras. Os fagos são produzidos em contínuo
pela célula infectada sem conduzir à sua lise.
A vantagem principal do fago M13, enquanto vector de clonagem, reside na propriedade
que tem de largar no meio de cultura da bactéria infectada, partículas fágicas contendo um
DNA circular monocatenário, homólogo de uma das duas cadeias da forma replicativa. Além
disso, esta molécula monocatenária pode ser utilizada como molde no sistema de
sequenciação de Sanger (método dos didesoxi) (Fig. 77.II.).
A clonagem na forma replicativa de M13 efectua-se como no caso dos plasmídeos. O
fragmento de DNA clonado será inserido na forma replicativa em qualquer das duas
orientações possíveis, visto que as extremidades do DNA são idênticas. Assim, em função da
orientação, quer uma quer outra cadeia do DNA estrangeiro corresponderá à cadeia (+) e será
empacotada no fago.
Para tirar partido do fago M13 na sequenciação do DNA, sintetiza-se um iniciador de
cerca de 17 bases, complementar de uma região do DNA de M13 próxima do sítio de
inserção. Este iniciador serve de substrato à DNA polimerase para fabricar os fragmentos
marcados que serão analisados em gel de poliacrilamida (Fig. 78.II. e 79.II.).
Um certo número de derivados do fago M13 foram construídos para facilitar, por um
lado a identificação dos fagos que contêm o inserto apropriado e para aumentar, por outro
lado, as possibilidades de clonagem em numerosos sítios de restrição (Fig. 80.II.).
57
Em primeiro lugar, um fragmento do DNA de E. coli, contendo as regiões de regulação e
a informação que codifica uma parte da ß-galactosidase (lacZ), foi introduzido numa região
não essencial do DNA de M13. Por outro lado, a estirpe receptora do fago M13 contém um
gene ß-gal-deficiente. Assim, quando o fago M13 infecta a bactéria hospedeira, há
complementação e produção de ß-galactosidase, em presença de um indutor gratuito, o IPTG
(isopropiltiogalactosídeo). As células portadoras do fago são detectadas por um indicador
corado (XGal) que reage com a ß-galactosidase. As colónias produtoras de fago aparecem
azuis sobre o meio sólido.
Além disso, uma sequência de DNA multi-adaptadora (polylinker), contendo diferentes
sítios de restrição únicos, foi inserida no DNA do fago, na parte do gene truncado da região
codificando a extremidade amino-terminal da ß-galactosidase. Esta inserção não afecta a
capacidade de complementação com o gene ß-gal-deficiente do hospedeiro. Em
compensação, qualquer inserção adicional de DNA na região do polylinker destrói a
complementação. Por conseguinte, os fagos contendo insertos dão origem a placas brancas
em presença de indutor IPTG e de XGal (vd. Secção 1.b.2, sequenciação pelo método de
Sanger).
Conclusões
Os quatro tipos de vectores, plasmídeos, bacteriófago λ, cosmídeos e M13, possuem
propriedades biológicas e físicas que os tornam apropriados para diferentes tipos de
clonagem (Tabela 2.II.).
Devido ao grande comprimento dos DNAs estrangeiros que se podem introduzir nos
cosmídeos e nos fagos λ, estes vectores são apropriados para a construção e a propagação de
bancos de DNA de eucariotas. Estes vectores são no entanto, relativamente difíceis de
manipular e são pouco adequados para a análise de pequenos fragmentos de DNA.
Os vectores do tipo M13 são adaptados essencialmente para a sequenciação de DNA
segundo o método de Sanger, ou como fonte de DNA monocatenário utilizável como sonda
de hibridação. Em compensação, os plasmídeos são apropriados para os diferentes processos
de clonagem. Podem aceitar fragmentos de DNA de comprimento reduzido e podem servir de
veículo para a subclonagem de grandes fragmentos, previamente clonados em cosmídeos ou
em fagos λ. São geralmente munidos de numerosos sítios de restrição únicos, permitindo
uma grande flexibilidade em clonagem. Por último, os plasmídeos são particularmente
apropriados para a clonagem de DNAs complementares (cDNA) e podem ser concebidos
para dirigir a síntese abundante e controlada de proteínas (vectores de expressão).
58
3. MUTAGÉNESE DIRIGIDA
A criação de mutantes é uma prática bem conhecida já em genética clássica, sendo
correntemente utilizada no estudo de funções genéticas. A abordagem de genética clássica,
recorre a agentes mutagénicos químicos ou físicos, que induzem mutações ao acaso. Os
mutantes são em seguida seleccionados, com base num fenótipo desejado. As posições
relativas das mutações num cromossoma podem ser determinadas, utilizando técnicas
convencionais de complementação e de análise de recombinantes. As técnicas modernas de
sequenciação permitem conhecer a natureza precisa da mutação.
Alternativamente, pode-se actualmente adoptar um procedimento antitético, i. é., criar
modificações específicas e controladas no DNA e analisar os efeitos destas modificações no
organismo, in vivo, após ter introduzido nele o DNA mutado (Fig. 81.II.). Os métodos
modernos de isolamento e clonagem de genes e, acima de tudo, a síntese química de DNA,
possibilitam a introdução de alterações específicas nos genes tais como eliminações
(deletions), inserções ou substituições. Nesta última classe de mutações estão incluídas as
trocas pontuais de bases.
Eliminações
A maneira mais simples de criar uma eliminação num cromossoma circular, é de cortar o
DNA com uma enzima de restrição que reconhece dois sítios e produz dois fragmentos.
Após separação e eliminação dum dos fragmentos (em geral o menor) o outro pode ser de
novo circularizado, ligando as suas extremidades coesivas intramolecularmente (Fig. 82.II.).
Também se podem obter eliminações por digestão com uma exonuclease, das
extremidades duma molécula de DNA linear, formada a partir dum DNA circular por uma
endonuclease de restrição que reconhece um sítio único. No exemplo da Fig. 83.II., o
fragmento linear, produzido por digestão com a endonuclease BamHI duma molécula de
DNA circular, é digerido de maneira limitada com a exonuclease Bal31, dando origem a
fragmentos de comprimento decrescente, em função do tempo de digestão e da concentração
da enzima. Estas cadeias de DNA de comprimento variável são de novo circularizadas,
adicionando fragmentos adaptadores sintéticos (linkers) que, após ligação com uma ligase,
criam de novo um sítio BamHI.
Para além de Bal31, que possui actividade nucleásica em 3' e em 5', podem ser utilizadas
outras exonucleases, isoladamente ou em associação, tais como a exonuclease λ (do fago λ),
que remove especificamente os nucleotídeos da extremidade 5' do DNA linear, a exonuclease
III (ExoIII de E. coli) que remove os mononucleotídeos em 5' de DNA bicatenário, mas na
59
direcção de 3' para 5', ou a nuclease S1 que cliva e digere o DNA monocatenário (ganchos ou
extremidades protuberantes).
Inserções
Oligonucleotídeos sintéticos podem ser utilizados como adaptadores e introduzidos em
sítios particulares do DNA clonado. A sequência original deste DNA é assim interrompida e
alterada, podendo-se, por exemplo criar novos sítios de restrição utilizáveis em mutagénese.
A Fig. 84.II. ilustra esta abordagem. Plasmídeos recombinantes são cortados pela
endonuclease DNaseI pancreática, uma vez em média, ao acaso. A adição de adaptadores
sintéticos Xho I, seguida de clivagem com a enzima Xho I e ligação com a T4 DNA ligase
para recircularizar o DNA, cria uma família de plasmídeos portadores de insertos de 8 bases.
Um outro método importante de mutagénese por inserção recorre à propriedade que têm
os transposões de saltar de um loco de DNA cromossómico para outro, por um mecanismo de
recombinação homóloga, que faz intervir sequências nucleotídicas idênticas orientadas em
direcção oposta (vd. I.8., os genes móveis). O transposão Tn5 que contém 5.7 Kb e codifica
para a resistência à kanamicina e/ou à neomicina, é um exemplo, de elemento móvel utilizado
para inserir genes num cromossoma. Esta técnica consiste em inserir o Tn5 numa molécula
de DNA clonada num vector, que é em seguida reintroduzida num DNA cromossómico a fim
de obter mutantes cromossómicos. A Fig. 85.II. ilustra as diferentes etapas deste processo.
O plasmídeo pRK290-nif::Tn5 de 30 Kb contém um gene clonado (nif de Rhizobium
melioti), no qual foi inserido o transposão Tn5. Quando este vector é introduzido por
conjugação em células de R. melioti transfere a região nif para o DNA cromossómico por um
mecanismo de recombinação homóloga. O gene nif cromossómico é substituído pelo gene nif
portador da inserção Tn5, que confere resistência à neomicina ao genoma de R. melioti.
Substituições
Antes de estudar em detalhe mutações pontuais únicas, é por vezes aconselhável examinar as
consequências biológicas de várias mutações numa região dada dum cromossoma. O método
de desaminação química de citidina modificando-a em uridina permite realizar este
objectivo.
Modificação de C em U por desaminação química
Esta técnica tira partido da propriedade que possui o bissulfito de sódio de desaminar
resíduos de citidina em fragmentos de DNA monocatenário. Estes podem ser criados por
corte com enzimas de restrição, seguido de digestão com uma polimerase possuindo
60
actividade exonucleásica. No exemplo da Fig. 86.II. um plasmídeo recombinante é cortado
por SmaI (CCCGGG) e as cadeias do DNA são digeridas de 3' em 5' pelo fragmento de
Klenow da DNA polimerase, em presença de ATP, unicamente. A enzima deter-se-á na
primeira adenosina que encontra.
As citosinas desemparelhadas, situadas nas extremidades protuberantes, são convertidas em
uridinas, por desaminação com o bissulfito de sódio. O preenchimento das extremidades
protuberantes, utilizando agora a actividade polimerásica da DNA polimerase de Klenow,
em presença dos 4 nucleotídeos trifosfato, seguido de ligação das extremidades rombas para
recircularizar o plasmídeo, gera uma molécula contendo, neste exemplo, duas mutações G-C
em A-U.
Existe um outro método para gerar DNA monocatenário, que recorre a fagos
monocatenários, tais como o M13. Qualquer DNA clonado neste vector pode ser obtido na
forma de molécula monocatenária e mutagenisado com bissulfito. A cadeia complementar (-)
é em seguida sintetizada, a partir da cadeia mutagenisada utilizando iniciadores específicos.
A região mutada de interesse, excisada da forma replicativa bicatenária, poderá ser reclonada
num vector não mutagenisado (Fig. 87.II).
Substituição por incorporação incorrecta
Em presença de brometo de etídeo, certas endonucleases de restrição (por exemplo, ClaI,
EcoRI) clivam a ligação fosfodiéster do DNA no sítio de reconhecimento, unicamente numa
das cadeias. Este corte pode ser alargado, sem ruptura da cadeia intacta, por uma polimerase
com actividade exonucleásica. O preenchimento da região monocatenária pela polimerase,
em presença de só 3 dos 4 nucleotídeos trifosfatos, resultará ocasionalmente, na introdução
incorrecta de um nucleotídeo em face da base cujo par complementar foi omitido. No
exemplo da Fig. 88.II. foi omitido o dCTP. Se o mecanismo corrector natural de excisão,
próprio à DNA polimerase não funcionar, o resultado final será uma molécula de DNA
contendo uma substituição de base. O desemparelhamento criado in vitro será reparado na
bactéria, durante a replicação, após transformação pelo plasmídeo. Os plasmídeos não
mutados podem ser identificados pela presença do sítio de restrição alvo do corte inicial
(ClaI, neste exemplo). Os mutados não serão reconhecidos pela endonuclease.
Uma alternativa para superar o mecanismo corrector da DNA polimerase, recorre a
análogos dos nucleotídeos, os nucleotídeos α-tiofosfatos, (Fig. 94.II.) que são substratos da
DNA polimerase mas não da sua actividade exonucleásica 3' → 5'. Uma vez incorporado, o
análogo não pode ser excisado pela enzima, mas a sua extremidade 3' é reconhecida como
iniciador para prolongar a síntese do DNA.
61
Os métodos descritos até agora dependem da presença dum sítio de restrição apropriado,
mais ou menos perto do sítio da mutação. Esta limitação pode ser superada, recorrendo a um
método universal e extremamente específico, que faz intervir oligonucleotídeos sintéticos
como agentes mutagénicos.
Mutagénese dirigida com oligonucleotídeos sintéticos
Este método oferece a possibilidade de mutar uma ou várias bases perfeitamente
definidas e localizadas, substituindo cada uma delas por qualquer outra antecipadamente
escolhida. O oligonucleotídeo sintético de sequência definida é complementar de uma das
cadeias do DNA que se pretende mutar, excepto numa ou várias posições alvo das
substituições mutagénicas. Em condições escolhidas judiciosamente, visando
nomeadamente, estabilizar a hibridação, o híbrido formado entre o oligonucleotídeo e o
DNA circular monocatenário, clonado num vector M13, se bem que imperfeitamente
emparelhado, será suficientemente estável para servir de iniciador numa reacção de
polimerização que levará à síntese da cadeia complementar do fago. A molécula bicatenária
resultante será portadora de um ou vários desemparelhamentos. Uma vez introduzida em
células E. coli competentes, os "erros" serão reparados e dois tipos de moléculas
descendentes serão obtidas: umas possuem a sequência do tipo selvagem, outras contêm as
modificações desejadas. Os fagos cuja cadeia (-) foi só parcialmente sintetizada darão
origem, após transfecção ao tipo selvagem (Fig. 89.II.).
Para distinguir as moléculas modificadas das do tipo selvagem, pode-se recorrer à
clivagem dos sítios de restrição, eventualmente criados, ou suprimidos pelas mutações, ou se
esse não for o caso, à hibridação do oligonucleotídeo sintético marcado radioactivamente
(com 32P por exemplo) com os dois tipos de fagos. A optimização das condições de
hibridação selectiva, nomeadamente a temperatura, permitirá distinguir o DNA mutado do
selvagem.
Os rendimentos geralmente obtidos em fago mutado são baixíssimos. Esta fraca
eficiência de mutação tem várias causas. A eficácia variável da reacção de polimerização é
certamente uma. Como o DNA monocatenário do fago também é infeccioso, se a síntese do
DNA complementar não for quantitativa as moléculas parcialmente monocatenárias, cuja
cadeia intacta é a não mutada, replicar-se-ão, dando origem ao tipo selvagem.
Um outro factor que favorece a ocorrência de clones do tipo selvagem, é a correcção dos
desemparelhamentos na forma replicativa (RF) antes da replicação in vivo. Este fenómeno
explica-se pela actividade 3'-exonucleásica ainda presente no fragmento de Klenow da DNA
polimerase I, que teoricamente pode digerir o iniciador antes do começo da síntese do DNA
in vitro. Mesmo um heterodúplex completo, contendo desemparelhamentos, pode ser
reparado por um mecanismo de excisão dos nucleotídeos desemparelhados. Ora, a cadeia
62
sintetizada in vitro é o alvo privilegiado destas reparações, porque não é metilado, ao
contrário do DNA parental, visto a metilação ocorrer in vivo após a replicação. Com efeito, o
mecanismo de reparação in vivo baseia-se, pelo menos em parte no reconhecimento do nível
de submetilação. A cadeia não metilada é portanto um bom substrato para o mecanismo de
reparação.
Numerosas estratégias foram desenvolvidas para superar estes problemas e elevar o
rendimento em moléculas mutadas, diminuindo de preferência a necessidade de escrutinar ou
purificar laboriosamente os mutantes. Este objectivo é tanto mais importante que a relação
entre o número de clones que é necessário escrutinar para ter uma probabilidade de 90 % de
obter um mutante, e a ineficácia da mutação, é logarítmica (Fig. 90.II.).
Uma das estratégias adoptadas recorre à utilização de DNA parental não metilado que
pode ser facilmente obtido através de estirpes de E. coli mutantes dam- que são deficientes no
mecanismo de metilação. Um inconveniente deste sistema é a elevada frequência de
mutações e de recombinações in vivo.
Foi desenvolvido um outro método que recorre a dois iniciadores oligonucleotídicos. O
segundo iniciador, que não introduz mutações, é dirigido para uma região da cadeia de DNA
monocatenário do fago em 5' do oligonucleotídeo mutagénico. O primeiro iniciador é
prolongado em presença do fragmento de Klenow da DNA polimerase, de DNA ligase e de
nucleotídeos trifosfatos. Este método visa proteger o oligonucleotídeo mutagénico da
actividade exonucleásica 5'→ 3' contaminante, da polimerase. Esta estratégia não impede no
entanto completamente o deslocamento do segundo oligonucleotídeo pela polimerase.
A fim de remediar o problema de reparação dos desemparelhamentos, foi estudado o
sistema do dúplex interrompido (gapped duplex). Este pode ser obtido por hibridação com o
DNA monocatenário dum vector que não possui a sequência clonada. A Fig. 91.II.
esquematiza as diferentes etapas deste método. O vector fágico M13 contém uma mutação
âmbar sem sentido e por consequência, só pode multiplicar-se num hospedeiro supressor de
âmbar. O DNA alvo da mutagénese é clonado neste fago e obtido na sua forma
monocatenária. Ao hibridar este DNA circular, com o DNA linearizado e desnaturado da
forma RF, não âmbar, do mesmo vector sem DNA estrangeiro, forma-se um dúplex parcial
na região do DNA clonado. O oligonucleotídeo mutagénico é dirigido para esta região
monocatenária e prolongado por uma polimerase, em presença dos 4 nucleotídeos trifosfatos.
Após ligação, a cadeia mutante poderá ser seleccionada num hospedeiro não supressor,
porque o vector selvagem não possui a mutação sem sentido. Na prática, a frequência de
mutantes é muito variável e frequentemente baixa. O método tem ainda a desvantagem de
produzir uma descendência não portadora do marcador sem sentido (âmbar), o que obriga a
63
recorrer de novo à clonagem no vector âmbar, se outras mutações forem necessárias no DNA
clonado.
Um sistema engenhoso de selecção, baseado na semelhança das sequências entre os
sítios de restrição EcoK e EcoB, possibilita a execução de vários ciclos de mutagénese com
elevada eficiência. EcoK e EcoB são enzimas de restrição do tipo I, que reconhecem um sítio
com cerca de 15 pb e cortam a uma distância de 1000 a 5000 bases dele:
EcoB 5'...... TGA ..... N8 ..…….TGCT......3'
EcoK 5'.…. GAAC .... N6 .….GTGCT.........3'
Um vector especial foi construído, que contém um sítio único EcoK num inserto
polylinker de 30 pb (vector M13K19 derivado de M13m19, Fig. 92.II.). São utilizados dois
iniciadores; um chamado iniciador de selecção modifica a sequência EcoK em EcoB, e o
outro, o mutagénico modifica a sequência alvo. Os iniciadores são prolongados pelo
fragmento de Klenow em presença dos 4 nucleotídeos trifosfatos e de DNA ligase e a
molécula bicatenária é levada a transformar uma estirpe bacteriana restritiva para EcoK. A
descendência com o sítio EcoK não sobreviverá e a mutada que contém o sítio EcoB e a
mutação de interesse será seleccionada. Esta selecção pode ser repetida com um iniciador de
selecção que modifica o sítio EcoB em EcoK e uma estirpe bacteriana restritiva para EcoB
(Fig. 93.II.). A eficácia pode atingir 70 % de rendimento.
Uma outra estratégia visa a destruição da cadeia (+) não interessante. Ela tira partido de
um hospedeiro especializado, para a multiplicação do fago antes da mutagénese. O vector
fágico monocatenário é multiplicado numa estirpe de E. coli Dut-Ung-. A deficiência no gene
dut, que codifica para a dUTPase leva a uma superprodução de dUTP que será incorporada
no DNA no lugar de dTTP. A deficiência em uraciloglicosidase impede a eliminação dos
resíduos de U do DNA (papel próprio a esta enzima). É assim possível obter um DNA fágico
monocatenário contendo 20 a 30 resíduos de uracilo. Este fago será inactivado por um
hospedeiro Ung+. Utilizada como matriz em mutagénese dirigida, em presença de dTTP, a
cadeia parental contendo os resíduos uracilo será copiada em cadeia mutada, contendo
timidina em vez de uracilo. Multiplicado num hospedeiro Ung+, o fago dará lugar a uma
descendência predominantemente mutada. Devido à multiplicação fraca das estirpes Dut-
Ung- o rendimento em fago é baixo apesar da frequência de mutação ser elevada (+ 80 %).
64
Uma das estratégias mais eficazes baseia-se na utilização e nas propriedades dum
isómero óptico, de um análogo de nucleotídeo trifosfato, o isómero Sp do dCTPαS que
contém um átomo de enxofre, em substituição dum átomo de oxigénio, ligado ao fósforo α
(Fig. 94.II.). Neste método, a cadeia não mutada é eliminada in vitro, sendo seleccionado um
puro homodúplex de DNA mutado. O oligonucleotídeo mutagénico é utilizado como
iniciador para a polimerização com o fragmento de Klenow, em presença de T4 DNA ligase.
O análogo dCTPαS é utilizado no lugar do dCTP e incorporado normalmente, o que permite
a eliminação selectiva da cadeia não mutada (Fig. 95.II.). Com efeito, certas enzimas de
restrição não clivam o DNA nos sítios onde um fosforotioato foi incorporado, mas criam
cortes simples na cadeia nativa. Estes cortes são o ponto de partida para a degradação
enzimática parcial, pela exonuclease III, do DNA não mutado. Este pode em seguida ser
utilizado como matriz para a reconstrução duma molécula bicatenária circular, que será por
consequência um homodúplex mutado. A eficácia da mutação é frequentemente superior a 80
%.
Selecção e identificação dos mutantes
A técnica mais directa para escrutinar os clones interessantes é a sequenciação do DNA
monocatenário purificado de cada clone, utilizando uma única reacção, com o
didesoxinucleotídeo que diferenciará o tipo selvagem dos mutantes. Se a mutação estiver
situada longe no sítio de clonagem pode ser necessário sintetizar um oligonucleotídeo
apropriado para ser utilizado como iniciador.
Se a mutação desejada criar ou destruir um sítio de restrição, a análise electroforética da
forma RF do DNA, preparado in vitro a partir do DNA monocatenário, purificado e cortado
pela enzima que reconhece o sítio, permitirá a identificação dos clones mutados.
O método de hibridação é o mais versátil e possibilita o escrutínio de um grande número
de mutantes potenciais. Utiliza-se directamente o iniciador mutagénico marcado com 32P,
como sonda de hibridação, que pode ser aplicada tanto com colónias bacterianas, como com
lisados de fagos. Um desemparelhamento entre o oligonucleotídeo mutagénico e o DNA
fágico monocatenário destabilizará o híbrido. Um aumento progressivo da temperatura
dissociará selectivamente a sonda marcada dos clones não mutados, mas permite que a sonda
permaneça hibridada com os mutantes de sequência perfeitamente complementar. A reacção
de hibridação e as etapas de lavagem a temperaturas crescentes são realizadas com o DNA
alvo fixo a um filtro de nitrocelulose ou de nylon.
65
Aplicações da mutagénese dirigida
A mutagénese dirigida é um instrumento extremamente poderoso para estudar
fenómenos bioquímicos e biofísicos, tais como o sítio de ligação com os receptores de
proteínas biologicamente activas, o sítio activo de enzimas (identificando os domínios
implicados na interacção com os receptores), porque permite modificar a especificidade das
ligações mediante alterações pontuais específicas dos genes.
O estudo da estrutura e da função das proteínas, assim como a engenharia de proteínas
com o fim de aperfeiçoar as suas propriedades, são sem dúvida áreas de grande aplicação
desta técnica.
Um exemplo é a mutagénese específica pontual do gene do interferão ß humano (IFN-ß).
Este gene foi clonado e abundantemente expresso em E. coli, mas a actividade específica
antiviral da proteína é apenas 1/10 da da proteína nativa glicosilada. O IFN-ß contém três
resíduos de cisteína, localizados nos aminoácidos 17, 31 e 141. Estas cisteínas podem formar
pontes dissulfureto intermoleculares, dando origem a dímeros ou oligómeros inactivos. Por
outro lado, podem reagir ao acaso intramolecularmente levando à formação de três tipos de
moléculas, correspondentes às três ligações dissulfureto intramoleculares possíveis. Só uma
destas formas possuirá a conformação nativa e poderá ter actividade biológica. A substituição
duma destas cisteínas por um outro aminoácido, é uma solução possível para eliminar a
formação de pontes dissulfuretos indesejáveis. Para manter as propriedades biológicas da
proteína é necessário, por um lado, que o aminoácido que substitui uma das cisteínas tenha
um comportamento próximo do do aminoácido original, para não provocar distorções
relativamente à conformação nativa e por outro lado, que a cisteína substituída não esteja
implicada numa ponte dissulfureto na proteína natural. A primeira condição tem grandes
probabilidades de ser satisfeita, escolhendo a serina para aminoácido de substituição, visto só
diferir da cisteína pela natureza dum átomo (um átomo de oxigénio no lugar de um átomo de
enxofre). A decisão de escolher a cisteína 17 para alvo da substituição é baseada na analogia
com o IFN-α que possui quatro cisteínas implicadas em duas pontes dissulfureto, entre as
posições Cys29 - Cys138 e Cys1 - Cys98. Sabe-se por outro lado, que a Cys-141 é essencial
para a actividade do IFN-ß, porque a sua substituição por uma tirosina dá origem a uma
modificação conformacional importante da proteína, que perde a especificidade de se ligar a
anticorpos dirigidos contra o interferão natural e de competir com os receptores do IFN-ß
nativo nas células alvo. A ligação dissulfureto mais provável no IFN-ß é pois entre a Cys-31
e a Cys-141.
A figura 96.II. ilustra a estratégia adoptada para mutagenisar especificamente o gene do
IFN-ß. A substituição pontual foi induzida por um decaheptanucleotídeo G-C-A-A-T-T-T-T-
C-A-G-A-G-T-C-A-G complementar de 16 nucleotídeos da cadeia não codificante do gene.
66
Um simples desemparelhamento na posição 12 do iniciador (um A no lugar dum T) induz a
mutação de cisteína em serina. Este gene clonado em E. coli, produz uma proteína mutada
IFN-ß Ser-17, que possui actividades biológicas, incluindo actividade antiviral, em tudo
comparáveis às da proteína natural, em contraste com a proteína IFN-ß Cis-17 produzida pelo
mesmo hospedeiro. A proteína mutada neutraliza o anti-soro dirigido contra o IFN-ß com a
mesma eficácia que a proteína natural, o que indica que as duas proteínas possuem
determinantes antigénicos comuns que são reconhecidos de maneira idêntica pelo anti-soro.
Os dois interferões são pois imunologicamente semelhantes. A substituição do aminoácido
Cis-17 por uma serina não causa alterações importantes na estrutura da proteína, que forma a
ponte dissulfureto e se enrola correctamente, ao contrário do IFN-ß Cis-17 expresso no
mesmo hospedeiro.
Para além da recuperação da actividade específica, o INF-ß Ser-17 possui uma estabilidade
muito superior à do IFN-ß Cis-17 recombinante produzido pela bactéria, o qual perde
rapidamente a actividade específica.
Este caso concreto aplicado a uma proteína de grande interesse terapêutico ilustra o
potencialidade da mutagénese dirigida em engenharia das proteínas. As aplicações desta
metodologia de mutagénese perfeitamente definida e controlada são numerosas, tanto no
plano teórico de investigação de mecanismos fundamentais, como no plano prático da
produção. Nesta área da investigação aplicada, descrevemos, como exemplo, a mutação no
gene do interferão-ß que modifica uma cisteína em serina. Esta alteração tem como resultado
melhorar o rendimento de produção da proteína activa por E. coli.
A mutagénese dirigida por oligonucleotídeos tem também, sido amplamente utilizada na
análise funcional de genes, no estudo de regiões reguladoras, de operões, de promotores ou
outras sequências de controlo (como por exemplo a elucidação do papel das sequências
consenso presentes nas junções intrão-exão), na elucidação da influência de sequências
específicas na biossíntese de tRNA, no estudo de alterações das propriedades catalíticas de
enzimas, na avaliação da influência da natureza da carga dos aminoácidos das sequências
sinal, no transporte das proteínas através da membrana celular. A aplicação desta técnica à
elucidação dos mecanismos de acção das enzimas e das relações existentes entre a estrutura
primária e as funções biológicas desenvolveu-se rapidamente e tem tido importantes
repercussões.
67
4. A TRANSFORMAÇÃO BACTERIANA
As moléculas de DNA recombinante formadas in vitro por ligação só começam a ter
interesse depois de introduzidas num hospedeiro biológico. De facto, a utilização das novas
moléculas de DNA formadas por engenharia genética depende da sua separação e
propagação. Por isso, é necessário introduzi-las em células (bacterianas, por exemplo) de
maneira a poderem replicar-se e serem preservadas e recuperadas facilmente. Um meio de o
conseguir é recorrer, como vimos, a vectores particulares recombinados com o gene que nos
interessa, para o introduzir num hospedeiro biológico em geral um colibacilo.
Uma série de métodos foi desenvolvida para assegurar a introdução eficaz de DNA no
hospedeiro. Sabe-se que o DNA exógeno pode entrar nas bactérias naturalmente. Estas
passam por um estado de competência que as torna aptas para aceitar o DNA exógeno,
fixando o DNA numa forma resistente às nucleases. O estado de competência pode ser
reproduzido artificialmente pela exposição das bactérias ao cloreto de cálcio antes da adição
do DNA exógeno (plasmídeo recombinante) (Fig. 97.II.)
Para manter o DNA recombinante nas células transformadas e evitar problemas de
degradação pelo sistema hospedeiro, as bactérias receptoras são geralmente tornadas
deficientes para o sistema de restrição (hsdR-) e por vezes também para o sistema de
modificação (hsdM-). A proliferação permite a obtenção de biliões de cópias idênticas do
fragmento clonado.
5. BANCO DE CLONES DE CDNA
Para construir um clone contendo sequências derivadas de um mensageiro de eucariota é
necessário obter, primeiramente, esta sequência na forma de DNA. A cópia DNA de um
RNA mensageiro chama-se DNA complementar (cDNA). O termo clone de cDNA descreve
uma bactéria portadora de um plasmídeo que contém a cópia DNA de uma molécula de
RNA.
Uma célula de eucariota comum contém vários milhares de sequências de RNA
mensageiros diferentes. Um banco de clones de cDNA, para ser representativo, deve conter
um número suficiente de transformantes distintos, para que cada RNA mensageiro esteja
representado pelo menos uma vez na população bacteriana. O número de transformantes
distintos a obter para ter uma elevada probabilidade de identificar o clone que se procura
varia entre +5.000 e +100.000, segundo a abundância relativa dum mensageiro na célula.
68
Esquema de construção de um banco de clones de cDNA
a) Preparação do DNA complementar bicatenário a partir de RNA poli (A)+ (Fig. 98.II.)
A partir de células pertencentes a um órgão apropriado isolam-se os RNA totais. Estes
são passados numa coluna de oligo-dT celulose de maneira a reter especificamente os RNA
poli (A)+ (hibridação A-T). Um iniciador oligo-dT é hibridado com os RNA poli (A)
+ para
iniciar a transcrição reversa em DNA complementar monocatenário, utilizando uma
transcritase reversa isolada do vírus aviano de mieloblastose. Para a síntese da segunda
cadeia do cDNA, pode utilizar-se a transcritase reversa, o fragmento de Klenow da
polimerase I de E. coli (enzima de Kornberg) ou a T4DNA polimerase. Estas últimas duas
enzimas não possuem actividade exonucleásica 5'→3' própria da DNA polimerase I e não
degradam o DNA bicatenário à medida que ele é sintetizado. Tanto a enzima de Kornberg
como a DNA polimerase de T4 requerem um iniciador para a extremidade hidroxílica em 3'.
Este iniciador pode criar-se espontaneamente, após a terminação da cadeia monocatenária do
cDNA, em cuja extremidade se forma um gancho (hairpin), que serve de iniciador para a
síntese da segunda cadeia de DNA pelo fragmento de Klenow da DNA polimerase I (ou a
trancritase reversa ou a T4 DNA polimerase). Este gancho pode ser depois clivado pela
nuclease S1, de maneira a produzir um DNA complementar bicatenário linear.
Também é possível prolongar a extremidade 3' do cDNA com uma cauda
homopolimérica. Neste caso, a síntese da segunda cadeia pode ser iniciada utilizando um
iniciador homopolimérico.
Uma etapa crítica na síntese do cDNA é o tratamento com a S1 nuclease. Existe um
processo alternativo, pelo qual o RNA do híbrido RNA-DNA obtido após a síntese da
primeira cadeia é retirado, não por um tratamento alcalino, mas antes por um tratamento
combinado RNAase H/DNA polimerase I de E. coli. A RNAase H (H de híbrido), que ataca
especificamente a cadeia de RNA do híbrido RNA-DNA, introduz um certo número de cortes
(nicks), i. é., extremidades 3'-hidroxílicas na cadeia de RNA, que servem de iniciadores para
a reacção de nick translation catalisada pela DNA polimerase I.
Observações:
1) A origem da região do gancho em 3' da primeira cadeia do cDNA não está bem
elucidada. É possível que muitos mensageiros tenham em 5' uma região complementar que
conduza à formação deste gancho.
69
2) Se o RNA não possui a região poli(A)+, esta pode ser adicionada in vitro à
extremidade 3' pela enzima poli(A) polimerase, para ser depois utilizada com o iniciador
oligo-dT.
3) Se a sequência nucleotídica do RNA mensageiro for conhecida, pode-se utilizar,
para a síntese do DNA complementar, um iniciador oligonucleotídico sintético complementar
da extremidade 3'do RNA mensageiro.
b) Inserção do cDNA num plasmídeo - Transformação das bactérias
Quando se dispõe dum DNA complementar bicatenário, é preciso em seguida inseri-lo
num vector destinado a transformar o hospedeiro bacteriano. Para isso, adicionam-se
extremidades coesivas às moléculas de cDNA bicatenário, segundo um dos esquemas
seguintes :
1) Adição de adaptadores sintéticos que geram sítios de restrição (Fig. 99.II.).
2) Adição de extremidades homopoliméricas complementares (Fig. 100.II.).
No termo destas manipulações dispõe-se de um banco de clones de cDNA.
70
6. BANCOS GENÓMICOS
Um banco de cDNA de um órgão, ou de uma dada população de células, é representativo
da população de genes expressos nestas células. Na célula, só alguns milhares, entre centenas
de milhares de genes dos cromossomas, são transcritos em mRNA. Um banco representativo
do mRNA destas células contém forçosamente menos clones diferentes que um banco
representativo da totalidade dos genes (banco genómico), o que simplifica a procura de um
gene.
Um banco genómico é uma colecção de clones plasmídicos ou de lisados fágicos, que
contém moléculas de DNA recombinante. A totalidade dos insertos individuais de DNA
representa a informação genética completa dum organismo.
A estratégia geral para a construção de bancos genómicos requer primeiro o isolamento
de fragmentos de DNA do organismo dado. Estes fragmentos têm, evidentemente, que
representar o genoma inteiro e são derivados do DNA genómico total por digestão enzimática
ou ruptura mecânica suave. Estes fragmentos são em seguida introduzidos num vector ad hoc
do tipo λ, ou cosmídeo, afim de assegurar a sua propagação (Fig. 101.II.).
O número mínimo de clones necessários para se obter a representação do genoma inteiro
dum organismo pode ser calculado. A probabilidade P de se obter um gene específico numa
colecção de clones depende do comprimento dos insertos de DNA e da complexidade do
genoma. Quanto maior e mais complexo for o genoma, maior é o número de clones de um
tamanho específico necessário para se obter uma representação completa da informação
genética. Este número N de clones pode ser determinado utilizando a fórmula :
)1ln(
)1ln(
f
PN
−
−=
em que P é a probabilidade de se obter uma sequência particular e f é a relação entre o
comprimento do inserto e a totalidade do genoma.
A tabela 3.II. fornece as valores de N para um inserto de 20 kb e para as probabilidades
de 90 % e de 99 % de se obter um clone particular. Estes valores devem ser considerados
como uma estimativa por defeito, porque foram obtidos fazendo a hipótese que cada
molécula híbrida têm uma capacidade de transformação semelhante e que cada colónia
representa uma ocorrência de transformação independente.
A tabela 4.II. fornece o número de clones teoricamente necessários para que o genoma
apareça representado pelo menos uma vez, em função dos tamanhos dos fragmentos clonados
e da origem do genoma. No entanto, este número mínimo, só representa estatisticamente uma
71
possibilidade em duas de se encontrar o clone alvo. Em geral, é necessário escrutinar de 3 a
10 vezes o número mínimo de clones, para se ter uma probabilidade razoável de identificar
um gene particular.
O esquema de clonagem no DNA de fago λ e o empacotamento nos invólucros fágicos
está ilustrado na Figura 102.II. A eficácia deste tipo de sistema é muito elevada; obtêm-se da
ordem de 108 pfu/µg de DNA (pfu = plaque forming units).
Em princípio, qualquer gene para o qual existe um sistema de detecção apropriado, por
exemplo, uma sonda de hibridação, pode ser isolado de um banco genómico, contanto que o
banco satisfaça os critérios mencionados e seja realmente representativo. Se o banco
genómico contiver fragmentos de DNA obtidos por digestão parcial, estes fragmentos
apresentarão sobreposições e o banco oferecerá a possibilidade de examinar a estrutura, não
apenas de genes individuais, mas também de sequências vizinhas. Este tipo de análise é
conhecido por chromosome walking (Secção 1.1.b.8).
7. MÉTODOS DE DETECÇÃO E DE ANÁLISE DE CLONES
Várias técnicas são utilizadas para detectar, entre os clones dum banco, os que
comportam a sequência de DNA desejada.
a) Hibridação in situ entre o DNA dos clones recombinantes e uma sonda de DNA
radioactiva (Fig. 103.II.)
A sonda radioactiva pode ser um cDNA purificado, um RNA mensageiro purificado ou
um oligonucleotídeo sintético. Estas sondas são marcadas in vitro com 32P por nick
translation (cDNA) ou por quinação (oligonucleotídeo de síntese, RNA poli (A)+).
b) Carta de restrição
Os clones positivos por hibridação podem ser analisados por restrição. A carta de
restrição é em seguida comparada com uma carta conhecida ou teórica (derivada da
sequência em aminoácidos da proteína cujo DNA foi clonado).
c) Sequenciação dos nucleotídeos do inserto nos clones positivos por hibridação
d) Selecção do mensageiro específico por hibridação com o DNA recombinante e tradução
in vitro
Neste método, o DNA plasmídico dos clones é isolado e em seguida fixo num filtro de
nitrocelulose. Em condições apropriadas de temperatura e de força iónica, hibrida-se com o
RNA mensageiro total que serviu para a síntese do DNA complementar. Só o RNA
mensageiro, que possui sequências complementares das do DNA imobilizado no suporte,
72
permanecerá associado a este. Pode-se assim isolar este RNA mensageiro, extrai-lo do
suporte e traduzi-lo num sistema de tradução in vitro. O produto codificado pelo RNA
mensageiro é em seguida identificado por imunoprecipitação com um anticorpo dirigido
contra a proteína cujo mensageiro foi clonado (Fig. 104.II.).
e) Southern blotting
Para localizar sequências particulares de DNA nos fragmentos de restrição, utiliza-se o
método desenvolvido por Southern (Fig. 105.II.). O DNA é clivado em fragmentos, que são
separados em gel de agarose e em seguida transferidos para uma folha de nitrato de celulose.
O filtro é depois hibridado com uma sonda radioactiva apropriada. A autorradiografia da
folha de nitrocelulose, depois de lavada, revela fragmentos contendo sequências
complementares das da sonda utilizada.
Uma técnica análoga existe para a caracterização do RNA (chamada neste caso Northern
blotting): os RNA totais ou mensageiros são separados em gel de agarose e depois
transferidos para um suporte apropriado (nitrocelulose, papel activado, ...). A hibridação com
uma sonda marcada permite em seguida conhecer o número e o comprimento dos RNA
mensageiros complementares da sonda.
f) Escolha das sondas de DNA sintéticas
Oligonucleotídeos sintéticos, escolhidos judiciosamente podem ser utilizados para escrutinar
um banco de clones por hibridação, ou para isolar um DNA complementar pouco abundante,
contanto que se conheça, pelo menos, uma parte da sequência dos aminoácidos da proteína,
cujo gene se deseja clonar. Uma sequência de alguns aminoácidos é suficiente para deduzir
todas as sequências do RNA que podem codificar para este péptido. Com efeito, se só a
sequência proteica for acessível, a estratégia na escolha dos oligonucleotídeos a utilizar para
escrutinar os bancos é menos directa. O conhecimento da sequência da proteína não permite
deduzir uma sequência de DNA única, devido à degenerescência do código genético. É, no
entanto, possível sintetizar todas as sequências nucleotídicas correspondentes.
Uma das estratégias consiste em escolher, como sequência alvo da sonda
oligonucleotídica, uma região correspondente a uma sequência de aminoácidos pertencendo
aos menos degenerados. A Fig. 106.II. exemplifica a aplicação desta estratégia à detecção de
clones de cDNA da uroquinase humana.
Não é só a complementaridade perfeita da sonda que é crítica para obter uma boa
hibridação; o seu comprimento é igualmente importante. Quanto maior for a complexidade
do DNA alvo, maior é a probabilidade de nele existir uma sequência qualquer dada, escolhida
ao acaso. 4n é o número total de sequências diferentes possíveis, constituídas pelos 4
nucleotídeos e com o comprimento de n nucleotídeos. A frequência com que uma sequência
73
dada de n nucleotídeos, considerada ao acaso, é susceptível de se encontrar num genoma de
3.5 109pb, como é o genoma humano, é dada pela equação:
n4
510.3 9
Esta frequência é pois, de 1/5 para uma sequência definida considerada ao acaso de 17
nucleotídeos. Para maior segurança e eliminar problemas de barulho de fundo, escolheu-se no
exemplo dado n = 23.
É corrente utilizar uma mistura de fragmentos sintéticos marcados, formada de todas as
combinações correspondentes à degenerescência, para escrutinar um banco de clones. Em
condições adequadas, só um oligómero correspondente a uma sequência clonada se hibridará
com esta e dará um sinal após autorradiografia. No exemplo da figura foi sintetizada uma
mistura de 16 oligonucleotídeos, desprezando os codões menos prováveis, afim de manter
uma concentração elevada do oligonucleotídeo perfeitamente complementar da sequência
alvo. Com efeito, quanto maior for a ambiguidade ao nível da utilização dos codões, mais
difícil é a utilização da mistura dos oligonucleotídeos de grande comprimento, porque o
número de possibilidades aumenta rapidamente e a concentração do oligonucleotídeo único,
que corresponde à verdadeira sequência clonada alvo, diminui proporcionalmente.
Neste contexto, uma outra estratégia, para evitar a síntese de misturas complexas e um
grande número de desemparelhamentos entre a sonda sintética e o DNA clonado, consiste em
utilizar a desoxiinosina para substituir todas as bases ambíguas. Este análogo tem um
comportamento aproximadamente neutro no emparelhamento entre as moléculas de DNA e
não destabiliza, ou destabiliza pouco, os híbridos.
desoxiinosina
O N
N
NNHO
OH
O
H
A especificidade de uma pequena sonda sintética de cerca de 20 nucleotídeos é notável.
Um único desemparelhamento no interior da região de emparelhamento, entre a sonda e a
sequência alvo, é suficientemente destabilizador do híbrido para provocar a sua dissociação,
em condições de temperatura e concentração salina que mantêm o híbrido perfeito estável.
Uma série de regras, relativamente empíricas, determinam a escolha e as condições de
utilização óptimas duma sonda oligonucleotídica. Nomeadamente, a temperatura de
74
hibridação deve ser determinada judiciosamente. Quanto mais baixa for a temperatura maior
será a probabilidade de o oligonucleotídeo se hibridar, não só com a sequência pretendida,
mas também com sequências próximas; por outro lado, a temperatura não pode ser
incrementada indefinidamente, dado que a eficiência da hibridação diminui com o aumento
da temperatura e só é de 50% à temperatura de dissociação (Td) do DNA. A regra empírica
seguinte permite calcular a temperatura de dissociação de híbridos formados com
oligonucleotídeos de comprimento não superior a 18 nucleotídeos:
CxCGxTATd º4)(2)( +++=
Esta temperatura aumenta 4°C por cada par de bases G:C e 2°C por cada par T:A hibridados
entre o oligonucleotídeo e o DNA alvo, em condições de concentração salina correntes
(6xSSC: NaCl 0.9 M, citrato de Na 50 mM, pH 7).
Para sequências mais compridas é conveniente utilizar a fórmula seguinte, válida para
oligonucleotídeos de comprimento compreendido entre 14 e 60-70 nucleotídeos:
[ ] )/600()(%41.0(log6.165.81 NCGNaTd −++−= +
em que N é o número de nucleotídeos. Na prática, quando existem desemparelhamentos
prováveis subtrai-se 1°C à temperatura calculada, por cada 1% de desemparelhamento e
efectuam-se as primeiras lavagens pós-hibridação a 1-10°C abaixo da Td calculada.
É todavia possível adoptar condições em que a temperatura de dissociação é
independente da proporção de G:C. Este efeito obtém-se utilizando uma concentração 3M de
cloreto de tetrametilamónio (ou de tetraetilamónio) em vez de NaCl, o qual se liga
selectivamente às sequências AT, aumentando a Td do DNA bicatenário (a temperatura de
dissociação de A:T passa a ser igual à de G:C). A Tabela 5.II fornece a Td dos híbridos de
DNA em função do comprimento e da composição das sondas, nas condições mencionadas.
75
8. A SÍNTESE QUÍMICA DE GENES
Uma alternativa à clonagem de cDNA, ou de um gene a partir de fragmentos do DNA
genómico, é a síntese total do DNA correspondente a uma proteína cuja sequência é
conhecida. Esta abordagem é viável graças ao refinamento que atingiu a química de síntese
dos oligonucleotídeos, tanto no que respeita aos rendimentos, como à pureza dos produtos e
à rapidez da sua obtenção, devido nomeadamente aos progressos realizados no campo do
automatismo (vd. Secção 1.1.c.).
No entanto, dada a impossibilidade de as reacções químicas atingirem repetidamente
rendimentos de 100 %, existe um limite ao comprimento dos fragmentos de DNA que é
possível sintetizar quimicamente. A síntese total de um gene realiza-se, por consequência,
por complementação de meios químicos e de meios enzimáticos.
Actualmente, é possível obter, em condições optimizadas de síntese, fragmentos de uma
centena de desoxinucleotídeos, com um grau de pureza aceitável. O exemplo das Fig. 107.II,
108.II e 109.II ilustra a síntese do gene do hGRF (human Growth Hormone Releasing Factor,
factor de libertação da hormona humana de crescimento), descrita em 1985 e realizada por
métodos manuais. O princípio da síntese do gene permanece válido.
O hGRF é uma pequena proteína de 44 aminoácidos, de cuja sequência foi deduzida a
sequência nucleotídica das duas cadeias do gene. Foram incluídos nos fragmentos sintéticos,
o codão de fim de tradução e um sítio Sal I, que servirá para a clonagem do gene num
plasmídeo linearizado pela mesma enzima.
Os fragmentos a sintetizar foram definidos de maneira a que cada um deles seja
complementado por hibridação com dois outros, conduzindo, após a sua mistura em solução,
a uma estrutura correspondente à sequência do gene, mas apresentando ainda nicks entre 2
fragmentos consecutivos. O fecho destes nicks realiza-se com uma ligase, que estabelece
enzimáticamente a ligação covalente entre o fosfato em 5' e o HO em 3', de dois
oligonucleotídeos consecutivos, mantidos nas suas posições correctas por hibridação entre
bases complementares (Fig. 108.II.). A figura ilustra esquematicamente as diferentes etapas
no sentido antitético, i.é., por ordem inversa à da realização, na prática, da síntese do gene.
No sentido sintético, cada um dos fragmentos purificados, depois de síntese, (excepto os
que correspondem às extremidades 5' da construção final) é fosforilado enzimáticamente. Os
fragmentos são em seguida misturados em condições que favorecem a sua hibridação
correcta (annealing), e ligados. O fragmento A31 na extremidade 5' do gene possui uma
extremidade coesiva própria para entrar num sitio de restrição NcoI (Fig. 109.II). É uma
variante da construção indicada na Fig. 107.II (comparar com A27), que ilustra a
76
flexibilidade introduzida pela possibilidade de sintetizar fragmentos de DNA de sequência
definida. Os oligonucleotídeos nas extremidades da construção contêm, não só as sequências
próprias ao gene, mas também sequências correspondentes a sítios de restrição úteis,
funcionando, portanto, igualmente como adaptadores, na construção.
A clonagem deste gene exemplifica outras aplicações dos oligonucleotídeos sintéticos.
Afim de expressar este gene sintético numa bactéria, este é inserido num plasmídeo, construído a partir do vector pCQV2 (Fig. 110.II), no qual o promotor PR de λ foi substituído
pelo promotor PL de λ, mais eficiente. Este foi introduzido por ligação de fragmentos
sintéticos, contendo a sequência do PLλ, com o plasmídeo em que foi suprimida a sequência PRλ. Os fragmentos sintéticos comportam, além das sequências do PLλ, sequências
correspondentes ao sítio de fixação do ribossoma (RBS-"Ribosoma Binding Site") e a sítios
múltiplos de restrição, potencialmente úteis para outras construções eventuais. A linearização
do plasmídeo, digerido pelas enzimas NcoI e SalI, expõe as extremidades coesivas às
extremidades complementares do gene sintético. Em presença de um excesso deste último, o
vector readquire a sua forma circular, ao hibridar as suas extremidades complementares e
enfim, a acção enzimática da ligase estabelece as ligações covalentes. Após transformação
bacteriana com a mistura de ligação, as colónias transformadas com o plasmídeo que contém
o inserto sintético, podem ser seleccionadas por hibridação com um dos oligonucleotídeos
marcados que serviram para a construção do gene. A visualização, como já vimos, é baseada
na marcação radioactiva do oligonucleotídeo, por fosforilação enzimática com uma quinase e
γ32P-ATP. O oligonucleotídeo marcado hibridar-se-á com a sua sequência complementar, no
inserto e só as colónias transformadas pelo plasmídeo contendo o hGRF e imobilizadas num
filtro de nylon ou de nitrocelulose emitirão um sinal radioactivo.
77
9. SISTEMAS DE EXPRESSÃO: ORGANISMOS HOSPEDEIROS - VECTORES
Um certo número de produtos biológicos não pode ser obtido em quantidade suficiente
para permitir um estudo pormenorizado da sua estrutura e da sua função. Clonar o DNA
correspondente a estes produtos não basta, é também preciso poder expressá-los em
abundância. Como vimos, um gene não é unicamente uma sequência de DNA codificando
para uma sequência de aminoácidos, mas comporta ainda um conjunto de sinais moleculares,
que diferem de um organismo para outro (idênticos ou parecidos, por exemplo, entre
mamíferos, mas diferentes na levedura ou no colibacilo). Estas diferenças têm que ser
consideradas para optimizar a expressão, tanto para fins de produção como de investigação.
Além disso, os vectores possuem a sua própria coerência genética e não são capazes de
se multiplicar em qualquer hospedeiro (são-no em geral só no hospedeiro de origem).
a. Expressão em E. coli
Vectores de expressão em E. coli
O colibacilo é o hospedeiro mais utilizado, tirando a sua supremacia das vantagens
inerentes à sua genética relativamente bem conhecida, à facilidade de ser cultivado,
recuperado e lisado; tem sido utilizado para a produção em massa de algumas proteínas.
Exemplos de vectores de expressão muito utilizados em E. coli são os plasmídeos
multicópias, comportando um promotor forte de origem bacteriana ou fágica (trp, lac, lpp, PR
ou PL de λ). A existência deste promotor forte assegura a transcrição eficaz do gene clonado
a jusante, mas não garante necessariamente a sua expressão eficaz. É, evidentemente,
necessário que os sinais moleculares apropriados estejam presentes: o promotor que indica o
local onde a cópia do gene em mRNA começa, a sequência de Shine-Dalgarno, sítio de
fixação reconhecido pelos ribossomas, o local da iniciação da tradução do mRNA em
proteína, os sinais de fim de transcrição e de tradução.
Além disso, é preciso conceber o sistema de tal maneira que o produto resultante da
expressão do DNA clonado seja autêntico, e não na forma de fusão com um fragmento
proteico codificado pelo plasmídeo.
É igualmente necessário evitar a presença e o efeito de sinais de terminação fortuitos da
transcrição (efeitos polares), assegurar-se da estabilidade do RNA mensageiro resultante da
transcrição do gene clonado, assim como da proteína sintetizada e enfim, do efeito letal
potencial do produto superexpresso, no crescimento do organismo hospedeiro.
O vector de expressão ideal deve teoricamente possuir as seguintes propriedades:
78
1. Ser estável, para não se perder nem modificar o gene estrangeiro.
2. Estar representado em número elevado e constante em cada célula, para aumentar o
número de cópias do gene, susceptíveis de serem traduzidas em proteínas.
3. Poder funcionar como vector vaivém (shuttle), quer dizer poder multiplicar-se em mais
de um tipo de hospedeiro.
4. Possuir genes marcadores de selecção, como por exemplo de resistência aos antibióticos.
5. Possuir um sistema de expressão potente (promotor forte), que permita uma produção
abundante de proteína.
6. Não possuir sequências terminadoras que interrompam prematuramente a transcrição.
7. Ser concebido de maneira que se possa inserir nele, facilmente e correctamente (em fase
de leitura), o cDNA ou o gene que se deseja expressar.
8. Possuir as instruções moleculares, as sequências de DNA que permitam a síntese de uma
proteína que seja segregada para fora da célula, para facilitar o seu isolamento e purificação.
Esta última propriedade é proporcionada por uma curta sequência de aminoácidos, que
precede a sequência da proteína propriamente dita, a sequência sinal. Ela orienta a síntese da
proteína nascente para a secreção para fora da célula. Esta sequência é clivada, perdida,
durante a passagem da proteína através da membrana.
A obtenção da proteína no meio extracelular têm vantagens na produção industrial,
porque facilita a sua purificação, já que não fica perdida no meio da massa de proteínas
celulares. Por outro lado, uma toxicidade eventual da proteína em relação ao hospedeiro será
reduzida. Enfim, mesmo pequenos péptidos que seriam normalmente destruídos no seio da
célula, podem ser produzidos.
O vector de expressão ideal não existe. Para optimizar a expressão de um gene e o
rendimento de obtenção duma proteína particular, é necessário dispor de um bom sistema
expressão-hospedeiro que não é forçosamente universal.
1) Construção de vectores de expressãobaseados no promotor lac
O DNA que se pretende expressar (um cDNA por exemplo) é removido do plasmídeo de
clonagem original por digestão enzimática (por exemplo, PstI, Fig 111.II). Um local de
restrição é em seguida colocado na proximidade do codão de iniciação ATG. O DNA é
primeiramente submetido à acção combinada das enzimas ExoIII e S1, ou à de Bal31. As
condições de digestão dependem da distância entre o local de clivagem inicial (neste exemplo
79
PstI) e o codão ATG, e devem ser ajustadas separadamente para cada caso particular. O
fragmento de DNA é em seguida ligado com linkers, neste exemplo EcoRI, de maneira a
poder ser inserido no local EcoRI de um vector adequado. Antes da clonagem, o fragmento é
digerido por EcoRI e outra enzima de restrição que cliva no local X, no interior do gene.
Obtêm-se assim fragmentos com uma extremidade direita definida, que pode ser utilizada
para mais tarde reconstruir o gene inteiro. Se bem que a extremidade esquerda seja definida
pelo local EcoRI, a distância entre este local e o codão de iniciação ATG varia duma
molécula para outra. A ligação a um vector adequado dará origem a uma gama larga de
clones diferentes, nos quais a distância entre o local EcoRI e ATG varia. Certos insertos
poderão não estar na fase de leitura correcta. Os clones na fase correcta de leitura poderão,
todavia, ser identificados, explorando o fenómeno da complementação α (vd. Secção
1.1.b.2). Para isso, como no caso da clonagem em M13, foram construídos vários plasmídeos
da série pUC (Fig. 112.II). Estes plasmídeos possuem a região de regulação lac e uma parte
do gene lac Z que codifica os 59 aminoácidos N-terminais da ß-galactosidase. A estirpe
hospedeira (JM 83) possui a eliminação M15 do operão lac, correspondente à remoção dos
aminoácidos 11-44 da ß-galactosidase, mas conserva a parte C-terminal completa da enzima.
Todos os genes lac Z incompletos expressarão um polipéptido inactivo. Todavia, estes
polipéptidos poderão complementar a parte C terminal da enzima produzida pela bactéria, na
forma de agregados. A actividade enzimática resultante poderá ser detectada em placas com
indicador X-gal. Os plasmídeos pUC 7, 8, 9, 12, 13, 18 e 19 contêm polilinkers no interior da
região do gene lac Z, correspondente aos 59 aminoácidos N-terminais. Estes polilinkers
possibilitam a clonagem de fragmentos de DNA comportando diferentes extremidades. Os
polilinkers não interferem com a complementação α, se a fase de leitura correcta for
preservada.
Quando os fragmentos de cDNA de diferentes comprimentos, descritos acima (Fig.
111.II), são inseridos no polilinker dum plasmídeo pUC, unicamente os clones possuindo
inserções na fase de leitura correcta, relativamente à ß-galactosidase, originarão colónias
azuis. O comprimento máximo dum inserto, que dá ainda lugar à complementação α, não é
conhecido; é, pois, preferível clonar fragmentos de DNA relativamente curtos. A intensidade
do azul dos diferentes clones é bastante variável; os de coloração mais intensa apresentam um
nível de expressão mais elevado e podem ser seleccionados para receberem a parte do gene
que falta, para a produção da proteína completa fusionada. As proteínas fusionadas, com
longas sequências peptídicas que incluem a parte N-terminal da ß-galactosidase (≈ 600
aminoácidos), são, em geral, insolúveis no interior da célula bacteriana, o que as protege da
degradação proteolítica e pode facilitar a purificação. É, geralmente, possível detectar
determinantes antigénicos na proteína fusionada. No entanto, a proteína pretendida deve
poder ser separada da componente bacteriana, do produto quimérico fusionado. A clivagem
80
com o brometo de cianogénio (vd. mais abaixo) é limitada às proteínas que, tais como a
proinsulina, não possuem metioninas internas. Caso contrário, é necessário recorrer à
clivagem enzimática, que exige construções comportando codões codificando sequências de
aminoácidos específicos (p. ex., Arg e Lys, típicos da clivagem tríptica, i. é., pela tripsina),
sensíveis a proteases, que evidentemente não podem estar presentes na sequência da proteína
fusionada. Duma maneira geral, este sistema de expressão de proteína fusionada é útil para a
produção de pequenas proteínas e de péptidos.
Para produzir directamente proteínas não fusionadas, a síntese proteica deve ser iniciada,
não na primeira metionina do péptido guia procariótico, tal como lac Z ou trp E, mas na
primeira metionina do próprio péptido pretendido. As construções biologicamente activas
possuem pois, em geral, promotores procarióticos indutíveis e um sítio de fixação
ribossómico híbrido, constituído pela sequência bacteriana de Shine-Dalgarno e por um
codão ATG, correctamente distanciado, que não tem que ser necessariamente de origem
bacteriana. No caso duma proteína eucariótica, este ATG pode constituir o próprio codão de
iniciação do gene eucariótico.
2) Vectores baseados no promotor PL de λ
O plasmídeo pAS1, representado na Fig. 113.II, deriva do plasmídeo pBR322 e comporta
sinais de regulação derivados do fago λ. O promotor PLλ foi escolhido em particular, porque
a eficácia com a qual ele permite a transcrição parece superior à da maioria dos promotores
bacterianos (lac, por exemplo).
A fim de poderem controlar a transcrição iniciada a partir de PLλ, os inventores do vector
introduziram um sistema de repressão na bactéria hospedeira, cujo genoma comporta um
profago λ contendo um repressor cI termo-lábil, cI857.
Nas bactérias lisogénicas, a transcrição a partir de PLλ é inibida pelo repressor cI, em
contínuo, mas unicamente a 30°C, i. é., a temperaturas em que o repressor é termo-estável.
Um simples aumento da temperatura de crescimento das bactérias (32°C→ 42°C) desencadeia a
transcrição a partir de PLλ, visto que, nestas condições, o repressor é desactivado e deixa de
bloquear o promotor.
Na prática, as bactérias portadoras do vector pAS1 podem ser cultivadas em massa a
30°C, sem que haja expressão do gene clonado a jusante do promotor, e serem em seguida
induzidas a 42°C, para sintetizar o produto do gene. Esta possibilidade de controlar a
expressão do gene clonado no vector, e de o poder induzir rapidamente, permite obter uma
super-expressão dos produtos clonados num prazo curtíssimo. Estas propriedades são
particularmente importantes para a expressão de produtos que poderiam ser tóxicos para o
81
hospedeiro no qual eles são sintetizados, e/ou cuja estabilidade no hospedeiro é pouco
elevada.
Além disso, o vector pAS1 é concebido de maneira a assegurar uma transcrição eficaz,
por intermédio de PLλ, através de qualquer sequência de DNA clonada a jusante. Para isso, o
vector comporta, a jusante de PLλ, os sítios nut (utilização de N, sítio de reconhecimento
necessário para a acção de N) e a bactéria lisogénica fornece o produto N (proteína
antiterminadora).
A expressão de N, no hospedeiro lisogénico, suprime a polaridade transcricional,
permitindo à RNA polimerase ler através de tL e tR (terminadores esquerdo e direito) e
impede, por consequência, qualquer paragem fortuita da transcrição, na unidade de
transcrição PLλ e na sequência de DNA clonada a jusante. É de notar, que um terminador
natural tR1 de λ, derivado da construção, existe no vector e que o seu efeito é contrariado por
N e nutR.
Por fim, o vector pAS1 comporta os sinais de regulação da tradução, necessários à
expressão de sequências de DNA que não possuam estas informações. Para este efeito, no
gene cII de λ, gene expresso eficazmente, foi suprimida a sua sequência codificante, de
maneira a manter unicamente a região de Shine-Dalgarno e o triplet de iniciação.
Imediatamente adjacente ao triplet ATG, foi introduzido um local de restrição único, prático
(BamH1), que permite a fusão directa de qualquer sequência codificante, a jusante do ATG, e
a obtenção duma junção na fase correcta de leitura, mediante adaptações para cada caso
particular.
Em certos casos, a utilização do vector de expressão pAS1 conduz à produção de 10 a 20
% da proteína desejada, em relação às proteínas totais.
3) λgt11 - vector de expressão derivado do fago λ
Este vector, representado na Fig. 114.II., comporta um local de restrição único, EcoRI,
que permite a inserção de DNA exógeno (possuindo extremidades EcoRI naturais ou
adicionadas) no gene da ß-galactosidase (lacZ). Esta inserção conduz à síntese de proteínas
híbridas (em fusão com a ß-galactosidase), sob a acção do promotor lac, em presença do
indutor IPTG (indutor gratuito que desactiva o repressor, impedindo-o de se fixar ao operador
de Z-ßlac, Y-permease e A-transacetilase, ao mesmo título que o indutor natural, a lactose,
mas sem ser consumido pela enzima; vd. Secção 1.1.b.2). Como a proteína fusionada perde a
actividade ß-galactosidásica, é possível, em presença de Xgal, distinguir os fagos
recombinantes (placas brancas) dos fagos não recombinantes (placas azuis com indicador
Xgal).
82
O vector comporta ainda o repressor cI termo-lábil (cI857) e uma mutação sem sentido
no gene S de λ, que torna a lise defectiva (na ausência de supressão pelo hospedeiro, supF).
Por consequência, as bactérias lisogénicas podem ser induzidas a 42°C, para acumularem
grandes quantidades de produtos fágicos, sem que haja lise. Esta pode ser efectuada expondo
as colónias a vapores de clorofórmio.
Por outro lado, o hospedeiro bacteriano possui o repressor do gene lac Z, que impede a
expressão da proteína fusionada, durante as primeiras horas do crescimento. É só no
momento apropriado, que se desactiva este repressor com o indutor IPTG, levando à
produção maciça da proteína fusionada.
A eficácia de clonagem do sistema λgt11 é de + 107 pfu/µg de DNA.
O escrutínio dos fagos recombinantes pode realizar-se de duas maneiras:
1) por hibridação com uma sonda de DNA marcada;
2) por detecção imunológica.
A expressão correcta do DNA clonado no λgt11, depende da orientação e da fase de
leitura do inserto em relação às do gene lac Z.
Identificação das placas produtoras
Um dos métodos de detecção das proteínas produzidas pelo fago recombinante baseia-se
na interacção dessas proteínas com anticorpos dirigidos contra elas. Na prática, reveste-se um
suporte sólido, inerte, com esses anticorpos e em seguida expõe-se esta matriz às colónias
(placas), lisadas in situ. Os sítios de fixação do antigénio podem ser detectados por incubação
com o anticorpo marcado (com 125I ou com peroxidase, por exemplo). A autorradiografia do
suporte sólido, ou a reacção corada com um substrato cromogénico da peroxidase, revela as
colónias produtoras do antigénio que se procura (Fig. 115.II.).
Alternativamente, o método de western blotting permite identificar o antigénio produzido
no seio duma população de proteínas. Este método baseia-se na separação dos componentes
proteicos dum extracto total, derivado de bactérias, por exemplo, por electroforese em
poliacrilamida e em seguida, na transferência eléctrica destas proteínas para uma folha de
nitrocelulose, onde elas aderam fortemente. A folha de nitrocelulose é embebida num
anticorpo, específico da proteína que se procura identificar e em seguida, após lavagem, é
tratada com um segundo anticorpo, dirigido contra a parte constante do primeiro anticorpo e
marcado com a peroxidase. Por fim, um substrato cromogénico permite revelar os complexos
imunoespecíficos (Fig. 116.II.).
83
Limitações da produção na bactéria
E. coli têm, no entanto, vários inconvenientes, derivados da sua incapacidade em
processar as proteínas, realizar modificações pós-traducionais, que são muitas vezes
necessárias para a sua actividade biológica (p. ex., glicosilação, fosforilação, carboxilação), e
em segregar certas proteínas para fora do citoplasma, que por vezes se acumulam em grandes
quantidades no citoplasma, de forma insolúvel e inactivas, cuja renaturação é extremamente
difícil. Estes agregados têm o nome de corpos de inclusão (inclusion bodies), partículas
constituídas essencialmente de proteína recombinante ou polímeros derivados, não
reductíveis e de proteínas endógenas, tais como RNA polimerase, proteínas de membrana e
de rRNA e de DNA plasmídico.
Para libertar a proteína é usual recorrer a agentes caotrópicos fortes, tais como a ureia 6
M ou o cloridrato de guanidina 8 M. O enrolamento correcto da proteína depois de remover o
agente desnaturante, é frequentemente um passo bastante difícil, por vezes impossível,
nomeadamente com proteínas de elevado peso molecular e numerosas pontes dissulfureto.
Por consequência, proteínas, como o activador tissular de plasminogéneo (t-PA) ou o factor
VIII da coagulação sanguínea, são produzidas de preferência em cultura de células de
mamíferos.
Certas proteínas, tais como o interferão-α2 (IFN-α2), o interferão γ (IFN-γ) ou a proteína
MX (induzida pelo interferão), que formam agregados insolúveis e são inactivas, quando
produzidas em culturas de E. coli a 37°C, podem ser obtidas na forma solúvel e activa,
quando a temperatura da cultura é de 30°C ou abaixo. Uma medida possível para obter
proteínas solúveis é, portanto, diminuir a temperatura de crescimento das culturas e evitar
vectores plasmídicos indutíveis termicamente.
A proteína exógena, formada no citoplasma da célula bacteriana, que é um meio redutor
menos estável que o citoplasma das células de mamífero e sujeito a variações de composição,
para manter o pH e as propriedades osmóticas, apresenta-se na sua forma reduzida. Só depois
da lise bacteriana, a molécula pode formar as pontes dissulfureto, o que pode ser uma
dificuldade suplementar na aquisição da conformação correcta, tanto menos provável quanto
o número de átomos de S for maior. Além disso, pequenos péptidos de E. coli, como por
exemplo o glutatião, podem fixar-se nos átomos de enxofre livres e perturbar a formação das
pontes S-S, conduzindo a proteínas anormalmente enroladas. Sabendo-se que, a menor
anomalia em relação à molécula nativa pode influir nas suas propriedades imunogénicas e
que uma proteína produzida, para ser utilizada com fins terapêuticos, não pode provocar o
aparecimento de anticorpos, podem-se prever impasses frequentes.
Assim, apesar dos sucessos obtidos na síntese de algumas proteínas de mamífero, na
forma solúvel, em E. coli, outras vias têm sido exploradas para forçar a sua secreção para
84
fora do citoplasma. E. coli e, em geral as bactérias gram-negativas, possuem uma membrana,
que se pode considerar dupla, constituída por uma parede interna rígida, coberta por uma
camada exterior menos espessa, composta por proteínas, lipoproteínas e lipopolissacáridos.
As proteínas segregadas para fora do citoplasma acumulam-se, em geral, neste espaço
periplasmático que constitui um meio mais favorável ao seu enrolamento correcto.
Existem exemplos que demonstram que esta abordagem é uma alternativa interessante. A
proteína, para ser segregada para o periplasma, deve possuir uma sequência sinal, que dirija a
cadeia polipeptídica através da parede interna da membrana. O péptido sinal é, normalmente,
clivado, durante a travessia para o espaço periplasmático, por uma protease que reconhece
uma sequência particular de aminoácidos.
Produção da hormona de crescimento humana (hGH)
Um exemplo de produção em E. coli, à escala industrial, de uma proteína segregada no
espaço periplasmático, é o da hGH. Esta hormona é um polipéptido de 191 aminoácidos,
segregada pela hipófise. É utilizada para estimular o crescimento de crianças, cuja deficiência
parcial ou total em hGH se traduzirá na idade adulta por uma altura abaixo do mínimo, ou por
uma estatura de anão.
A acção da hormona de crescimento não se limita à estimulação do crescimento do
esqueleto. Ela permanece pela vida inteira, mesmo após a interrupção do crescimento. A
hGH está, com efeito, implicada no crescimento da massa de todos os tecidos do corpo. Ela
parece também poder ser utilizada eficazmente no tratamento de fracturas, de queimaduras e
de úlceras. Esta hormona é específica de espécie (a hormona de crescimento isolada de
diferentes espécies é sem acção na espécie humana), razão pela qual, a sua única fonte, antes
do advento das técnicas de engenharia genética, provinha da hipófise extraída de cadáveres
humanos. Para além da insuficiência do material assim obtido, para curar todos os casos de
deficiência, existe ainda o risco de contaminações, provenientes de purificações insuficientes
de hGH, a partir de glândulas infectadas.
A cadeia polipeptídica, no momento da sua síntese na hipófise, na forma de precursor,
comporta 217 aminoácidos. Os 26 aminoácidos suplementares em relação à proteína madura,
correspondem à sequência sinal. O enrolamento no espaço, preciso e complexo, cuja
estabilização é, em parte, assegurada por duas pontes S-S, está representado na Fig. 117.II, de
maneira muito rudimentar.
Uma primeira abordagem, para a clonagem e a expressão do DNA que codifica a hGH,
ignora a sequência sinal e visa a produção no citoplasma da proteína madura. A clonagem
recorre à combinação de dois métodos. Por um lado, um DNA complementar foi obtido por
cópia do RNA mensageiro da hGH, derivado da hipófise; por outro, um fragmento de DNA
85
correspondente aos aminoácidos 1 a 24, provido com um triplet de iniciação, foi sintetizado
quimicamente (Fig. 118.II.). Os dois fragmentos foram introduzidos, após ligação, num
vector de expressão, a jusante dum promotor forte (lac). O plasmídeo recombinante foi em
seguida utilizado para transformar um hospedeiro bacteriano. Os clones obtidos foram
seleccionados pela resistência a um antibiótico e caracterizados por hibridação com sondas
radioactivas apropriadas. Os clones que contêm a informação genética da hGH produzem a
hormona de crescimento humana, cuja actividade biológica foi demonstrada por imunoensaio
e por testes in vivo, em ratos desprovidos de hipófise. A actividade biológica manifesta-se por
um aumento de peso e um crescimento, nos ratos, da cartilagem das tíbias.
A natureza do produto clonado é idêntica à do produto natural, no que respeita à actividade biológica. No entanto, a metionina presente na extremidade NH2 da proteína
(derivada do codão de iniciação ATG e que, durante o processo natural, é eliminada com o
péptido sinal) não é clivada na bactéria. A proteína expressa não pode, por consequência, ser
considerada rigorosamente autêntica, visto possuir um aminoácido a mais (met-hGH). A
percentagem de expressão varia de 2 a 30 % de proteínas solúveis, segundo o tipo de
promotor utilizado. Neste exemplo, a hGH é produzida no citoplasma e não é segregada. No
entanto, ao contrário doutras proteínas super-expressas na bactéria, a hGH permanece solúvel
e é produzida por fermentação a grande escala e purificação em grandes quantidades (Tabelas
6.II. e 7.II.). A quantidade obtida, a partir dum fermentador de 500 litros, é equivalente à
obtida por extracção de 12.000 hipófises de cadáveres. A met-hGH é clinicamente activa, se
bem que, a longo termo, a experiência clínica revele o aparecimento de anticorpos não
neutralizantes, em quantidade reduzida. O seu efeito, ao longo de vários anos de tratamento, é
uma incógnita. O aparecimento de anticorpos pode estar correlacionado com um perfil
antigénico particular da hGH produzida por engenharia genética. A presença da metionina
excedentária poderia, por exemplo, conferir uma estrutura terciária particular à hormona e
criar um sítio antigénico novo. O enrolamento diferente da met-hGH poderia ser, igualmente,
causado pelo facto de as pontes dissulfureto, S-S (que estabilizam normalmente a molécula
enrolada), se formarem unicamente no momento da lise da bactéria (devido ao meio redutor
do citoplasma). No momento da lise, pequenos péptidos de E. coli podem-se fixar ao nível
dos átomos de enxofre das cisteínas e perturbar a formação das pontes S-S internas,
conduzindo a moléculas anormalmente enroladas. Uma contaminação, mesmo fraca, da
hormona, por produtos bacterianos, pode também ser responsável pela resposta imunitária.
Uma segunda abordagem recorre à clonagem do DNA completo, incluindo a sequência
que codifica para o péptido sinal da hGH (Fig. 119.II.). Esta sequência sinal de mamífero é
reconhecida pelos mecanismos celulares bacterianos, que presidem à expulsão das proteínas
para fora do citoplasma. A hGH acumula-se no espaço periplásmico, libertada da sequência
sinal, clivada durante a travessia da parede interna da membrana citoplásmica (Fig. 120.II.).
86
Ela comporta, por consequência 191 aminoácidos, como a molécula natural. É possível
extrair a hormona acumulada no periplasma, sem ter que recorrer à lise das células
bacterianas (Fig. 121.II.). Utiliza-se a técnica do choque osmótico, que consiste num primeiro
tempo, em mergulhar as bactérias numa solução muito concentrada de soluto. Nesta solução
hipertónica, a célula retrai o citoplasma, aumentando por consequência o espaço
periplásmico, onde se acumulam as moléculas de hGH. Num segundo tempo, as bactérias são
transferidas bruscamente para um meio muito pouco concentrado de soluto. Nesta solução
hipotónica o citoplasma aumenta brutalmente de volume, reduzindo o espaço periplásmico ao
mínimo e forçando as moléculas de hGH a atravessar os poros da parede exterior da
membrana. A proteína recuperada do meio extracelular é muito pouco contaminada por
proteínas bacterianas.
As análises físicas e químicas da hGH, obtida por esta metodologia, revelaram
propriedades idênticas às da proteína natural. As análises clínicas tendem a comprovar que
não há desenvolvimento de anticorpos nas crianças tratadas com este produto.
A secreção da hGH para o meio de cultura de E. coli é a terceira via possível. Um
exemplo desta abordagem recorre à transformação de E. coli com dois vectores, um dos
quais, pOmpA-hGH2, expressa a proteína híbrida, constituída pela sequência sinal de OmpA
(Outer membrane protein A, proteína cuja expressão é regulada pela osmolaridade do meio) e
da cadeia polipeptídica da hGH (a Fig. 122.II. esquematiza os passos essenciais da
construção deste vector) e o outro, pJL3 expressa a BRP (Bacteriocin Release Protein),
proteína que activa a fosfolipase A da membrana externa, permeabilizando as membranas
interna e externa. A sequência sinal de OmpA guia a cadeia polipeptídica através da
membrana interna e a BRP leva à formação de zonas permeáveis nas membranas celulares,
através das quais a hGH pode passar e ser libertada no meio de cultura.
A Fig. 123.II. ilustra alguns elementos essenciais dos vectores utilizados. O vector de
secreção, pOmpA-hGH2, possui o sistema promotor-operador lpp-lac, que é regulado pelo
repressor lac. A indução parcial da síntese de hGH, em E. coli, é provocada, cultivando as
células em meio rico, (TY), que contém lactose, ou em presença de níveis fracos ou
moderados de IPTG. O vector contém ainda a sequência ompA que codifica o péptido sinal, o
qual, fusionado ao DNA da hGH, orienta a sua secreção. Este plasmídeo, pOmpA-hGH2,
comporta o gene de resistência à ampicilina.
O plasmídeo pJL3 possui o mesmo híbrido, composto do promotor de lipoproteína (lppp)
e do promotor-operador lac (lacpo) de E. coli, que o vector de secreção, e que dirige a
expressão do gene de BRP clonado a jusante. A expressão desta proteína é também regulada
pelo repressor lac, codificado pelo gene lacI. O cloranfenicol é utilizado como marcador de
87
resistência. Os dois plasmídeos são compatíveis, e após co-transformação de E. coli, os
transformantes são seleccionados com base na resistência dupla aos antibióticos.
Os dois genes, de BRP e de hGH, são pois regulados pelo repressor lac. Em presença de uma
concentração baixa de isopropil-1-tio-ß-D-galactopiranosídeo (IPTG, 20 mM), tanto a BRP,
como a proteína híbrida OmpA-hGH se expressam e a hormona de crescimento madura é
libertada no meio de cultura, processada correctamente. Com efeito, a sequência de
aminoácidos N-terminal é correcta, o que indica que o péptido sinal foi clivado como se
esperava (Fig. 124.II.).
O nível de produção situa-se na ordem de 4,5 mg/ml. Apesar de ser mais baixo que o
rendimento da secreção periplásmica (10-15 mg/ml), a purificação, numa única etapa, por
HPLC, em coluna de fase reversa, atinge 98 %.
Este sistema têm a vantagem de não requerer, nem a lise das células bacterianas, nem
operações suplementares para permeabilizar ou romper a membrana exterior, necessárias no
caso da produção periplásmica. Um dos interesses maiores desta técnica é a possibilidade
teórica de poder, no futuro, assegurar uma produção em contínuo a partir de células de E.
coli, imobilizadas num suporte sólido. É necessário, evidentemente, avaliar previamente o
comportamento imunogénico da proteína in vivo.
Outros sistemas de secreção no meio de cultura de E. coli têm sido estudados, que
favorecem a permeabilização da membrana exterior, recorrendo a mutações específicas ou à
hiper-expressão de outras proteínas que alteram a permeabilidade da membrana, tais como o
péptido kil. Este péptido induz a secreção de proteínas heterólogas ou homólogas, em duas
etapas, primeiro actuando sobre a membrana citoplásmica, em seguida permeabilizando a
membrana externa.
Hormonas de crescimento animais
Para além da hGH, outras hormonas de crescimento de origem animal (porco, boi...)
foram objecto de trabalhos de clonagem. Visto ser a hormona de crescimento específica de
espécie, a produção de hormona de crescimento de porco e de boi, com fins veterinários,
impunha-se. A estratégia adoptada é paralela à que conduziu à produção da hGH. O RNA
mensageiro foi extraído a partir de hipófise de porco e de boi, e o DNA complementar foi
sintetizado e clonado num vector plasmídico. A análise das sequências nucleotídicas mostrou
que os dois cDNA são muito homólogos (+ 90 %). As hormonas diferem apenas em 18
aminoácidos. As duas sequências contêm uma sequência sinal, que codifica um péptido (27 e
20 resíduos) implicado na secreção da hormona pelas células somatotrópicas.
88
Para expressar os cDNA em E. coli, recorreu-se, como acima descrito com a hGH, a uma
construção que comporta adaptadores sintéticos, contendo um codão ATG em 5' e a
sequência de bases correspondente aos primeiros 24 aminoácidos da hormona. Estes
fragmentos sintéticos foram, depois de associados e ligados, fusionados num vector de
expressão. A expressão, obtida em elevado nível, em E. coli leva à produção da hormona sem
sequência sinal.
Produção de insulina humana
A insulina é uma hormona peptídica segregada pelas células pancreáticas e presente na
circulação sanguínea. A insuficiência em insulina conduz ao diabete, perturbação grave do
metabolismo dos glúcidos, dos lípidos e dos prótidos. Esta hormona, antes da aplicação das
técnicas da engenharia genética, era isolada a partir das fontes convencionais, para ser
utilizada no tratamento do diabete. Ela comporta um péptido sinal, que permite o transporte
da molécula através das membranas intracelulares. Durante o transporte, este péptido sinal é
clivado. O resto da molécula é, em seguida, armazenado nas vesículas ligadas à membrana
das células pancreáticas.
A forma acumulada nas vesículas, chamada proinsulina, difere da insulina
fisiologicamente activa (Fig. 125.II.). A proinsulina é um polipéptido simples, enrolado numa
forma particular, que é estabilizado por 3 pontes dissulfureto. A insulina madura é, pelo
contrário, constituída por duas cadeias separadas, uma de 21 aminoácidos (cadeia A) e a
outra de 30 aminoácidos (cadeia B), mantidas associadas pelas mesmas pontes S-S. A
proinsulina é convertida em insulina, no seio das vesículas pancreáticas, por maturação
enzimática do precursor e libertação dum polipéptido excedentário, de 33 aminoácidos
(péptido C). A insulina madura é, em seguida, acumulada na forma de complexo com iões de
zinco, pronta para ser exportada.
Resumindo, a insulina existe em 3 formas: a pré-proinsulina (produto de tradução
original), a proinsulina (destituída de péptido sinal) e a insulina activa.
A insulina é produzida actualmente em E. coli, programada por técnicas de DNA
recombinante, numa forma idêntica à da insulina natural. Conhecendo a sequência de
aminoácidos das cadeias A e B da insulina humana, é possível reconstituir, por síntese, os
fragmentos de DNA correspondentes (cadeia A: 63 pares de bases e cadeia B: 90 pares de
bases). Cada fragmento de DNA é provido, em 5', com um codão especificando a metionina,
e em 3', com um codão de fim de cadeia (TGA). Cada um dos genes sintéticos, A e B, é em
seguida fusionado em fase com o gene da ß-galactosidase (ou pelo menos com uma parte
deste), contido num plasmídeo de expressão. Os plasmídeos recombinantes são, em seguida,
89
utilizados na transformação de E. coli, replicam-se, e o RNA mensageiro, sob controlo dos
sinais de regulação do gene ß-gal (promotor, sequência Shine-Dalgarno), é traduzido em
proteína híbrida, comportando uma parte da ß-galactosidase e a cadeia da insulina, A ou B.
Como a insulina não contém metioninas, com excepção da que foi deliberadamente
introduzida em 5', durante a síntese das cadeias A e B, é possível clivar a proteína fusionada,
com brometo de cianogénio (que cliva especificamente ao nível das metioninas), de maneira
a libertar a insulina dos fragmentos de ß-galactosidase. Depois da purificação, as duas
cadeias A e B, ao serem misturadas, associam-se correctamente, formando as três pontes
dissulfureto. O resultado é uma insulina pura e biologicamente activa (Fig. 126.II.).
Alternativamente, a insulina humana pode ser produzida a partir dum clone comportando
o DNA complementar, derivado do mRNA da insulina (proinsulina) (Fig. 127.II.). O RNA
mensageiro que codifica a proinsulina é isolado e copiado em cDNA. Imediatamente a
montante do codão correspondente ao primeiro aminoácido da pro-insulina, introduz-se um
triplet ATG que codifica a metionina. Este DNA complementar é em seguida ligado ao gene
ß-gal, contido num plasmídeo de expressão. As bactérias transformadas pelo plasmídeo
recombinante produzem uma proteína híbrida, que contém um fragmento de ß-galactosidase
e a proinsulina. Esta é libertada da fusão, por clivagem com o brometo de cianogénio (que
destrói a metionina), é purificada e obtida na forma enrolada natural, com 3 pontes S-S
correctas. É em seguida submetida a uma clivagem enzimática, in vitro, para originar a
insulina biologicamente activa.
90
b. Expressão em Bacillus subtilis
A secreção das proteínas que se deseja produzir para o meio extracelular é, como já
salientámos, vantajoso porque simplifica a recuperação e a purificação, favorece o
enrolamento correcto e abre perspectivas para o desenvolvimento de biorreactores de células
imobilizadas mais eficazes. É, pois, natural que bactérias gram-positivas, como Bacillus
subtilis, Staphylococcus aureus ou Streptomycetes, que não possuem membrana externa e
que são excelentes excretoras, tenham suscitado elevado interesse enquanto organismos
potencialmente produtores de proteínas recombinantes. Com efeito, ao contrário do
colibacilo, B. subtilis secreta enzimas naturalmente e várias estirpes de Bacillus são utilizadas
na produção industrial de amilases e de proteases, enzimas que intervêm nas indústrias do
amido e dos detergentes, e Streptomycetes, na produção de antibióticos naturais.
As propriedades de B. subtilis, i) secretor de proteínas no meio de cultura, ii) bem
conhecido e aceite industrialmente na fabricação de proteínas, iii) não patogénico (não
produz endoxinas), tornam este organismo extremamente atractivo para produzir proteínas
humanas e animais pela tecnologia do DNA recombinante. No entanto, a expressão eficaz de
genes exógenos e a secreção das proteínas correspondentes têm sido dificultadas em razão de
vários problemas. Os mecanismos de secreção dos bacilos gram-positivos não estão bem
caracterizados, e em particular, os mecanismos de controlo são mal conhecidos. Têm faltado,
por outro lado vectores apropriados para a expressão e a secreção dos produtos de genes
heterólogos. A maiora das estirpes de colecção de Bacilli contém unicamente plasmídeos
crípticos, destituídos de marcadores de selecção. Foram, por isso, desenvolvidos vários
plasmídeos, sobretudo derivados de S. aureus, capazes de transformar B. subtilis, possuindo
genes de resistência a antibióticos, para serem utilizados em clonagem. Alguns foram, ainda,
manipulados para serem utilizados como vectores de inactivação insercional e como vectores
vaivém (shuttle) para E. coli e B. subtilis. Foram introduzidos marcadores adicionais de
resistência, derivados de outros plasmídeos de S. aureus, do DNA cromossómico de outras
estirpes de Bacilli ou do plasmídeo pBR322 de E. coli (Fig. 128.II.).
A partir destes plasmídeos foram construídas séries de vectores de secreção para
clonagem em B. subtilis, na esperança de obter expressão e secreção eficazes de produtos de
genes estrangeiros. Como a experiência têm mostrado que a expressão de genes heterólogos
em B. subtilis requer aparentemente sinais de transcrição e de tradução de Bacillus ou doutras
bactérias gram-positivas, é frequente recorrer a sequências promotoras, ao local de ligação do
ribossoma e à sequência sinal do gene da α-amilase (que é secretada em grande quantidade
por alguns Bacilli no meio de cultura), para orientarem a síntese e a secreção de genes
estrangeiros clonados em pUB110, por exemplo. Um exemplo é a clonagem do gene da ß-
lactamase de E. coli a jusante de sequências reguladoras do gene da α-amilase de Bacillus
91
amyloliquefaciens. Estas foram previamente introduzidas no plasmídeo pUB110 para
construir o vector pKTH38 (Fig. 129.II.), a partir do qual foram realizadas várias construções
que diferem pela junção entre o linker sintético - gene da ß-lactamase (destituído da sua
sequência sinal) e a sequência sinal do gene da α-amilase que se apresenta quase completa
(pKTH78), cortada (pKTH86), ou aumentada com sequências codificantes de diferentes
comprimentos (pKT16, pKT83 e pKT84) (Fig. 130.II.).
Uma estirpe de B. subtilis mutante deficiente em protease, transformada com as
construções que apresentam a sequência sinal quase completa (-1) ou contendo 11
núcleotídeos do gene da α-amilase (+4) segrega 95 % da actividade de ß-lactamase no meio
de cultura, à razão de 20 mg/ml. As outras construções são muito menos produtivas e a (-7),
correspondente ao péptido sinal amputado dos 6 aminoácidos carboxílicos terminais não
segrega a enzima.
Apesar destes resultados encorajadores, as tentativas de secreção de interferões humanos
(IFN-α2 e IFN-γ, por exemplo) em sistemas semelhantes têm-se revelado infrutíferas. O
nível de secreção é apenas de 1 a 3 % do da α-amilase produzido por B. subtilis transformado
com o mesmo vector (1-2 mg/l contra 250-400 mg/l). As razões desta ineficiência são em
parte a degradação proteolítica, mas, sobretudo, o transporte e/ou o processamento deficiente
do precursor do IFN. O IFN-γ é, por outro lado, aparentemente tóxico para as células
produtoras. Com efeito, os níveis de RNAs mensageiros da α-amilase e do IFN não são
significativamente diferentes, como foi demonstrado por análise do RNA, isolado de culturas
produtoras de IFN e de α-amilase, por eletroforese e hibridação com sondas radioactivas de
DNA (Fig. 131.II., tabela 8.II.). Na realidade, o precursor do IFN acumula-se sob forma
insolúvel nas células por razões ainda não bem esclarecidas.
Outros sistemas têm sido utilizados para expressar diferentes genes correspondentes a
proteínas e enzimas humanas, mas sempre com fracos rendimentos de secreção.
Em conclusão, e apesar dos progressos realizados na elucidação da bioquímica e da
genética de B. subtilis, a caracterização de promotores eficazes e de sinais de tradução
apropriados neste organismo está muito aquém do que é conhecido no colibacilo: não se
conhecem promotores com uma força comparável à dos lac, trp de E. coli ou PL de λ. Por
outro lado, os vectores recombinantes introduzidos em B. subtilis são frequentemente
instáveis e perdem ou transformam o gene heterólogo, faltando por isso bons sistemas
hospedeiro-vector. Apesar de B. subtilis possuir potentes sistemas de secreção autóctones,
como por exemplo o da α-amilase, as construções que recorrem à sequência sinal desta
proteína, para guiar genes estrangeiros codificando proteínas de mamíferos clonados a
jusante, têm-se revelado ineficazes, com baixos níveis de produção e de secreção, e as
92
proteínas são mal processadas e inactivas e, por vezes, degradadas por proteínas
extracelulares endógenas.
c. Expressão na levedura
A levedura Saccharomyces cerevisiae é um dos organismos eucariotas mais úteis para
estudar a regulação da expressão dos genes. Devido ao seu genoma relativamente pequeno (4
vezes o de E. coli) e do seu tempo de geração relativamente curto, a levedura pode ser
manipulada tão comodamente como a maioria dos procariotas. A genética da levedura é
relativamente bem conhecida; foram isoladas, caracterizadas e mapeadas centenas de
mutações por métodos genéticos convencionais e, actualmente, a sequência do seu genoma
(de S. cerevisiae) está totalmente determinada. Além disso, a levedura possui a propriedade
de se propagar de maneira estável do estado haplóide ao estado diplóide, o que permite a
complementação entre marcadores genéticos por conjugação de estirpes haplóides,
portadoras cada uma de um dos dois marcadores que se pretende analisar. O diplóide
resultante da conjugação pode ser depois induzido afim de regenerar haplóides, por meiose
(tetrada), os quais podem ser manipulados e tratados isoladamente.
No que respeita à clonagem, um dos meios originais de identificação dos genes de
levedura consiste em complementar mutações nos genes correspondentes de E. coli. O
genoma inteiro da levedura pode ser clonado em plasmídeos (banco genómico), os quais,
nesta forma recombinante, podem ser utilizados para transformar estirpes bactérianas
portadoras de diferentes mutações. Vários genes de levedura que codificam enzimas do
metabolismo dos aminoácidos ou dos ácidos nucleicos foram assim clonados directamente (p.
ex., LEU2, URA3).
É evidente que, se bem que a RNA polimerase de E. coli transcreva fragmentos de DNA,
seja qual for a sua origem, o RNA correspondente a um gene de levedura só será traduzido
correctamente se o gene em questão não comportar intrões.
Este método foi, no entanto, substituído pela clonagem de genes de levedura por
complementação directa de mutantes. Esta abordagem foi implementada graças ao
desenvolvimento de métodos de introdução de DNA na própria levedura. Um DNA exógeno
introduz-se relativamente facilmente na levedura, eliminando a parede celular para formar
esferoplastos (digestão dos polissacáridos por enzimas específicas). Em presença de iões de
cálcio e de polietilenoglicol (PEG) os esferoplastos absorvem o DNA.
Após regeneração da parede celular o crescimento das leveduras transformadas pode ser
iniciado. Este método baseia-se igualmente na utilização de plasmídeos vaivém que contêm,
93
simultaneamente, sequências necessárias à replicação do DNA em E. coli e à replicação na
levedura. Os fragmentos de DNA de levedura podem ser assim introduzidos por ligação
nestes plasmídeos vaivém e propagados em E. coli. A população heterogénea dos plasmídeos
recombinantes é em seguida introduzida nos esferoplastos de levedura. Qualquer plasmídeo
recombinante que complemente uma mutação no hospedeiro, em condições apropriadas de
selecção, pode ser identificado, reintroduzido em E. coli e multiplicado à vontade (Fig.
132.II.).
Os vectores de expressão de S. cerevisiae
A maioria das estirpes de levedura contém naturalmente um plasmídeo chamado 2µ,
constituído por uma molécula de DNA bicatenário, circular, com ≈6300 pb, localizado no
núcleoplasma à razão de 60 a 100 cópias por célula, e dotado de replicação autónoma. 2µ
comporta uma origem de replicação e codifica três funções REP que determinam a
amplificação quando o número de cópias baixa. Em condições normais, o círculo 2µ replica-
se a velocidade idêntica à do resto do genoma; quando o número de cópias diminui, as
proteínas REP dissociam a replicação do plasmídeo da do genoma e iniciam ciclos repetidos
de replicação independente do 2µ, até que a quantidade de cópias atinja de novo o número de
+ 60 a 100 por célula. Este sistema de regulação assegura a propagação do plasmídeo 2µ em
número elevado de cópias durante o ciclo celular da levedura (Fig. 133.II.). Na figura estão
indicados a origem de replicação e os três genes conhecidos, codificados por 2µ-REP1, REP2
e REP3 que são necessários à conservação dum número elevado de cópias. FLP determina a
passagem da forma (A) à forma (B) do círculo 2µ.
O DNA transformante pode-se estabelecer na levedura, quer por integração no genoma,
quer por replicação autónoma, na qualidade de epissoma. A presença ou a ausência de
sequências particulares, chamadas ARS (Autonomously Replicating Sequence), determina o
destino do DNA transformante. Um vector plasmídico para clonagem na levedura replicar-
se-á de maneira autónoma, contanto que possua as sequências ARS. Estas sequências têm um
comprimento de 60 pb, são ricas em AT (80 %) e possuem uma sequência consenso
AAATATAAA
C Normalmente, durante a divisão celular, os plasmídeos que se encontram na levedura não
segregam regular e uniformemente. Na ausência de pressão de selecção, as leveduras perdem
o plasmídeo durante o crescimento. Para remediar esta situação tira-se partido de sequências
de DNA derivadas da região centromérica dos cromossomas de levedura. As sequências CEN
asseguram naturalmente a ligação dos cromossomas à rede fibrosa do aparelho mitótico e
contribuem para a repartição igual dos cromossomas quando a levedura se divide. Clonadas
94
num plasmídeo, estas sequências CEN asseguram a sua permanência na célula durante a
divisão.
O conjunto das condições descritas está resumido na Fig. 134.II, dentro do contexto da
construção dum vector plasmídico ideal para a clonagem do DNA na levedura. Este vector
ideal deveria portanto comportar:
1°) uma sequência derivada do plasmídeo pBR322 que permita a replicação e a
selecção na bactéria (AmpR);
2°) uma sequência ARS que permita a replicação autónoma na levedura;
3°) uma sequência CEN que assegure a conservação do plasmídeo durante a divisão da
levedura;
4°) um marcador de selecção para a levedura (por exemplo o marcador nutricional
LEU-2, que complementa uma mutação auxotrófica no hospedeiro);
5°) um ou vários locais únicos de restrição para a introdução de DNA exógeno.
Exemplos de vectores de expressão para produção de proteínas exógenas em leveduras
Uma série de vectores plasmídicos destinados a clonar e a expressar um DNA heterólogo
na levedura foram construídos. Um exemplo está representado na Fig. 135.II.). Este vector
vaivém possui o gene amp utilizado para selecção na bactéria, a origem de replicação
específica de E. coli, um marcador de selecção (LEU2) adequado para a levedura, a origem
de replicação própria da levedura (2µ parcial ou 2µ completo) e uma cassete de expressão
ARG3. Esta cassete contém o promotor ARG3, derivado do gene de levedura ornitina
carbamóil transferase e a sequência terminadora, derivada do mesmo gene.
A actividade do promotor ARG3 é regulável; em presença de concentração elevada de
arginina este promotor é reprimido; quando a concentração baixa é desbloqueado.
Estas duas sequências, promotora e terminadora estão flanqueadas por locais de restrição
que permitem remover os sinais promotor ou terminador ARG3 e substitui-los por outros. Por
outro lado, no vector pRIT10774 um local BamH1, situado entre o promotor e o terminador,
permite a inserção e a expressão dum DNA heterólogo possuindo o seu próprio sinal de
iniciação ATG. A versão pRIT10779 comporta ainda um local NcoI entre o promotor e o
terminador que permite a introdução de DNA desprovido do sinal de iniciação ATG.
Um exemplo de aplicação prática de S. cerevisiae como organismo hospedeiro de
expressão de DNA exógeno é a produção industrial dum antigénio de superfície, HBsAg, do
vírus da hepatite B, capaz de induzir a produção de anticorpos protectores e comercializado
recentemente como vacina. A expressão deste antigénio sob controlo do promotor
95
cromossómico, altamente eficiente, de levedura, TDH3 (triosefosfato desidrogenase), é
constitutiva durante a multiplicação celular. Em 3' um sinal eficaz de terminação de
transcrição de ARG3 assegura um nível elevado de mRNA estável. LEU-2 é utilizado como
marcador de selecção (Fig. 136.II.).
Várias outras proteínas de mamíferos foram expressas na levedura (Tabela 9.II.).
Algumas são produzidas em quantidade suficiente e possuem actividade biológica suficiente
para serem comercialmente viáveis.
A levedura pode efectuar as modificações postraducionais de acetilação, fosforilação e
glicosilação, frequentemente necessárias para obter completa actividade biológica das
proteínas. O grau de glicosilação é, no entanto, bastante variável, diferente da realizada nas
células de mamífero e é por vezes observada hiperglicosilação (sobretudo N-glicosilação com
manose pesado), o que pode originar instabilidade e antigenicidade.
Muitas das proteínas produzidas pela levedura possuem alguma actividade biológica, o
que pressupõe uma conformação tridimensional correcta. Nalguns casos a formação de
pontes dissulfureto faz-se ao acaso, como acontece por exemplo com o t-PA (tissue
plasminogen activator), expresso em quantidade elevada mas pouco activo biologicamente e
não segregado para fora da célula.
No que se refere à secreção das proteínas pela levedura foram construídos vários
vectores que contêm sinais de secreção de ferromonas, tais como o factor sexual α, que induz
o acoplamento entre o dois tipos sexuais α e a e é naturalmente segregado pela estirpe
haplóide. O gene da proteína que se deseja fazer segregar para meio é inserido naquele
vector, imediatamente a seguir ao sinal de secreção. Algumas proteínas activas maduras
foram assim recuperadas no meio de cultura, se bem que os rendimentos sejam em geral
modestos.
A maioria das proteínas estrangeiras não é produzida em S. cerevisiae com níveis de
expressão elevados. A proteína endógena correspondente da levedura é expressa por vezes
neste organismo, sob controlo dos seus próprios promotores, de 15 a 50 vezes mais
intensamente. Com efeito, se bem que cassetes de expressão, comportando os sinais de
começo e de fim de transcrição dos genes (da glicólise da levedura, por exemplo), sejam
extremamente eficazes num sistema homólogo (para expressar um gene de levedura), elas
funcionam em geral com um rendimento muito menor para expressar um gene estrangeiro.
Qualquer "coisa" na região codificante do gene de levedura facilita a sua transcrição ou
aumenta a estabilidade dos mensageiros. Estes sinais, ausentes nos genes estrangeiros são
objecto de pesquisas intensivas.
96
A levedura Pichia pastoris metilotrófica (metabolisadora de metanol) é outro sistema de
produção de proteínas com grandes potencialidades. As regiões reguladoras de genes
implicados na via de utilização do metanol foram isoladas. Por exemplo, sequências que
regulam a expressão das enzimas álcool desidrogenase e álcool oxidase, foram utilizadas para
controlar a expressão de várias proteínas exógenas importantes. A modulação pela fonte de
carbono permite regular os níveis de expressão.
Existem vectores de expressão replicativos (de expressão autónoma) e integrativos. A
utilização dos integrativos, capazes de induzir a incorporação de cópias múltiplas de um gene
seleccionado no DNA cromossómico do hospedeiro, e a selecção de estirpes recombinantes
com capacidade para se multiplicarem mais rapidamente, são desenvolvimentos que levaram
em certos casos à obtenção de níveis de expressão elevadíssimos. Exemplos da aplicação
deste sistema à produção de proteínas de interesse em medicina são a expressão do antigénio
de superfície do vírus da hepatite B (HBsAg), o factor de necrose tumoral (TNF), a
estreptoquinase e o t-PA.
Assim, o gene do HBsAg, controlado pelo promotor regulado pelo metanol, da álcool
oxidase I (AOX1) e flanqueado em 3' pelas sequências terminadoras do mesmo gene AOX1,
constitui uma cassete de expressão que foi inserida no plasmídeo pBSAGI51 (Fig. 137.A.II.).
O gene his4 de P. pastoris em 3' desta cassete funciona como marcador de selecção na
transformação duma estirpe auxotrófica que requer histidina por ser deficiente em histidinol
desidrogenase (HIS4). Para inserir a cassete no genoma de P. pastoris, recorre-se ao método
de substituição de gene, já anteriormente utilizado em S. cerevisia, pelo qual os fragmentos
de DNA clonados vão substituir sequências genómicas nativas por um mecanismo que
implica uma recombinação estimulada por sequências flanqueantes, homólogas de regiões
genómicas (Fig. 137.B.II.). Neste exemplo, o gene AOX1 genómico foi o alvo da
substituição pela construção cassete de expressão - HIS4.
A inserção da cassete no genoma hospedeiro elimina problemas potenciais de
instabilidade dos plasmídeos. A cultura do P. pastoris recom(-HAUT-) utilizando fontes de
carbono repressivas, tais como glucose ou glicerol, leva à acumulação duma massa ilimitada
de células, sem selecção significativa de mutantes deficientes em expressão genética
heteróloga.
Quando se adiciona metanol, depois de deixar esgotar a fonte de carbono repressor,
induz-se a expressão do gene heterólogo controlado pelo promotor AOX1. A limitação do
período de expressão de HBsAg, graças à possibilidade de regulação pelo metanol, minimiza
as probabilidades de selecção de mutantes não expressores. O nível de expressão em
produção à escala industrial atinge 0,4 g de HBsAg por litro de cultura (3 a 4 % da massa
proteica total). Esta proteína parece ter as mesmas propriedades antigénicas in vitro e in vivo
97
(induz anticorpos neutralizantes no rato) que a proteína nativa e constitui uma concorrente
potencial à produzida por S. cerevisiae e já utilizada como vacina humana.
A aplicação das técnicas da engenharia genética às leveduras não têm unicamente a
finalidade de clonar e expressar DNA heterólogos. Muitas informações fundamentais têm
sido obtidas sobre a estrutura dos cromossomas dos eucariotas e sobre a organização e a
regulação dos genes de levedura.
Exemplos:
1) A integração dirigida
O DNA introduzido nos esferoplastos, pode-se integrar nos cromossomas de levedura.
Este processo efectua-se por recombinação entre sequências homólogas presentes no DNA
transformante e no cromossoma. Um plasmídeo de levedura pode-se integrar nos
cromossomas, contanto que seja desprovido da sequência ARS. No entanto, a frequência da
integração de moléculas de DNA circulares é fraca, ao contrário dum plasmídeo previamente
linearizado que se integrará com uma frequência 100 vezes superior à forma circular. A
integração do plasmídeo no cromossoma da levedura pode ser dirigida pelo local do corte de
linearização com a enzima (Fig. 138.II.). Esta propriedade de dirigir a integração do DNA
num sítio específico pode servir para substituir um gene normal por um gene mutado. Este
processo, chamado substituição alélica, permite estudar os efeitos duma mutação específica
num gene, realizada in vitro, na expressão deste gene na levedura. Pode-se, por exemplo,
modificar in vitro por mutagénese dirigida, a sequência do DNA que codifica para a actina.
Este DNA "mutante", transportado por um plasmídeo de integração e linearizado por corte no
gene da actina, num sítio apropriado, será reintroduzido na levedura e integrar-se-á no lugar
da actina. Os efeitos da mutação na expressão do gene da actina podem assim ser medidos in
vivo. No caso deste exemplo, os efeitos da modificação introduzida por mutagénese dirigida
são recessivos e letais, indicando que a levedura não sobrevive se a actina não for funcional.
2) O isolamento de alelos mutantes
Pode-se tirar partido do processo de integração do DNA nos cromossomas de levedura
para isolar alelos mutantes, contanto que o gene selvagem clivado esteja disponível. Toda a
região codificante do gene, flanqueado pelas sequências não codificantes em 5' e em 3', é
excisado do plasmídeo portador de um marcador de selecção e de uma ARS. O plasmídeo
amputado é em seguida introduzido na levedura; para se replicar ele têm que ser reparado e
recircularizado, o que só acontece por recombinação das sequências flanqueantes, presentes
no plasmídeo, com as sequências homólogas que delimitam o gene mutado presente no
cromossoma. Assim, durante a duplicação, o gene mutado será introduzido no plasmídeo.
98
Este contém, pois, uma cópia do alelo cromossómico que poderá replicar-se e propagar-se
(Fig. 139.II.).
3) Regulação da expressão dos genes na levedura
Ao contrário do que acontece com as bactérias, os genes cujo controlo se efectua de
maneira coordenada não são obrigatoriamente contíguos e podem, até, estar localizados em
cromossomas diferentes. Assim, por exemplo, três genes de levedura que intervêm na
biossíntese da histidina encontram-se em cromossomas diferentes. As regiões que flanqueiam
estes três genes em 5' têm muito pouco homologia e há pouco tempo, pelo menos,
desconhecia-se como se efectua a coordenação da expressão. Cada gene contém, no entanto,
sequências de controlo essenciais para haver expressão normal. Um tipo de sequência
assegura um nível de transcrição baixo (nível basal) e um outro tipo de sequência
desencadeia uma transcrição abundante (regulação positiva em condições de carência) (Fig.
140.II.).
O fenómeno de regulação a longa distância da expressão dos genes de levedura já foi
evocado. Por exemplo, a expressão do tipo "mating" na levedura faz intervir mecanismos de
inserção de gene afastados num determinado locus de expressão.
4) Um intrão codifica para uma proteína reguladora
Certos genes de mitocôndria de levedura possuem propriedades genéticas complexas,
que só puderam ser elucidadas por análise molecular de DNA. O gene box que codifica para
o citocroma b existe em duas versões :
a) um gene "longo", de 1155 pb codificantes, distribuído ao longo de 6400 pb em 6
exões (B1 a B6) e 5 intrões (I1 a I5);
b) noutras estirpes, este gene é "curto"; as sequências correspondentes aos 4 primeiros
exões do gene "longo" são contíguas no gene "curto".
As duas formas do gene box expressam-se de maneira idêntica.
O gene box "longo" (Fig. 141.II.).
Os RNAs correspondentes a este gene existem em vários tamanhos distintos. O mais
curto têm 3300 pb e corresponde ao RNA mensageiro (incluindo as sequências flanqueantes
em 3' e 5'). Os RNAs de comprimento superior contêm uma ou várias sequências
correspondentes aos intrões. O transcrito primário têm um comprimento de 8500 pb.
Um certo número de mutações no gene box foram isoladas e caracterizadas. Distribuem-
se por grupos separados e por distâncias bastante grandes. Uma primeira classe de mutações
afecta a proteína directamente; o RNA mensageiro é normal mas durante a tradução há
99
interrupção prematura, sem sentido (nonsens), ou incorporação errada (missence). Estas
mutações situam-se nos exões B1, B3, B4 e B6.
Um outro grupo de mutações, box9 e box2, possui características particulares,
provocando a síntese de RNA anormais. Estas mutações situam-se todas no intrão 4. As
mutações box9 estão situadas a +350 pb a jusante da extremidade 5' do intrão e as mutações
box2, a 25 pb a montante da extremidade 3' do intrão. Os dois grupos de mutações impedem
o splicing e a junção dos exões B4 e B5. Mutações em sítios específicos podem impedir o
reconhecimento das junções de splicing, mesmo estando relativamente afastadas destas
junções.
Por outro lado, as mutações de tipo box3, 10 e 7 estão localizadas nos intrões I2, I3 e I4.
Nenhuma pode complementar outra mutação do mesmo tipo, mas podem, no entanto,
complementar mutações noutros clusters. Isto significa que os grupos box3, box10 e box7
codificam para um produto difusível, distinto do cromossoma b, que actua em trans e é
necessário para a síntese do citocroma b.
Cada um dos três intrões I2, I3 e I4 comporta sequências que codificam para um produto
cuja existência é independente e que desempenha um papel regulador na produção do
citocroma b. Com efeito, estas mutações bloqueiam a maturaçãodo RNA mensageiro do
citocroma b o que provoca a acumulação dos seus precursores. Cada grupo de mutações
bloqueia a maturação numa fase particular do processo desactivando um produto difusível
necessário ao splicing dum intrão. O produto difusível é uma RNA maturase. É provável que
esta proteína reconheça as extremidades intrónicas e assegure a execução dum splicing
correcto.
A análise da sequência núcleotídica do gene box dá peso a esta hipótese. Com efeito, o
primeiro exão (B1) codifica para os primeiros 139 aminoácidos do citocroma b (417 pb);
segue-se um intrão (I1) de 765 pb sem fases de leitura aberta, a seguir um segundo exão (B2,
15 pb ou seja 5 codões) e, finalmente, o segundo intrão (I2) cujas 840 primeiras bases estão
em fase em relação às do exão precedente (Fig. 142.II.). As mutações box3 criam codões sem
sentido na fase de leitura aberta do intrão I2. Por consequência, o produto codificado por esta
fase de leitura não é sintetizado e o splicing deixa de ser correcto, o que provoca a
acumulação do RNA precursor.
Na ausência da mutação box3, supõe-se que a tradução que conduz à formação da RNA
maturase começa no exão B1 e continua através de B2 e do intrão I2, contanto que o primeiro
intrão tenho tido um splicing correcto. A RNA maturase seria assim constituída por 424
aminoácidos [139 (B1) + 5 (B2) + 279 (I2)].
100
Se efectivamente a RNA maturase é necessária para o splicing do intrão I2, a acção desta
enzima implica um mecanismo de retro-controlo negativo bastante sofisticado (Fig. 143.II.).
A eliminação do intrão 2 pela RNA maturase suprime a sua própria síntese, visto que
parte do RNA que codifica para ela neste intrão desaparece. É necessário que se estabeleça
um equilíbrio entre as duas formas de RNA que estão sendo alvo do splicing e a RNA
maturase.
Aparentemente este mecanismo não é único e poderia existir noutros genes tais como o
oxy3 (subunidade 1 da citocroma-oxidase).
5) Estrutura do gene da ferromona de levedura (MFα)
A conjugação na levedura parece facilitada por factores peptídicos chamados
ferromonas, que bloqueiam as células de tipo conjugativo oposto, numa fase particular da
divisão celular. As células haplóides α produzem o factor α com 12 a 13 aminoácidos de
comprimento (2 formas). As células haplóides a produzem o factor a, com 11 aminoácidos de
comprimento (2 formas). As células diplóides α/a não produzem ferromonas e não são
sensíveis a elas.
Devido ao seu tamanho pequeno, e por analogia com outras situações, era de admitir que
estas ferromonas derivassem de precursores muito maiores cujo processamento conduzisse à
forma biologicamente activa (analogia com precursores de hormonas). A clonagem do gene
da ferromona α confirmou esta hipótese.
A estratégia desenvolvida para clonar este gene foi a seguinte:
certas estirpes de levedura mutadas produzem o factor α, mas não o segregam porque ele é
degradado muito rapidamente na célula. Todavia, o gene α clonado num plasmídeo
multicópia deveria expressar-se abundantemente e em quantidade suficiente para saturar a
actividade de degradação e conferir um fenótipo produtor de α que fosse facilmente
identificado. Por conseguinte, o DNA plasmídico isolado dum banco genómico de levedura
foi utilizado para transformar as leveduras não secretoras de α (matα2, leu2). Os
transformantes, seleccionados para leu+, foram escrutinados para a secreção do factor α por
um processo que faz intervir células a sensíveis ao factor α (produção de um halo ao contacto
dos transformantes secretores de α com as células a). Um plasmídeo recombinante
superprodutor de α foi identificado e caracterizado. O gene de estrutura do factor α codifica
para um precursor de 165 aminoácidos (prepropoli α F) (Fig. 144.II. e 145.II.). A
extremidade N-terminal do precursor contém uma sequência sinal hidrófoba e comporta três
sítios de glicosilação. A extremidade C-terminal contém quatro cópias do factor α maturado
unidas por péptidos relativamente homólogos.
101
Maturação do precursor de α
O processamento do precursor α requer a glicosilação dos três sítios na região guia, entre
o sinal e a primeira unidade α e em seguida a proteólise entre as quatro unidades α tornando-
as biologicamente activas (Fig. 146.II.). A proteólise realiza-se por etapas; corte a jusante da
região Lys-Arg por uma endopeptidase (KEX2), eliminação das sequências C-terminais por
uma carboxipeptidase e, enfim, eliminação dos aminoácidos excedentes Glu-Ala no termino NH2 por uma dipeptidilaminopeptidase.
d. Expressão nos fungos filamentosos
A genética dos fungos é ainda pouco conhecida apesar de alguns serem utilizados
industrialmente, nomeadamente na produção de antibióticos. Por exemplo, certos Aspergillus
são utilizados e cultivados industrialmente para a produção de penicilinas e doutros
antibióticos. Outros são utilizados na produção à escala industrial de proteínas segregadas no
meio, como por exemplo Aspergillus niger que pode segregar até 20 g/l de enzima endógena
glucoamilase.
Os fungos são pois candidatos importantes para a produção de proteínas estrangeiras
segregadas. No entanto, as dificuldades são ainda grandes porque não existem bons vectores
de expressão. Os promotores destes fungos não foram bem caracterizados e os vectores têm
bastante inconvenientes: não existem na forma autónoma e têm tendência a integrar-se nos
cromossomas, o que diminui a sua capacidade de expressão. As construções recorrem a
diversos outros elementos derivados de fungos clássicos e, em geral, da levedura S.
cerevisiae.
Tem havido progressos na estabilização destes vectores, mas o nível de expressão e de
secreção de proteínas estrangeiras permanece baixo.
A integração dos vectores no genoma pode ser, no entanto, uma vantagem se o nível de
expressão for melhorado. Foi observado, nalguns casos, a aquisição duma grande
estabilidade, sem pressão de selecção, como se a estirpe não tivesse sido modificada, o que é
importante nas aplicações industriais.
Os fungos filamentosos têm sido utilizados para produzir enzimas industriais. Já
referimos a glucoamilase produzida por A .niger. Outro exemplo é a renina (ou quimosina),
utilizada no fabrico de queijo, que pode ser preparada em larga escala, tanto em A. niger
como em Trichoderma reesei. A renina na sua conformação activa possui 3 ligações
dissulfureto intramoleculares e é difícil de expressar correctamente noutro sistema de
expressão. Existem exemplos de secreção de proteínas de mamíferos na forma activa, que
requerem a formação correcta de pontes dissulfureto para serem activas biologicamente. Não
102
existem, no entanto, dados suficientes para generalizar a capacidade dos fungos em relação às
modificações pos-tradução de proteínas expressas heterologamente.
Um exemplo de expressão de uma proteína de mamífero, aparentemente com a
conformação correcta, é o do interferão humano α-2 cujo cDNA foi clonado num vector de
expressão e colocado sob controlo do promotor indutível pelo etanol, da alcool
desidrogenase, derivado de Aspergillus nidulans. O vector integra-se de maneira estável no
genoma do hospedeiro. Foi ainda desenvolvido um outro vector de expressão comportando o
promotor da glucoamilase de A. niger para expressar aquele interferão humano.
Uma área importante de aplicação dos fungos filamentosos é o da utilização dos seus
genes para produzir enzimas de degradação da celulose e da lenhina. Por exemplo, o fungo T.
reesei segrega um complexo de enzimas que degradam a celulose em glucose. Alguns dos
genes que codificam para estas enzimas foram caracterizados e clonados em vectores de
levedura (nomeadamente de S. cerevisiae), sob controlo de promotores e de terminadores do
hospedeiro, afim de aumentar o nível de expressão, caracteristicamente baixo no organismo
nativo. Existem projectos para produzir, a partir de cassetes de expressão o conjunto do
complexo das celulases.
A expressão do complexo de genes que codificam para as lenhinases é igualmente
objecto de grande interesse, dada a importância que representa, a nível mundia,l o
processamento da pasta de papel.
A tecnologia do DNA recombinante pode também ser aplicada ao melhoramento da
produção de antibióticos em estirpes já altamente produtivas. Obtidas classicamente por
mutagénese ao acaso, com agentes mutagénicos químicos ou físicos, e selecção de mutantes
superprodutores dos precursores dos metabolitos primários, estas estirpes fizeram as suas
provas como organismos de produção industrial. A engenharia genética abre novas
perspectivas de desenvolvimento racional da capacidade produtora dos fungos. A criação de
mutações dirigidas, utilizando métodos de recombinação genética, pode reduzir
drasticamente o número de colónias que é preciso escrutinar para obter uma estirpe
optimizada. É, evidentemente, importante conhecer o pathway de biossíntese do antibiótico e
o complexo de enzimas que nele participa. Um exemplo de aplicação bem sucedida desta
abordagem é a modificação do Cephalosporium acremonium, fungo produtor do antibiótico
cefalosporina C, cujo pathway biossintético está representado na Fig. 147.II.
A primeira etapa consistiu em identificar um intermediário que se acumulasse de
maneira significativa na estipe altamente produtora. Isto foi realizado por análises química e
cromatográfica (HPLC) do meio de fermentação, que mostraram ser a penicilina N o
intermediário procurado. Estes resultados sugerem que a actividade da enzima
103
desacetoxicefalosporina C sintetase (DAOCS), que expande o ciclo tiazolidina da penicilina
N (etapa 4 do pathway biossintético), é limitante na síntese de cefalosporina C.
A segunda etapa é a clonagem do gene cefEF, que codifica para esta enzima, afim de
introduzir cópias suplementares do gene na estirpe produtora. Para isso foi construído um
plasmídeo que, para poder ser obtido em quantidades suficientes, têm que ser amplificado em
E. coli e necessita por consequência da origem da replicação colE1 e dum marcador de
selecção, CAT (cloranfenicol acetiltransferase). A escolha do marcador é importante porque,
se o gene que produz a enzima que inactiva o antibiótico de selecção dos transformantes em
E. coli se expressar gratuitamente nos transformantes de C. acremonium, os antibióticos beta
lactâmicos intracelulares poderão ser destruídos. Por isso foi escolhido CAT, que têm como
substrato um antibiótico que não possui a estrutura ß-lactâmica.
Para seleccionar os transformantes fungais é necessário um outro marcador de resistência
antibiótica, por exemplo a higromicina B fosfotransferase (HPT), conhecido como sendo um
marcador dominante de selecção, útil nas transformações genéticas de eucariotas inferiores.
A transformação de C. acremonium e a expressão de HPT foram conseguidas com
plasmídeos em que foi clonado o gene híbrido, composto pela fase de leitura aberta do gene
que codifica para HPT, derivado de E. coli (HPTorf), e o promotor (IPNSp) do gene pcbC, do
fungo, que codifica para a isopenicilina N sintetase.
O plasmídeo pPS55, cuja construção está esquematizada na Fig. 148.II., é um exemplo
de vector utilizado com o híbrido IPNSp/HPTorf para transformar eficazmente C.
acremonium, levando à integração estável no DNA genómico. O gene cefEF e as suas
sequências flanqueantes reguladoras foram introduzidos em 5' do fragmento IPNSp de pPS55
e o plasmídeo resultante, pPS56, foi utilizado para criar transformantes de C. acremonium,
seleccionados pela resistência à higromicina B. Uma selecção suplementar baseada na análise
da capacidade produtora de cefalosporina C, levou ao isolamento duma estirpe transformante
que produz industrialmente 15 % mais antibiótico que a melhor estirpe não transformada. A
presença, no genoma de C. acremonium, duma cópia suplementar do gene cefEF foi
correlacionada com um aumento duplicado da actividade específica da enzima DAOCS, o
qual se correlaciona por sua vez com uma diminuição substancial da quantidade de penicilina
N sedregada e com o aumento da cefalosporina produzida relativamente à estirpe parental.
e. Expressão em células de mamíferos
Os níveis de expressão e secreção variam de um organismo para outro, segundo a
proteína; esta é uma dificuldade maior que está por resolver em todos os sistemas hospedeiro-
vector conhecidos presentemente.
104
Muitos dos produtos farmacologicamente relevantes, recentemente descobertos e
identificados não podem ser produzidos na sua forma fisiologicamente activa pelas bactérias
ou até pelas leveduras. A capacidade dos organismos para sintetizarem proteínas com a
conformação correcta natural, para as glicosilarem correctamente, processarem com todas as
modificações secundárias necessárias para a sua função e estabilidade, a sua inocuidade e
actividade biológica, é limitada. Em muitos casos, as proteínas produzidas por micróbios têm
que ser enroladas correctamente in vitro e as processadas incorrectamente têm que ser
removidas. Esta purificação não é muitas vezes possível, ou é insuficiente e, além disso,
substâncias contaminantes pirogénicas têm que ser eliminadas, em particular das proteínas
produzidas por E. coli.
As células de mamíferos efectuam um processamento pós-traducional eficaz durante a
biossíntese de proteínas e de péptidos, o que pode favorecer fortemente a estrutura natural do
produto derivado do DNArec, influenciando, por consequência, a sua homogeneidade,
estabilidade e eficácia. Os produtos perfeitamente homólogos da proteína natural humana são
sempre preferíveis, afim de garantirem uma actividade farmacológica, específica e uma
compatibilidade clínica óptima durante as aplicações.
A expressão de DNA recombinante em cultura de células de mamíferos é, em princípio,
o melhor método para produzir quantidades suficientes de substâncias complexas
glicosiladas, com a condição de não estarem contaminadas com, por exemplo, vírus latentes,
ou outras substâncias potencialmente perigosas. A cultura de células animais têm vindo a
impor-se como uma tecnologia das mais importantes para investigação e desenvolvimento
em biologia celular, virologia e imunologia, assim como em investigação na área tumoral.
São utilizadas, por exemplo, linhagens celulares de macaco e de hamster que não têm
grandes exigências de meio de cultura e crescem em grande quantidade. Qualquer gene de
mamífero, tanto na forma genómica como na de cDNA, pode ser colocado num vector de
expressão adaptado às células de mamíferos. Pode ser flanqueado dos seus próprios sinais de
regulação, ou doutros mais potentes e complementados eventualmente com um sinal de
secreção. Estes vectores funcionam bem nas células em que são introduzidos, e os genes de
que são portadores expressam-se normalmente. As proteínas produzidas são segregadas no
meio de cultura e são correctamente processadas, diferindo pouco do produto segregado pela
célula de origem. Assim, por exemplo, a glicosilação efectuada pela célula de rato difere um
pouco da realizada por células humanas, mas esta diferença é sem significado nas
propriedades fisiológicas e imunológicas do produto final. Actualmente, a expressão nas
células de mamíferos em cultura constitui a única maneira de produzir, numa escala
relativamente grande, proteínas de organismos superiores que exigem, para serem activas,
105
modificações pós-traducionais. É o caso de certos factores de coagulação do sangue, do
activador tissular do plasminogéneo, de hormonas, de interleucinas, etc.
Os problemas inerentes à expressão nas células de mamíferos decorrem, primeiramente,
dos vectores próprios deste tipo de células. Como se integram quase sempre nos
cromossomas, o número de cópias activas nas células é limitado. Existem excepções, tais
como a dos vectores derivados do vírus do papiloma bovino (Fig. 149.II.). Existem, no
entanto, métodos para amplificar o número de cópias do gene que se deseja expressar. A
segunda dificuldade é de ordem económica, porque a cultura das células de mamíferos nem
sempre é fácil. Apesar dos enormes progressos realizados na simplificação dos meios de
cultura, no aumento da massa de células, graças ao crescimento em suportes sólidos, no
melhoramento das técnicas de fermentação etc..., a produção industrial de células animais é
ainda relativamente dispendiosa e reservada a produtos de alto valor acrescentado.
É de assinalar, todavia, que a cultura in vitro das células animais têm progredido a ponto
de se poder utilizar células normais não transfectadas para produzir substâncias interessantes,
tais como HBsAg segregada por células hepáticas ou ainda factores imunológicos, como a
interleucina 2 ou os interferões. É possível que, graças a progressos futuros nas técnicas de
cultura das células de mamíferos, as células normais não manipuladas possam vir a suplantar
as linhagens celulares transfectadas com vectores de expressão recombinados.
Transferência de genes nas células de mamíferos (transfecção)
O estudo da expressão dos genes de eucariotas evoluídos não teria sido possível sem o
desenvolvimento de técnicas que permitissem a introdução do DNA nas células. O processo
natural de absorção de DNA viral pelas células é muito pouco eficaz, e só foi possível
melhorá-lo recorrendo ao método de co-precipitação DNA-cálcio. O DNA purificado é
precipitado em presença de iões de cálcio e os grânulos assim formados são fagocitados pelas
células em cultura; uma pequena fracção deste DNA é susceptível de se integrar no DNA
cromossómico das células. Afim de identificar as células que integraram este DNA foi
preciso desenvolver técnicas de selecção apropriadas.
Um sistema muito utilizado recorre ao isolamento de linhagens celulares deficientes em
timidina kinase, enzima que intervém na biossíntese das pirimidinas. Esta enzima fosforila a
timidina proveniente da degradação do DNA celular; a TMP formada é em seguida
transformada em TTP e reincorporada no DNA. Esta via metabólica não é, no entanto,
essencial para a sobrevivência da célula que utiliza habitualmente a dCDP. É portanto
possível obter células tk- perfeitamente viáveis. O isolamento de mutantes tk- efectua-se
segundo o esquema da Fig. 150.II. Em presença de bromodesoxiuridina, as células cuja tk é
funcional são inviáveis porque esta enzima fosforila o composto análogo, que é incorporado
106
no DNA, tornando-o hipersensível à radiação ultravioleta. As raras células deficientes em tk
sobrevivem a este tratamento.
No entanto, as células tk- morrem no meio HAT (meio que contém hipoxantina,
aminopterina e timidina), porque a aminopterina bloqueia a utilização normal de dCDP
obrigando a célula a recorrer à acção da timidina kinase, única via possível para sintetizar a
TTP. Existe, portanto, um sistema de selecção de células tk+ (Fig. 151.II.). O gene tk pode,
portanto, ser utilizado como marcador de selecção para a integração, no DNA de células de
mamíferos, doutros genes que lhe estão ligados.
O sistema de selecção baseado no gene tk apresenta certos inconvenientes. É preciso,
primeiramente, tornar a linhagem tk- e, por outro lado, obter uma mutação tk-, cuja
frequência de reversão seja muito baixa. Foram, por isso, desenvolvidos sistemas melhores,
que se baseiam na utilização de genes de procariotas associados aos sinais de controlo dos
eucariotas (Fig. 152.II.).
Um dos vectores é portador dum gene bacteriano XGPRT (utilização de xantina como
fonte de purinas, xantina guanina fosforribosil transferase). Este gene foi inserido entre o
promotor e o sítio de adição de poli A do gene de SV40, que codifica para o grande antigénio
T (a célula contém o gene HGPRT, utilização de hipoxantina e praticamente de nenhuma
xantina). Uma grande quantidade de XGPRT bacteriana é produzida sob acção do promotor
muito eficaz. É pois possível seleccionar o fenótipo HGPRT+ em meio HAT nas linhagens
celulares HGPRT-; mesmo nas linhagens selvagens, HGPRT+, é possível seleccionar o
fenótipo HGPRT+, em presença de xantina e de ácido micofenólico que bloqueia a enzima
celular HGPRT, porque as células portadoras do vector são capazes de utilizar a xantina,
graças à enzima codificada pelo vector.
O segundo vector contém o gene procariota que confere resistência à neomicina
(inactivação da neomicina por fosforilação enzimática). Este gene é também inserido entre o
promotor e o sítio de adição poli A de SV40. As células eucariotas são sensíveis a um
análogo da neomicina, G418; este análogo é também desactivado pelo produto do gene
NeoR. Este vector SVneo pode, portanto, ser utilizado na transformação de células de
eucariotas, seleccionadas pela resistência ao G418.
Co-transformação
Na prática, não é necessário ligar, por ligação in vitro, o fragmento de DNA que se
deseja introduzir nas células com o marcador de selecção. Basta co-precipitá-los com iões de
cálcio e transfectar as células. O DNA exógeno encontra-se na forma de longo concatâmero
que se integra ao acaso e em bloco no cromossoma (Fig. 153.II.).
107
Micro-injecção
Outra alternativa é a introdução do DNA em células em cultura por microinjecção no
núcleo celular. Este método, se bem que sofisticado e delicado, é muito eficaz, pois 50 % das
células microinjectadas integram e expressam os genes injectados. Além disso, este método
não requer nenhuma pressão de selecção para manter o gene transfectado e permite em
princípio injectar qualquer DNA em qualquer célula.
Isolamento dos genes transferidos
A possibilidade de transferir genes para as células de mamíferos fornece, ao mesmo
tempo, os meios de os isolar. Uma abordagem possível está ilustrada na Fig. 154.II. O DNA
genómico é cortado em fragmentos por uma ou várias enzimas que se sabe não afectarem o
gene que se pretende transferir. Este DNA é em seguida ligado a um DNA heterólogo (por
exemplo pBR322), de maneira a marcar todos os fragmentos de DNA genómico com um
DNA procariota. Após tranfecção e selecção, o gene que se pretende isolar é integrado no
cromossoma das células receptoras na vizinhança imediata deste marcador. Isola-se então o
DNA das células transformadas e prepara-se um banco genómico, num fago λ ou num
cosmídeo. Este banco é em seguida escrutinado com uma sonda característica do marcador
utilizado. É de esperar que o clone positivo para o marcador, contenha igualmente o gene
seleccionado (no exemplo da figura trata-se da adenosina fosforribosil transferase).
Uma outra abordagem possível, chamada rescue, baseia-se na adição dum DNA
funcional ao DNA que se pretende transferir, por exemplo, uma resistência a um antibiótico
ou um supressor procariota como supF (tRNA) (Fig. 155.II.). Depois da transfecção, o DNA
das células seleccionadas é cortado por uma enzima que não afecta o gene que se pretende
isolar, recircularizado e utilizado na transformação de bactérias. A selecção de resistência a
um antibiótico (ampicilina, por exemplo) fornece os clones portadores do gene pretendido.
As técnicas de transfecção e de isolamento dos genes transferidos permitiram identificar,
nomeadamente, sequências de DNA responsáveis pelo controlo da expressão de certos genes
de eucariotas. No caso preciso do vírus MMTV (Mouse Mammary Tumor Vírus), a
expressão do DNA é controlada pelas hormonas glucocorticóides. O provírus clonado,
introduzido nas células de rato em cultura, contendo o receptor hormonal ad hoc continua a
responder à hormona. A transcrição do DNA proviral transferido nas células aumenta de 5 a
10 vezes em presença da hormona. O sítio sensível ao efector foi identificado e localizado no
long terminal repeat (LTR) do provírus (sequências que intervêm na inserção viral nos
cromossomas celulares) (Fig. 156.II.).
Existem outros genes eucariotas, activáveis ou desactiváveis por diferentes factores; são exemplos o gene da α2-globulina de rato, sensível à insulina, o gene da metalotionéina,
108
induzido pelo cadmium. Em todos estes casos, os elementos de regulação estão localizados
na proximidade do próprio gene.
As técnicas de transferência de genes permitiram identificar e clonar genes implicados na
formação de cancros. Estas experiências começaram a desenvolver-se quando se observou
que o DNA extraído de tumores pode transformar células normais e torná-las malignas (Fig.
157.II.).
Estas células transformadas, injectadas em ratos, levam à formação de tumores. A
conclusão é 1) que, com estes tumores pelo menos, o fenótipo é dominante, isto é, devido à
presença e não à ausência dum produto específico; 2) que o fenótipo transformado das células
é induzido pela expressão dum só gene. É, com efeito, pouco provável que a transformação
das células se pudesse realizar se ela exigisse a transferência e a expressão simultânea de dois
genes.
Clonagem de oncogenes humanos
Vários oncogenes humanos foram clonados por uma das técnicas já referidas
anteriormente e que estão ilustradas nas Fig. 158.II. e 159.II. Assim, os oncogenes presentes
nas linhagens cancerosas derivadas de tumores da bexiga, do neuroblastoma, de tumores do
cólon ou do pulmão foram clonados e caracterizados. Estes genes têm comprimentos
compreendidos entre + 5 e 45 kb. Apresentam todos um arranjo intrão-exão idêntico: quatro
exões codificam para proteínas similares mas distintas, de massas moleculares de cerca de
21.000 daltons.
Estas proteínas, chamadas p21, geralmente associadas à membrana plasmática das
células cancerosas são assaz homólogas dos produtos dos oncogenes já identificados nos
retrovírus. O gene do cancro da bexiga, por exemplo, é muito semelhante ao do oncogene ras
encontrado no genoma do vírus HSV (Harvey Sarcoma Vírus), enquanto que o oncogene do
cancro do pulmão é muito parecido com o oncogene ras do vírus KSV (Kirston Sarcoma
Vírus).
Estes oncogenes humanos, assim como os oncogenes virais, têm os seus homólogos
celulares normais de que eles derivam aparentemente por mutação. O oncogene do carcinoma
da bexiga, por exemplo, difere do seu equivalente celular normal numa única mutação pontual (Gly12→Val12 na p21). Está, no entanto, por demonstrar que esta mutação pontual
seja a causa única do cancro de bexiga. Também não se conhece o papel da proteína p21,
nem no estado normal, nem no estado mutado.
109
Vectores virais utilizados para transfectar as células de mamíferos
A infecção viral é um processo natural muito eficaz que conduz à introdução de várias
cópias dum mesmo gene em cada célula receptora. O genoma viral comporta promotores
muito potentes, susceptíveis de expressar eficazmente os genes que dependem deles e de
produzir RNA e as proteínas correspondentes em abundância. Estas propriedades conduziram
naturalmente à construção de vectores derivados de vírus para introduzir DNAs heterólogos
nas células animais.
Vector SV40
Foram adoptadas duas vias para tirar partido do DNA viral como vector. A primeira
consiste em construir recombinantes entre o DNA de SV40 e um fragmento de DNA
heterólogo, e introduzir em seguida as moléculas híbridas nas células receptoras afim de
sintetizar as partículas virais que contêm o DNA recombinante.
a) Substituição da região tardia de SV40
Quando se substitui o DNA de SV40, correspondente às funções tardias (implicadas na
síntese da cápsula viral), por um fragmento de DNA heterólogo é necessário complementar
estas funções perdidas pelas fornecidas por um vírus amputado das funções precoces
(implicadas na replicação do DNA viral). Transfectam-se, simultaneamente, as células pelo
DNA de SV40 recombinante e o DNA helper; um fornece as proteínas da cápsula, o outro, as
funções de replicação. Resulta uma população viral mista, difícil de separar. Utiliza-se, então,
a mistura de partículas virais, para re-infectar outras linhagens celulares e acumular o produto
do gene clonado (Fig. 160.II.).
b) Substituição da região precoce de SV40
Quando se substitui o DNA de SV40, correspondente às funções precoces por um DNA
heterólogo, a produção de partículas virais intactas depende da complementação pelas
proteínas precoces, os antigénios T. É possível evitar a utilização dum vírus helper
introduzindo o DNA de SV40 recombinante nas células COS de macaco. Estas células já
foram transformadas por um vírus SV40 portador de DNA codificando para as funções
precoces, mas deficiente em relação à origem de replicação viral. Por consequência, nestas
células, o vírus SV40 fornece os antigénios T mas não se pode replicar independentemente
dos cromossomas da célula (Fig. 161.a.II.). Quando um DNA de SV40 recombinante,
deficiente em funções precoces, é introduzido nas células COS, a origem de replicação que
ele contém será reconhecida pelos antigénios T celulares e o vírus poderá replicar-se e
fornecer uma descendência viral normal (Fig. 161.b.II.)
A vantagem deste método é que todas as partículas virais produzidas contêm o DNA
recombinante e não ha contaminação pelo vírus helper.
110
É possível, por outro lado, utilizar unicamente a origem de replicação do SV40 para
transfectar células. Constrói-se um DNA recombinante portador desta origem e dum
fragmento de DNA heterólogo. Nas células COS, os antigénios T celulares induzem a
replicação da molécula recombinante na forma plasmídica, até um número de cópias muito
elevado. O DNA heterólogo replicar-se-á pois, pelo menos de maneira transitória,
independentemente do DNA celular, produzindo uma alta percentagem de mensageiro
correctamente processado (Fig. 162.II.).
Vector vaivém derivado de SV40
Um plasmídeo, portador da origem de replicação SV40 ligada a um marcador de
selecção de eucariota, é levado a integrar-se no DNA cromossómico de células de rato.
Quando se fusionam estas células com células COS, os antigéneos T que estas produzem
difundem-se no núcleo das células de rato e induzem a replicação na origem de replicação de
SV40 presente nos cromossomas. Esta replicação bidireccional conduz à produção de
moléculas de DNA circulares que se soltam dos cromossomas e podem ser isoladas
facilmente. Se a origem de replicação procariótica e um marcador de selecção para procariota
estiverem presentes, na vizinhança da origem de SV40, estas moléculas circulares podem ser
utilizadas para transformar bactérias e recuperar o plasmídeo de partida (Fig. 163.II.). Este é
um exemplo de vector vaivém capaz de se replicar, tanto em células animais, como em
bactérias.
Habitualmente, os vectores derivados de SV40 possuem, para além da origem de
replicação SV40, sequências virais estimuladoras (enhancers). Estas sequências estão
localizadas a montante do promotor do gene T de SV40, elas estimulam a expressão de
qualquer promotor contido num plasmídeo no qual elas foram clonadas.
Vector BPV (Bovine Papilloma Virus)
O vírus BPV responsável pelas verrugas do gado bovino tem um genoma de 8 kilobases.
O DNA circular de BPV é capaz de transformar certas linhagens celulares de rato em
fenótipo maligno. Nestas células, o DNA do BPV permanece circular e extra-cromossómico,
à razão de 30 a 100 cópias por célula (situação análoga à dos plasmídeos). Pode-se clonar
DNAs heterólogos num genoma de BPV e introduzi-los desta maneira em células de rato em
cultura (Fig. 164.II.).
Se sequências apropriadas de pBR322 forem clonadas no DNA de BPV, obtém-se um
vector vaivém capaz de se manter na forma plasmídica nas bactérias e nas células de rato. Na
prática, não se utiliza o DNA completo do BPV, mas antes um fragmento correspondente a
69 % do genoma, fragmento dotado da capacidade de transformação das células e de
replicação autónoma extra-cromossómica. Afim de facilitar a identificação das células
111
transformadas pelo vector BPV, introduz-se um marcador de selecção dominante, como por
exemplo, a resistência à neomicina (na realidade resistência a um análogo G418).
Um dos vectores derivados do BPV, correntemente utilizado para expressar DNAs
heterólogos está ilustrado na Fig. 165.II.
Vectores derivados de retrovírus
Vimos que o genoma dos retrovírus é constituído por uma molécula de RNA semelhante
a um RNA mensageiro, possuindo a estrutura cap em 5' e uma cauda poli A em 3'. Um
retrovírus têm um número restrito de genes, para além do gene pol, responsável pela síntese
da enzima característica dos retrovírus, possui um gene gag que governa a síntese de
proteínas estreitamente associadas ao genoma viral e um gene env, que determina a síntese
das proteínas do invólucro; por fim as sequências ditas LTR, nas duas extremidades do
genoma, que intervêm na inserção do vírus nos cromossomas das células.
O RNA do retrovírus é copiado em DNA bicatenário, que se integra no genoma das
células infectadas. Uma vez integrado, o provírus é transcrito como um gene celular. O
provírus integrado possui em cada uma das suas extremidades uma sequência LTR, onde fica
localizado o único promotor conhecido para a expressão dos genes virais. A produção dos
diferentes RNAs que codificam para as diferentes proteínas virais é regulada ao nível do
splicing do transcrito primário. Os provírus clonados podem ser utilizados para introduzir
DNAs heterólogos nas células de mamíferos, se se substituir um dos genes virais por um
fragmento de DNA estrangeiro (Fig. 166.II.).
As células infectadas por um retrovírus recombinante produzirão grandes quantidades do
novo RNA mensageiro cuja transcrição começa no LTR. Com a complementação dum vírus
helper, são fornecidas as funções necessárias ao encapsulamento do RNA do retrovírus
recombinante e por consequência à produção de partículas virais.
Na Fig. 167.II. estão representadas duas maneiras de produzir retrovírus. Na parte A da
figura está representado um primeiro método, segundo o qual se faz penetrar (transfecção),
por um método fisico-químico, o DNA dum retrovírus no qual se introduziu um gene
estrangeiro (este ocupa, por exemplo, o lugar do gene pol), numa célula dita assistente que é,
por outro lado, infectada por um vírus selvagem. Este poderá dirigir a síntese de novas
partículas virais infecciosas selvagens e, além disso, fornecer as moléculas de transcritase
reversa às partículas virais, que incorporaram o RNA que veicula o gene estrangeiro, o qual
foi sintetizado graças ao DNA integrado nos cromossomas da célula. Estas últimas partículas
virais poderão ser utilizadas, conjuntamente com as selvagens, para infectar células alvo, tais
como células de embrião de mamífero.
112
O método representado na parte B da figura é uma versão aperfeiçoada da precedente.
Visa produzir unicamente partículas virais contendo o genoma viral que veicula o gene
estrangeiro. Para isso, prepara-se um DNA mutado, a partir do selvagem, amputado duma
sequência nucleotídica ψ que intervém no empacotamento do RNA viral pelas partículas do
invólucro. O método consiste em fazer penetrar numa célula assistente, uma cópia de DNA
viral amputado da sequência ψ e uma cópia de DNA viral que veicula o gene estrangeiro
(contendo a sequência ψ). As cópias do DNA vão-se alojar nos cromossomas da célula e
dirigir a síntese dos diferentes elementos das partículas virais (RNA e proteínas).
As partículas infecciosas, finalmente formadas, comportarão unicamente o RNA que
veicula o gene estrangeiro, porque só este foi empacotado.
É frequente que os retrovírus, uma vez inseridos no cromossoma, activem genes
vizinhos. Estes genes, que eram silenciosos antes da inserção do retrovírus, podem revelar-se
proto-oncogenes e induzir a transformação cancerosa da célula infectada. Um certo número
de cancros animais são o resultado deste género de mecanismo.
Os retrovírus são relativamente instáveis e, mesmo quando foram tornados não
infecciosos pela eliminação do gene da transcritase reversa, podem, uma vez alojados nos
cromossomas duma célula, produzir de novo um vírus infeccioso recombinando-se a vírus
latentes presentes nas células hospedeiras. Por estas razões, outras vias têm sido estudadas,
tais como o recurso aos AAV (Adeno-Associated Virus) que parecem inserir-se de maneira
estável e sem inconvenientes no genoma das células que ele infecta.
f. Introdução de genes estrangeiros em óvulos fertilizados. Animais transgénicos
A transfecção de células em cultura fornece um instrumento indispensável ao estudo da
regulação dos genes de eucariotas. Esta abordagem é, no entanto, limitada a células muito
diferenciadas e não fornece nenhuma indicação sobre os mecanismos moleculares
responsáveis pelo controlo da expressão dos genes num dado tecido celular, nem sobre a
evolução deste controlo durante o desenvolvimento embrionário.
Uma maneira de abordar estes problemas baseia-se na introdução de genes estrangeiros,
facilmente identificáveis, em zigotos ou embriões precoces e na análise da sua expressão nos
tecidos destes embriões ou dos animais deles nascidos. O método, simples no seu princípio,
consiste na deposição duma solução dos genes clonados no núcleo dum ovo (de rato por
exemplo) recentemente fecundado (a deposição no citoplasma conduz frequentemente à
degradação rápida do DNA por enzimas). Mais precisamente, a solução de DNA é micro-
injectada num dos pro-núcleos pertencentes às células sexuais, antes que elas se associem no
ovo fecundado. O pro-núcleo macho, pertencente ao esperma, é habitualmente escolhido para
113
a micro-injecção, porque é de maiores dimensões e permanece durante algumas horas perto
da superfície do óvulo fecundado (Fig. 168.II.).
Os ovos de mamífero (rato, porco, etc.) assim injectados são, ou reintroduzidos no
oviducto duma fêmea portadora, preparada hormonalmente para o efeito, ou desenvolvidos in
vitro, em cultura, até ao estado blastocito antes de serem implantados no útero (Fig. 169.II.).
Este género de experiências foi realizado com vários genes clonados, correspondentes à
hormona de crescimento, ao interferão, à insulina, à globina, à timidina kinase, etc. De 200 a
30.000 moléculas de DNA, de comprimento variável entre 5 e 50 kbases são injectadas por
ovo. A percentagem de sobrevivência dos ovos injectados de rata é de 10 a 30 % e a
proporção de ratas que integram o DNA injectado nos seus cromossomas é de cerca de 40 %.
A percentagem de sucesso parece, no entanto, depender da estirpe de rato e da espécie
utilizada. A técnica é muito menos eficaz quando aplicada ao carneiro, à vaca, ao porco e ao
coelho.
Na maioria dos casos analisados, várias cópias de DNA micro-injectado encontram-se
integradas num dos cromossomas dum par de cromossomas, no rato adulto. Duma
experiência para outra a integração ocorre num cromossoma qualquer, o que mostra que o
processo de integração não é específico. O DNA integrado encontra-se habitualmente tanto
nas células somáticas como nas células germinais (óvulos e esperma). Ele é, portanto,
transmitido por intermédio destas como um carácter mendeliano (Fig. 170.II.), o que implica
que o acontecimento de integração se passa muito cedo durante o desenvolvimento
embrionário, antes de a população de células germinais se separar das células somáticas de
origem. O DNA estrangeiro pode-se transmitir durante várias gerações; integra-se, portanto,
de maneira estável, no genoma do rato, sem no entanto lhe conferir nenhuma vantagem
selectiva.
Os pontos fracos deste método de micro-injecção são a impossibilidade de prever qual o
número de cópias de um dado gene que se vai inserir no património genético do animal e a
localização da inserção, que se faz ao acaso, o que têm, por vezes, como efeito, desactivar
certos genes da célula hospedeira e provocar anomalias morfológicas mais em menos graves.
Além disso, o nível de funcionamento do gene estrangeiro é totalmente imprevisível.
Expressão do DNA estrangeiro nos animais transgénicos
Os óvulos micro-injectados que chegam ao seu termo normal de desenvolvimento são
unicamente aqueles cujo desenvolvimento embrionário não é perturbado pela integração do
DNA estrangeiro. É, pois, necessário que o DNA integrado o seja de forma passiva, seja
geneticamente silencioso e não expresso, ou controlado normalmente na sua expressão.
114
O exemplo seguinte mostra que a expressão do DNA integrado pode ser específica de
tecidos celulares. Quando um plasmídeo, portador do promotor da metalotioneína (MT) a
montante da sequência que codifica para a timidina kinase, é microinjectado em embriões de
rato, prevê-se que a expressão do gene da timidina kinase seja controlada por sinais
moleculares que desencadeiam a acção do promotor da metalotioneína, por iões Cd, por
exemplo (o papel fisiológico de metalotioneína é de fixar iões de metais pesados, sendo o
promotor MT induzido por estes iões) (Fig. 171.II.). A exposição dos ovos micro-injectados a
estes iões metálicos conduz, com efeito, à síntese de timidina kinase.
Por outro lado, os ovos micro-injectados, após reimplantação em fêmeas portadoras, dão
origem a uma descendência que possui o gene MT-tK integrado no cromossoma numa
proporção de 10 a 15 %. A injecção de sulfato de cádmio nestes ratos conduz à síntese de
timidina kinase, mas a expressão do gene integrado é específica de um tecido dado, neste
caso, o fígado, o que corresponde à localização natural da metalotioneína no rato. Durante as
gerações seguintes, uma parte da descendência perde o gene MT-tK. Entre os ratos que
herdaram o gene, certos deixam de o expressar e outros expressam-no com abundância
superior à dos pais. Aparentemente, durante a passagem pelo óvulo e pelo esperma e durante
o desenvolvimento embrionário, acontecimentos importantes levaram à extinção ou à
amplificação da expressão do gene integrado.
Numa outra abordagem experimental, um plasmídeo, portador do promotor da
metalotioneína de rato e do DNA genómico que codifica para a hormona de crescimento
(GH) de rato, foi micro-injectado em óvulos de rata (a hormona de crescimento, sintetizada
normalmente na hipófise encontra-se no fígado onde desencadeia a síntese de somatomedinas
que estimulam o crescimento muscular, ósseo e cartilaginoso) (Fig. 172.II.). Este plasmídeo
contém os sinais de regulação MT e o DNA genómico que codifica para a GH, como o sinal
de iniciação AUG, os exões e os intrões correspondentes e o sinal de poliadenilação. A
transcrição deste DNA fusionado conduz à síntese de um RNA que codifica para a hormona
de crescimento do rato. Na micro-injecção utiliza-se o plasmídeo linearizado, que se integra
melhor que a molécula circular, à razão de 600 cópias por pro-núcleo macho. Foram
injectados e implantados 170 ovos no útero de ratas portadoras, das quais 21 chegaram ao seu
termo. Sete ratos em 21 tinham o DNA integrado em várias cópias num cromossoma. Seis
destes 7 ratos desenvolveram-se mais rapidamente que os outros, mesmo na ausência de
indução do promotor MT com iões de cádmio. Como previsto, a hormona de crescimento
nestes 6 ratos expressa-se 100 a 800 vezes mais que em ratos de controlo. A aceleração do
crescimento nestes ratos transgénicos resulta, por consequência, da integração e da expressão
do gene fusionado MT-GH (Fig. 173.II.).
115
No domínio da micro-injecção de genes, os trabalhos que se desenvolvem actualmente
visam essencialmente definir as mudanças moleculares que ocorrem durante a diferenciação
e correlacionar estas modificações com as alterações da expressão dos genes integrados.
A utilização dos retrovírus
Um outro tipo de experiências tira partido das propriedades dos retrovírus, afim de os
utilizar como vectores que veiculam genes estrangeiros nos animais. Por exemplo, o DNA
proviral do vírus MLV (vírus da leucémia de rato) pode ser integrado em embriões de rato de
duas maneiras diferentes:
1) infectando os embriões com o vírus para desencadear a síntese de DNA proviral
bicatenário que é seguida de integração num cromossoma;
2) micro-injectando directamente o DNA proviral clonado nos embriões.
No primeiro caso, os resultados obtidos diferem completamente segundo o estado de
desenvolvimento do embrião (32 células ou embrião de 8 a 10 dias) (Fig. 174.II.). A análise
da descendência resultante da integração no embrião de 32 células mostra que o DNA
proviral está integrado em algumas células pertencentes a diferentes tecidos e, sobretudo, que
este DNA proviral está intensamente metilado e não expresso. Na descendência derivada da
infecção de embriões mais velhos, o DNA proviral encontra-se em todos os tecidos sob
forma não metilada e muito expresso. Estes resultados sugerem que a metilação do DNA
integrado determina, pelo menos parcialmente, a ausência de expressão do gene. Parece, pois,
evidente que os embriões tardios não possuem mais a capacidade para metilar e, portanto,
suprimir geneticamente, a expressão do DNA proviral.
Numa segunda experiência, o DNA proviral, clonado a partir de células de um dos ratos
da experiência precedente, foi injectado, 1°) nos núcleos de óvulos fertilizados, ou 2°) no
citoplasma destes óvulos. A descendência resultante da micro-injecção no núcleo contém
várias cópias do DNA proviral em todas as células, altamente metiladas e não expressas. A
descendência derivada da micro-injecção no citoplasma, em compensação, contém uma só
cópia de DNA proviral por célula e em todas as células. Além disso, 10 % dos ratos
produzem RNA mensageiro correspondente ao vírus MuLV, localizado em quantidade muito
variável em todos os tecidos. O sítio de integração no cromossoma parece, pois, influenciar a
expressão do DNA viral duma maneira específica de tecido.
Conclusões e resumo
1) É possível introduzir genes por micro-injecção em células somáticas e germinais.
2) O sítio cromossómico no qual se integra o DNA e o grau de metilação deste DNA
influenciam a activação do gene durante o desenvolvimento.
116
A ausência de metilação pode ser correlacionada com a expressão do gene.
3) O grau de expressão do gene integrado é também influenciado pela diferenciação celular
e pode ser específico do tecido.
4) Genes estrangeiros podem ser colocados sob controlo regulatório normal das células
hospedeiras.
g. Expressão em células de insectos
As células de insectos poderão ser uma alternativa às células animais em cultura. Vários
grupos mostraram que vectores derivados de vírus de insectos podem ser utilizados para a
produção notável de substâncias, como interleucinas, interferões, várias proteínas derivadas
dos vírus HIV, da hepatite B, da influenza, etc.
O sistema que têm sido utilizado com sucesso baseia-se na utilização de vectores de
Autographa californica, vírus das poliedroses nucleares (AcMNPV), protótipo da família
Baculoviridae, que possui um largo espectro de hospedeiros, infectando mais de 30 espécies
de lepidópteros, assim como, tricópteros, himenópteros, dípteros e crustáceos.
A. californica, assim como os outros membros do subgrupo A dos baculovírus, formam
oclusões constituídas por proteínas virais, com a configuração de cristais ou corpos oclusivos,
chamados corpos poliedrais ou poliedros, encerrando cada um, um número elevado de
partículas virais. A proteína principal dos poliedros é a poliedrina de MM de 29.000 daltons,
que é produzida intensamente, acumulando-se, por exemplo, nas culturas celulares de
Spodoptera frugiperda, correntemente utilizadas, a níveis elevadíssimos de 1 mg/ml por 1-2
106 células infectadas, representando, pelo menos, 50 % das proteínas da célula detectáveis
em gel de poliacrilamida-SDS. O ciclo de vida do baculovírus está representado na Fig.
175.II.
Os baculovírus são o grupo mais relevante de vírus conhecido que infecta insectos.
Constituem aparentemente o único grupo que possui os artrópodes como único hospedeiro.
Devido a esta especificidade, à sua natureza contagiosa e à sua estabilidade relativa no meio
ambiente, têm um enorme potencial na agricultura como agentes extremamente úteis, seguros
e selectivos de controlo de pestes.
A aplicação mais atraente do baculovírus, enquanto sistema de vector em tecnologia do
DNA recombinante, é o seu potencial para expressar grandes quantidades de produtos de
genes estrangeiros. A poliedrina expressa-se em abundância superior à de qualquer outra
proteína em células de eucariotas infectadas por vírus. Mais de 15 % da massa total de
proteína encontrada em células de larvas infectadas por NPV é constituída por poliedrina.
117
Para além de sequências promotoras fortes, que dão a vantagem aos vectores de
expressão deste vírus de expressar proteínas recombinantes a elevados níveis, comparados
com os sistemas bacterianos, de levedura ou de mamíferos, os baculovírus possuem várias
outras características que os torna interessantes para a clonagem e expressão de DNA
estrangeiros:
1) Não são patogénicos para os vertebrados ou as plantas porque não se replicam nestes
tipos de células, não sendo necessário recorrer a células transformadas ou a elementos
transformantes, como é o caso com os sistemas de expressão das células dos mamíferos.
2) Possuem um espectro de hospedeiros limitado a certos invertebrados.
3) O genoma foi mapeado relativamente a muitas enzimas de restrição e caracterizado
em relação à actividade transcricional.
4) Os vectores do baculovírus utilizam muitos sistemas de modificação, processamento e
transporte de proteínas que ocorrem nas células superiores de eucariotas, que podem ser
essenciais para as funções biológicas completas das proteínas recombinantes. Estas são,
consequentemente, com frequência, antigenicamente, imunologicamente e funcionalmente
semelhantes às suas homólogas autênticas.
5) O invólucro do baculovírus pode empacotar pelo menos dois comprimentos
genómicos, o que sugere que é capaz de inserir famílias de genes, ou um grande número de
genes.
O genoma do AcMNPV consiste num DNA circular, super-enrolado, bicatenário, com
um comprimento de cerca de 128 kilobases. O gene da poliedrina do AcMNPV foi mapeado
e sequenciado. Foi demonstrado que não é essencial para a replicação ou a produção de vírus
extracelular em células em cultura. A eliminação ou a desactivação insercional do gene da
poliedrina leva à produção de vírus de oclusão negativa (Occ-), que formam placas de lise
distintas das formadas pelos vírus selvagem de oclusão positiva (Occ+). Estas morfologias
distintas das placas fornecem um meio de escrutinar visualmente os vírus recombinantes, nos
quais o gene da poliedrina do tipo selvagem AcMVPV foi substituído por um outro gene, ou
por um híbrido.
A natureza não essencial e os elevados níveis de expressão do gene da poliedrina, aliados
à facilidade com a qual os vírus recombinantes Occ- podem ser detectados, tornam o
promotor deste gene particularmente apropriado para a construção dum vector de expressão.
Construção dum vector de transferência do baculovírus
A maioria dos vectores de transferência contém sequências do AcMNPV que incluem o
promotor do gene da poliedrina e várias percentagens do DNA viral, que flanqueia em 5' e
118
em 3' o gene da poliedrina, clonado num plasmídeo bacteriano de número elevado de cópias.
As sequências do gene estrangeiro no plasmídeo recombinante podem ser transferidas para o
AcMNPV por recombinação homóloga, no interior de uma célula transfectada com os DNAs
do plasmídeo e do vírus selvagem.
A Fig. 176.II. esquematiza a sequência de etapas de clonagem de um gene estrangeiro e
o escrutínio de placas recombinantes. Um fragmento apropriado de gene estrangeiro é
inserido num vector de transferência na orientação correcta a jusante do promotor da
poliedrina. Células de insecto (S. furgiperda) em cultura são co-transfectadas com uma
mixtura de DNA viral e de plasmídeo e a progenitura viral é plaqueada. Os recombinantes
virais Occ- são identificados visualmente ou por hibridação com uma sonda da DNA e
purificados a partir da placa, até atingirem a homogeneidade.
O baculovírus recombinante independente de helpers produz uma proteína recombinante
48-72 horas após a infecção, a qual é essencialmente lítica após 4-5 dias.
O vector de transferência mais correntemente utilizado para a introdução de genes
estrangeiros no AcMNPV é o pAC373 (Fig. 177.II.). Deriva dum plasmídeo constituído por
um fragmento EcoRI de 7kb contendo o gene da poliedrina de AcMNPV clonado no
fragmento EcoRI-HindIII de pVC8. Após mutagénese com Bal31 e adição de linkers BamHI
(CGGATCCG), obtém-se o plasmídeo pAC373 que contém a eliminação duma sequência
entre a posição -8 (8 bases a montante do ATG do gene da poliedrina e aproximadamente 40
bases a jusante do sítio de iniciação de transcrição) e os locais naturais BamHI no núcleotídeo
+121.
Uma boa expressão de proteínas estrangeiras não fusionadas requer que os genes
estrangeiros tenham uma sequência condutora curta. Os comprimentos das sequências não
codificantes em 3' e 5' (cuja influência em relação aos níveis de expressão se desconhece) dos
genes expressos em vectores dos baculovírus têm variado de 3 a 400 bases.
Como a sequência condutora da poliedrina é muito rica em AT, recomenda-se,
geralmente, que sequências guias ricas em G-C ou demasiado compridas, sejam truncadas,
tanto quanto possível, antes do gene estrangeiro ser inserido no vector de transferência.
Todos os vectores de transferência têm o sinal de poliadenilação da poliedrina intacto. Bons
níveis de expressão foram obtidos com genes que possuem os seus próprios sítios de
poliadenilação adicionados aos do gene da poliedrina. Todos os genes expressos com níveis
elevados foram derivados de cDNA ou de clones de genomas que não contêm intrões.
Foram construídos vários outros vectores de transferência apropriados para a produção
de proteínas fusionadas ou não fusionadas .
119
Actividade biológica das proteínas recombinantes
As proteínas recombinantes produzidas nas células de insecto, em vectores de
baculovírus, são biologicamente activas e a maioria é processada pós-tradução, produzindo
produtos recombinantes muito semelhantes às proteínas autênticas. As proteínas
recombinantes podem ser segregadas, dirigidas para o núcleo, para a superfície da célula,
associadas em complexos oligoméricos e em dímeros ligados por pontes dissulfureto,
clivadas proteoliticamente, fosforiladas, N-glicosiladas, O-glicosiladas, miristiladas ou
palmitiladas. Estes produtos são antigenicamente, imunologicamente e funcionalmente
semelhantes aos seus análogos naturais.
Todavia, muito está ainda por elucidar acerca da natureza da glicosilação nas células dos
insectos. A capacidade destas células para efectuarem a N-glicosilação implica a adição de
oligossacarídeos do tipo manose pesado. Estudos efectuados com linhagens celulares de
Aedes aegypti e Aedes albopictus (mosquitos), mostraram que os oligossacarídeos ligados à
Asparagina são deficientes em ácido siálico, galactose e fucose. Assim, a conversão de
manose pesado em complexos oligossacarídicos ligados a N parece não se efectuar naquelas
células de insectos. Nas células de mosquitos a ausência de complexos N-glicanos foi
confirmada pelos baixos níveis de N-acetilglucosaminil-, galactosil- e sialitransferases,
responsáveis pela maturação dos manose-N-glicanos pesados das glicoproteínas dos
mamíferos.
Está ainda por elucidar se esta diferença aparente ou potencial na via do processamento
oligossacarídico entre insectos e vertebrados é um factor importante na produção de
glicoproteínas nas células de insectos, ou se diferentes linhagens de células de insectos
apresentam capacidades diferentes para glicosilar proteínas estrangeiras. Alguma
investigação é ainda necessária para elucidar os detalhes moleculares do processamento,
transporte e condução das proteínas recombinantes produzidas por células de insectos.
120
10. ENGENHARIA GENÉTICA DE PLANTAS
O melhoramento genético das espécies vegetais é uma prática milenária, cujos princípios
só começaram a ser racionalizados com Mendel. No entanto, uma intervenção racional no
património genético de plantas, só nestes últimos anos têm sido objecto de experiências
laboratoriais, com um impacto, actualmente, já bastante importante nas aplicações de campo
e com um futuro altamente promissor.
Com efeito, os numerosos métodos desenvolvidos nestes últimos 20 anos, que visam
regenerar plantas a partir de células vegetais em cultura, conjugados com as técnicas de DNA
recombinante, abrem perspectivas novas para o melhoramento de plantas, nomeadamente no
que respeita ao seu conteúdo em aminoácidos essenciais, e à resistência a doenças, a pragas, a
herbicidas e a condições climatéricas.
No âmbito desta disciplina serão abordados unicamente os grandes princípios da
manipulação do DNA vegetal.
Agrobacterium tumefaciens
Agrobacterium tumefaciens é uma bactéria que infecta um certo número de plantas
causando a formação de tumores, sobretudo no colo das dicotiledóneas. A excrescência, ou
galha, que se desenvolve no colo da planta têm o nome corrente inglês de crown gall (galha
do colo). Esta bactéria vive habitualmente no solo e penetra na planta por uma ferida, em
geral durante um Inverno rigoroso, exercendo o seu poder patogénico nos tecidos que
apresentam lesões provocadas pela geada. O crescimento do tumor, em geral, só se termina
com a morte da planta ou do órgão atingido (Fig. 178.II.). As células destes tumores
assemelham-se fortemente às células cancerosas do tipo animal, tendo adquirido a
propriedade de se multiplicarem de maneira independente e incontrolada.
Em cultura, as células crown gall aglomeram-se formando um calo, isto é, uma massa
não organizada e pouco diferenciada de células, mesmo na ausência de fito-hormonas
(auxina, citoquinina) que são indispensáveis à cultura in vitro de células vegetais normais.
Uma das primeiras contribuições importantes da cultura in vitro dos tecidos vegetais foi
a de demonstrar que as células atingidas de crown gall contêm substâncias específicas que
não existem nas células normais: as opinas, derivadas da arginina.
Por um lado, estes compostos nunca se encontram nas plantas sãs, eles são utilizados
pela bactéria como fonte de carbono e de azoto. Por outro, o carácter tumoral das células de
crown gall é permanente, e independente da presença das bactérias que provocaram o
aparecimento do tumor. Na realidade, o agente tumorígeno na bactéria é um plasmídeo, que
121
funciona integrando uma parte do seu DNA nos cromossomas das células vegetais
hospedeiras e que expressa as funções necessárias para a indução e a metabolização das
opinas.
As células da planta invadida por A. tumefaciens são incapazes de utilizar as opinas. Por
consequência, a infecção bacteriana não só induz um tumor na planta, mas ainda desvia o seu
metabolismo para fabricar aminoácidos que só podem ser consumidos pela bactéria.
À descoberta, nas estirpes patogénicas de A. tumefaciens, dum plasmídeo dum
comprimento nunca antes observado noutro organismo (circular, 200 kbases, + 112 108
daltons, 3 a 5 % do cromossoma bacteriano) (Fig. 179.II.), seguiu-se rapidamente a
demonstração de que era ele que conferia o carácter patogénico à bactéria; daí o seu nome Ti,
indutor de tumor (tumor inducing).
Existem essencialmente dois tipos de plasmídeos Ti, caracterizados pela natureza da
opina que induzem: plasmídeo octopina e plasmídeo nopalina. A bactéria A. tumefaciens só
pode conter um tipo de plasmídeo Ti.
A sequência em bases do DNA dos plasmídeos Ti é pouco conservada, com excepção de
quatro regiões de elevada homologia, das quais uma, como foi demonstrado, se integra no
genoma das células de crown gall. Ela corresponde a um fragmento de Ti, chamado T-DNA
(DNA transferido). É este T-DNA que, integrado no genoma da célula vegetal, confere à
célula, ao expressar-se, o carácter tumoral e a propriedade de sintetizar opinas.
Várias funções foram identificadas e estudadas no plasmídeo Ti. A função Vir de
virulência, responsável pela transferência do T-DNA para a célula vegetal, a função
oncogénica, Onc, responsável pela proliferação tumoral, a função ou as funções que
especificam a síntese das opinas, Ops, e as funções catabólicas (Opc: opine catabolism) que
conferem à estirpe bacteriana a possibilidade de degradar as opinas produzidas pelo tumor.
Convém distinguir bem dois tipos de funções: as funções situadas fora do T-DNA (Vir,
Opc, etc.), que se expressam na bactéria e não são propriamente patogénicas, e as funções
contidas no T-DNA, que se expressam na célula vegetal depois da transferência deste
fragmento (Onc, Ops) (Fig. 180.II.).
A bactéria, em si, não têm efeito patogénico, não secreta toxinas, nem enzimas que
dissolvam as paredes celulares, como outras bactérias fitopatogénicas. A sua acção limita-se
à transferência de um fragmento de DNA, o T-DNA, cuja expressão na célula vegetal é
responsável pela doença. A eliminação, no plasmídeo Ti do segmento correspondente à
função Onc, ou a desactivação, por mutação, dos seus genes, torna a bactéria que o contém
perfeitamente inofensiva, sem no entanto suprimir a propriedade de poder transferir o DNA
para uma célula de planta.
122
Assim que se transfere para a célula vegetal o T-DNA expressa a suas funções. A função
oncogénica (Onc) é responsável pela proliferação celular que conduz ao desenvolvimento do
tumor. Esta proliferação é a consequência da síntese de auxina e de citoquinina, dois factores
fito-hormonais que são em geral necessários para a multiplicação e a diferenciação das
células vegetais. Aqui se encontra a explicação do facto de as células crown gall em cultura
não terem necessidade de fito-hormonas no meio. Estas hormonas determinam, uma, o
aparecimento dos rebentos e, a outra, a formação das raízes. Nas células normais, o equilíbrio
entre auxinas e citoquininas controla a via de diferenciação. Nas células de crown gall estas
duas hormonas são produzidas em grande excesso, mantendo as células num estado
indiferenciado.
As funções Ops estão implicadas na síntese das opinas; não são patogénicas, visto que o
tumor se desenvolve perfeitamente quando elas são desactivadas por mutação e, por outro
lado, a sua expressão na ausência da função Onc é perfeitamente compatível com o
desenvolvimento normal das células ou das plantas que as comportam.
O significado biológico da correlação entre a síntese de opinas nos tumores e a sua
degradação pelas bactérias é fornecido pelo carácter parasitário da bactéria, que realiza uma
manipulação genética natural para criar o seu nicho ecológico, fazendo a planta produzir
substâncias que lhe servem de alimento. De facto, a síntese das opinas constitui um desvio
duma parte da actividade fotossintética da planta em proveito da bactéria (Fig. 181.II.).
O plasmídeo Ti como vector
O processamento e a transferência do T-DNA são mediados por um sistema bacteriano,
que reconhece as sequências flanqueantes de T-DNA, de 23 pb cada. É a região
compreendida entre estes limites que é transferida e se integra no genoma da planta. Foi
demonstrado que nenhum dos genes do T-DNA é necessário para o desenrolar deste processo
e que qualquer gene estrangeiro colocado entre aquelas sequências é transferido com o T-
DNA para a célula vegetal.
Para fazer funcionar, numa célula vegetal, um gene estrangeiro introduzido pelo T-DNA
e pôr em evidência a sua expressão, foi efectuada uma primeira experiência fazendo intervir
o crown gall de tabaco e um gene bacteriano (de E. coli) que confere resistência ao
antibiótico cloranfenicol. Para obter a transcrição do gene na célula do tabaco, o promotor de
E. coli foi substituído por um promotor reconhecido pela polimerase do tabaco, neste caso, o
do gene da nopalina sintetase, proveniente do T-DNA de A. tumefaciens. O gene quimérico
introduzido no plasmídeo Ti expressa, após inoculação duma estirpe de Agrobacterium em
plântulas de tabaco, a actividade de cloranfenicol transacetilase em extractos dos tumores
123
formados. Esta experiência demonstrou, pela primeira vez, que a expressão dum gene
estrangeiro numa célula vegetal era possível.
Neste exemplo, as células transformadas eram tumorais e eram incapazes de regenerar
um indivíduo inteiro. A experiência fundamental seguinte utiliza um T-DNA "desarmado"
dos genes tumorais, para veicular um gene de resistência à canamicina (Fig. 182.II.). O gene
quimérico foi construído associando in vitro a sequência que codifica para a neomicina
fosfotransferase (NPT), que confere a resistência à canamicina, uma sequência promotora e
uma sequência terminadora do gene da nopalina sintetase (NoS) do T-DNA de A.
tumefaciens. O gene assim construído foi introduzido no plasmídeo Ti desarmado das
funções Onc, o qual foi por sua vez integrado em A. tumefaciens. A bactéria é, em seguida,
levada a infectar protoplastas de tabaco (é, geralmente, mais prático infectar células vegetais
em cultura que induzir tumores numa planta inteira). O método consiste em converter células
derivadas de folhas de plantas em protoplastas, (células destituídas de membrana) que são
infectados com A. tumefaciens portador do plasmídeo Ti recombinante e que, em cultura,
regeneram a parede celular e se dividem. Após algumas horas, as bactérias de A. tumefaciens
são mortas adicionando um antibiótico e as células, depois de algumas semanas de cultura em
meio contendo fito-hormonas, formam amontoados celulares, ou calos. Neste momento, o
meio de cultura é substituído por um meio sem hormonas, em presença de um agente
selectivo que permita seleccionar as células que receberam o plasmídeo Ti. Estas sobrevivem,
multiplicam-se e sintetizam opinas. Em certos casos regeneram espontaneamente rebentos e
plantas inteiras.
Algumas devem ser resistentes à canamicina; sendo férteis, a transmissão do carácter de
resistência à descendência pode ser estudada, semeando as sementes resultantes duma auto-
fecundação, num meio contendo canamicina. A observação do comportamento selectivo é
particularmente simples porque a canamicina interfere com o desenvolvimento dos
cloroplastas (lugar de fotossíntese). As plântulas sensíveis aos antibióticos permanecem
brancas. As plantas resistentes possuem a NPT que desactiva a canamicina e assegura o
funcionamento do sistema cloroplástico, apresentam uma cor verde e continuam a
desenvolver-se, enquanto que as plântulas brancas, incapazes de efectuar a fotossíntese,
morrerão. Cerca de um quarto das plântulas não possui o gene de resistência. Esta é a
proporção esperada para a segregação dum gene qualquer segundo as leis de Mendel. O gene
introduzido comporta-se como os próprios genes de planta, fazendo parte do seu património
genético.
O plasmídeo Ti possui duas características ideais para promover a introdução de DNA
heterólogo em células de plantas.
124
1°) A. tumefaciens pode infectar praticamente todas as plantas dicotiledóneas e em
certas condições monocotiledóneas, tais como o trigo e o milho.
2°) O T-DNA integrado nos cromossomas de plantas transmite-se de maneira
mendeliana. Os genes contidos no T-DNA são, ainda, portadores dos seus próprios
promotores aos quais se podem associar genes estrangeiros e que podem dirigir a expressão
destes.
A maneira mais simples de introduzir o T-DNA nas células vegetais consiste em infectá-
las com A. tumefaciens portador do plasmídeo apropriado e deixar agir a natureza. Bastaria,
como vimos, inserir os genes de interesse na região T do plasmídeo Ti. No entanto, isto não é
muito cómodo, devido ao tamanho enorme deste plasmídeo. Com a descoberta da
propriedade, que possuem as funções de virulência, de agir à distância, foram desenvolvidos
sistemas binários de transferência de genes que, como o nome indica, fazem intervir dois
plasmídeos. Um dos plasmídeos é o Ti sem T-DNA. O outro é um pequeno plasmídeo que
serve de vector aos genes a introduzir. Este segundo plasmídeo têm, além disso, a
propriedade de se poder multiplicar, tanto em E. coli, como em A. tumefaciens. Esta
propriedade, assim como a seu tamanho relativamente pequeno, simplifica
consideravelmente as manipulações para a realização de construções de genes a introduzir
nas plantas.
A abordagem utilizada está representada na Fig. 183.II. O T-DNA é primeiramente
excisado do plasmídeo Ti por digestão com enzimas de restrição e, em seguida, é introduzido
num vector de procariota, como o pBR322. O T-DNA clonado pode assim ser amplificado e
isolado. Na etapa seguinte, um gene dado é inserido no T-DNA, sem afectar as funções
essenciais deste DNA. O híbrido é, em seguida, introduzido nas bactérias de A. tumefaciens
contendo o plasmídeo Ti intacto. Por recombinação genética homóloga entre o T-DNA
híbrido e o T-DNA do plasmídeo Ti, obtêm-se plasmídeos Ti completos portadores do T-
DNA híbrido. Alternativamente, basta fornecer um Ti contendo unicamente a região vir, para
assegurar a transformação das plantas; neste caso, deixa de haver recombinação homóloga
mas existe somente complementação de função.
Também é possível transformar protoplastas vegetais com o DNA do plasmídeo Ti
recombinante; este método é, no entanto, muito menos eficaz que o precedente, mas mostra
que a bactéria A. tumefaciens não é essencial para a transformação e o seu papel é só de
facilitar a introdução do plasmídeo Ti nas células.
A regeneração de plantas inteiras e férteis, a partir de células tumorais, não é, como
vimos, geralmente, possível se se utilizar o plasmídeo Ti intacto. No entanto, certos mutantes
Ti contêm eliminações na região T, que suprimem a capacidade para formar tumores mas
125
mantêm a síntese de opinas. As células vegetais transformadas por este plasmídeo Ti mutante
comportam-se, em cultura, como células normais e podem ser regeneradas em plantas férteis.
A título de exemplo, a Fig. 184.II. descreve um sistema de vectores correntemente
utilizado que consiste, por um lado, num vector vaivém do tipo pBR322 e por outro lado,
num vector Ti aceitador não oncogénico. Este vector é excisado dos genes que impedem a
diferenciação das células transformadas (funções responsáveis, como vimos, pela síntese de
fito-hormonas). Os genes removidos do T-DNA são substituídos pelo plasmídeo pBR322. A
extremidade direita do T-DNA residual codifica a enzima nopalina sintetase. Esta actividade
enzimática serve de marcador para a selecção das células transformadas.
O gene heterólogo que se pretende introduzir na planta é, primeiro, clonado no vector
vaivém derivado do pBR322 e, em seguida, inserido no plasmídeo Ti onc-, aceitador, por
recombinação homóloga. Um simples crossing-over conduz à co-integração do vector
vaivém no Ti onc-, entre as regiões flanqueantes do T-DNA. Se um marcador de selecção
apropriado (resistência a um antibiótico) for utilizado no vector vaivém, poder-se-á
seleccionar para este acontecimento de recombinação em A. tumefaciens (pBR322 não se
replica em A. tumefaciens).
Pode-se, por exemplo, introduzir no vector vaivém, o promotor vegetal (NOS) associado
a um gene de resistência à canamicina, nas plantas, seguido das regiões (NOS) que codificam
para o splicing e a poliadenilação dos mensageiros. Por consequência, esta unidade de
transcrição funcionará na planta e permitirá seleccionar para a resistência à canamicina, i. é.,
para os transformantes.
Expressão controlada pela luz e específica de órgão, dum gene de trigo em plantas de tabaco
A transformação das monocotiledóneas com A. tumefaciens não é corrente.
Aparentemente, o processo de transformação pelo plasmídeo Ti falha ao nível do colo. Ora,
uma grande parte dos vegetais de consumo corrente pertencem à família das
monocotiledóneas, tais como os cereais milho, trigo, arroz. É, no entanto, possível expressar
e controlar normalmente genes de monocotiledóneas em plantas dicotiledóneas. A introdução
do gene de trigo que codifica para uma proteína do complexo de assimilação da luz (cab) no
genoma do tabaco, pelo sistema Ti, e a regeneração de plantas inteiras, é um exemplo.
Na primeira etapa, deriva-se do genoma de trigo o DNA genómico que codifica para a
proteína Cab e clona-se num vector vaivém, do tipo pBR322, contendo um sistema de
selecção para procariotas (SpcR / StrR), um sistema de selecção para células vegetais
(NOS/NPTII) (resistência à canamicina), uma região de homologia com o plasmídeo Ti e a
região do T-DNA (Fig. 185.II). Este plasmídeo recombinante é, em seguida, mobilizado na
126
bactéria A. tumefaciens "desarmada", i. é., contendo um Ti Onc-. Os protoplastas de tabaco são
transformados e as células resistentes à canamicina seleccionadas. Após a obtenção de calos,
as plantas completas são regeneradas em condições apropriadas. Pode-se em, seguida,
verificar que o gene cab, integrado nas plantas transgénicas, é expresso e controlado pela luz
de maneira idêntica à da planta de origem. Para isso, expõem-se as plantas transgénicas a
períodos variáveis de iluminação ou de obscuridade, em seguida, extrai-se o RNA
mensageiro das folhas e doseia-se por hibridação com um fragmento de DNA radioactivo
(Northern blotting), derivado do gene cab. Os resultados mostram que o gene cab do trigo se
expressa, pois o RNA mensageiro é detectado correctamente transcrito, processado e
poliadenilado. Além disso, a percentagem do mensageiro cab é claramente função do tempo
de exposição à luz; decresce quando as plantas permanecem na obscuridade e aumenta
quando são iluminadas.
Constata-se, por outro lado, que a síntese do produto codificado pelo gene cab nas
plantas transgénicas é especifico de órgão; encontra-se uma grande quantidade de
mensageiros nas folhas e praticamente nenhum nos caules, raízes e pétalas (Fig. 186.II.).
Estes resultados mostram que o gene cab do trigo é transcrito correctamente e se
expressa selectivamente nas plantas transgénicas e que, portanto, o sistema de transcrição
nuclear das dicotiledóneas reconhece as regiões reguladoras do gene cab derivado duma
monocotiledónea.
Para que este tipo de manipulação apresente um interesse agronómico é preciso
identificar, isolar e clonar genes susceptíveis de melhorar plantas cultivadas. Se os caracteres
tiverem uma base genética complicada isto pode constituir uma tarefa difícil. O rendimento
de produção ou a resistência duma planta ao frio, por exemplo, são provavelmente caracteres
governados por numerosos genes que não serão, sem dúvida, durante bastante tempo, objecto
de manipulações. Em compensação, quando se trata dum gene microbiano ou mesmo dum
gene vegetal, cujo produto (uma enzima ou uma proteína de estrutura) é conhecido e, de
preferência, abundante ou fácil de purificar, o objectivo é mais fácil de atingir: o gene pode
ser isolado, a sua sequência determinada, pode ser manipulado in vitro, sinais apropriados de
expressão podem ser-lhe associados e a introdução numa planta, efectuada nas condições
definidas acima.
Plantas transgénicas
a) Resistência a herbicidas
O milho é naturalmente resistente a uma família de herbicidas, as triazinas. As condições
de produção deste cereal foram altamente melhoradas pela possibilidade de utilizar estes
herbicidas para matar as ervas daninhas nos milheirais. A resistência do milho às triazinas é o
127
resultado duma desintoxicação enzimática da molécula herbicida. O gene responsável por
esta desintoxicação foi recentemente clonado e é de prever que seja introduzido noutras
plantas que, como o soja, estão frequentemente associadas ao milho no afolhamento.
O estudo e a utilização de genes quiméricos que conferem resistência aos herbicidas, são
objecto de importantes projectos industriais. Um dos resultados mais espectaculares foi
obtido pela introdução no tabaco, na batata, no tomate, no colza, na beterraba, por exemplo,
de um gene de resistência a um herbicida não selectivo correntemente utilizado, a
fosfinotricina. O gene que confere a resistência a este herbicida foi isolado a partir de
Streptomyces hygroscopicus. Ele codifica para a fosfinotricina acetiltransferase que acetila os
grupos NH2 livres da fosfinotricina e, consequentemente, impede naturalmente a auto-
toxicidade da fosfinotricina em Streptomyces. As plantas transgénicas sintetizam a enzima
codificada pelo gene transferido e suportam o herbicida pulverizado em doses dez vezes
superiores às normalmente utilizadas na agricultura. As plantas assim manipuladas
transmitem à descendência o gene nelas expresso (Fig. 187.II.C).
As consequências agro-económicas derivadas deste género de manipulação são fáceis de
imaginar. As previsões são, aliás, pouco ecológicas, se elas se traduzirem unicamente pela
generalização da utilização de herbicidas. Em compensação, as perspectivas parecem mais
favoráveis na luta contra insectos nocivos ou contra vírus, fungos ou bactérias.
b) Resistência a insectos
Preparações comerciais de esporos da bactéria Bacillus thuringiensis têm desempenhado
um papel importante no controlo biológico de insectos nos campos. Elas associam uma
elevada toxicidade para com os insectos e uma segurança biológica em relação ao meio
ambiente. B. thuringiensis não afecta todos os insectos e é completamente não tóxico para os
vertebrados. As inclusões cristalinas produzidas durante a esporulação contêm proteínas
insecticidas que afectam o epitélio do tracto intestinal de certos insectos, nomeadamente as
larvas dos lepidópteros. Os cristais dissolvem-se nas condições alcalinas do tracto intestinal
do insecto e libertam proteínas que são processadas proteoliticamente pelas proteases do
insecto, produzindo fragmentos polipeptídicos tóxicos, de massa molecular compreendida
entre 65.000 e 160.000 daltons.
O gene bt2 de B. thuringiensis codifica uma proteína Bt2, que é uma toxina potente para
as larvas de vários lepidópteros, tais como Manducta sexta, que é uma praga da planta do
tabaco. Bt2 é uma protoxina que gera um polipéptido de menor tamanho (60.000), que
conserva ainda uma plena actividade tóxica.
Nas experiências de transformação da planta do tabaco foram utilizados vários genes
quiméricos contendo a sequência completa de bt2, assim como genes excisados.
128
As construções no T-DNA incluem, para além das sequências de bt2, o gene da
neomicina fosfotransferase (neo), marcador de selecção de resistência à canamicina (NPTII),
um promotor constitutivo do gene 2, que dirige a expressão da manopina sintetase no TR
DNA do plasmídeo pTiA6 (Fig. 188.II.) e sinais de terminação e de poliadenilação da
extremidade 3' do gene.
Os plasmídeos resultantes destas construções no T-DNA dos vectores de expressão em
plantas, pGSH160 ou pGSH150 (Fig. 189.II), foram mobilizados em A. tumefaciens, receptor
que contém um plasmídeo Ti octopina (pGV2260), do qual a região T-DNA foi excisada e
substituída por pBR322. Recombinações entre o pGV2260 e o vector de expressão, através
das sequências homólogas de pBR322, produziram plasmídeos Ti contendo as várias
construções incluindo o gene bt2 e seus derivados excisados (Fig. 190.II.).
As plantas de tabaco transgénicas foram obtidas por infecção de discos de folhas de
Nicotiana tabacum. Rebentos resistentes à canamicina foram seleccionados em todas as
experiências de transformação, indicando que os genes fusionados conferem, com efeito,
actividade NPTII às células das plantas transformadas.
As plantas transformadas foram cultivadas individualmente e controladas,
subsequentemente, em relação à resistência à canamicina, testando a sua capacidade para
produzirem calos a partir de discos de folhas em concentrações crescentes de canamicina.
As folhas das plantas transgénicas, que contêm os vários tipos de construção do gene de
B. thuringiensis, foram dadas como alimento às larvas de M. sexta, a fim de avaliar se os
níveis de toxina expressos na planta tinham efeitos insecticidas. Observou-se 75-100 % de
mortalidade das larvas, num quarto das plantas que expressavam a proteína fusionada Bt-
NPT23 mais longa e em dois terços das que expressam a fusão menor Bt-NPT860 (Fig.
190.II). A toxicidade para com os insectos está directamente correlacionada com o nível de
resistência à canamicina. Constatou-se, ainda, que só os genes bt2 incompletos expressam
níveis de proteína fortemente insecticidas nas plantas transgénicas de tabaco, sendo a fusão
de menor comprimento a que produz os maiores níveis de proteína biologicamente activa.
Os resultados de experiências visando a determinação da real eficácia de protecção
contra os estragos causados pelos insectos estão exemplificados nas Fig. 187.II.A e B e
191.II. Eles mostram que é possível proteger plantas transgénicas programadas para
produzirem toxinas contra pragas de origem larvar.
Para verificar se esta propriedade é hereditária a descendência F1 destas plantas
transgénicas foi testada, tanto em relação à resistência à canamicina, como à toxicidade para
com as larvas de M. sexta. A actividade insecticida revelou-se idêntica à observada nas
plantas parentais, confirmando o carácter hereditário da protecção.
129
O exemplo da construção de plantas de tabaco resistentes às larvas de M. sexta, descrito
com certo pormenor, ilustra as potencialidades ofertas pelas manipulações genéticas das
plantas. Outros estudos sobre a protecção contra doenças fúngicas, bacterianas ou virais têm
sido desenvolvidos. Assim, por exemplo, resultados obtidos com o vírus do mosaico do
tomate, o vírus do mosaico da luzerna, o vírus do mosaico do pepino ou o PVX de batata
mostram que, quando um gene codificando uma proteína da cápsula do vírus se expressa nas
plantas transgénicas, estas adquirem uma protecção considerável contra a infecção viral.
c) Resistência a vírus
O princípio de protecção viral de plantas através da inoculação de estirpes atenuadas de
vírus ou de viróides, a fim de impedir a infecção por estirpes mais virulentas, é conhecido dos
agricultores, que o têm aplicado desde há muito tempo. É uma prática que foi utilizada para
reduzir os prejuízos provocados em culturas de tomates, de batatas ou em citrinos, por
exemplo e causados pelos vírus do mosaico do tomate (TMV), pelo viróide fusiforme do
tubérculo e o vírus da tristeza dos citrinos.
Esta prática, denominada protecção cruzada, têm vários inconvenientes e insuficiências,
tais como o risco de mutação da estirpe atenuada numa estirpe mais virulenta, ou o
desenvolvimento duma condição patogénica derivada de uma eventual sinergia entre a estirpe
atenuada do vírus e um outro vírus presente na cultura, que tenha características mais severas
que a causada por cada um dos vírus ou, ainda, o risco de o vírus protector duma planta poder
ser um patógeno severo para outra. A estirpe protectora pode ainda causar um prejuízo
significativo, mesmo reduzido.
Fazer expressar na planta o princípio activo da protecção, inscrito definitivamente no seu
genoma e, consequentemente transmissível hereditariamente, resolveria os problemas
inerentes à protecção cruzada, com a vantagem suplementar de propagar definitivamente às
gerações futuras as características protectoras.
O desenvolvimento da engenharia genética aplicada às plantas permitiu realizar
progressos notáveis, também nesta área. Foi, com efeito, demonstrado que a expressão
constitutiva, numa planta transformada geneticamente, da proteína do invólucro dum vírus,
ou proteína capsídica (CP), assegura a imunização da planta contra a infecção por esse vírus.
Este fenómeno, ainda mal compreendido, parece ser geral e foi posto em evidência em várias
espécies vegetais, tais como a planta do tabaco, a luzerna, o pepino, a batata.
Analisemos em mais detalhe um exemplo de transformação duma variedade de batata
(Russet Burbank), que confere à planta transgénica resultante a resistência dupla aos vírus
PVX e PVY. Estes vírus causam baixas importantes de rendimento de produção da batata,
que podem atingir 80 %, sobretudo o PVY.
130
O PVY possui um RNA único de cerca de 10.000 nucleotídeos de comprimento. Possui
uma pequena proteína (Vpg) ligada covalentemente à sua extremidade 5' e a extremidade 3' é
poliadenilada. O genoma expressa-se na forma de precursor de poli-proteína que é
processada pós-tradução em proteínas singulares. A proteína CP do invólucro é gerada por
clivagem da poli-proteína por uma protease viral. Ao contrário do PVX, que só se transmite
mecanicamente, o PVY é transmitido também por afídeos.
O PVX possui um RNA monocatenário único, de 6.4 kbases, com estrutura chapéu em
5', uma sequência poli A em 3' e cinco fases abertas de leitura. A sua sequência nucleotídica
era conhecida antes da do PVY. Esta foi determinada a partir do cDNA obtido num banco
construído em λgt10, preparado utilizando um iniciador oligo T e escrutinado com um
oligonucleotídeo sintético degenerado. A sequência desta sonda foi deduzida da sequência
dos aminoácidos N-terminais da proteína do invólucro. Os clones de cDNA identificados
com esta sonda foram sub-clonados no mp19 e as suas sequências nucleotídicas
determinadas.
A sequência do RNA da proteína CP de PVY constituída por 801 nucleotídeos é
traduzida em 267 aminoácidos que constituem a proteína. Para expressar o cDNA da CP do
PVY nas plantas transgénicas, a sequência codificante foi alterada por mutagénese dirigida a
fim de criar uma sequência de começo de tradução, no início da sequência codificante, e um
sítio de restrição para clonar o cDNA em vectores de expressão de plantas. Um sítio NcoI foi
criado a montante do codão do aminoácido N-terminal, alanina e um sítio BglII foi
introduzido 11 pares de bases a montante do sítio NcoI (Fig. 192.II.). A criação dum sítio
NcoI introduz um codão de metionina na extremidade N da CP de PVY. O DNA
mutagenizado, comportando 326 pb da sequência não traduzida em 3', foi inserido no vector
pMON906, entre a sequência estimulada do promotor 35S do CaMV (vírus do mosaico da
couve-flor) e a sequência 3' terminal E9 do gene da RuBP carboxilase (pequena subunidade
da ribulose-1,5-bifosfato carboxilase de ervilha -rbcS), dando origem ao vector pMON9892.
A sequência estimulada do promotor 35S do CaMV é uma construção obtida por duplicação
de 250 pb a montante do promotor, as quais actuam como sequências estimuladoras
(enhancers), aumentando de 10 vezes a actividade da transcrição natural do promotor.
A sequência que codifica para a CP do PVX situa-se na região 3' do genoma que é
traduzida, in vivo, a partir dum RNA sub-genómico. A sequência nucleotídica deste gene
comporta 711 pares de bases e codifica para uma proteína de 237 aminoácidos. Para construir
o vector pMON9898 que contém as sequências codificantes da CP de ambos os vírus, o gene
da proteína do invólucro de PVX foi removido do vector 9809 e ligado no pMON893 que é
um derivado do pMON200, que contém a extremidade 3' da proteína de reserva 7S do soja e
é desprovido do gene da nopalina sintetase. Um fragmento HindIII de DNA, que contém o
131
promotor estimulado 35S do CaMV, o gene da CP do PVY e a extremidade 3' da rbcS E9, foi
excisado de pMON9892 e ligado ao pMON9896. O vector resultante, pMON9898, foi
utilizado para transformar a batata Russet Burbank, recorrendo a um sistema de
transformação mediado por A. tumefaciens cujo princípio descrevemos acima.
A Fig. 193.II. mostra os resultados das análises, por Northern blotting, dos transcritos de
PVX e de PVY obtidos por purificação do RNA total extraído de folhas de plantas
transgénicas e a Fig. 194.II., as análises, por Western blotting, da expressão das CP de PVX e
de PVY separadas da mistura de proteínas extraídas das folhas das mesmas plantas. Os níveis
de expressão das proteínas de invólucro de PVX e de PVY situam-se entre 0.05-0.2 % e 0.01-
0.05 % do total das proteínas das folhas, respectivamente.
Estas proteínas exogénicas asseguram a protecção das plantas transgénicas contra as
infecções por PVX e por PVY. Foi, com efeito, demonstrado em experiências de challenge
nas quais, concentrações crescentes de vírus foram inoculadas em folhas de batata, que as
plantas transgénicas possuem uma excelente resistência à infecção (Fig. 195.II).
No entanto, a maior parte das linhagens transgénicas é sensível à infecção simultânea
pelos dois vírus, o que confirma observações anteriores de que a infecção mista da batata, por
PVX e PVY, causa um acréscimo sinergético da severidade da doença. Só uma linhagem se
revelou resistente à infecção simultânea pelos dois tipos de vírus, tanto por via mecânica,
como por intermédio de afídeos. Não parece existir correlação entre o nível de expressão das
proteínas do invólucro e a capacidade de resistência. Esta observação sugere que factores,
tais como expressão específica de um tipo de tecido ou de célula, ou a localização sub-celular
da CP, podem ser importantes para determinar o nível de resistência.
Como foi demonstrado com outros exemplos, que as características de resistência viral
são herdadas de maneira estável através de várias gerações, esta abordagem poderá ter um
desenvolvimento geral importante na construção de plantas transgénicas resistentes a vírus.
Qual é o princípio que preside a este fenómeno de resistência concedida pela expressão
nos tecidos das plantas, da proteína do invólucro viral?. Uma das hipóteses avançada para
explicar a protecção mediada pela CP afirma que o despojamento do invólucro do vírus é
impedido pela proteína do invólucro. Algumas observações, demonstrando a perda da
resistência à infecção por inoculação do RNA viral, são compatíveis com este mecanismo
mas não excluem outras hipóteses, tais como o impedimento pela CP da penetração do vírus,
ou a possibilidade de que, o impedimento do vírus perder o invólucro diminua a sua
capacidade de disseminação de célula em célula, no caso da deslocação se fazer na forma de
virião.
132
Observações feitas com outros tipos de vírus levaram no entanto a resultados opostos,
tendo sido posta em evidência a protecção contra a infecção pelo RNA. Pode-se, neste caso,
fazer a suposição de que a CP se liga ao RNA do vírus impedindo a tradução da replicase ou
interferindo com a replicação. É, pois, provável, que os mecanismos de protecção variem
com o tipo de vírus.
d) Produtoras de péptidos
Um dos resultados mais espectaculares obtidos com a construção de plantas transgénicas
demonstra a possibilidade de fazer produzir péptídos de aplicação farmacêutica por sementes.
A experiência diz respeito ao neuropéptido Leu-encefalina, pentapéptido de sequência
TyrGlyGlyPheLeu, detentor de actividade opiácea. A estratégia adoptada consiste em
substituir uma parte do gene da proteína de reserva albumina 2S de Arabidopsis thaliana,
pelos codões correspondentes à Leu-encefalina, numa região menos conservada entre as
diferentes espécies, a fim de tirar partido da presença abundante das albuminas 2S (de 20 % a
60 % do total das proteínas de sementes em várias espécies), para explorar a possibilidade de
produzir quantidades grandes de péptidos na forma de proteínas quiméricas de reserva de
plantas.
A região escolhida de inserção na albumina 2S é bastante variável em comprimento e
sequência, portanto, pouco susceptível de afectar a estrutura secundária e a estabilidade da
proteína. A substituição foi realizada de maneira a fazer corresponder os resíduos 35-41 da
proteína resultante à encefalina flanqueada por resíduos lisina, necessários para realizar a
clivagem do péptido do restante da albumina 2S.
A construção do gene híbrido foi efectuada substituindo parte do gene da 2S, clonado
num plasmídeo, por mutagénese dirigida utilizando um oligonucleotídeo sintético. A
construção final do gene quimérico no vector T-DNA, utilizado para transformar a planta,
compreende, nomeadamente, o gene quimérico, os genes neo e hph, marcadores de selecção
de resistência à canamicina e à higromicina, as extremidades 3' do gene da octopina sintetase
e do gene 7 do T-DNA, o promotor bi-direccional, PTR, do T-DNA (Fig. 196.II.). O
plasmídeo pGSATE1, construído, foi mobilizado em A. tumefaciens e as plantas transgénicas
Arabidopsis foram obtidas por infecção em disco de folha e selecção, subsequente, com
canamicina. As sementes obtidas a partir das plantas regeneradas foram germinadas em
presença de canamicina. A proteína foi extraída a partir das sementes provenientes desta
segunda geração, purificada e tratada enzimaticamente para extrair a Leu-encefalina. O
rendimento obtido com este exemplo é de 200 nmol/g de semente.
133
As plantas monocotiledóneas
Até há pouco tempo pensava-se que só a classe das dicotiledóneas podia ser
transformada por A. tumefaciens, sendo as monocotiledóneas resistentes ao crown gall.
Mostrou-se, no entanto, que esta limitação não é absoluta, pois certas monocotiledóneas, como
o espargo ou o narciso, são permeáveis à transformação por A. tumefaciens. No que respeita
aos cereais, começou a poder-se realizar transformações sem recorrer a A. tumefaciens,
adicionando o DNA não integrado num organismo ao meio de cultura de protoplastas de
cereais. Células transformadas em cultura, resistentes à canamicina, podem ser assim obtidas.
O método utilizado, ao começo, com as dicotiledóneas, consiste em fazer penetrar o DNA
purificado nos protoplastas. Diferentes técnicas têm sido utilizadas, entre as quais a
electroporação parece particularmente eficaz.
O princípio consiste em submeter os protoplastas a uma forte descarga eléctrica de curta
duração, que cria na membrana poros minúsculos, pelos quais o DNA pode penetrar. Para
além da electroporação, outros métodos, que não são limitados pela espécie vegetal, e que
podem ser utilizados com tecidos de plantas de raízes, caules ou folhas, são por exemplo a
micro-injecção, o bombardeamento com microprojécteis e a precipitação com o fosfato de
cálcio.
Por outro lado, o número de espécies susceptíveis de serem regeneradas com sucesso, a
partir de células em cultura, aumenta constantemente graças aos progressos da cultura in
vitro. Ao mesmo tempo desenvolvem-se as técnicas que permitem transformar, tanto células
sexuais, como os tecidos embrionários que são normalmente programados para regenerar um
indivíduo completo.
Em paralelo com as aplicações de finalidades mais imediatas, a investigação
fundamental continua a desenvolver-se, tendo por objectivo a compreensão dos mecanismos
que regulam a expressão dos genes. Estes mecanismos, ainda pouco conhecidos, controlam
propriedades importantes, como a síntese de um pigmento, a de uma proteína de reserva na
semente, ou o desenvolvimento dos tecidos ou dos órgãos.
É evidente que, compreender estes mecanismos significa adquirir os meios para
manipular as propriedades que deles emanam.
134
11. O DNA RECOMBINANTE E O DIAGNÓSTICO EM MEDICINA
A tecnologia do DNA recombinante têm também aplicações importantes no campo do
diagnóstico. O princípio geral que preside a esta nova metodologia do diagnóstico é a
detecção de sequências, de fragmentos de DNA resultantes de rearranjos ou de mutações, de
uma maneira geral (inserções, substituições ou eliminações), responsáveis por anomalias
genéticas, ou a detecção, em tecidos ou em fluídos biológicos, de sequências típicas do
genoma de organismos infecciosos de origem viral, bacteriana, fungal ou de parasitas.
Existem pelo menos três categorias de alterações genéticas: cromossómicas,
monogénicas e multifactoriais.
a. ALTERAÇÕES CROMOSSÓMICAS
A maioria dos defeitos cromossómicos é incompatível com a vida, asserção que é
confirmada pela observação da correlação, que excede 50 %, entre a frequência deste tipo de
anomalias e o número de abortos espontâneos ocorridos no primeiro trimestre da gravidez.
Alguns tipos de defeitos cromossómicos menos deletérios, são caracterizados por
aberrações numéricas dos autossomas ou dos cromossomas sexuais e resultam de falhas de
disjunção durante a divisão meiótica. Pertencem a esta categoria de anomalias a síndrome de
Down (trisomia 21), a síndrome de Klinefelter (47, XXY) e a síndrome de Turner (45, XO).
Os pacientes com o cariótipo XXY são fenotipicamente machos, apresentando digénese
testicular e infertilidade. Os indivíduos com o cariótipo XO são fêmeas estéreis deficientes no
seu desenvolvimento sexual secundário.
Uma outra forma de anomalias cromossómicas observadas em certas doenças são as
translocações: durante o fenómeno natural de translocação recíproca, os segmentos de dois
cromossomas diferentes permutam. Bastante frequente no homem, este fenómeno manifesta-
se por uma percentagem elevada de abortos e anomalias congénitas. Foram registadas mais
de 300 translocações recíprocas no homem e as células dos indivíduos afectados existem em
colecção. Várias leucémias e linfomas estão associados a este género de ocorrência. Um
exemplo é a leucémia mielogénica crónica, resultante da translocação do braço comprido do
cromossoma 22 para o braço comprido do cromossoma 9. Esta anomalia estrutural é
conhecida por cromossoma de Filadélfia.
Em certos casos, parece existir uma relação directa, entre uma translocação
cromossómica específica e um carácter maligno. A hipótese supõe que a translocação leva ao
deslocamento de oncogenes não expressos de um cromossoma dado para locais de um outro
cromossoma, onde eles seriam activados e expressos. Esta hipótese foi confirmada com um
135
linfoma humano, o linfoma de Burkitt, que conduz ao desenvolvimento de tumores dos
linfócitos B. O gene c-myc, não expresso em situação normal, é transposto do seu sítio
normal, o cromossoma 8, para uma região de cromossoma 14 que codifica para as cadeias
pesadas das imunoglobulinas (Fig. 197.II.). Nas células B tumorais, a região do DNA que
codifica para as cadeias pesadas das imunoglobulinas está sujeita a recombinações
frequentes. É bastante provável que uma recombinação aberrante, ocorrendo com baixa
frequência, leve à colocação dum promotor activo das cadeias pesadas a montante do gene c-
myc e conduza à sua expressão e à transformação maligna.
b. CARTOGRAFIA DOS CROMOSSOMAS HUMANOS
A obtenção de cartas genéticas detalhadas de cada cromossoma humano poderá em breve
fornecer um instrumento essencial para o diagnóstico das doenças genéticas. Vários genes
foram localizados em cromossomas humanos utilizando a genética mendeliana clássica.
Depois do aparecimento das técnicas de fusão celular entre espécies diferentes e das técnicas
de DNA recombinante, o estabelecimento de cartas genéticas ao nível dos cromossomas
acelerou-se consideravelmente.
Existem actualmente vários métodos que permitem fusionar células humanas em cultura
com células de outras espécies. Por outro lado, é possível transferir em células humanas e
animais, em cultura, fragmentos de DNA do tamanho dum cromossoma ou limitados a um
gene particular. A exploração destes métodos de trocas genéticas artificiais permite
posicionar um gene humano num cromossoma particular ou num fragmento de cromossoma
particular.
Quando se fusionam células humanas com células de rato, os híbridos resultantes
sobrevivem e dividem-se mas perdem, no entanto, progressivamente, os cromossomas
humanos. É possível correlacionar a presença duma proteína humana, com base em testes que
recorrem à expressão do gene nas células híbridas, com a presença dum cromossoma humano
particular (Fig. 198.II.).
Na realidade, este método sofre dum condicionamento importante, visto ser necessário
dosear uma actividade enzimática ou proceder a uma identificação imunológica para
identificar o produto do gene que se quer mapear. Ele foi, no entanto, amplamente utilizado e
permitiu localizar mais de 100 genes humanos em diferentes cromossomas. Quando um gene
foi cartografado num cromossoma dado, qualquer outro gene ligado geneticamente ao
primeiro (com base em estudos genealógicos) pode ser igualmente atribuído a esse
cromossoma.
A combinação dos métodos de fusão celular e das técnicas de DNA recombinante
oferece possibilidades bem mais amplas, pois é baseada na utilização dum gene ou dum
136
fragmento de DNA clonado, como sonda, para procurar sequências homólogas nas células
híbridas. Neste caso, deixa de haver dependência em relação à expressão do gene. O primeiro
exemplo deste tipo de abordagem é a localização do gene da globina ß no cromossoma 11
(Fig. 199.II.). Depois deste primeiro sucesso, numerosos outros genes humanos foram
atribuídos por este método a um ou outro cromossoma (Fig. 200.II., Tabela 10.II.).
Depois de atribuir um gene a um cromossoma, é necessário posicioná-lo em relação a
outros genes situados no mesmo cromossoma. Em genética clássica, a localização determina-
se pela medida das frequências de recombinação, durante a meiose, entre pares ou grupos de
genes. Quanto mais próximos estiverem dois genes, menor é a frequência com que eles se
recombinam. Em genética das células somáticas recorre-se a outros métodos tais como a
indução de eliminações, de translocações recíprocas ou de fragmentação de cromossoma.
Assinalámos, mais acima, a existência das translocações recíprocas espontâneas e a
correlação estabelecida entre este fenómeno e o aparecimento dum carácter maligno
veiculado por um oncogene, posicionado em situação propícia para ser activamente expresso.
A posição das translocações recíprocas pode ser identificada devido à alteração observável ao
microscópio, provocada na distribuição das bandas dos cromossomas, corados por um
processo apropriado. É, assim, possível atribuir um gene a um fragmento particular dum
cromossoma (Fig. 201.II.). O exemplo ilustrado na figura refere-se ao posicionamento do
gene da insulina na parte distal do segmento curto do cromossoma 11.
Alternativamente, pode-se induzir uma fragmentação aleatória dos cromossomas nas
células somáticas por irradiação aos raios X e, em seguida, fusionar estas células com células
receptoras, acompanhando, no híbrido celular, a retenção de dois genes mapeados
previamente num mesmo cromossoma (mede-se, neste caso, uma actividade enzimática típica
destes dois genes). Quanto mais próximos estiverem estes genes no cromossoma, mais
frequentemente permanecerão retidos juntos nos híbridos, visto estarem situados no mesmo
fragmento (Fig. 202.II.). No exemplo da figura foi demonstrado que os genes humanos tk e
gk estão separados por cerca de 1,2 106 pares de bases no cromossoma X.
A cartografia fina dos genes num cromossoma dado pode ser estabelecida directamente,
in situ. Para isso, utiliza-se um DNA radioactivo clonado, para marcar, por hibridação, a
posição dum gene num cromossoma. Praticamente, é preciso bloquear as células humanas no
estado mitótico, de maneira a que cada cromossoma da célula seja claramente identificável
por microscopia. O DNA clonado radioactivo é então hibridado in situ com os cromossomas
e a posição do gene é determinada por autorradiografia e por quantificação da granulometria
da autorradiografia. A localização faz-se em relação a um cliché dos cromossomas expostos
em série e corados. O exemplo da Fig. 203.II. ilustra a atribuição dos genes do interferão α
ao cromossoma 9.
137
Graças ao desenvolvimento das técnicas de DNA-recombinante, nomeadamente de
sequenciação, foi possível , recentemente, concluir a sequenciação total do genoma humano o
que permitirá, em breve obter uma carta genética detalhada completa de cada cromossoma
c. MAPEAMENTO DO GENOMA HUMANO POR RFLP
A organização estrutural dos genes em genomas de grande comprimento, como o
humano, pode ser elucidado utilizando o polimorfismo dos fragmentos de restrição
(Restriction Fragment Length Polymorphisms - RFLP). O polimorfismo é um fenómeno
conhecido há bastante tempo na área das proteínas, sendo um dos exemplos mais conhecidos
o dos grupos sanguíneos de histocompatibilidade. Quando existem modificações ligeiras na
estrutura primária de proteínas originárias de diferentes indivíduos da mesma espécie, que
têm funções e localizações cromossómicas idênticas, estas proteínas apresentam um carácter
polimórfico. As diferenças nas estruturas primárias das proteínas manifestam-se no nível do
DNA e podem ocasionalmente originar novos locais de restrição.
A Fig. 204.II. esquematiza duas moléculas de DNA diferentes, codificando para um
mesmo gene hipotético X, flanqueado por locais de clivagem para as enzimas A e B. Os dois
alelos são idênticos em relação à posição dos locais de clivagem da enzima A, mas diferem
em relação à posição dos locais de clivagem da enzima B. O padrão de separação por
electroforese dos fragmentos de DNA, observado após hibridação com uma sonda do gene X,
marcada radioactivamente, mostra uma banda quando a enzima A é utilizada para clivar o
DNA celular e duas bandas com a enzima B. No segundo caso, as duas bandas diferem no
comprimento e correspondem a duas formas alélicas diferentes. O gene X é dito polimórfico
em relação ao local alvo da enzima B. Na maioria dos casos, estes polimorfismos, também
chamados variações alélicas, são causados por simples substituições de bases que destroem
ou criam um local de restrição, mas, ocasionalmente, os RFLPs podem ser ocasionados por
eliminações ou inserções.
Os polimorfismos de DNA possuem um certo número de vantagens para o mapeamento
do genoma. O número de marcadores conhecidos de DNA excede o das proteínas e além
disso a sequência de DNA não necessita de expressar obrigatoriamente uma proteína para ser
identificada por locais de clivagem polimórficos. Os polimorfismos de DNA podem,
evidentemente, ocorrer em qualquer sequência de DNA e em particular em intrões.
Se os marcadores de polimorfismo estão muito próximos dum gene, isto é, são herdados
juntos, o RFLP pode também ser utilizado para mapear genes e portanto para caracterizar
anomalias genéticas, mesmo quando o gene em questão é completamente desconhecido.
A Fig. 205.II. mostra dois marcadores de polimorfismo, A e B, localizados perto dum
gene. Neste exemplo, o alelo normal está situado no cromossoma do macho e o alelo mutado
138
no da fêmea. A mãe é heterozigótica e o pai homozigótico em relação à variante normal.
Segundo as regras de Mendel, estes quatro alelos (dois paternos e dois maternos) dão origem
a quatro combinações possíveis na descendência. Se o marcador A e o gene defeituoso estão
a curta distância um do outro, serão co-transmitidos, isto é, todos os filhos que herdarem o
defeito genético herdam igualmente o alelo A do marcador. A presença do marcador de
polimorfismo A não implica forçosamente a presença da anomalia genética. Esta correlação
só se aplica a situações em que o gene e o marcador de polimorfismo estão situados muito
perto um do outro. Se estão bastante separados, podem-se realizar recombinações com mais
frequência relativa, colocando o gene defeituoso no cromossoma que contém o marcador B.
A probabilidade de existirem trocas genéticas aumenta com a distância entre o marcador e o
gene em questão. Quanto mais perto estiverem os marcadores mais conclusivas serão as
correlações observadas.
É, portanto, possível seguir a transmissão de qualquer marcador de polimorfismo por
análise genealógica e correlacionar a sua presença com a expressão fenotípica dum defeito
genético, se o marcador estiver situado suficientemente perto do gene mutado.
Na prática, o DNA dum grande número de indivíduos, pertencentes a uma linhagem, é
clivado com uma enzima de restrição que reconhece um polimorfismo na região da sonda de
DNA que será utilizada ulteriormente. Serão obtidos aproximadamente um milhão de
fragmentos diferentes de DNA, que podem ser separados por electroforese em gel de agarose
e submetidos a análise por Southern blotting. Várias centenas de sondas RFLP foram já
identificadas e utilizadas para mapeamento.
d. ANOMALIAS MONOGÉNICAS E MULTIFACTORIAIS
As anomalias monogénicas são causadas por mutações em genes únicos. As suas
características mendelianas de transmissão hereditária são autossómicas dominantes,
autossómicas recessivas ou ligadas ao cromossoma X. As aberrações autossómicas
dominantes manifestam-se mesmo quando um só dos dois alelos dum gene particular é
afectado. No caso das doenças autossómicas recessivas, pelo contrário, é necessário que
ambos os alelos dum gene sejam afectados, para haver manifestação clínica de doença. Os
efeitos das anomalias ligadas ao cromossoma X são diferentes nas fêmeas e nos machos,
visto estes últimos possuírem um só cromossoma X. Uma fêmea com dois cromossomas X,
pode ser homozigótica ou heterozigótica em relação a um gene mutado, ligado ao X, e a
expressão pode ser dominante ou recessiva. Qualquer que seja o modo de expressão nas
fêmeas, um carácter ligado ao X será sempre expresso de maneira dominante nos machos
(que possuam um só cromossoma X).
139
Cerca de 1400 doenças genéticas conhecidas são causadas por mutações em genes
únicos. Em geral, a prevalência é fraca (como ilustrado nos exemplos da Tabela 11.II.), se
bem que correspondam de 5 % a 10 % de todos os casos registados em pediatria. As lesões
bioquímicas de mais de 250 destas doenças são conhecidas. Elas afectam sobretudo enzimas,
mas existe igualmente uma variedade de outras proteínas implicadas, tais como factores de
coagulação do sangue, proteínas de transporte, hormonas peptídicas, receptores.
As doenças monogénicas podem não ser herdadas, mas serem antes o resultado de uma
nova mutação no indivíduo afectado. A frequência da ocorrência deste género de mutações
foi calculada como sendo de 5 x 10-6 mutação por gene e por geração. Aproximadamente um
em cada 100.000 recém-nascidos deveria, portanto, possuir uma nova mutação num qualquer
locus genético. Mas, visto que muitas destas mutações são ou recessivas, ou geneticamente
silenciosas, porque não afectam a função da proteína correspondente, as novas mutações com
manifestação clínica devem ser extremamente raras. Pensa-se, por exemplo, que todos os
casos de Huntington's chorea (várias dezenas de milhar) tiveram origem num pequeno
número de indivíduos afectados (provavelmente com mutações independentes), que puderam
ser rasteados até ao século XVIII.
Casos assinalados de doenças genéticas aparecendo subitamente na descendência de pais
não afectados podem-se explicar, na maioria dos casos, mais provavelmente, por paternidade
extra-conjugal do que por aquisição duma nova mutação.
Nas perturbações multifactorias estão incluídas uma grande variedade de doenças, tais
como o cancro, diabetes mellitus, hipertensão etc. A predisposição para ser afectado por este
tipo de doenças parece ser geneticamente transmissível. São enfermidades poligénicas; visto
que o número de genes implicados é frequentemente desconhecido, o risco individual é difícil
de avaliar. Contudo, este risco é, em geral, consideravelmente menor (1 a 5 %) que o de
aquisição de doenças monogenéticas a partir de pais afectados (25 % ou 50 %), porque é
necessário que vários genes sejam simultaneamente afectados. Só algumas destas
predisposições podem ser actualmente diagnosticadas.
Entre o pequeno número de loci associados de maneira relevante com predisposições
para várias doenças figuram os do complexo de histocompatibilidade, HLA (Human
Leukocyte Antigen). Consiste em quatro loci genéticos distintos comportando, cada um,
alelos múltiplos que codificam para proteínas diferentes. Um conjunto particular é, por
exemplo, o HLA-B27, associado com um maior risco de contrair a espondilite ancilosante. O
risco de contrair esta doença grave é 90 vezes mais elevado para os indivíduos HLA-B27
positivos do que para os HLA-B27 negativos. Se bem que esta predisposição possa ser
diagnosticada, não existe terapia para a doença, propriamente dita, devido à sua natureza
genética multifactorial.
140
e. O DIAGNÓSTICO DE DEFEITOS GENÉTICOS
O diagnóstico e a prevenção de doenças genéticas podem ser realizados a diferentes
níveis. Se a base molecular de um defeito genético não for conhecida, os dados disponíveis
só podem servir para avaliar estatisticamente o risco de vir a ter uma criança com a doença
familiar.
Um conhecimento profundo da doença ao nível molecular, conjugado com técnicas
apropriadas de detecção do defeito molecular, permite pelo contrário, identificar de maneira
segura uma lesão num dado indivíduo. Isto pode ser realizado ao nível das proteínas,
analisando, por exemplo, espécimes de sangue fetal. As técnicas de clonagem permitem
actualmente a detecção dum defeito genético até ao nível do gene. Como estas análises
podem ser efectuadas com quantidades ínfimas de tecidos, obtidas, por exemplo, por
amniocentese ou biopsia coriónica, as doenças genéticas podem ser diagnosticadas numa fase
muito precoce da gravidez (Fig. 206.II.). Em função do resultado dos testes, a interrupção
voluntária da gravidez pode ser realizada com um mínimo de risco.
Se um defeito genético que se pretende diagnosticar conduz à não expressão do gene,
será evidentemente impossível detectar o produto deste. A identificação duma proteína
mutada não permite definir a natureza da mutação dum gene, não indica se o defeito afecta
um sinal de regulação, ou o transporte duma proteína, ou a sequência codificante.
1) RFLP (Restriction Fragment Length Polymorphism)
Os RFLPs são particularmente úteis para identificar defeitos genéticos no homem e
podem ser aplicados com fins de diagnóstico, contanto que as alterações no DNA implicado
não ocorram várias vezes e que estejam associadas unicamente a genes únicos. A maioria dos
RFLPs conhecidos ocorreram ao acaso e não têm relação com os genes vizinhos.
Um exemplo importante da aplicação desta metodologia é a detecção dum marcador da
Huntington's chorea, doença caracterizada pela degenerescência irreversível das células
nervosas, que ocorre com uma frequência de 1 em 10.000 indivíduos. O DNA proveniente de
duas linhagens genealógicas portadoras desta anomalia genética foi analisado por hibridação
de sondas radioactivas com fragmentos de restrição originados por clivagem em locais
polimórficos (chamados marcadores polimórficos) conhecidos, sem se saber à partida se um
qualquer destes marcadores polimórficos se situava na vizinhança do gene de Huntington e
segregava com ele.
Observou-se, no entanto, que uma das sondas reconhecia um polimorfismo que obedecia
àquelas condições, causado por dois locais HindIII, cuja presença ou ausência dá origem ao
padrão de hibridação representado na Fig. 207.II. A presença ou a ausência do primeiro local
HindIII cria fragmentos de comprimento de 15 ou 17.5 kb, respectivamente, enquanto que a
141
presença ou ausência do segundo local HindIII gera fragmentos de 3.7 e de 4.9 kb,
respectivamente. Existem, portanto, 4 padrões de fragmentação possíveis, chamados
haplotipos A, B, C e D. Como há sempre dois alelos num gene dado duma célula somática,
os quatro haplotipos geram dez combinações duplas diferentes.
A frequência destas combinações duplas numa população normal é variável. A análise da
árvore, representada na Fig. 208.II, revelou que o haplotipo C (presença dos dois locais
HindIII) segrega sempre com a doença. Como este haplotipo também ocorre na população
normal, a única conclusão plausível é que um membro da família, que não herdou o haplotipo
C dos pais, tem uma grande probabilidade de não ser afectado pela doença; por outro lado,
um indivíduo com o haplotipo C não poderá ter a certeza de que a doença se manifestará. Só
aproximadamente 25 % da população normal tem o haplotipo C; portanto, a probabilidade de
um indivíduo de haplotipo C, pertencente a uma família de risco, desenvolver a doença é
bastante alta.
Destas observações pode-se tirar a conclusão de que predições conclusivas só podem ser
feitas após uma análise genealógica. Como o haplotipo C também ocorre na população
normal, o facto de ser identificado num indivíduo pertencente a uma família sem
predisposição, não têm grande sentido.
A associação observada entre o locus marcador G8 e a doença não significa que o gene
responsável pela doença tenha sido identificado. Foi observado um único recombinante na
árvore genealógica analisada, que provém duma translocação do gene de Huntington para um
cromossoma de haplotipo A. A partir desta ocorrência única, conclui-se que a distância entre
o gene responsável pela doença e o marcador é de ordem de pelo menos 2000 kb.
As aplicações do RFLP não se restringem ao mapeamento de defeitos genéticos mas
intervêm também, como vimos, na construção dum mapa genético de cromossomas humanos.
A descoberta dos RFLPs e a generalização das suas aplicações têm consequências práticas
importantes. A determinação do polimorfismo de dadores de orgãos para transplantações,
realizada actualmente por técnicas serológicas, poderá ser ultrapassada por determinações
mais rigorosas e rápidas de polimorfismos de DNA. Será, também, possível detectar
correlações entre a predisposição de alguns indivíduos para certas doenças e a sua
constituição genética.
2) Diagnóstico de mutações identificadas
Se o gene responsável duma dada doença genética estiver identificado pode-se, a partir
dum clone correspondente ao gene normal, determinar a sua sequência nucleotídica e
estabelecer uma carta de restrição detalhada. Por outro lado, o gene normal pode ser utilizado
como sonda para identificar e isolar o gene correspondente, presente no DNA das células
142
fetais. Comparando as sequências e as cartas de restrição é possível identificar as mutações
que afectam o gene fetal.
O exemplo mais estudado é o das ß-talassemias.
ß-talassemias
As pertubações genéticas da síntese de hemoglobina, chamadas talassemias, foram
estudadas em detalhe ao nível do DNA. As hemoglobinas humanas são codificadas por duas
séries de genes: os genes de tipo α, localizados no cromossoma 10 e os genes de tipo ß,
localizados no cromossoma 11 (Fig. 209.II.) Estas regiões foram clonadas e sequenciadas.
A hemoglobina normal dum indivíduo adulto é constituída por duas cadeias α e duas
cadeias ß. As talassemias são patalogias caracterizadas pela ausência total ou parcial de
síntese de um tipo de globina. O resultado é um desequilíbrio entre as cadeias α e ß e uma
anemia, mais ou menos pronunciada, segundo o tipo de talassemia. Estes estados têm origem
numa deficiência de transcrição do DNA, ou num defeito de maturação do RNA, ou numa
instabilidade do RNA ou, ainda, numa incorrecção na tradução do RNA. Estes defeitos
podem resultar de mutações pontuais que conduzem a um desfasamento da tradução ou ao
aparecimento prematuro de sinais de fim de cadeia ou, ainda, derivar de eliminações do gene,
no seu todo ou parciais.
As ß-talassemias homozigóticas são caracterizadas por anemias bastante severas e
ausência total ou quase total de globina ß. A doença é fatal nos primeiros anos de vida porque
as cadeias de globina ß só são activas depois do nascimento. Normalmente, o feto não é
afectado porque utiliza as cadeias de globina γ fetais. Em certos casos, os indivíduos
talassémicos adultos (privados de globina ß) podem permanecer de boa saúde porque
conservam uma percentagem de hemoglobina fetal elevada (persistência hereditária de
hemoglobina fetal).
a) Mutações sem sentido e frame shift (Tabela 12.II)
A ß-talassemia, caracterizada pela ausência total da síntese da globina ß, resulta duma
mutação pontual no codão correspondente ao aminoácido 17 ou no correspondente ao
aminoácido 39. Nos dois casos, a mutação dá origem a um codão sem sentido. Para além de
serem intraduzíveis, os RNA mensageiros correspondentes são muito instáveis in vivo.
Outras talassemias de tipo ß resultam de eliminações ou de inserções na sequência que
codifica para a globina ß; o resultado é uma deslocação da fase de leitura do RNA
mensageiro.
143
b) Mutações que afectam a transcrição
Num dos casos, uma substituição do nucleotídeo em posição -87 em relação ao local de
chapéu do mensageiro conduz a uma percentagem muito fraca de mensageiro de ß globina;
no segundo caso, uma mutação na TATA box em posição -30 bloqueia a iniciação da
transcrição.
c) Mutações que afectam a maturação do RNA
Um certo número de talassemias resultam dum splicing anormal dos transcritos primários
da ß globina.
O gene ß contém dois intrões cujo splicing é necessário para a maturação do mensageiro
(Fig. 210.II.).
Nestes tipos de talassemias, a sequência GT que se encontra sempre presente em 5' da
junção do splicing é mutada em AT, no primeiro ou no segundo intrão. O splicing correcto
não se realiza; no seu lugar são utilizadas outras sequências semelhantes à normalmente
implicada no splicing. O resultado é um RNA mensageiro intraduzível e de estrutura
incorrecta.
Por outro lado, certas talassemias resultam de mutações no interior de um intrão, que
criam uma sequência de splicing 3' (aceitador) que entra em competição com a sequência
natural e provoca um splicing incorrecto.
Outras mutações aparecem na região codificante do gene e criam locais de splicing do
tipo 5' que entram em competição com o local normal. O resultado é, evidentemente, mais
uma vez, a formação de RNAs mensageiros que não podem ser traduzidos correctamente.
O diagnóstico pré-natal das talassemias pode ser, actualmente, efectuado por análise de
Southern blotting do DNA amniótico. Um padrão anormal de fragmentos de DNA aparece
quando genes de globina são suprimidos, como no caso de α-talassemia. A detecção pré-natal
da ß-talassemia é mais complexa, porque muitas mutações diferentes podem dar origem à
síntese da cadeia de ß-globina defeituosa. Algumas mutações alteram os locais de
reconhecimento de enzimas de restrição, directamente, e podem ser detectadas por análise de
restrição (vd. exemplo da anemia falciforme mais adiante), outras não. Para fazer um
diagnóstico, nestes casos, pode-se recorrer à identificação dos cromossomas que contêm as
mutações talassémicas, estabelecendo relações com locais de restrição polimórficos que se
situam ao longo do cluster do gene da ß-globina (vd. mais acima RFLP). Foi, no entanto,
desenvolvida uma abordagem mais directa que recorre à detecção de mutações pontuais que
provocam ß-talassemias, por hibridação com oligonucleotídeos sintéticos.
144
d) Utilização dos oligonucleotídeos sintéticos
Uma das aplicações mais interessantes dos oligonucleotídeos sintéticos de sequência
definida é a sua utilização como sondas para diagnosticar doenças genéticas em fase pré-
natal. Esta área de aplicação só pôde, evidentemente, ser desenvolvida graças à tecnologia do
DNA recombinante.
A especificidade duma pequena sonda sintética de cerca de vinte nucleotídeos é notável.
Um único desemparelhamento (mismatch), no interior da região de associação entre a sonda e
o DNA alvo, é suficientemente destabilizador do híbrido para poder ser posto em evidência.
É este o princípio básico da detecção e do diagnóstico, mesmo em fase pré-natal, de
mutações genéticas pontuais (Fig. 211.II).
Esta técnica foi aplicada para detectar, no DNA, substituições de um nucleotídeo que
provocam a talassemia de tipo +ß. Um exemplo está ilustrado na Fig. 212.II que mostra a
transição de G em A na posição 110 da região IV S-1 do gene. Uma sonda oligonucleotídica
de sequência perfeitamente complementar do DNA normal, marcada por quinação com um
radioisótopo (32P), hibridar-se-á com o fragmento de 1,8 kb produzido por digestão BamHI
do genoma e a hibridação será revelada por emissão radioactiva. A sonda formará um
desemparelhamento C-A com a sequência mutada e, em condições de temperatura de
hibridação selectivas, o híbrido dissociar-se-á, libertando a sonda. O resultado prático será
ausência de sinal radioactivo na autorradiografia. Pelo contrário, uma sonda de sequência
homóloga da região mutada do gene dará um resultado simetricamente oposto, com o gene
normal e o gene mutado. O conjunto da informação permitirá diagnosticar rigorosamente se
um indivíduo é homozigótico normal ou mutado, ou se é heterozigótico.
A fotografia dum gel electroforético do DNA de indivíduos duma família de risco,
digerido por BamHI e hibridado com as duas sondas oligonucleotídicas, ilustra esta análise
(Fig. 213.II). A banda de 1.8 kb do DNA do pai hibrida-se com a sonda normal e com a
mutada. A da mãe responde de maneira semelhante. Os pais são, portanto, os dois
heterozigóticos para a mutação. O DNA do filho, pelo contrário, só se hibrida com a sonda
mutada. É, pois, homozigótico para esta mutação.
Outro exemplo é o da detecção da talassemia ß, que resulta duma mutação sem sentido
no aminoácido 39ß; a glutamina do codão CAG é mutada em codão de fim de cadeia TAG,
causando a terminação prematura da tradução da ß-globina. Esta mutação é a causa
predominante da ß-talassemia na Sardenha e está espalhada por toda a região mediterrânica.
A sequência de DNA correspondente ao codão mutado não comporta locais de
reconhecimento por enzimas de restrição.
145
Num estudo modelo, dois nonadecâmeros sintéticos foram utilizados (sublinhados na
Fig. 214.II.) para diagnosticar a presença de mutação em casos de gravidez, em que os fetos
apresentavam de risco de ß-talassemia. 20 ml de fluído amniótico foram tirados na 18ª
semana de gestação e o DNA isolado e digerido por BamHI. Após separação por
electroforese e hibridação do gel, sequencialmente, com as duas sondas marcadas, o híbrido,
ou a ausência de híbrido radioactivo formado com a banda de 1,8 kb, permite fazer um
diagnóstico. Num caso, ambas as sondas se hibridam com o DNA (Fig. 215.II.), o que
implica um diagnóstico de ß-talassemia heterozigótica (Aβ). Nos outros dois casos, só a
sonda ßA se hibrida com o DNA, indicando que os fetos eram normais (AA).
e) Anemia falciforme
A anemia falciforme é uma doença hereditária que resulta duma mutação que muda um
resíduo de ácido glutâmico (GAG) em valina (GTG) na posição 6 da cadeia ß-globina da
hemoglobina. A consequência desta modificação é a síntese duma hemoglobina que tem
tendência para cristalizar nos glóbulos vermelhos; as células tornam-se menos flexíveis e são
eliminadas do sangue ao nível do baço, o que conduz à anemia.
A mutação de bases A → T suprime um local de restrição no DNA do gene da globina ß.
É, pois, fácil detectar a mutação por análise de restrição do DNA fetal. Um DNA normal
contém o local de restrição, enquanto que no DNA mutado este local está ausente. Na prática,
esta modificação manifesta-se por uma distribuição anormal dos fragmentos de restrição (Fig.
216.II).
Praticamente digere-se o DNA, extraído de células derivadas dum doador normal e dum
indivíduo anémico, pela enzima de restrição DdeI (sequência reconhecida CCTGAG) ou,
melhor, por MstII (sequência reconhecida CCTNAGG), em seguida separam-se os
fragmentos em gel de agarose e transferem-se para uma membrana de nitrocelulose (Southern
blotting). O comprimento dos fragmentos formados por digestão é detectado por hibridação
com o DNA complementar de globina marcado com 32P.
A deficiência hereditária de αααα1-antitripsina
Os indivíduos deficientes em α1-antitripsina têm uma forte predisposição para
desenvolver enfisema pulmonar ou cirrose infantil do fígado. A α1-antitripsina é uma
proteína sintetizada no fígado e presente no plasma. O seu papel é inibir a elastase, proteína
implicada na perca da elasticidade dos tecidos pulmonares. Nos indivíduos normais o equilíbrio entre α1-antitripsina e elastase é controlado; nos deficientes hereditários, pelo
contrário, a elastase não é inibida e destrói os tecidos pulmonares.
A análise dos genes normais (M) e mutados (Z) mostra que eles só diferem numa única
base, G → A. Esta transição provoca a substituição dum resíduo glutâmico por um resíduo
146
lisina, em posição 342 da proteína. Esta substituição não cria nem destrói locais de restrição,
de maneira que é impossível utilizar o polimorfismo dos fragmentos de restrição na região
codificante para revelar a mutação do gene. No entanto, é possível tirar partido de sondas de
DNA sintéticas para diagnosticar a doença (Tabela 13.II), sintetizando, por exemplo, um
oligómero de 19 nucleotídeos, no qual a base G ou a base A é flanqueada de um lado e de outro pelas 9 bases correspondentes à sequência de DNA da α1-antitripsina. Estas sondas
marcadas com 32P por quinaçao foram testadas por hibridação com o DNA clonado da α1-
antitripsina. Uma escolha judiciosa das condições de hibridação permite obter um sinal diferencial (Fig. 217.II.). As duas sondas reconhecem o DNA normal da α1-antitripsina a
45°C; todavia, a 55°C só a sonda totalmente homóloga ao DNA da α1-antitripsina dá um
sinal de hibridação. Em função destas condições, é possível utilizar o oligómero correspondente ao DNA da α1-antitripsina normal, para testar a hibridação com o DNA
derivado de indivíduos deficientes em α1-antitripsina. O DNA genómico derivado das
células de indivíduos MM, MZ e ZZ, digerido pelas enzimas de restrição HindIII/XbaI ou
BamHI/XbaII, e transferido para uma folha de nitrocelulose é em seguida hibridado com o
oligómero sintético marcado, em condições previamente determinadas (55°C para a
hibridação e a lavagem) (Fig. 218.II.).
Os fragmentos do DNA MM normal, com o qual a sonda é completamente
complementar, e que contêm a região correspondente ao aminoácido 342 (fragmento de 2,4
ou de 2,6 kbases), dão um sinal positivo forte. O DNA MZ heterozigótico dá um sinal
reduzido e o DNA ZZ homozigótico não dá sinal. Este método é, pois, capaz de distinguir os
indivíduos ZZ dos indivíduos MM ou MZ e pode ser utilizado para o diagnóstico pré-natal da deficiência em α1-antitripsina.
Também neste caso existe a possibilidade de diagnosticar a deficiência em α1-
antitripsina pela análise do polimorfismo dos fragmentos de restrição, se se estudar o gene
inteiro incluindo os intrões. Com efeito, existe um polimorfismo de restrição para três
enzimas SstI, MspI e AvaII, que pode ser posto em evidência por hibridação com sondas de
fragmentos de DNA genómico clonados, segundo o princípio e técnicas previamente
descritos.
Os métodos de diagnóstico que recorrem à análise do DNA por hibridação com sondas
moleculares são de aplicação geral e tanto mais precisos quanto mais completo for o
conhecimento ao nível molecular dos defeitos do DNA geneticamente transmissíveis.
f. DETECÇÃO DE MUTAÇÕES SOMÁTICAS
A detecção de mutações com sondas oligonucleotídicas não esgota as suas
potencialidades com as doenças genéticas. É também possível detectar mutações somáticas
147
que conduzem a transformações oncogénicas. A família dos genes humanos ras constitui um
exemplo. Estes genes em número de 3, H-ras, K-ras e N-ras codificam proteínas de 21
kdaltons, localizadas na parte interna da membrana celular, que parecem estar implicadas na
transdução de sinais de receptores celulares de superfície para os seus alvos intracelulares.
Uma percentagem importante de linhagens celulares tumorais e de tecido tumoral possui um
gene ras activado. Estes genes caracterizam-se pela propriedade de induzirem uma
transformação oncogénica em células em cultura. Em quase todos os casos analisados a
activação foi correlacionada com mutações pontuais dos codões 13 ou 61 dos genes ras, as
quais levam à substituição de um aminoácido na proteína.
A sua natureza pontual e fixa torna possível a utilização de oligonucleotídeos sintéticos
para escrutinar, directamente, no DNA genómico, a presença das mutações responsáveis pela
activação destes genes. Por exemplo, uma abordagem utilizada para escrutinar mutações no
codão 61 do gene humano N-ras recorre à síntese de quatro grupos diferentes de icosâmeros
(Fig. 219.II.). O primeiro oligonucleotídeo (N61-I) tem uma sequência idêntica a um
segmento de 20 nucleotídeos que inclui o codão 61 (CAA) do gene N-ras normal. N61-II é
uma mistura de 3 oligonucleotídeos que diferem de N61-I pela natureza do primeiro
nucleotídeo do codão 61, em que o C do tipo selvagem foi substituído por A, por G ou por T.
Este grupo de oligonucleotídeos formará sempre um híbrido imperfeito com o gene N-ras
normal. Contudo, se o codão 61 apresenta uma mutação na primeira posição, um dos
oligonucleotídeos do grupo N61-II formará um emparelhamento perfeito com o gene mutado.
De maneira análoga, no grupo N61-III, o segundo nucleotídeo G, T ou C substitui o A na
posição 2 do codão. Por fim, os dois icosâmeros do grupo N61-IV possuem um T, ou um C,
no lugar do A natural na terceira posição do codão (a substituição por G origina uma mutação
silenciosa). As sondas oligonucleotídicas foram marcadas com elevada actividade específica,
incorporando vários nucleotídeos marcados com o radioisótopo 32P. O método utilizado
recorre à síntese química prévia de oligonucleotídeos anti-sentido (i. é., complementares e
orientados em sentido oposto) em relação às sequências das sondas e de um octâmero
complementar da extremidade 3' dos icosâmeros. O radioisótopo é introduzido prolongando o
octâmero, que funciona como primer, com a DNA polimerase I e (α-32P)dNTPs, utilizando
os icosâmeros anti-sentido como matrizes da polimerização.
Polim I5'
3' HO- 5'ATGAGAAGAACATACTCTTCTTGTCCAGCTGT- GGTCGACA-p 5'
3'
α-32PdNTPs
TACTCTTCTTGTCCAGCTGT-
5' 3'
GGTCGACA p
* * * *** ***** *
OH OH
Como o octâmero é portador dum fosfato 5' terminal, o icosâmero marcado
radioactivamente pode ser separado da matriz não fosforilada, num gel electroforético de
poliacrilamida-ureia.
148
Para escrutinar e determinar a natureza das mutações, o DNA genómico é digerido por
uma enzima de restrição e fraccionado num gel de agarose 0.5 %, desnaturado in situ e seco.
O gel seco é humidificado em água destilada e posto directamente em hibridação com os
oligonucleotídeos marcados. O gel é resistente às diferentes manipulações de hibridação e
lavagem e permite a detecção directa de um gene cópia única, a partir de uma quantidade de
DNA genómico de 1 a 5 µg, eliminando a necessidade de transferência para uma membrana
de nylon ou de nitrocelulose (Southern blotting). Em condições salinas apropriadas, a
temperatura de dissociação observada de um híbrido perfeitamente emparelhado, formado
entre os icosâmeros e o DNA genómico, é de 61-62°C, e a de um híbrido contendo um
desemparelhamento é de 55-56°C. Realizando a hibridação a 50°C e as lavagens a 59°C, é
possível detectar especificamente um híbrido perfeito, enquanto que os híbridos com um
desemparelhamento se dissociam. A Fig. 220.II. mostra o resultado das hibridações dos
oligonucleotídeos marcados N61-I (painel I), N61-II (painel II), N61-III (painel III) e N61-IV
(painel IV), com o DNA genómico (10µg), digerido por PstI e fraccionado
electroforeticamente, isolado das linhagens celulares MOLT-4 (corredor-1), HL60 (corredor-
2), Rc-2a (corredor 3), K562 (corredor-4), HT1080 (corredor-5) e RD301 (corredor 6), ou
dos plasmídeos pAT8.8 e pSVN-ras (corredores 7 e 8).
Forma-se um fragmento de 3.6 kb a partir do DNA genómico e fragmentos de 4.4 kb e de
2.8 kb a partir do DNA clonado, respectivamente no pAT8.8 e no pSVN-ras, contendo todos
o codão 61 do gene N-ras. Todas as linhagens celulares contêm um alelo normal N-ras,
dando um sinal positivo por hibridação com o oligonucleotídeo perfeitamente complementar
N61-I, após lavagem a 59°C (painel I). O painel II mostra que só o DNA das células HT1080
se hibrida com a mistura N6-II e o painel III, que só o DNA das células HL60 se hibrida
especificamente com a mistura N61-III. O painel IV mostra por seu lado, que a mistura N61-
IV se hibrida exclusivamente com o DNA de RD301. Este resultado implica que, na proteína
N-ras de RD301, a glutamina natural (CAA) foi mutada em histidina (CAC ou CAT).
Pode-se ainda concluir que, tanto HT1080, como HL60, possuem a mesma mutação
pontual no codão 61 que os genes isolados dos transfectantes celulares e clonados nos
plasmídeos. Com efeito, os DNAs isolados de HT1080 e de HL60 hibridam-se com N61-II e
N61-III, respectivamente, assim como com o DNA dos plasmídeos pAT8.8 e pSVN-ras, os
quais contêm partes dos genes N-ras activados isolados de transfectantes, respectivamente com as mutações conhecidas CAA61 → AAA e CAA61 → CTA.
Conclui-se, ainda, que estas três linhagens celulares contêm, para além do gene N-ras
mutado, um alelo N-ras normal.
149
Não foram detectadas mutações nas linhagens MOLT-4 e Rc-2a com os
oligonucleotídeos utilizados, o que significa que, provavelmente, as mutações podem estar
localizadas no codão 13 ou numa outra posição.
Um problema geral, associado com este método de detecção de mutações no DNA
genómico com oligonucleotídeos sintéticos, decorre da fraca sensibilidade (cf. o complicado
método de marcação para obter sondas de alta actividade específica, descrito mais acima) e o
elevado barulho de fundo devido a hibridações inespecíficas (Figs. 213.II, 215.II e 218.II).
g. AMPLIFICAÇÃO ENZIMÁTICA DE DNA (PCR)
As limitações de sensibilidade e de barulho de fundo, inerentes à necessidade de detectar
modificações pontuais com pequenas sondas cuja marcação é forçosamente reduzida, em
presença de um número enorme de sequências de DNA genómico, foram ultrapassadas com o
desenvolvimento duma técnica extremamente poderosa (denominada PCR: Polymerase
Chain Reaction) que permite amplificar enzimaticamente fragmentos de comprimento bem
definido, a partir de quantidades ínfimas de DNA. A reacção de polimerização em cadeia é
um método enzimático de amplificação de fragmentos específicos de DNA, que revolucionou
o diagnóstico molecular e abriu numerosos campos da biologia molecular, anteriormente
inacessíveis devido à inexistência de métodos analíticos suficientemente sensíveis.
Se a sequência nucleotídica de pequenos segmentos flanqueando a região alvo da
detecção for conhecida, pode-se sintetizar dois oligonucleotídeos, de cerca de 20 bases,
complementares de cada uma das cadeias do DNA, de um lado e de outro da região alvo da
amplificação, e que podem ser prolongados por polimerização enzimática em sentidos
opostos e convergentes.
A amplificação comporta vários ciclos (Fig. 221.II.) compostos, cada um, das seguintes
etapas: 1) desnaturação do DNA, 2) hibridação com os oligonucleotídeos sintéticos e 3)
polimerização enzimática com uma polimerase e dNTPs. Os oligonucleotídeos orientados
com a extremidade 3' na direcção do alvo da amplificação servem de iniciadores da
polimerização a partir das cadeias opostas do DNA. No fim do segundo ciclo obtêm-se
moléculas de DNA com uma extremidade bem definida. No fim do 3° ciclo formam-se
fragmentos de DNA com as duas extremidades definidas.
Para além do DNA ter sido amplificado 8 vezes, a sequência alvo foi extraída do DNA
total. Como os fragmentos sintetizados por polimerização contêm as sequências
complementares dos iniciadores, a utilização dum excesso destes e de dNTPs conduz a uma
amplificação unicamente limitada pelo número de ciclos e pela actividade da polimerase. Em
cada ciclo sucessivo a quantidade do DNA sintetizado duplica, o que leva à acumulação
exponencial do fragmento alvo segundo a lei aproximada 2n, em que n é o número de ciclos.
150
A eficácia da amplificação aumenta com a utilização duma polimerase termo-estável, a
Taq polimerase, isolada de Thermus aquaticus, organismo que vive em condições de
temperatura elevada. O facto de se poder efectuar a polimerização a temperatura elevada (p.
ex., a 70°C) aumenta a especificidade da hibridação dos oligonucleotídeos, eliminando
associações parasitas, e permite a realização dum grande número de ciclos de amplificação
(20 a 60, por exemplo), sem necessidade de voltar a adicionar a enzima em fases intermédias,
como é o caso com a polimerase I (fragmento de Klenow) que vai perdendo
progressivamente a actividade. Este desenvolvimento importante têm como consequência um
aumento considerável da especificidade, do rendimento, da sensibilidade e do comprimento
dos fragmentos alvos da amplificação.
Segmentos de DNA de comprimento que pode variar de uma centena (ou menos) de
pares de bases até mais de 2000 pb, podem assim ser amplificados mais de 10 milhões de
vezes com grande especificidade, a partir de quantidades extremamente pequenas de DNA.
A técnica do PCR têm sido utilizada na análise de variações de sequências nucleotídicas,
nomeadamente na detecção de mutações e de rearranjos cromossómicos, em clonagem de
sequências genómicas com alta eficácia, na sequenciação directa de DNA mitocôndrico e
genómico, na detecção de organismos patogénicos ou contaminantes (virais, bacterianos,
incluindo micloplasmas, fúngicos e parasitas).
A título de exemplo descrevemos, a seguir, a aplicação da técnica do PCR à análise de 2
mutações da ß-globina humana.
1) Detecção da anemia falciforme e da hemoglobina C por PCR
As mutações correspondentes à anemia falciforme e à hemoglobina C situam-se, ambas,
no codão 6 do gene da ß-globulina. A Fig. 222.II. representa uma região do gene de 110 pb,
no centro do qual se situa o codão 6 alvo da detecção por hibridação com sondas
oligonucleotídicas sintéticas marcadas radioactivamente, 19A, 19S e 19C (complementares
do alelo normal, do alelo da anemia falciforme e do alelo da hemoglobina C,
respectivamente). Esta região é amplificada a partir de dois iniciadores, PC03 e PC04, de 20
nucleotídeos cada, que flanqueiam a sequência alvo da amplificação e que estão orientados
em sentidos opostos e convergentes na direcção da polimerização (5' → 3').
O DNA extraído de seis amostras de sangue de indivíduos potencialmente mutados no
codão 6, de um indivíduo normal e da linhagem celular GMZ2064 (que contém uma
eliminação homozigótica do gene) é submetido a 25 ciclos de amplificação. Em seguida, 33
ng (1/30) dos produtos das amplificações são aplicados, na forma de dot blot, num filtro de
nylon, a partir do qual foram preparadas três réplicas. Cada um destes três filtros é hibridado,
em condições de temperatura selectivas (que dissociam os híbridos não perfeitamente
151
emparelhados), com uma das três sondas marcadas com 32P. O autorradiograma (Fig.
223.II.) mostra claramente a existência de 6 combinações diploídicas ßAßA (homozigótico
normal, AA), ßAßS (heterozigótico para a mutação da anemia falciforme, AS), ßSßS
(homozigótico para a anemia falciforme, SS), ßSßC (simultaneamente heterozigótico para as
mutações da anemia falciforme e da hemoglobina C, SC), ßCßC (homozigótico para a
mutação da hemoglobina C, CC), ßAßC (heterozigótico para a hemoglobina C, AC) e
confirma a eliminação do gene nas células GMZ2064 (XX).
Por análise dos produtos da amplificação, clonados, pode-se avaliar a 1 % a frequência
do fragmento de ß-globina amplificado, o que representa um enriquecimento superior a 105
em relação ao DNA genómico não amplificado. É esta redução substancial da complexidade
que permite a aplicação de sondas de 19 nucleotídeos, marcadas por simples fosforilação em
5' com uma quinase, à detecção de mutações utilizando a técnica extremamente simples do
dot blot.
Desenvolvimentos mais recentes da PCR mostram que é possível explorar a elevada
sensibilidade deste método para detectar colorimetricamente mutações genéticas. Assim, o
genótipo relativo à anemia falciforme pode ser determinado utilizando 3 tipos de iniciadores
para a amplificação do mesmo DNA. Dois destes iniciadores (decapentâmeros) são
conjugados de maneira covalente a grupos fluorescentes e são dirigidos para a região do
codão 6 do gene da ß-globina. Um, perfeitamente complementar da sequência normal, está
ligado à fluoresceína e o outro, conjugado à rodamina, difere do primeiro num nucleotídeo e
é complementar da mutação da anemia falciforme. O terceiro iniciador, correspondente à
sequência da cadeia oposta e situado a montante do codão 6, é utilizado como iniciador desta
cadeia, sendo o seu par na reacção de amplificação, ora o iniciador marcado com a
fluoresceína, ora o marcado com a rodamina.
Este método é baseado no princípio duma maior eficácia da PCR quando um dos
iniciadores é completamente complementar da sequência com que se hibrida do que quando
apresenta um desemparelhamento. Quando o DNA normal é amplificado, o iniciador
complementar da sequência é prolongado. Como este iniciador está marcado com a
fluoresceína, o DNA amplificado emite uma cor verde à luz ultravioleta. Quando o DNA
amplificado provém dum feto ou dum paciente com anemia falciforme, só o iniciador
marcado com a rodamina, complementar da mutação, é prolongado, e o DNA amplificado
fluoresce com cor vermelha. Quando o DNA provém dum indivíduo heterozigótico, ambos
os iniciadores, marcados cada um com o seu próprio grupo fluorescente são prolongados e o
DNA amplificado apresenta uma cor amarela resultante da fluorescência complementar dos
dois corantes. A cor do produto amplificado pode ser analisada, após electroforese em gel de
agarose (Fig. 224.II.), por laser de comprimento de onda dupla (vd. secção sobre a
152
sequenciação automática) ou por filtração num sistema de microfiltração selectivo que
permite eliminar o excesso dos iniciadores do meio reaccional e reter o DNA amplificado.
Este é em seguida analisado por laser ou à luz UV.
Estes desenvolvimentos permitem a automatização do diagnóstico, em rotina, de doenças
genéticas, em fase pré-natal, de maneira rápida precisa, sensível e simples.
2) Detecção de doenças infecciosas por PCR
Entre as numerosas aplicações da técnica do PCR, a detecção de infecções numa fase
precoce, têm uma importância particular. Por exemplo, o diagnóstico de infecções
microbacterianas ou microplásmicas é por vezes longo e laborioso, necessitando a cultura do
microorganismo, frequentemente difícil e longa (várias semanas), ou um aumento
significativo do título de anticorpos para fazer um teste serológico.
Foi demonstrado que a introdução da PCR ao diagnóstico da tuberculose, amplificando
um fragmento de 383 pb que é em seguida hibridado com oligonucleotídeos específicos,
permite a detecção rápida de Mycobacterium tuberculosis.
A mesma abordagem, aplicada à detecção de Mycoplasma pneumonia, responsável de
várias doenças respiratórias, revelou que é possível detectar até 102 organismos, após
lavagens bronco-alveolares, com grande especificidade.
O diagnóstico de infecções virais assume um relevo especial pela importância, por vezes
crítica, em detectar a presença de vírus o mais cedo possível no organismo supostamente
exposto, afim de poder aplicar mais eficazmente uma terapia ou tomar medidas preventivas
contra a disseminação e conter um risco epidemiológico.
Dois exemplos característicos são o do HPV (Human Papilloma Vírus, vírus humano do
papiloma) e o do HIV (Human Immunodeficiency Vírus, vírus humano da imunodeficiência).
Detecção de HPVs
Os vírus humanos do papiloma apresentam-se na forma de viriões icosaédricos contendo
um DNA de cerca de 8 kb. Cerca de 60 tipos distintos de HPV foram descritos, estando
muitos associados a sintomas clínicos particulares ou a manifestações patológicas bem
definidas. Por exemplo, cerca de 20 tipos de HPV foram identificados em lesões benignas em
pacientes com epidermodisplasia verruciforme ou com simples verrugas comuns. Dentro
deste grupo foram particularmente identificados 2 tipos, HPV5 e HPV8, presentes em cerca
de 90 % dos casos de cancro da pele.
Dentro do grupo dos HPVs que ocorrem em lesões genitais (pelo menos 7) dois tipos,
HPV16 e HPV18, foram encontrados associados a uma percentagem elevada de cancros do
cérvix uterino ou a outros cancros anogenitais (HPV16 a mais de 50 % e HPV18 a cerca de
153
20 %). Sendo, actualmente, correntemente, admitido que estes tipos de vírus são um cofactor
etiológico importante na patogénese destes cancros e, HPV16 e HPV18, nomeadamente, na
dos cancros anogenitais, torna-se evidente a importância da sua detecção precoce. Não
existindo, actualmente, sistemas de cultura apropriados para replicar os HPV, nem testes
serológicos disponíveis, numerosos esforços foram desenvolvidos para detectar a presença do
vírus por hibridação molecular e, em particular, mais recentemente, por PCR, nos tecidos de
risco.
Um dos factores importantes a ter em consideração para a escolha dos segmentos de
DNA viral, alvos da amplificação, é o da integridade dessa região, no decorrer do processo
infeccioso. Sabe-se, com efeito, que no caso das lesões malignas o DNA viral se integra
frequentemente no DNA genómico das células hospedeiras, conduzindo a eliminações ou a
rupturas de sequências virais. Contudo, duas regiões do vírus, correspondentes aos genes que
codificam para as proteínas E6 e E7 são invariavelmente conservadas e constituem portanto
um alvo privilegiado da amplificação. Uma escolha judiciosa dos iniciadores de
amplificação, dirigidos para sequências pouco conservadas dos diferentes tipos de vírus, e
iniciadores da amplificação de fragmentos de DNA de comprimento facilmente separáveis
por análise electroforética e de sequências diferenciáveis com sondas oligonucleotídicas
específicas, permite detectar e identificar especificamente a presença e o tipo de vírus
infectando potencialmente tecidos de risco.
Exemplo desta abordagem é a detecção dos HPV11 e 16 no DNA celular obtido a partir
de esfregaços cervicais de mulheres suspeitas de possuírem anomalias citológicas. Os
iniciadores sintéticos utilizados para a amplificação enzimática obedecem aos critérios
definidos acima (Fig. 225.II.). São dirigidos para uma região do gene E6 dos vírus HPV11,
16 e 18, são específicos de cada um dos vírus e amplificam segmentos de comprimento
diferente (90, 120 e 100 pb, respectivamente). A Fig. 226.II. atesta a especificidade destes
iniciadores utilizados na aplicação da PCR ao DNA isolado de linhagens celulares que
contêm DNA do HPV16 (CaSki), do HPV18 (HeLa) ou aos DNAs de HPV11, 16 e 18
clonados em plasmídeos.
Os iniciadores dirigidos para o HPV16 iniciam a amplificação do DNA de CaSki e do
DNA de HPV16 clonado (corredor 1 e 2), mas não o do HPV11 ou o do das células HeLa
(corredores 3 e 4), os iniciadores dirigidos para o DNA de HPV11 amplificam um segmento
deste DNA clonado (corredor 5) mas não o das células CaSki (corredor 6) e os iniciadores
específicos de HPV18 iniciam a amplificação do DNA de HeLa e do DNA de HPV18
clonado, (corredores 7 e 8), mas não do DNA de CaSki (corredor 9). Os fragmentos
amplificados, analisados por electroforese em gel de poliacrilamida e visualizados com o
brometo de etídeo, separam-se nitidamente, correndo em função do comprimento respectivo
154
(90, 100 e 120 pb). Este resultado é confirmado por análise por Southern blotting hibridando
os fragmentos amplificados com sondas oligonucleotídicas específicas, marcadas com 32P.
A Fig. 227.II. ilustra o resultado do diagnóstico da infecção por HPV em esfregaços do
cérvix uterino. O espécimen 47 é negativo para HPV16 (Fig. 227.II.A) e positivo para
HPV11 (Fig. 227.II.B) e os espécimes, 76, e 84 são positivos para HPV16, apresentando
bandas amplificadas de intensidade variável. Os espécimes 38, 43 e 47 são positivos para
HPV11, que está normalmente associado com lesões benignas (condilomas). Os espécimes 1,
7 e 87, submetidos à amplificação por PCR com uma mistura de pares de iniciadores
específicos de HPV11 e de HPV16 revelam-se infectados por ambos os vírus. Três controlos
figuram nos corredores centrais (Fig. 227.II.B). Podem, pois, ser efectuadas reacções com
iniciadores múltiplos para a detecção simultânea de diferentes tipos de HPV na mesma
amostra clínica.
Análises com uma amostragem mais ampla mostram que todas os mulheres que
apresentam uma citologia cervical anormal estão infectadas, unicamente com o HPV16 ou
simultaneamente com o HPV16 e o HPV11, mas nunca só com o HPV11.
A enorme sensibilidade (1 molécula de DNA de HPV em 105células), a especificidade
elevada, a possibilidade de utilizar quantidades ínfimas de material (< 0,5 µg de DNA
celular) para as análises de rotina e de detectar simultaneamente mais de um tipo de HPV,
são propriedades que fazem desta técnica, não só um poderoso meio de diagnóstico, mas
igualmente um instrumento de investigação epidemiológica sobre o potencial oncogénico dos
HPVs.
Detecção de HIV
Uma outra aplicação de grande actualidade e enorme interesse é a detecção dos vírus
HIV. Foi, com efeito, demonstrado que a técnica PCR permite identificar indivíduos
infectados com HIV antes de estes terem desenvolvido anticorpos. Sendo a detecção de
anticorpos a base actual do diagnóstico de rotina, é compreensível que numerosos
desenvolvimentos sejam realizados para permitirem a adopção em rotina de análise clínica
por PCR. Estando bem documentada a existência frequente de casos de pessoas infectadas
com HIV que não desenvolvem anticorpos antivirais por períodos para cima de um ano, não
deve ser excepcional que dadores de sangue infectados escapem ao diagnóstico. Um outro
grupo importante são as crianças de mães seropositivas para o HIV e cujo diagnóstico
serológico não é possível durante vários meses antes do desenvolvimento do sistema
imunológico.
O HIV é um vírus de RNA do tipo dos retrovírus. Como vimos, o genoma destes vírus é
copiado em DNA complementar por uma transcritase reversa e eventualmente integrado, na
155
forma de DNA, no DNA cromossómico das células infectadas e, em particular, no caso dos
HIVs, nos linfócitos T, nos macrófagos e nas células microgliais do cérebro.
O vírus pode ser identificado por PCR, nomeadamente no sangue de indivíduos de risco.
Dada a heterogeneidade do genoma viral, bem caracterizada por sequenciação de vírus
isolados de vários indivíduos ou do mesmo indivíduo, a tempos diferentes do processo
infeccioso, é importante escolher para alvo da amplificação uma região do genoma cuja
sequência seja perfeitamente conservada. É este o caso do gene gag de HIV1, dentro do qual
foram seleccionadas duas sequências em cadeias opostas para a hibridação com dois
oligonucleotídeos sintéticos, iniciadores de amplificação de um fragmento de 213 pb.
A amplificação aplicada à detecção directa do HIV em amostras de sangue, para ser
eficaz, têm que ser altamente sensível porque, em geral, só uma pequena percentagem de
linfócitos T está infectada. A Fig. 228.II.A ilustra a sensibilidade da amplificação aplicada ao
segmento de 213 pb, a partir de 2 picogramas de DNA de HIV clonado num plasmídeo, em
função do número de ciclos. A detecção é efectuada por hibridação de uma amostra diluída
de 1/70 de meio reaccional, aplicada numa membrana de nitrocelulose, com uma sonda
oligonucleotídica de 19 nucleotídeos, marcada com 32P (dot blot).
A verificação do comprimento do segmento amplificado efectua-se por electroforese
num gel de agarose 2 % de uma amostra do meio reaccional, seguida de autorradiografia. A
radioactividade provém da incorporação de um nucleosídeo trifosfato (por exemplo 32P-
dCTP), adicionado à mistura dos restantes 3 nucleosídeos trifosfatos durante a reacção de
polimerização (Fig. 228.II.B).
Uma quantificação do número de moléculas de DNA detectáveis dá a medida da
sensibilidade deste método. A Fig. 228.II.C. mostra que é possível detectar até 4 moléculas
de DNA. Este resultado foi obtido amplificando uma mistura composta de uma quantidade
fixa do DNA do HIV plasmídico (4 x 105 moléculas) e de quantidades crescentes (a partir de
1µg) de DNA humano de controlo que serve de meio de diluição serial. Esta sensibilidade de
4 moléculas corresponde à possibilidade de detectar 1 molécula de DNA de HIV em cerca de
106 linfócitos.
Aplicada à identificação de HIV em indivíduos seropositivos, a amplificação enzimática
confirma inequivocamente a infecção. A Fig. 229.II. representa o resultado da hibridação de
DNA, proveniente de sangue de três indivíduos seropositivos, amplificado e aplicado numa
membrana, com a sonda oligonucleotídica. O número de ciclos de amplificação necessários
para obter um sinal é variável de indivíduo para indivíduo e reflecte provavelmente a
abundância de linfócitos T no sangue destes pacientes.
156
Os resultados mais importantes deste estudo aparecem na Fig. 230.II. Entre um grupo de
risco constituído por 16 pessoas seronegativas, parceiras de indivíduos seropositivos, 5
revelaram-se inequivocamente infectadas por HIV. Uma análise electroforetica do DNA
amplificado destes indivíduos confirma plenamente estes resultados (Fig. 231.II.).
A detecção directa do DNA viral pode, pois, antecipar-se ao desenvolvimento de uma
reacção serológica positiva. Este método foi, também, aplicado com sucesso à identificação
do DNA de HIV no sangue de crianças com menos de 18 meses nascidos de mães
seropositivas.
Utilizado a grande escala este teste constituirá, sem duvida, um progresso importante
para conter a disseminação, controlar a epidemia e determinar estratégias terapêuticas.
157
12. REGULAMENTAÇÃO SOBRE A UTILIZAÇÃO DE ORGANISMOS
GENETICAMENTE MODIFICADOS E A PROTECÇÃO CONTRA OS RISCOS
BIOLÓGICOS
As aplicações dos organismos recombinantes que podem beneficiar as nossas sociedades
são, como vimos, numerosas e abrangem importantes sectores económicos e sociais. No
entanto, como qualquer outra actividade humana, a que recorre à utilização dos organismos
geneticamente modificados não é isenta de riscos. Estes riscos potenciais de futuras
aplicações foram, pela primeira vez, objecto de preocupações expressas publicamente pelos
próprios cientistas, em 1974, em carta dirigida à Academia das Ciências dos Estados Unidos
da América. Foi primeiramente pedido que fosse observado uma moratória, aplicando-se às
experiências de clonagem que envolvessem os genomas de certos vírus animais, de
determinantes de resistência a antibióticos, de toxinas e de oncogenes. Foram, em seguida,
elaboradas, pela primeira vez, em 1976, pelo National Institutes of Health (NIH), uma série
de directivas que foram actualizadas em 1986, que definem categorias de confinamento
biológico e físico a que os investigadores desta área se devem submeter. Estes diferentes
níveis de confinamento são definidos em função do tipo de vector e da origem do DNA
objecto da recombinação.
O novo conceito de confinamento biológico preconiza a utilização de sistemas vector-
hospedeiro "desarmados", que só podem sobreviver em condições laboratoriais especiais.
A noção de confinamento físico estabelece quatro níveis de segurança, que vão das
práticas laboratoriais microbiológicas de base (BL-1 = Biosafety Level-1) até às mais
sofisticadas medidas e condições de protecção do pessoal e do meio ambiente (BL-4), por
imposição de progressivas barreiras físicas (pressão negativa, portas duplas e herméticas,
autoclaves, filtração do ar de saída, descontaminação rigorosa de todo o material e dos
efluentes, etc.)
Estas recomendações levaram ao desenvolvimento de sistemas vector-hospedeiro sem
risco para o tipo de actividade em vista (ensino, investigação académica ou industrial,
produção...). Um certo número de estirpes bacterianas foram modificadas de maneira a torná-
las não viáveis fora do laboratório. Por exemplo, a estirpe X1776, derivada de E. coli K12,
possui uma exigência metabólica (biossíntese da lisina), que não pode ser compensada pelas
substâncias presentes no intestino humano (acido diaminopimélico).
Além disso, esta estirpe possui uma membrana celular frágil que se desagrega em
presença de detergente ou de força iónica fraca. A esta estirpe seguiram-se outras derivadas
de K12, de utilização mais cómoda, mas também incapazes de sobreviver fora do laboratório.
158
Os plasmídeos também foram modificados para serem incapazes de se transferirem de
uma estirpe para outra e não poderem disseminar a resistência aos antibióticos.
Quanto aos fagos, uma série de mutações sem sentido nos genes de associação, torna-os
incapazes de se multiplicarem fora dum hospedeiro de laboratório apropriado.
Os riscos potenciais do DNA recombinante continuam a pertencer ao domínio da
especulação, na medida em que os milhões de experiências realizadas nos últimos 25 anos
não permitiram nunca pôr em evidência riscos biológicos causados por uma bactéria, vírus,
fungo, ou célula portadores de DNA recombinante, para além dos perigos inerentes à
natureza da molécula de DNA recombinante. Isto é, a recombinação genética não levou até
hoje ao desenvolvimento de novas propriedades inesperadas nos organismos recombinantes.
Como não é, no entanto, possível demonstrar a segurança absoluta duma construção genética
particular em todas as circunstâncias que se possam imaginar, é normal e aconselhável, que
as experiências envolvendo organismos geneticamente modificados se efectuem adoptando
medidas de precaução definidas por directivas compulsórias, em particular as experiências de
maior risco, pelo impacto que podem vir a ter no meio ambiente, ou as que levantam
problemas de ordem ética, tais como:
-fermentações a grande escala de organismos contendo DNA recombinante,
-a libertação deliberada no ambiente de organismos geneticamente modificados,
-a transferência de genes em células embrionárias de mamíferos e criação de animais
transgénicos,
-a terapia genética e a clonagem de seres humanos.
Em 1990, o Parlamento Europeu aprovou duas directivas, uma relativa à utilização
confinada de microorganismos geneticamente modificados e outra relativa à libertação
deliberada no ambiente de organismos geneticamente modificados, propostas pelo Conselho
das Comunidades Económicas Europeias, que definem a legislação que os Estados Membros
deverão implementar.
Esta legislação é apresentada, na sua forma integral, em anexo.