41

Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Ferramentas de Tradução e Terminologia

José João Dias de [email protected]

Alberto Manuel B. Simõ[email protected]

Departamento de InformáticaUniversidade do Minho

Page 2: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Conteúdo

1 Introdução 6

2 Cultura Geral 72.1 Tipos de �cheiros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2 Compactação de �cheiros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.2.1 Instalação do WinZip . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.2.2 Utilização do WinZip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3 Internet como fonte de informação 103.1 Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.1.1 Directorias Temáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.1.2 Motores de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.1.3 Uso de Motores de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . 113.1.4 Uso avançado de Motores de Pesquisa . . . . . . . . . . . . . . . . . . . 11

3.2 Biblioteca de referência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

4 Corpora 144.1 Introdução aos corpora e linguística de corpora . . . . . . . . . . . . . . . . . . 14

4.1.1 Exemplos de uso de corpora . . . . . . . . . . . . . . . . . . . . . . . . . 144.1.2 Construção de corpora . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144.1.3 Terminologia, glossários, dicionários . . . . . . . . . . . . . . . . . . . . 15

5 Tradução 165.1 Tradução automática exploratória . . . . . . . . . . . . . . . . . . . . . . . . . . 165.2 Tradução assistida por computador . . . . . . . . . . . . . . . . . . . . . . . . . 16

6 Gestão de terminologia 186.1 Trados MultiTerm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

6.1.1 Interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186.1.2 Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216.1.3 De�nição de Estrutura . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226.1.4 Inserção de uma �cha terminológica . . . . . . . . . . . . . . . . . . . . 246.1.5 Hiper-ligações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266.1.6 Exportação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266.1.7 Filtros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276.1.8 Modelos de Inserção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

1

Page 3: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

7 Gestor de Memórias de tradução 297.1 Trados Workbench . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

8 Sistema de alinhamento 308.1 Trados WinAlign . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

8.1.1 De�nição do Projecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308.1.2 Alinhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

9 Tradução de formatos especí�cos 369.1 Trados TagEditor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

10 Gestão de projectos de tradução 3710.1 Trados Workspace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

A Documentos de leitura sugerida 38

2

Page 4: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Lista de Figuras

6.1 Estrutura da janela principal do MultiTerm . . . . . . . . . . . . . . . . . . . . 196.2 Estrutura do registo de um conceito . . . . . . . . . . . . . . . . . . . . . . . . 206.3 De�nição de estrutura de uma base terminológica . . . . . . . . . . . . . . . . . 236.4 Inserção de uma �cha terminológica . . . . . . . . . . . . . . . . . . . . . . . . 256.5 De�nição de �ltros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

8.1 De�nições de Alinhamento (línguas) . . . . . . . . . . . . . . . . . . . . . . . . 318.2 De�nições de Alinhamento (�cheiros) . . . . . . . . . . . . . . . . . . . . . . . . 328.3 De�nições de Alinhamento (exportação) . . . . . . . . . . . . . . . . . . . . . . 338.4 Pré-alinhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348.5 Processo de alinhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3

Page 5: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Lista de Tabelas

6.1 Linguagem de de�nição de �ltros . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4

Page 6: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Lista de Exercícios

2.1 Instalação de um compactador . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3.1 Pesquisa de traduções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

6.1 Navegação sobre uma base terminológica . . . . . . . . . . . . . . . . . . . . . . 206.2 Pesquisa Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216.3 Pesquisa Global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216.4 Pesquisa fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226.5 De�nição da estrutura de uma base terminológica . . . . . . . . . . . . . . . . . 256.6 Inserção de �cha terminológica . . . . . . . . . . . . . . . . . . . . . . . . . . . 266.7 Hiper-ligações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266.8 Exportação de base terminológica . . . . . . . . . . . . . . . . . . . . . . . . . . 27

5

Page 7: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Capítulo 1

Introdução

Este documento pretende dar apoio à disciplina de Ferramentas de Tradução e Terminologiado curso de Línguas Estrangeiras Aplicadas da Universidade do Minho.

6

Page 8: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Capítulo 2

Cultura Geral

Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentaralguns conceitos básicos sobre o uso de um computador e gestão de �cheiros.

1. Instalação de software simples (Ex. software domínio público, software de demonstração,etc);

2. Aprender a visualizar e imprimir PDF e alguns outros formatos comuns (ir buscar oAcrobat Reader, instalá-lo e utilizá-lo);

3. Aprender a mandar documentos (qualquer tipo) via mail em anexo (attachment).

2.1 Tipos de �cheiros

Com certeza que já reparou na grande panóplia de diferentes tipos de documentos existenteno mundo da Informática. Em particular, se usa o Microsoft Windows, deve ter reparado quevários documentos apresentam ícones diferentes. Cada um destes ícones representa um tipode �cheiro diferente.

Apesar de existir sistemas como o Microsoft Windows que apresentam ícones para cadatipo de �cheiro, normalmente os diversos tipos são identi�cados por um conjunto de letras queaparecem no �m do nome do �cheiro precedidas por um ponto.

sebenta.doc manual.pdffotografia.jpg documento.xml

Nos nomes de �cheiros apresentados, .doc, .jpg, .pdf e .xml são exemplos de extensõesde nomes de �cheiros. A cada uma destas extensões está associado um tipo de documento e,muitas vezes, um tipo de aplicação.

Esta secção pretende apresentar uma pequena listagem de tipos de �cheiros, e aplicaçõesa ele relacionadas.

.txt é o mais simples formato existente. Limita-se a uma sequência de caracteres, sem qual-quer tipo de formação. Para a sua edição sugere-se, em Windows, o notepad ou blocode notas. No caso de se usar o wordpad ou o Microsoft Word deve-se ter o cuidado devoltar a gravar o documento em formato de texto;

7

Page 9: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

.doc extensão de documentos criados com o Microsoft Word ou Wordpad. Embora úteis paraa criação de documentos, são completamente ine�cientes em relação à sua portabilidade,e intercâmbio entre sistemas;

.rtf conhecido como Ritch Text Format, é um formato baseado em texto puro com um con-junto de comandos (normalmente precedidos por uma barra invertida) que permitem asua formatação. Podemos considerá-lo como o antecessor do formato .doc. Para a suaedição sugere-se o Microsoft Windows ou o WordPad ;

.pdf Portable Document Format. Formato de hiper-documentos portáveis entre sistemas.Além de permitirem a formatação de texto e inclusão de imagens, suportam hiper-ligações entre zonas do documento, tornando-se documentos interactivos. Para a suavisualização é necessário o Acrobat Reader, um programa da Adobe que é gratuito.

.ps PostScript, pode ser considerado o predecessor do formato PDF, mais vocacionado parao modo como as impressoras funcionam do que para a sua visualização.

.xml eXtensible Markup Language é um formato baseado em texto puro que utiliza etiquetas(sequências especiais de caracteres) para delimitar zonas nos documentos. Embora usecomandos, é o formato ideal para intercâmbio de informação por se basear em textopuro. Por esta razão, pode ser editado em ferramentas como o NotePad, embora existamferramentas dedicadas à sua edição.

.html/.htm HyperText Markup Language é uma linguagem baseada em SGML (uma vari-ante do XML) para a descrição de páginas para a Internet. Ultimamente, é consideradocomo uma instância especí�ca da linguagem XML para a Web. Programas como o Mi-crosoft Word, Microsoft Frontpage ou Netscape Composer permitem a sua modi�cação,mantendo o formato original;

.tmx Translation Memories Exchange é um formato também baseado em XML com o ob-jectivo de permitir o intercâmbio de memórias de tradução entre os vários sistemasexistentes. Voltaremos a falar sobre este formato na secção 7 da página 29;

.jpg formato para imagens, baseado num algoritmo de compressão com perdas. É e�cientena compressão de fotogra�as, uma vez que a razão entre as perdas introduzidas peloalgoritmo e a compressão é compensadora;

.gif formato para imagens, baseado em compressão sem perdas, em que cada imagem podeusar um máximo de 256 cores. É usado para imagens como diagramas, em que a quali-dade é importante, e o número de cores desprezável. Suporta transparência. e a criaçãode animações para Internet, baseadas na sobreposição de imagens;

.png Portable Network Graphics é um novo formato para imagens, algo entre o tipo JPG eGIF. Suporta 16 milhões de cores, e utiliza um algoritmo de compressão sem percas.Suporta transparência a vários níveis, e está cada vez mais a ser o formato adoptadopara páginas na Web;

.bmp Bitmap é um formato quase sem compressão e que suporta vários níveis de cores, desde256 a 16 milhões. Visto não usar compressão não é aconselhado o seu uso em páginasde Internet uma vez que os seus tamanhos são, normalmente, gigantescos;

8

Page 10: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

.zip um dos mais comuns formatos de documentos ou pastas compactadas. Estes �cheirosespeciais de que iremos falar na secção 2.2, utilizam algoritmos e�cientes de compactaçãosem percas para reduzir o tamanho de um ou vários documentos, de forma a seremtransportáveis em suportes com memória reduzida; Para o seu manuseio, sugere-se o usoda aplicação WinZip ou WinRar ;

.rar outro formato de documentos compactados com as mesmas características dos �cheirosZIP. Em alguns casos, a sua e�ciência é maior na relação entre o espaço original e espaçocompactado. Para abrir documentos com esta extensão deve usar a aplicação WinRar ;

.ppt formato do Microsoft PowerPoint, para apresentações multimédia;

.xls formato do Microsoft Excel, para folhas de cálculo.

.mtw formato do Trados MultiTerm para bases de dados terminológicas. Ver secção 6.1.

.mdx formato do Trados MultiTerm para de�nições de exportação. Ver secção 6.1.6.

2.2 Compactação de �cheiros

A compactação de �cheiros tem como objectivo a redução dos seus tamanhos de forma apermitir transportá-los de forma mais rápida (pela Internet, por exemplo) ou de forma a quecaibam em dispositivos de memória reduzida (por exemplo, uma disquete).

Esta compactação pode ser feita apenas a um �cheiro ou a um conjunto deles. Ao com-pactar juntamente vários �cheiros, existe a vantagem de que o programa de compactação irácriar apenas um �cheiro que contém todos os �cheiros compactados.

Embora seja possível com os programas actuais abrir e alterar documentos compactados,tal nem sempre é uma boa ideia por gastar mais recursos do computador respectivo.

A compactação é obtida com base na catalogação de partes que se repetem ao longo dodocumento, criando um dicionário que associa a cada uma destas partes um pequeno códigoque a irá substituir ao longo do documento.

2.2.1 Instalação do WinZip

Exercício 2.1 Instalação de um compactadorInstale um sistema de compactação/descompactação no seu computador. Pode arranjar oWinZip, na sua versão shareware em http://www.winzip.com.

2.2.2 Utilização do WinZip

9

Page 11: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Capítulo 3

Internet como fonte de informação

Embora a utilização de dicionários, gramáticas e enciclopédias seja imprescindível para otradutor, existe informação que não se pode obter pelos métodos tradicionais. Exemplo decasos em que estes utensílios não são su�cientes é a tradução de textos técnicos com termosemergentes que nem sempre estão incluídos em dicionários.

Para colmatar este problema, sugere-se a utilização de Internet como fonte de informaçãoquer para a desambiguação do uso de determinados termos, quer para a de�nição de termosmenos comuns.

3.1 Pesquisa

Devido à grande quantidade de informação disponível na Internet, várias formas de a catalogarforam aparecendo. Em particular, apareceram páginas (ou sites) que permitem a pesquisasobre um grande conjunto de páginas catalogadas.

Estes centros de informação dividem-se em dois grandes grupos: motores de pesquisa edirectorias temáticas.

3.1.1 Directorias Temáticas

Vários sites, como por exemplo o SAPO1, dispõem de uma árvore temática (muito semelhante aum thesaurus) em que estão organizadas as várias páginas de Internet catalogadas. Este tipode estrutura permite uma navegação semanticamente orientada sobre a sua base de dados.Em certos casos, estes sites também incluem uma zona de pesquisa a partir de um conjuntode palavras. No entanto, este método distingue-se das motores de pesquisa por permitiremapenas a pesquisa sobre os documentos que se encontram catalogados na árvore temática.

3.1.2 Motores de Pesquisa

Estes sites, embora também possam incluir directorias temáticas, têm um tipo de funciona-mento diferente; usam robots que percorrem a Internet seguindo ligações entre páginas, e vãocatalogando cada uma delas. Esta catalogação não as insere numa árvore temática, indexandoapenas o seu conteúdo. Ao realizar uma pesquisa num destes sites, o sistema irá percorrer

1http://www.sapo.pt

10

Page 12: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

toda a sua base de dados de páginas indexadas e não só as que foram colocadas manualmentena árvore temática.

Exemplos de motores de pesquisa são: google2, yahoo3, altavista4.

3.1.3 Uso de Motores de Pesquisa

Ao visitar um motor de pesquisa acabamos por encontrar uma página com um local paraintroduzir o texto que estamos a procurar. Depois de o escrever e escolher o botão respectivopara iniciar a pesquisa, o sistema irá apresentar uma lista de entradas (normalmente, as dezprimeiras) ordenadas de acordo com os critérios do motor de pesquisa.

Assim como cada motor de pesquisa tem os seus critérios de relevância sobre as páginas,cada um tem uma linguagem associada que permite aumentar o poder de pesquisa.

Por exemplo, o Google[1] tem as seguintes propriedades:• as páginas apresentadas contêm todos os termos introduzidos para pesquisa;• alguns termos introduzidos são ignorados, quando são reconhecidos como termos dema-siado comuns. Exemplos destes termos são letras soltas ou http ou .com;

• não faz stemming, ou seja, não procura sub-padrões. Se procurar �telef� o google nãoirá encontrar �telefone� ou �telefax�. Se está em dúvida, use ambas as palavras;

• não é sensível às maiúsculas ou minúsculas, ou a acentos e marcas diacríticas;• para procurar frases completas, como �to be or not to be� use aspas na pesquisa: � "tobe or not to be" �;

3.1.4 Uso avançado de Motores de Pesquisa

Alguns destes motores de pesquisa suportam métodos de pesquisa mais e�cientes do que osapresentados na secção anterior. Para isso, usam uma linguagem especí�ca para de�nir certoscritérios de pesquisa.

Alguns detalhes técnicos acerca do Google:• embora ignore palavras comuns, letras ou algarismos (visto que aumentam o tempo depesquisa), indica que palavras foram ignoradas. No entanto, se alguma destas palavrasé essencial para encontrar os resultados que procura, pode usar o sinal �+� (mais) antesda palavra em questão. Não esquecer o espaço antes do sinal.Se quiser procurar o primeiro episódio da Guerra das Estrelas poderia usar �Star WarsEpisode +I�;

• por vezes uma palavra pode ter dois signi�cados. Ao procurar pela palavra �canto�poderia encontrar quer páginas relativas a canções, como páginas referentes a pássaros.Neste caso, pode pedir ao Google que procure páginas em que determinada palavra nãoexista. Isto pode ser obtido usando o sinal �-� (menos) antes da palavra em questão:�canto -pássaro�;

2http://www.google.com3http://www.yahoo.com4http://www.altavista.com

11

Page 13: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

• se procura páginas que contenham uma de várias palavras use o operador �OR� (emmaiúsculas). Se deseja procurar um destino de férias mas ainda não decidiu entre Londrese Paris, tente: �férias londres OR paris�;

• procura o contacto de um funcionário da Universidade do Minho. Nesse caso, é na-tural que a página que lhe interessa esteja num dos sites da Universidade (dentro deuminho.pt). Poderá usar o operador �site:� para esse �m: �reitor site:uminho.pt�.De forma semelhante, para obter páginas no web português (.pt) pode usar �pt�;

• pode querer saber que páginas estão a apontar para determinado endereço, por exem-plo, para a sua página pessoal. Para isso usa-se o operador �link:� antes do ende-reço em questão. Por exemplo, para encontrar páginas que liguem ao Google iria usar�link:www.google.com�;

• o operador �related:� irá listar páginas �semelhantes� ao endereço indicado.�related:www.google.com� irá listar as páginas parecidas com a do Google;

• para obter informação sobre determinada página usa o operador �info:�. Experimente�info:www.google.com�;

• se usar o operador �allintitle:�, todas as palavras que lhe seguem têm de aparecer notítulo da página para que o Google as mostre;

• de forma semelhante, o operador �intitle:� irá obrigar a que a palavra que se lhe segueapareça no título (e não todas);

• o operador �allinurl:� irá restringir a páginas em que todas as palavras que se lheseguem estejam no URL da página em questão;

• com funcionalidade semelhante, o operador �inurl:� irá restringir a páginas em que apalavra que se lhe segue esteja no URL da página em questão;

Note que nos operadores que acabam em dois pontos (:) não deve incluir um espaço entreeles e a palavra que se lhe segue.

Exercício 3.1 Pesquisa de traduçõesTente usar o Google e as propriedades de pesquisa avançada para encontrar traduções determos que não sejam triviais de traduzir. Tente descobrir qual a forma �o�cial� de traduzir�Computer Graphics�.

3.2 Biblioteca de referência

Constituição de informação organizada sobre referências temáticas tais como:• enciclopédias;• dicionários, glossários;• cronologias;

12

Page 14: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

• informação cultural geográ�ca;• bibliotecas digitais;• revistas;• repositórios terminologias, memórias de tradução, . . .

13

Page 15: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Capítulo 4

Corpora

4.1 Introdução aos corpora e linguística de corpora

• Entende-se por corpus (mono-lingue) como um grande conjunto fechado de texto emdeterminada língua, e por vezes, de determinado género linguístico.

• Da mesma forma, entende-se por corpus bilingue dois conjuntos de texto, em línguasdistintas, que podem ser a tradução um do outro.

• Corpora paralelos (semelhante a memórias de tradução) � tipicamente corpora bilinguecom alinhamento à frase

• Corpora comparados � dada a di�culdade em arranjar corpora paralelos, por vezesconstitui-se corpora bilingues por junção de textos de temática muito semelhante. (exem-plo: juntar artigos de jornal Ingleses e Portugueses a descrever o desastre do Prestige.Embora não sejam a tradução um do outro, é de esperar que a haja terminologia seme-lhante)

• Corpora etiquetado � corpora em que é acrescentada informação adicional ligada à pa-lavra, à estrutura ou a outras coisas.

4.1.1 Exemplos de uso de corpora

• Corpora pesquisável pela Internet;

4.1.2 Construção de corpora

• "juntar"textos (como resultado de processos anteriores, digitalização, via rede, ...);• alinhamento de textos paralelos;• questões associadas a formatos (durabilidade, independência de ferramentas, platafor-mas, etc);

• ferramentas ligadas a corpora

14

Page 16: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

4.1.3 Terminologia, glossários, dicionários

• Exemplo do Babylon (babylon builder: constrói glossários (.gls) textuais; babylon: dis-ponibiliza muitos glossários, dicionários de tradução);

• Exemplo do Trados MultiTerm; (estrutura mais complexa e poderosa; dependente deplataforma mas capaz de exportar em TEI, RTF, formatos textuais; integrado no sistemade tradução Trados)

• FreeDict;• Thesaurus;

15

Page 17: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Capítulo 5

Tradução

A tradução pode ter grau de exigência variada consoante o objectivo a que se destina. Destaforma, convencionamos que:

• tradução exploratória é destinada a obter um documento traduzido, mesmo que compalavras por traduzir ou mal traduzidas, e erros sintácticos, apenas para compreendertotal ou parcialmente o conteúdo do documento;

• tradução humana é aquela que tem validação humana. Pode ser totalmente manual ouajudada por computador.

5.1 Tradução automática exploratória

Este tipo de tradução é, normalmente, completamente automática e portanto, autónoma dotradutor. É baseada em dicionários de palavras ou termos e raramente ou quase nunca temem conta a estrutura gramatical de cada língua.

Embora sem qualidade, este tipo de tradução pode ser útil como dicionário de tradu-ção (embora se obtenha apenas uma possível tradução) ou então como processo rápido paracompreender parcialmente o conteúdo do documento, podendo mais tarde vir a traduzir ma-nualmente em caso de interesse.

Estes sistemas são normalmente disponibilizados por motores de pesquisa na web, de formaa que qualquer utilizador possa ler um qualquer documento da aldeia global. Exemplo de umdestes sistemas é o babel�sh, que pode ser visitado em http://babelfish.altavista.com.

5.2 Tradução assistida por computador

A tradução assistida por computador pode ser dividida em dois grupos. Um em que o tradutorusa a máquina apenas como dicionário de tradução, e outro em que são usados sistemas deabstracção sobre tipos de documentos, sistemas de gestão de memórias de tradução, gestoresde terminologia, etc.

É deste tipo de tradução que vamos falar. Normalmente, estas ferramentas são designa-das de �CAT Tools � Computer Assisted Translation Tools�. Exemplos de ferramentas CATcomerciais são o Trados e o DéjàVu.

Estas ferramentas envolvem os seguintes componentes:

16

Page 18: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

• gestor de terminologias � mais do que um dicionário de tradução, uma base terminológicaassocia termos a conceitos, podendo agregar exemplos de uso, de�nições, comentários,etc.;

• memórias de tradução � sempre que é efectuada uma tradução para determinado cliente,o trabalho efectuado não vai ser deitado fora. Usando memórias de tradução, traduçõesde textos iguais ou semelhantes a traduções anteriormente efectuadas podem voltar aser usadas;

• gestor de projectos de tradução � normalmente um trabalho de tradução não envolveapenas a tradução de determinado documento. Ao existir uma aplicação de gestão deprojectos, é possível organizar documentos, bases terminológicas e memórias de traduçãoespecí�cas do projecto num local comum;

• editor de tradução � permite a abstracção sobre os tipos de documentos a traduzir,de forma a que o tradutor não precise de se preocupar com o formato interno dosdocumentos;

17

Page 19: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Capítulo 6

Gestão de terminologia

Uma das principais ajudas para uma tradução bem feita é um conjunto de terminologia ade-quada ao documento a traduzir. Determinados termos, em algumas áreas, têm traduções quepelo seu uso durante vários anos, e por várias instituições, �caram cristalizados e são as tra-duções �o�ciais�. Nestes casos, os tradutores não devem tentar fazer a sua própria tradução,mesmo que julgue que a sua seria melhor. Como estes termos e respectivas traduções �o�ciais�não aparecem em dicionários, o tradutor deve ter um conjunto de bases terminológicas, paracada uma das áreas em que está a trabalhar.

Estas bases terminológicas podem ser disponibilizadas pelo cliente da tradução (o que acon-tece só em casos de empresas de grandes dimensões) ou, geralmente, devem ser constituídase mantidas pelos tradutores. Para a sua construção o tradutor deve usar não só documentosque tem à sua disponibilidade, desde dicionários a enciclopédias, como também a Internet,como vimos no capítulo 3, ou ainda a discussão com técnicos da área em que a tradução deinsere.

Cada base terminológica deve ser fechada (self-contained), ou seja, deve conter os termosda área, relacionando-os entre si.

Podemos de�nir de forma abstracta uma base terminológica como sendo um conjunto deregistos terminológicos. Cada um destes registos contém um ou mais termos em várias línguas,que se referem ao mesmo conceito. Em vários casos pode ser necessário associar ao conceitoou a algum dos termos uma de�nição, categorização gramatical e/ou morfológica da palavra,exemplos de uso ou qualquer outro tipo de informação adicional.

6.1 Trados MultiTerm

O pacote de ferramentas Trados inclui um gestor de terminologia[3] bastante poderoso. Per-mite não só a construção de bases terminológicas (com um formato con�gurável), como a suaconsulta ou exportação em diversos formatos.

6.1.1 Interface

Quando iniciamos o MultiTerm (escolhendo no botão Iniciar/Start a opção adequada) deveráaparecer uma janela de diálogo a questionar o utilizador sobre se deseja acesso restrito àbase terminológica. Isto deve-se à aplicação ter sido desenvolvida para funcionar numa redede computadores. Neste ambiente, torna-se importante que quando um utilizador efectue

18

Page 20: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

alterações à base terminológica não possa existir outro utilizador a realizar também alterações(mas apenas a consultar). Assim sendo, sempre que desejamos realizar alterações nas basesterminológicas, devemos escolher a opção que nos dá acesso restrito.

Figura 6.1 Estrutura da janela principal do MultiTerm

Depois da aplicação iniciada deverá aparecer uma janela semelhante à apresentada na�gura 6.1. As zonas apresentadas correspondem a:Barra de menu onde se podem escolher as operações passiveis de serem realizadas sobre a

base terminológica e os seus registos;Barra de diálogo zona que permite a navegação sobre a base terminológica. Esta é com-

posta pelos campos da língua de origem e língua de destino, pelos botões de navegaçãopara os conceitos seguintes e anteriores, pelo conceito actual e pelo campo de pesquisa;

De�nição do conceito zona onde é mostrada a �cha terminológica do conceito actual (ex-plicada na �gura 6.2);

Barra de mensagens onde aparecem mensagens importantes do sistema que explicam oserros ou sucessos das operações efectuadas;

Língua de origem permite a escolha da língua de origem da consulta, de entre as línguasexistentes na base terminológica;

Língua de destino permite a escolha da língua de destino da consulta, de entre as línguasexistentes na base terminológica;

Conceito actual mostra o conceito que está a ser visualizado nesse momento (na língua deorigem);

19

Page 21: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Próximo conceito botão com o próximo conceito (pela ordem lexicográ�ca) da base termi-nológica. Pode ser usado para navegar sequencialmente pelos vários termos existentes.

Conceito anterior botão (que não aparece na imagem) à esquerda do conceito actual quepermite aceder ao conceito anterior da base terminológica;

Campo de pesquisa zona que permite efectuar pesquisas de termos na língua de origemsobre a base terminológica (ver secção 6.1.2);

Figura 6.2 Estrutura do registo de um conceito

Por sua vez, a �gura 6.2 mostra a estrutura típica de uma �cha terminológica:Cabeçalho contém um conjunto de campos referentes ao conceito, como um todo. Neste

exemplo podemos reparar não só no número de registo, como também no assunto emque se insere este conceito, assim como uma nota;

Língua de Origem contém os vários termos na língua de origem que se inserem neste con-ceito, assim como de�nições, notas ou propriedades a eles associados;

Língua de Destino contém os vários termos na língua de destino que se inserem neste con-ceito, assim como de�nições, notas ou propriedades a eles associados;

Outras Línguas contém termos noutras línguas que não as seleccionadas como língua deorigem ou língua de destino;

Exercício 6.1 Navegação sobre uma base terminológicaExecute o Trados MultiTerm. Utilize uma base terminológica (por exemplo, sample.mtw)para experimentar a alteração das línguas de origem e destino, assim como o uso dos botõespara aceder ao próximo ou ao termo anterior.

20

Page 22: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

6.1.2 Pesquisa

Existem três tipos de pesquisa: simples, global e fuzzy. Cada uma tem a sua funcionalidadeespecí�ca.

Pesquisa SimplesPermite pesquisar um termo directamente. É útil quando sabemos exactamente que termoestamos a procurar, ou com que caracteres ele começa.

Para realizar este tipo de pesquisa escreve-se no campo de pesquisa o termo, ou as primeirasletras do termo que procuramos, e carrega-se na tecla Enter.

A pesquisa funciona da seguinte forma:• se o termo existe, este é apresentado;• se o termo existe e é apresentado, e o botão do termo seguinte é o mesmo termo, signi�caque existem palavras homónimas na base terminológica;

• se o termo não existe, o MultiTerm irá apresentar o termo existente lexicamente seguinteao termo procurado. Também é apresentada na barra de mensagens �Not found �.

Exercício 6.2 Pesquisa SimplesTente efectuar várias pesquisas usando o campo de pesquisa. Experimente com palavras nãoexistentes, e experimente usar apenas os primeiros caracteres de cada palavra;

Pesquisa GlobalEste tipo de pesquisa é semelhante ao tipo de pesquisa simples. Na verdade, não é mais do quea pesquisa simples usando-se um caracter especial (o asterisco � *) para representar qualquersequência de caracteres.

Ou seja, se escrever na caixa de pesquisa qualquer coisa como �*ware� numa base termi-nológica, o MultiTerm iria apresentar uma janela com todos os termos (da língua de origemseleccionada) que terminam com �ware�. Da mesma forma, �a*z� irá apresentar todos os ter-mos que começam com a letra �a� e terminal com a letra �z�. Pode, também, utilizar maisdo que uma vez o asterisco. Assim, �*xyz*� iria apresentar todos os termos que contenham asequência de caracteres apresentada.

Exercício 6.3 Pesquisa GlobalUtilizando a base terminológica sample.mtw procure vários termos, utilizando o asterisco. Porexemplo, tente *berry e *berry*.

Pesquisa Fuzzy

Este tipo de pesquisa, a forma mais poderosa para encontrar um termo numa base termino-lógica, baseia-se num índice criado com todos os termos existentes, incluindo também formasortogra�camente erradas. Por exemplo, para a palavra �carro� o índice iria incluircarro acrro craro caror

21

Page 23: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

e, possivelmente, outras variantes.No entanto, este índice tem de ser construído antes de ser possível realizar uma pesquisa

deste tipo. Como estes índices incluem várias combinações para cada palavra, são lentos aserem construídos.

Para a criação do índice deve seleccionar a língua de origem da pesquisa que deseja realizar.Depois, no menu �File� escolhe-se a opção �Create Fuzzy Index �. É necessário con�rmar acriação do índice na janela que se lhe segue. O MultiTerm irá começar a criar imagens fuzzyde todos os termos da base terminológica. Quando o índice estiver pronto a ser usado, amensagem �Fuzzy index successfully created � irá aparecer na barra de mensagens.

Depois de criado o índice, pode-o usar escrevendo um cardinal (#) antes do termo a pes-quisar. Para perceber melhor experimente os exemplos do exercício 6.4.

Exercício 6.4 Pesquisa fuzzyNa base terminológica sample.mtw experimente criar um índice fuzzy para o inglês, e efectuarvárias pesquisas. Experimente #grape bunch ou #bunsh of prapes. Em ambos os casos, oMultiTerm deverá encontrar bunch of grapes.

6.1.3 De�nição de Estrutura

Uma base terminológica MultiTerm é um conjunto de registos indexados por língua. Cadaregisto pode conter termos em várias línguas. Cada termo, ou todo o registo (o conceito),pode ter a si associado um conjunto de campos. Além desta estrutura, cada língua pode terpropriedades de ordenação, e o registo pode ainda conter imagens.

Existem vários tipos de campos numa base terminológica:campos indexados normalmente correspondem às línguas existentes na base terminológica.

Só estes campos é que permitem o uso do campo de pesquisa;campos de texto podem estar associados ao conceito ou a um campo indexado e correspon-

dem a informação textual. São usados para campos como: de�nição, contexto, origem,gramática, exemplos;

campos enumerados também podem estar associados ao conceito ou a um campo indexado.No entanto, correspondem a campos cujo valor (texto inserido) tem de ser escolhido deentre uma lista de escolhas possíveis. São usados para campos como: género, categoria;

campos mistos são campos enumerados que permitem a inserção de texto extra além doexistente na lista de escolha;

Para de�nir uma base terminológica usa-se a opção �Create new termbase� no menu �File�.Irá aparecer uma janela semelhante à apresentada na �gura 6.3. Depois de de�nir a estruturadesejada, deve utilizar o botão �OK �, seguindo-se a escolha do nome do �cheiro onde vai gravara base terminológica.

Campos indexadosPara adicionar um campo indexado procede-se da seguinte forma:

1. seleccionar um campo indexado (língua) já existente;

22

Page 24: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Figura 6.3 De�nição de estrutura de uma base terminológica

23

Page 25: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

2. usar o botão Add ;3. escrever o nome do campo;Da mesma forma, é simples apagar um campo indexado já existente. Neste caso, selecciona-

se o campo indexado (língua) a apagar e usa-se o botão Delete.

Campos de textoSão de�nidos e apagados exactamente da mesma forma dos campos indexados:

1. seleccionar um campo de texto já existente;2. usar o botão Add ;3. escrever o nome do campo;

ou seleccionar o campo a apagar e usar o botão Delete.

Campos enumeradosA de�nição de campos enumerados é feita a dois níveis. Realiza-se um primeiro passo seme-lhante ao realizado para os campos anteriores:

1. seleccionar um campo enumerado já existente;2. usar o botão Add ;3. escrever o nome do campo;

Passa-se a de�nir os valores que este campo pode conter. Na caixa respectiva, escreve-se emcada linha um dos textos pré-de�nidos que o campo pode conter. Para mudar de linha usa-sea combinação de teclas �Ctrl+Enter�. Para apagar um destes valores usa-se o teclado comonum editor de texto comum.

Para apagar todo o campo enumerado, selecciona-se o campo em questão e usa-se o botãoDelete.

Campos mistosComo referido acima, pode existir necessidade de manter um campo enumerado que permita aadição de mais algum texto. A sua de�nição é realizada criando um campo enumerado normale, os valores que devam permitir texto extra, têm de terminar com o caracter �dois pontos �:�.

6.1.4 Inserção de uma �cha terminológica

Para inserir uma �cha terminológica usa-se a opção �Add Entry� no menu �Edit�. Irá apareceruma janela semelhante à apresentada na �gura 6.4.

A �gura mostra não só a janela de inserção mas também a janela que lhe irá aparecer seusar o botão �Entry Header �. Esta janela mostra apenas informação como a data de inserçãodo registo, data em que foi alterado e número de ordem do registo.

24

Page 26: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Exercício 6.5 De�nição da estrutura de uma base terminológicaTente de�nir um novo tipo de base terminológica com a seguinte estrutura:

• campos indexados: português, inglês, francês;• campos de texto: de�nição, nota, exemplo;• campos enumerados: género (masculino/feminino), número (singular/plural), categoriagramatical (verbo/nome/adjectivo/. . . );

Figura 6.4 Inserção de uma �cha terminológica

Os outros dois botões permitem cancelar totalmente a edição da �cha terminológica ougravar o registo. As outras duas áreas permitem a edição do registo e ver as mensagens dosistema em relação à edição que está a efectuar.

A inserção de dados é bastante dependente do local onde o cursor do rato se encontra.Sempre que for necessário colocar o rato sobre determinado local na área de edição, repare nabarra de mensagens se tem o rato no sítio correcto.

Para inserir um campo indexado deve usar a tecla �I�. Irá aparecer a lista de línguasexistentes na base terminológica. Depois de escolher a língua que deseja inserir irá apareceruma janela onde deve escrever o termo que está a inserir.

Repare que ao colocar o cursor sobre um dos termos indexados a língua em questão iráaparecer na barra de mensagens.

Para inserir um campo de texto, enumerado ou misto associado ao conceito em geral, devecolocar o rato de forma a que a barra de mensagens não mostre qualquer língua. Normalmente,a forma mais simples de obter este estado é colocar o rato ligeiramente abaixo do botão�Cancel �.

Para inserir o campo associado a determinada língua deve colocar o rato sobre a línguaem questão.

25

Page 27: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

A inserção de um campo de texto é efectuada usando a tecla �T�. Irá escolher o campode texto em questão e escrever o texto respectivo. Da mesma forma, para inserir um campoenumerado ou misto irá usar a tecla �A�.

Para apagar um termo ou campo use a tecla �E�.

Exercício 6.6 Inserção de �cha terminológicaUsando a de�nição do exercício anterior introduza dois ou três registos, associando camposnão só aos vários termos mas também ao conceito geral;

6.1.5 Hiper-ligações

O MultiTerm permite inserir hiper-ligações nos campos de texto ou nos campos mistos. Destaforma, torna-se simples de colocar numa de�nição, exemplo ou nota um texto que ao serclicado salte para um outro termo.

Estas hiper-ligações são criadas utilizando um acento circun�exo antes e depois da palavra(ou termo) que deverá ser procurado na base terminológica.

Assim, poderia colocar numa de�nição um texto do género:chimpanzé: mamífero muito parecido com um ^macaco^.

que irá tornar a palavra �macaco� numa ligação para o termo com o mesmo nome.

Exercício 6.7 Hiper-ligaçõesExperimente criar uma hiper-ligação entre dois dos termos que inseriu no exemplo anterior.Veri�que que depois de gravadas, a hiper-ligação funciona!

6.1.6 Exportação

Para que a base terminológica seja de alguma forma útil é importante que seja pesquisávelmas também que possa ser usada para outros �ns.

Por esta razão, o MultiTerm inclui funcionalidades de exportação da base terminológicapara outros formatos, desde formatos simples de texto até um formato RTF pronto a serincluído num documento Word e impresso tal e qual um dicionário pro�ssional. É aindapossível de�nir1 os seus próprios formatos de exportação.

A exportação da base terminológica é realizada em dois passos. Em primeiro lugar énecessário de�nir estruturalmente a forma como a exportação é realizada. No segundo passo,exporta-se realmente a base terminológica.

Embora o Trados MultiTerm já inclua formatos de exportação continua a ser necessárioefectuar o primeiro passo. É preciso carregar a de�nição de exportação para o formato dese-jado. Para isso usa-se a opção �De�ne export� no menu �File�. A janela apresentada é usadapara a de�nição do formato de exportação. No entanto, é possível utilizar o botão �Load �para carregar um formato já existente. Depois de pressionado irá aparecer uma janela a pediro nome da função de exportação. Usa-se o botão �Browse� para escolher a de�nição a partir

1este tópico não irá ser coberto neste documento. Para mais informações consulte o manual de terminologiada Trados

26

Page 28: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

de um �cheiro do nosso disco. Irá surgir uma janela semelhante às usadas para abrir �chei-ros, em que se deve seleccionar o tipo de exportação desejado. Estes �cheiros, de extensão.mdx encontram-se na directoria em que o Trados foi instalado. Normalmente corresponde ac:\Program Files\trados\T5_fl\TT\.

Nesta directoria devem existir os seguintes formatos de exportação:backup.mdx permite exportar no formato de backup da Trados, um formato textual legível

num editor de texto;list.mdx formato textual que corresponde à lista dos termos da base terminológica;rtf.mdx exportação2 num formato pronto para um processador de texto como o Microsoft

Word, que gera um formato de dicionário pronto a ser impresso;tei.mdx exportação no formato TEI (Text Encoding Initiative) em XML;ventura.mdx exportação para a aplicação Corel Ventura;

Para qualquer um destes tipos de exportação, o processo segue escolhendo-se o �cheiro emcausa e usando-se o botão �Open�. O MultiTerm voltará à janela de de�nição de formatos deexportação, mas agora com um formato em memória. Termina-se este primeiro passo usandoo botão �Close�.

Segue-se a exportação. No menu �File� escolhe-se uma das opções �Export this entry� ou�Export all entries� conforme se deseje exportar apenas uma ou todas as �chas terminológicas,respectivamente. O MultiTerm abrirá uma janela onde deverá escrever o nome do �cheiro emque deseja exportar a base terminológica.

Exercício 6.8 Exportação de base terminológicaExperimente exportar uma base terminológica (por exemplo, a sample.mtw) para vários for-matos. Experimente o formato Backup e abra o �cheiro gerado com o Bloco de Notas (note-pad). Tente realizar a exportação da base terminológica no formato RTF e abrir o respectivodocumento gerado do Microsoft Word.

6.1.7 Filtros

O MultiTerm permite a de�nição de �ltros para seleccionar �chas terminológicas com deter-minadas propriedades. Por exemplo, é possível procurar todas as �chas terminológicas sobredeterminado assunto, ou procurar todas as �chas terminológicas que não têm um termo emdeterminada língua.

A �gura 6.5 mostra a janela onde se de�nem �ltros. Pode aceder à janela usando no menu�View � a opção �De�ne Filter �.

2A exportação no formato RTF é ligeiramente mais complicada do que a exportação num dos outrosformatos. Na verdade, antes de proceder ao carregamento do formato de exportação é preciso copiar um�cheiro especial que contém o cabeçalho RTF do documento a gerar.É necessário procurar o �cheiro MultiTerm.rtx no disco do seu computador (normalmente na directoria

c:\Program Files\trados\T5_fl\TT\) e copiá-lo para junto do �cheiro da base terminológica. Supondo quea sua base terminológica se chama c:\base.mtw terá de copiar o �cheiro MultiTerm.rtx para c:\base.rtx.Só depois poderá realizar a exportação neste formato.Deverá também ter cuidado ao gravar o �cheiro gerado, porque deve escolher a extensão correcta: .rtf

27

Page 29: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Figura 6.5 De�nição de �ltros

Cada linha da tabela é composta por duas partes: do lado esquerdo aparece o nome docampo que estamos a analisar, e do lado direito, o critério de �ltragem de�nido sobre essecampo.

Para a de�nição de critérios usam-se os caracteres especiais apresentados na tabela 6.1.

Tabela 6.1 Linguagem de de�nição de �ltros* o campo existe (mesmo que vazio)! o campo existe e não é vazio

!* o campo não existeo campo está vazio

xyz conteúdo do campo igual a �xyz�*xyz* o campo contém a sequência de caracteres �xyz�

!(...) negação da propriedade entre parêntesis

. . .

6.1.8 Modelos de Inserção

. . .

28

Page 30: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Capítulo 7

Gestor de Memórias de tradução

Com certeza de que se já realizou algum tipo de tradução comercial, deverá ter reparado quedeterminadas frases, slogans ou termos aparecem de forma repetida nos vários documentos atraduzir. É natural que se estiver a traduzir um conjunto de manuais de uma aplicação, cadaum dos manuais contenha uma notícia de direitos de cópia, uma secção introdutória e outraszonas que de uma forma ou de outra aparecem repetidamente em todos os documentos.

Nestes casos, a utilização de memórias de tradução torna a tradução mais simples e aomesmo tempo mais coerente. Sempre que o sistema encontre uma frase semelhante a uma quejá foi traduzida, irá mostrar esse caso e sugerir a reutilização desse texto.

Um gestor de memórias de tradução permite a consulta destas memórias de tradução, asua edição, importação e exportação em diferentes formatos.

. . .

7.1 Trados Workbench

. . .

• Consulta (procura paralela de pares de frases que concordem com um determinado pa-drão - �concordance�)

• Edição• importação/exportação em alguns formatos

29

Page 31: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Capítulo 8

Sistema de alinhamento

Se já realizou diversas traduções sem utilizar uma ferramenta de tradução especí�ca, é provávelque tenha um conjunto de trabalhos antigos perdidos pelo seu computador, completamente de-saproveitados. Os sistemas de alinhamento têm como objectivo a reutilização destes trabalhosem memórias de tradução para que o sistema possa vir a reutilizar o trabalho já realizado.

Outros sistemas existem para alinhar textos à palavra. Estes sistemas, menos populares,usam texto já alinhado à frase para, por meios estatísticos, construir dicionários de tradução.

8.1 Trados WinAlign

O WinAlign[2] é a ferramenta que a Trados fornece para o alinhamento de textos à frase.Na verdade, não é mais do que um sistema que dado um conjunto de pares de �cheiros osparte em blocos e os apresenta a par. Cabe ao utilizador unir os blocos entre as duas línguas.Depois de alinhados, pode-se exportar a memória de tradução produzida para ser utilizadaem traduções posteriores.

. . .• Produção de material a incorporar em memórias de tradução;• Projecto de alinhamento;• Alinhamento orientado à palavra;

8.1.1 De�nição do Projecto

A criação de um projecto de alinhamento é feita em vários passos. É necessário indicar aoTrados quais as línguas a usar, que �cheiros vão ser alinhados, tipo dos �cheiros, nível derelevância estrutural e vários outros parâmetros.

Para iniciar, use a opção �New Project� no menu �File�. Irá surgir uma janela semelhanteà apresentada na �gura 8.1. Cada separatória apresenta um tópico diferente de con�guração.

GeneralNesta zona con�guram-se as propriedades principais do projecto de alinhamento:Project Name nome do projecto. Não é o nome do �cheiro criado, mas sim, algum tipo de

descrição que o permita caracterizar;

30

Page 32: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Figura 8.1 De�nições de Alinhamento (línguas)

File Type tipo de �cheiros a alinhar. Embora um projecto de alinhamento possa alinharvários pares de �cheiros, estes têm de ser todos do mesmo tipo. Aqui deve ser escolhidoo tipo adequado e caso se trate de um formato XML ou SGML, escolher o DTD a siassociado;

Source Settings permite escolher a língua de origem (Source Language) e con�gurar o nívelde segmentação do documento (Source Segmentation);

Target Settings permite escolher a língua de destino e con�gurar o nível de segmentação dodocumento;

Intermediate Result Files directoria onde o Trados deve colocar �cheiros auxiliares.O que tem impreterivelmente de ser preenchido é o nome do projecto, tipos de �cheiros elínguas a alinhar.

FilesAqui determinam-se que �cheiros vão ser alinhados. Usa-se o botão �Add...� de cada umadas colunas para adicionar os �cheiros. No lado esquerdo os �cheiros da língua de origem eno lado direito os �cheiros da língua de destino. O botão �Remove� permite remover algum�cheiro adicionado por engano.

Depois de adicionados os �cheiros é necessário associar os �cheiros da língua de origemcom os da língua de destino. Se as colunas de �cheiros os mostram pela ordem correcta (oprimeiro da esquerda corresponde ao primeiro da direita, o segundo, ao segundo direita e

31

Page 33: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Figura 8.2 De�nições de Alinhamento (�cheiros)

assim sucessivamente) basta usar o botão �Align File Names� para criar a associação entreos �cheiros. Se, por outro lado, os �cheiros estão por ordem incorrecta, é necessário fazer aassociação de forma manual. Para isso, use o rato para arrastar as folhas à beira de cada�cheiro para a folha respectiva do outro �cheiro.

Alignment. . .

Structure Recognition. . .

Interface. . .

ExportEsta separatória permite con�gurar o método de exportação da memória de tradução geradapelo alinhamento dos �cheiros.

A primeira zona permite escolher entre os dois formatos possíveis para serem exportados:• Translator's Workbench Import Format formato proprietário da Trados, para usoentre aplicações da Trados.

32

Page 34: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Figura 8.3 De�nições de Alinhamento (exportação)

• Translation Memory Exchange Format (TMX) formato independente da aplica-ção, em XML, para intercâmbio de memórias de tradução entre aplicações;

. . .

8.1.2 Alinhamento

Depois de criado o projecto �camos com uma janela idêntica à apresentada na �gura 8.4.Aqui são apresentados os pares de �cheiros. Para alinhar cada um dos pares faz-se um

duplo-clique sobre um dos �cheiros. Irá aparecer uma janela como a da �gura 8.5.Esta é a janela principal no processo de alinhamento. A parte superior mostra uma es-

quematização do alinhamento entre capítulos e secções dos �cheiros. A parte inferior é oalinhamento entre as frases de cada uma das secções.

As ligações apresentadas indicam que os segmentos do lado esquerdo correspondem aossegmentos a si ligados do lado direito. A diferença entre os vários tipos de traços correspondemà qualidade do alinhamento. O alinhamento automático é apresentado por traços picotadosou tracejados. O alinhamento realizado pelo tradutor são traços a cheio.

O processo limita-se a alterar (ou não) as ligações efectuadas automaticamente. As ligaçõeserradas podem ser removidas usando o botão direito do rato sobre a folha ligada de formaerrada, e escolhendo a opção �disconnect�. Depois de removidas as ligações erradas procede-seao novo alinhamento que se efectua arrastando as folhas dos segmentos correspondentes.

É importante lembrar que um segmento de um dos lados pode ser ligado a vários segmentosdo outro lado. No entanto, não é possível ligar um conjunto de segmentos de um lado a umconjunto de segmentos do outro lado. Quando este tipo de ligação é necessário edita-se os

33

Page 35: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Figura 8.4 Pré-alinhamento

Figura 8.5 Processo de alinhamento

34

Page 36: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

segmentos de um dos lados de forma a que isso se resolva. Para editar os segmentos utiliza-seo botão do lado direito do rato sobre o segmento em causa, e usa-se a opção �Edit activesegment�. Aqui pode-se alterar o texto, seleccionar alguma porção, copiar e, editando outrosegmento, colar essa porção de texto.

35

Page 37: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Capítulo 9

Tradução de formatos especí�cos

Um tradutor tem de estar preparado para traduzir os mais diversos formatos de documentos.Desde simples documentos Microsoft Word, páginas de Internet ou documentos DocBook, énecessário efectuar a tradução mantendo a mesma estrutura conceptual e visual.

Como é difícil o tradutor conhecer todos os formatos existentes, e possuir todas as aplica-ções necessárias para a sua manipulação, é habitual os sistemas de tradução terem capacidadede manusear os mais diversos formatos existentes. Não só a capacidade de os mostrar, masa capacidade de compreender a estrutura do documento e desta forma, ajudar o tradutor amantê-la.

9.1 Trados TagEditor

O TagEditor[5, 4]Dado um formato especí�co F, há necessidade de:• extrair as frases a traduzir,• utilizar um editor de tradução capaz:

� de utilizar as memórias de tradução e� de utilizar a terminologia do projecto

que permita traduzir as várias frases e enriquecer as memórias de tradução• encaixar as frases traduzidas na estrutura do texto original

36

Page 38: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Capítulo 10

Gestão de projectos de tradução

Quando nos deparamos com a tradução de uma grande quantidade de textos, distribuídospor vários �cheiros, é necessária alguma organização para manter o trabalho em ordem. Porexemplo, pode ser útil criar uma memória de tradução ou base terminológica por cliente.Embora determinada tecnologia possa ser associada a uma área, existem empresas que usamdiferentes termos para o mesmo objecto.

10.1 Trados Workspace

[4]

• de�nição de um projecto de tradução� língua origem, destino� memória de tradução a utilizar� terminologia a utilizar� lista dos (grupos de) �cheiros a traduzir� estado actual da tradução

37

Page 39: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Apêndice A

Documentos de leitura sugerida

• Intomàtica Aplicada a la Traducció - Mikel L. Forcada i Juan Ortiz, Universidadede Alincante;Muito do conteúdo deste livro não é falado durante a disciplina, especialmente devidaà baixa escolaridade desta disciplina. No entanto recomenda-se a sua leitura, pondoespecial cuidado nos capítulos III, IV, V, VI, X.

• Acetatos apresentados durante as aulas;• Documentação do Trados (ver CD da disciplina)• Ligações Internet recomendadas:

� Google (http://www.google.com) - onde se recomenda a leitura da ajuda em relaçãoa expressões de pesquisa e a�ns

� Biblioteca de referência da disciplina (http://natura.di.uminho.pt/cgi-bin/biblioteca.pl)- recomendando-se que explore as várias ligações nela contidas e que contribua comoutras sugestões

• Corpora - Projecto AC/DC (http://cgi.portugues.mct.pt/acesso)• Página da disciplina (http://natura.di.uminho.pt/~jj/ftt)

38

Page 40: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Bibliogra�a

[1] Google advanced search guide. http://www.google.com.[2] TRADOS Ireland Ltd, Dublin, Ireland. TRADOS 5 - Advanced Alignment Guide, 2001.[3] TRADOS Ireland Ltd, Dublin, Ireland. TRADOS 5 - Advanced Terminology Guide, 2001.[4] TRADOS Ireland Ltd, Dublin, Ireland. TRADOS 5 - Specialist Guide, 2001.[5] TRADOS Ireland Ltd, Dublin, Ireland. TRADOS 5 - Translation Guide, 2001.

39

Page 41: Ferramentas de Tradução e Terminologiajj/ftt2006/sebenta.pdf · Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos

Índice

compactadores, 9winzip, 9

directorias temáticas, 10exportação

base terminológica, 26extensões, 7

.bmp, 8

.doc, 8

.gif, 8

.htm, 8

.html, 8

.jpg, 8

.mdx, 9, 27

.mtw, 9

.pdf, 8

.png, 8

.ppt, 9

.ps, 8

.rar, 9

.rtf, 8, 26, 27

.tmx, 8

.txt, 7

.xls, 9

.xml, 8, 27

.zip, 9�cheiros

compactação, 9descompactação, 9extensões, 7

motores de busca, 10motores de pesquisa, 10MultiTerm

exportação, 26inserção, 24inter-ligações, 26pesquisa fuzzy, 21

pesquisa global, 21pesquisa simples, 21

40