31
Memórias do Texto: aspectos tecnológicos na construção de um corpus histórico do português I. Relatório de Atividades Maria Clara Paixão de Sousa IEL - Unicamp Relatório de Pesquisa apresentado à FAPESP Junho, 2006 04/03462-4

I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

Embed Size (px)

Citation preview

Page 1: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

M e m ó r i a s d o T e x t o :aspectos tecnológicos na construção de um corpus histórico do português

I. Relatório de Atividades

M a r i a C l a r a P a i x ã o d e S o u s aI E L - U n i c a m p

Relatório de Pesquisaapresentado à FAPESPJunho, 2006

0 4 / 0 3 4 6 2 - 4

Page 2: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

a p r e s e n t a ç ã o

Este Relatório de Atividades é a Parte I do segundo Relatório Anual de Pesquisa do

projeto “Memórias do Texto: Aspectos tecnológicos na construção de um corpus histórico do português”

(04/03462-4).

O Relatório de Atividades está organizado em cinco seções:

• A seção I apresenta um breve resumo dos objetivos para o período, dos

resultados alcançados, e das perspectivas para o desenvolvimento da pesquisa.

• A seção II apresenta um balanço completo das metas e resultados alcançados

entre setembro de 2005 e junho de 2006.

• A seção III apresenta um detalhamento dos resultados quanto à estruturação

do trabalho técnico da pesquisa.

• A seção IV apresenta um detalhamento dos resultados quanto à estruturação da

reflexão teórica envolvida na pesquisa.

• A seção V aponta as perspectivas para o prosseguimento da pesquisa.

Além deste Relatório de Atividades, o Relatório Anual de Pesquisa é composto ainda pela Parte II –

Produtos, em que se apresenta a documentação da preparação de textos para o Corpus Histórico do

Português Tycho Brahe. A documentação divide-se em dois volumes: Edições Críticas Eletrônicas:

Diretrizes e Fundamentos, e Manual de Procedimentos. Este Relatório de Atividades remete aos

dois volumes, quando relevante, para o detalhamento do desenvolvimento do sistema de preparação.

O Relatório Anual de Pesquisa é acompanhado de Anexos, com a cópia de todos os trabalhos

publicados no período, mencionados neste Relatório de Atividades.

a p r e s e n t a ç ã o |2|

Page 3: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

S u m á r i oa p r e s e n t a ç ã o................................................................................................................................................................... 2

I . Resumo ......................................................................................................................................................................................... 4

II . Balanço de Metas e Resultados ...................................................................................................................................... 5

1. Resumo Pontual de Metas e Resultados................................................................................................................................. 51.1. Metas Estabelecidas para o segundo ano...................................................................................................................... 51.2 Resultados Obtidos no segundo ano.............................................................................................................................. 6

3. Quadro Resumo Cronológico.................................................................................................................................................. 7

III . Deta lhamento dos Resul tados : Estruturação do Trabalho Técnico ......................................................... 8

Visão Geral...................................................................................................................................................................................... 81. Gestão do Módulo de Preparação........................................................................................................................................... 9

1.1 Reestruturação da Documentação ................................................................................................................................. 91.2 Reestruturação da Equipe............................................................................................................................................... 12

1. Ampliação do Corpus.............................................................................................................................................................. 131.1 Transcrição de Novos Textos........................................................................................................................................ 131.2 Adaptação dos textos da Fase I..................................................................................................................................... 13

2. Desenvolvimento do Sistema ................................................................................................................................................ 142.1 Diretrizes de Transcrição................................................................................................................................................ 142.2 Diretrizes de Edição........................................................................................................................................................ 142.3 Desenvolvimento da Catalogação................................................................................................................................. 14

IV. Deta lhamento dos Resul tados : Estruturação da Ref lexão Teór ica ....................................................... 15

1. Visão Geral................................................................................................................................................................................ 152. Atividade Acadêmica............................................................................................................................................................... 16

2.1 Balanço Geral................................................................................................................................................................... 162.2 Resumo Pontual............................................................................................................................................................... 17

2.2.1 Participação em Eventos Científicos............................................................................................................ 172.2.2 Publicações em Meio Impresso..................................................................................................................... 172.2.3 Experiência Docente....................................................................................................................................... 182.2.4 Indicação a Prêmios........................................................................................................................................ 18

3. Preparação do Seminário “Memórias do Texto”................................................................................................................. 193.1 Esboço Conceitual do Seminário.................................................................................................................................. 193.2 Atividades Preparatórias Realizadas.............................................................................................................................. 20

3.2.1 Encontro com o projeto Memórias de Leitura, e II Simpósio de Literatura e Informática................. 203.2.2 Encontro na I Oficina de Anotação ........................................................................................................... 213.2.3 Experiência de Anotação Sintática no Seminário Temático de Lingüística Histórica........................... 21

4. Preparação do Artigo “Memórias do Texto”....................................................................................................................... 224.1 Esboço Conceitual do Trabalho.................................................................................................................................... 224.2 Atividades Preparatórias Realizadas.............................................................................................................................. 24

4.2.1 Elaboração do volume “Edições Críticas Eletrônicas: Fundamentos e Diretrizes”.............................. 244.2.2 Elaboração do Artigo: “Critical Hipereditions: New Challenges for Text-Critique”............................ 254.2.3 Bibliografia Estudada...................................................................................................................................... 26

V. P e r s p e c t i v a s ........................................................................................................................................................... 28

1. Objetivos Gerais....................................................................................................................................................................... 282. Plano de Procedimentos.......................................................................................................................................................... 29

2.1 Gestão dos Trabalhos da Equipe Técnica................................................................................................................... 292.2 Desenvolvimento do Hipertexto Crítico...................................................................................................................... 292.3 Organização e Realização do Seminário ...................................................................................................................... 302.4 Elaboração do Livro........................................................................................................................................................ 30

3. Cronograma.............................................................................................................................................................................. 31

a p r e s e n t a ç ã o |3|

Page 4: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

I. Resumo

A meta principal deste neste segundo ano de pesquisa era dirigir o foco dos trabalhos à edição de textos e à reflexão teórica, paralelamente ao prosseguimento dos avanços técnicos do trabalho de preparação de textos junto ao Corpus Histórico do Português Tycho Brahe.

Os trabahos foram organizados em dois ciclos, conforme proposto no planejamento de atividades realizado em junho de 2005: um ciclo dedicado à estruturação do trabalho técnico, e um ciclo didicado à estruturação do trabalho teórico.

No que se refere à estruturação do trabalho técnico, planejava-se finalizar o sistema de preparação dos textos, lançando uma versão estruturada do Corpus Histórico com acesso a todos os textos no novo sistema, devidamente documentado num Manual de Procedimentos. Além disso, previa-se que o resultado desse trabalho técnico formaria um artigo a ser submetido para publicações da área de tecnologias de texto. Estes dois objetivos gerais foram plenamente atingidos.

Quanto à estruturação da reflexão teórica, planejava-se dedicar o início do ano de 2006 à pesquisa histórica sobre os textos, com vistas à preparação de um segundo artigo, e organizar um seminário em torno dos textos do Corpus Histórico, sob diversos pontos de vista teóricos. Esta vertente da pesquisa avançou consideravelmente neste segundo ano. No decorrer do estudo bibliográfico e das primeiras tentativas de sistematização do artigo sobre os aspectos históricos dos textos, percebi entretanto a necessidade de modificar os objetivos gerais da reflexão teórica. De início, propunha uma reflexão historiográfica sobre os textos do Corpus; neste momento, proponho uma reflexão melhor caracterizada no âmbito da crítica textual.

O terceiro ano da pesquisa será dedicado centralmente ao aprofundamento da reflexão teórica, concretizando-na sob forma de um trabalho a ser publicado como artigo ou como livro, e por meio da realização do seminário.

I . Resumo |4|

Page 5: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

II. Balanço de Metas e Resultados

1 . R e s u m o P o n t u a l d e M e t a s e R e s u l t a d o s

1 .1 . Meta s Es tabe lec idas para o segundo anoO quadro a seguir mostra as metas de trabalho estabelecidas no Cronograma proposto no relatório anterior,

de junho de 2005:

Quadro 1: Cronograma estabelecido para o segundo ano de pesquisa:

Final do primeiro ano de pesquisa (Junho a Agosto de 2005): 1. Preparação para o lançamento da Versão Preliminar do Catálogo Dinâmico;2. Oficina com a equipe do Projeto Memórias de Leitura (agosto, 2005);

Segundo ano de pesquisa (Fase I: Setembro a Dezembro de 2005)3. Lançamento do Catálogo Dinâmico, Versão Preliminar: setembro de 2005;4. Seleção e supervisão da transcrição de novos textos;5. Desenvolvimento do sistema de preparação de textos; 6. Desenvolvimento do Catálogo Dinâmico ;7. Elaboração do artigo “Aspectos tecnológicos da construção de um corpus eletrônico do português”.

Segundo ano de pesquisa (Fase II: Janeiro a Agosto de 2006)8. Lançamento do Catálogo Dinâmico em Versão Completa;9. Elaboração do artigo “Memórias do texto: aspectos históricos na construção de um corpus eletrônico do português”;10. Organização do Seminário “Memórias do Texto”.

Na seção a seguir, pontuam-se os resultados obtidos em cada um dos itens acima.

I I . Ba lanço de Meta s e Resu l t ados |5|

Page 6: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

1 .2 Resu l t ados Obt idos no segundo ano

1. Preparação para o lançamento do Catálogo Dinâmico (inclui pontos 3, 6 e 8 do quadro acima)

• Em setembro de 2005, o Catálogo Dinâmico, em estágio avançado de elaboração, substituiu o catálogo antigo do Corpus Histórico (cf. Seção III.2.2.3).

2. Oficina com a equipe do Projeto Memórias de Leitura

• A oficina foi realizada em agosto de 2005, tendo como repercussão a abertura de uma nova vertente de interação acadêmica para o projeto Memórias do Texto. Como resultado direto deste processo, apresentei o projeto no II Simpósio Nacional de Literatura e Informática, a convite da Profa. Marcia Abreu. (cf. IV.2.2.1 e IV.3.2.1).

4. Seleção e supervisão da transcrição de novos textos

• Neste segundo ano, quatro novos textos foram transcritos, o texto piloto foi terminado, e dois novos conjuntos de documentos estão sendo preparados para inclusão, a partir de transcrições de manuscritos (cf. III.1.1.1).

5. Desenvolvimento do sistema de preparação de textos

• O sistema de preparação está amadurecido, e seu esquema de documetação foi reestruturado (cf. III.2). O sistema foi estendido para a preparação de textos transcritos a partir de originais manuscritos, um avanço consolidado pela realização da I Oficina de Anotação, em conjunto com o grupo de pesquisas do PHPB da Bahia, na UFBa, em abril de 2006. (cf. IV.3.2.2).

6. Elaboração do artigo “ Aspectos tecnológicos da construção de um corpus eletrônico do português ”.

• O artigo foi elaborado, sob o título “Metadata and XML standards at work: a corpus repository of Historical Portuguese texts”, em colaboração com Thorsten Trippel. Foi submetido e aceito em uma das mais importantes conferências internacionais da área de tecnologias da linguagem (Language Resources Evaluation, LREC); a comunicação foi realizada em 23 de maio, e o artigo será publicado nos anais do encontro (cf. IV.2.2.1).

7. Elaboração do artigo “ Memórias do texto: aspectos históricos na construção de um corpus eletrônico do português ”

• Dois trabalhos preliminares foram elaborados em preparação para esta meta. A partir de um pequeno artigo sobre “O texto digital” (apresentado na I Oficina de Anotação em Salvador), elaborei o volume “Edições Críticas Eletrônicas: Fundamentos e Diretrizes”. No mesmo âmbito de reflexão, submeti um resumo de artigo para ser apresentado na conferência internacional “Literaturas: Del Texto al Hipertexto”, na Universidade Complutense de Madri. As duas atividades se refletiram no desenvolvimento da reflexão para o artigo (cf. IV.4).

8. Organização do Seminário “ Memórias do Texto ”

• Três atividades realizadas neste ano são preparatórias para este seminário: o encontro com o projeto Memórias de Leitura, a I Oficina de Anotação na UFBa, e as atividades didáticas no curso Seminário Temático em Lingüística Histórica, na pós-graduação do IEL. A partir dessas três experiências, delineia-se uma concepção mais precisa do seminário a ser organizado (cf. IV.3).

I I . Ba lanço de Meta s e Resu l t ados |6|

Page 7: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

3 . Q u a d r o R e s u m o C r o n o l ó g i c o2 0 0 5

A g o s t o

• Participação em Evento: Oficina com a equipe do Projeto Memórias de Leitura

• Atividade Acadêmica: Início do Curso: Lingüística Histórica, LL 132S e t e m b r o

• Participação em Evento: VI Jornada Alemã de Lusitanistas (Leipzig, 15.09)

• Atividade de Pesquisa: Lançamento do Catálogo Dinâmico, Versão PreliminarO u t u b r o

• Participação em Evento: II Simpósio Nacional de Literatura e Informática (Florianópolis, 08.10)N o v e m b r o

• Participação em Evento: V Encontro de Corpora (São Carlos, 25.11)D e z e m b r o

• Atividade Acadêmica: Participação na banca de defesa de tese de doutoramento de Zenaide de Oliveira Novais Carneiro: “Cartas Brasileiras (1808-1904): Um Estudo Lingüístico-Filológico” (Campinas, 13.12).

2 0 0 6J a n e i r o

• Atividade Acadêmica: Curso Ministrado na III Escola de Verão em Lingüística Formal da América do Sul: Contato Lingüístico e Mudança Sintática. (Campinas, 16.01 – 21.01)

F e v e r e i r o

• Atividades de Gestão do Grupo de Pesquisa: Início do Treinamento dos novos integrantes da Equipe Técnica do Módulo de Preparação do Corpus Histórico

M a r ç o

• Atividade Acadêmica: Início do Curso: Seminário Temático em Lingüística Histórica (LL 424)

• Outras Atividades: Submissão de artigo para o Seminário Internacional Literaturas: Del Texto al Hipertexto, Universidade Complutense de Madrid, setembro de 2006.

A b r i l

• Participação e Organização de Evento: I Oficina de Anotação (Salvador, 18.04 – 21.04)M a i o

• Atividade Acadêmica: Participação em concurso público para o cargo de professor doutor, área de Filologia e Língua Portuguesa, FFLCH-USP (São Paulo, 08.05 – 10.05).

• Participação em Evento: V International Conference for Language Resources and Evaluation (LREC 2006) – representada pelo co-autor (Gênova, 23.05)

I I . Ba lanço de Meta s e Resu l t ados |7|

Page 8: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

III. Detalhamento dos Resultados: Estruturação do Trabalho Técnico

V i s ã o G e r a lOs planos para a estruturação do trabalho técnico incluíam, no relatório anterior, as seguintes metas específicas:

• Metas para seleção e inclusão de novas obras: • Início da transcrição anotada e edição de novos materiais

• Metas para a anotação da estrutura bruta: • Finalização da adaptação dos 42 textos da primeira fase• Finalização da transcrição anotada e da edição dos cinco textos selecionados

até agora.• Desenvolvimento de um sistema de controle de versões, com aplicação de

uma numeração automática das partes do texto codificadas.

• Metas para a edição dos textos:• Verificação da consistência e correção da aplicação do novo sistema de edição

aos 42 textos da Fase I, resultando em sua finalização completa • Finalização da edição do texto-piloto e desenvolvimento das Diretrizes de

Edição.

• Metas para o Catálogo Dinâmico: • Término da versão-teste atual, ou seja: inclusão de todos os 42 textos da Fase

I, com vistas ao lançamento de uma Versão Preliminar em Setembro de 2005;• Desenvolvimento técnico, incluindo: concepção e aplicação de buscas mais

refinadas (incluindo buscas cruzadas); concepção e aplicação de técnicas para a geração de sub-corpora compactados para download; refinamento da categorização por gêneros.

• Lançamento de uma Versão Completa, com a absorção dos desenvolvimentos acima, no início de 2006.

Tais metas foram cumpridas satisfatoriamente, como se resume pontualmente em III.1 e III.2 a seguir.

Antes disto, em III.1 a seguir, resumem-se alguns pontos importantes relativos à gestão do Módulo de Preparação de Textos neste ano.

I II . De ta lhamento dos Resu l t ados : Es t ru turação do Traba lho Técn ico |8|

Page 9: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

1 . G e s t ã o d o M ó d u l o d e P r e p a r a ç ã o

1 .1 Rees t ru turação da Documentação Neste ano, foram implementadas algumas mudanças no sistema de documentação do Módulo de Preparação de Textos, tendo sido o antigo Manual de Preparação dividido em dois volumes.

Esta divisão foi realizada por conta do aumento do volume de informações a serem incluídas na documentação. A equipe técnica julgou mais apropriado ter um manual de consulta rápida, para uso cotidiano, em volume separado; este volume é denominado “Manual de Procedimentos”.

Questões conceituais e diretrizes gerais estão no volume separado, sob o título “Edições Críticas Eletrônicas: Fundamentos e Diretrizes”.

Os quadros a seguir mostram as tábuas de conteúdos de cada volume.

I II . De ta lhamento dos Resu l t ados : Es t ru turação do Traba lho Técn ico |9|

Page 10: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

Conteúdo do “ Manual de Procedimentos ” Introdução ao S is tema de Preparação de textos no Corpus Tycho Brahe

ObjetivosHistórico

I . Informações Prel iminaresI.1 Estruturas de DiretórioI.2 Sistema de nomeação dos arquivosI.3 Documentação de Anotação

I.3.1 Gramática da anotação XML no Corpus (DTD)I.3.2 Modelo de Documento .xml

II . Anotações de Transcr içãoResumoII.1 Procedimentos de Transcrição

II.1.1 DigitaçãoII.1.2 Anotação da Estrutura BrutaII.1.3 Estruturas a serem Anotadas - ResumoII.1.4 Estruturas a serem Anotadas - AplicaçãoII.1.5 Checagem no browser (debug)

III . Anotações de EdiçãoResumoIII.1 Procedimentos de Anotação de Edição

III.1.1 Revisão das Anotações de TranscriçãoIII.1.2. Elementos de AnotaçãoIII.1.3 Procedimentos de AnotaçãoIII.1.4 Procedimentos de Checagem

IV. As t ransformações XLSTIV.1 Procedimentos de Ativação

IV.1.1 Ativação das transformações – via localIV.1.2 Ativação das transformações – via remota

IV.2 Programações de Transformação

V. Cata logaçãoResumoV.1 Anotação de Catalogação

V.1.1 Esquema da anotação de cabeçalhosV.1.1 Amostra: cabeçalho de um texto do CorpusV.1.3 Exemplo de uma ficha catalográfica

V.2 Ativação do Catálogo DinâmicoV.2.1 Ativação do Catálogo – via localV.2.1 Ativação do Catálogo – via remota

VI. Adaptações para os textos da Fase I 1. Histórico2. Adaptação da anotação da estrutura bruta

2.1 Resumo2.2 Procedimentos

3. Adaptação da anotação de Edição3.1 Resumo3.2 Procedimentos

4. Adaptação dos cabeçalhos 4.1 Resumo

I II . De ta lhamento dos Resu l t ados : Es t ru turação do Traba lho Técn ico |10|

Page 11: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

Conteúdo de “ Edições Cr í t i ca s Ele t rôn i cas : Fundamento s e Dire t r ize s ” I n t r o d u ç ã o

I . Fundamentos

1. O Processamento Eletrônico de Textos1.1 Conceitos Introdutórios1.2 A codificação eletrônica da informação1.3 Breve tipologia dos textos eletrônicos

2. Controle do Processamento Eletrônico2.1 Motivações para o processamento controlado2.2 O Hipertexto como forma de processamento controlado2.3 A linguagem de anotação extendida, ou XML

3. Etapas do Trabalho de Edição Eletrônica3.1 Procedimentos de Edição – Visão Geral3.2 Procedimentos da Edição Eletrônica

II . Dire tr izes de Transcr ição

1.Visão Geral2. Diretrizes para a transcrição de originais

2.1 Normas para a transcrição de originais2.2 Exemplo: Transcrição de um original impresso

III . Normas de Edição

1.Visão Geral2. Diretrizes para as edições interpretativas

2.1 Normas de Edição Interpretativa2.2 Exemplo: edição interpretativa

3. Diretrizes para a transposição digital de outras edições3.1 Exemplo: Transposição Digital de uma edição semi-diplomática3.2 Normas para a Transposição Digital de Outras Edições

IV. Sis tema de Apresentação

1. Visão Geral2. Exemplo da apresentação de um texto editado eletronicamente3. Fonteiras do Sistema: o Hipertexto Crítico

I II . De ta lhamento dos Resu l t ados : Es t ru turação do Traba lho Técn ico |11|

Page 12: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

1 .2 Rees t ru turação da Equipe

Neste ano, três novos bolsisitas de Capacitação Técnica chegaram ao Projeto Temático, duas delas no regime TT2. Com isto, foi possível reestruturar a equipe, que fundamentalmente se dividiu entre duas alunas trabalhando diretamente na transcrição dos textos (etapa que inclui a digitação e a anotação da estrutura textual), e duas alunas trabalhando na edição de textos.

O quadro a seguir mostra a estrutura atual da equipe e suas atribuições.

Equipe de Transcrição e Estruturação (TT1)

Anna Carolina Garcia de Souza• Etapa de Anotação Estrutural dos Originais Manuscritos• Assitência à elaboração da documentação do Manual de Procedimentos

Layâna Castro • Anotação Estrutural e Adaptação dos textos para as Ferramentas Automáticas

Daiane Moro• Anotação Estrutural e Adaptação dos textos para as Ferramentas Automáticas

Equipe de Edição (TT2)

Gilcélia de Menezes• Edição de Textos - Originais Impressos• Assitência à elaboração da documentação das Diretrizes de Edição

Ana Luiza Araújo• Edição de Textos - Originais Manuscritos

I II . De ta lhamento dos Resu l t ados : Es t ru turação do Traba lho Técn ico |12|

Page 13: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

1 . A m p l i a ç ã o d o C o r p u s

1 .1 Transcr i ção de Novos Tex tosEm 2005, quatro novos textos foram transcritos:

• Duarte Galvão (1435-1517) : Chronica do muito alto e muito esclarecido principe D. Affonso Henriques primeiro Rey de Portugal. , 1726 (Ferreira, 1689-1739, ed. Lit). [cód: g_009]

• Fernão Lopes: Chronica del Rey D. Ioam I de Boa Memoria e dos reys de Portugal o decimo, 1644.[cód: L_002]

• Rui de Pina (1440?-1522?): Chronica do muito alto e muito esclarecido principe Dom Diniz, sexto rey de Portugal, 1729 (Ferreira, 1689-1739, ed. Lit). [cód: p_002]

• Manuel dos Santos (1672-1760 ): Historia sebastica, 1735. [cód: s_002]

O texto piloto foi terminado (integralmente anotado e editado em versão modernizada):

• Magalhães de Gandavo: Historia da prouincia de Sancta Cruz a que vulgarmente chamamos Brasil, 1576 [cód: g_008]

Adicionalmente, novos textos estão sendo preparados para inclusão, a partir de transcrições de manuscritos:

• Corpus “Cartas Brasileiras”, editado por Z. Carneiro (UEFS)

• Corpus “Atas da Irmandade do Rosário”, editado por Klebson Oliveira (PHBP-UFBa)

1 .2 Adaptação dos tex tos da Fas e IAs metas previam que todos os 42 textos da Fase I fossem inteiramente finalizados entre 2005 e 2006. Entretanto, alguns deles ainda estão em processo de preparação. Este atraso se deve fundamentalmente a uma re-organização do sistema de anotação lingüística automática, que teve impacto direto no sistema de preparação. No âmbito do Módulo de Anotação Lingüística, estão sendo implementadas mudanças importantes no etiquetador automático; este agora requer que os textos sejam enviados de uma nova forma para serem etiquetados.

No sistema anterior, o etiquetador marcava “palavras compostas” com etiquetas compostas:

dele ► dele/P+PRO

No novo sistema, o etiquetador analisará formações como esta separadamente:

dele ► de ele ► de/P ele/PRO

A eliminação das etiquetas compostas irá aumentar consideravelmente a performance do etiquetador, e terá ainda conseqüências importantes na análise sintática automática.

Por outro lado, esta inovação implicou em um processo adicional de preparação. Por sobre as edições já realizadas, os textos a serem etiquetados precisam passar pelo processo de separação das palavras compostas, como no exemplo acima (dele ► de ele). Um dos textos foi já preparado nos novos moldes (as Memórias do Marquês de Fronteira e Alorna, a_003); todos os demais textos ainda não etiquetados precisarão ser assim preparados nos próximos meses.

I II . De ta lhamento dos Resu l t ados : Es t ru turação do Traba lho Técn ico |13|

Page 14: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

2 . D e s e n v o l v i m e n t o d o S i s t e m a

2 .1 Di re t r i zes de Transcr i çãoAs principais metas para o desenvolvimento do sistema de anotação estrutural eram criar um sistema de correspondência automática que permitisse melhor controle de versões, e adaptar as diretrizes para a transcrição de manuscritos.

O sistema de correspondência automática foi desenvolvido: as estruturas anotadas nos textos (sentenças e anotações de edição) estão numeradas, permitindo o controle de versões. A numeração é feita por uma programação automática por mim desenvolvida, gravada como <insert_ids.xsl> no diretório <www.ime.usp.br/~tycho/cgi-bin>.

O sistema foi ampliado para a transcrição de manuscritos. Presentemente, a equipe técnica está adaptando dois conjuntos de manuscritos editados sob forma de “Edições Simi-Diplomáticas” (cf. 1.1 acima), de forma inteiramente integrada ao nosso sistema de anotação.

• O desenvolvimento conceitual do sistema de transcrição está documentado no volume de Fundamentos e Diretrizes, seção II.

• Os procedimentos técnicos de transcrição estão documentados no Manual de Procedimentos, seção II.

• Há uma seção especial sobre a transposição de outras edições para o sistema eletrônico, no volume de Fundamentos e Diretrizes, seção III.3.

2 .2 Di re t r i zes de EdiçãoCom o término da edição modernizada do texto-piloto (g_008), foram sistematizadas as Diretrizes que orientarão as edições deste ponto em diante. A aluna Gilcélia de Menezes, bolsista de Capacitação Técnica 2, será a responsável direta pela edição dos quatro novos textos já integralmente transcritos (cf. 1.1 acima).

• O desenvolvimento conceitual do sistema de edição e a sistematização das normas de edição estão documentados no volume de Fundamentos e Diretrizes, seção III.

• Os procedimentos técnicos de edição estão documentados no Manual de Procedimentos, seção II.

2 .3 Desenvo lv imento da Ca ta logaçãoNeste ano, todos os textos foram incluídos no Catálogo Dinâmico, que compõe agora o sistema principal de acesso ao Corpus (via <www.ime.usp.br/~tycho/corpus/arquivos/catalogo.htm>).

• O desenvolvimento conceitual do sistema de catalogação e apresentação dos textos estão documentados no volume de Fundamentos e Diretrizes, seção IV.

• Os procedimentos técnicos de catalogação estão documentados no Manual de Procedimentos, seção V.

I II . De ta lhamento dos Resu l t ados : Es t ru turação do Traba lho Técn ico |14|

Page 15: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

IV. Detalhamento dos Resultados: Estruturação da Reflexão Teórica

1 . V i s ã o G e r a lEsta seção apresenta um detalhamento dos trabalhos de estruturação da reflexão teórica da pesquisa. Os planos para esta estruturação incluíam, no relatório anterior, a preparação de um artigo e a organização de um seminário. Com o caminhar das pesquisas neste último ano, estes planos se desenvolveram de modo bastante interessante; entretanto, o aprofundamento dos estudos neste sentido provocou uma reformulação dos objetivos inicialmente estabelecidos – em especial no que se refere à preparação do artigo.

A idéia inicial do artigo propunha um trabalho de cunho historiográfico, que tomasse como ponto de partida o estudo dos ambientes editoriais em que foram produzidos os textos do Corpus para contextualizá-los historicamente. Neste sentido, o relatório apresentava algumas metas específicas e um levantamento bibliográfico preliminar, com seis títulos sobre a história da formação da norma escrita portuguesa, as reformas ortográficas, e a instituição das tipografias, e obras específicas sobre a questão dos efeitos no texto. Planejou-se, ainda, realizar um cotejo entre algumas obras utilizadas no corpus a parir de re-edições do século 20 e suas edições originais. Com o desenvolvimento desta vertente mais reflexiva dos trabalhos, nestes meses passados, os objetivos mais específicos do artigo foram bastante modificados, como procuro explicitar mais adiante.

Quanto ao seminário, a idéia inicial foi explicitada da seguinte forma no relatório de 2005 :

“O foco do encontro será a reflexão sobre o texto, a partir de diferentes áreas: linguística computacional, linguística histórica, linguística textual, filologia, teoria literária. Um dos objetivos dessa realização será pôr à prova a multiplicidade de usos do Corpus Histórico, e fomentar as diversas perspectivas de reflexão que ele pode propiciar” (cf. Relatório Anual, 10.06.2005)

Com o desenvolvimento da pesquisa neste ano, os objetivos do seminário foram consolidados, e conceituados de modo mais objetivo, como se mostra mais adiante.

Este desenvolvimento será melhor contextualizado, aqui, ao ser precedido de um relato das atividades acadêmicas realizadas ao longo do último semestre de 2005 e até este ponto do ano de 2006. Assim, na seção IV.2 a seguir, procedo à descrição das atividades acadêmicas relevantes; em seguida, as seções IV.3 e IV.4 descrevem, respectivamente, o estado atual da preparação do seminário e do artigo.

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |15|

Page 16: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

2 . A t i v i d a d e A c a d ê m i c a

2 .1 Ba lanço Gera lHá três pontos a serem ressaltados nas atividades acadêmicas desenvolvidas até esta altura do segundo ano de pesquisas, quanto ao seu impacto no desenvolvimento da reflexão teórica proposta nesta pesquisa.

O primeiro ponto é o avanço obtido por meio de participações em encontros científicos. Foram especialmente importantes, neste sentido, os resultados da participação no II Simpósio nacional de Literatura e Informática, e a organização da I Oficina de Anotação junto ao projeto CorPorA. No primeiro caso, a experiência mostrou as possibilidades de interface deste projeto com o trabalho dos estudiosos da área de crítica literária – uma vertente que, desde o início, tinha como objetivo aprofundar. No segundo caso, a experiência revelou os caminhos que se podem percorrer na confluência entre o trabalho de lingüística computacional e a pesquisa de cunho filológico. Volto aos dois temas na seção 3.

Um segundo ponto que merece ser destacado está relacionado a uma atividade ainda corrente, representada pelo trabalho didático junto ao curso “Seminário Temático de Lingüística Histórica”. A proposta central deste curso foi a de explorar “verticalmente” um texto representativo do Português Clássico, para dar aos alunos a oportunidade de trabalhar com um texto de época e explorar as múltiplas possibilidades de análise lingüística que ele oferecia. Escolhi para isto trabalhar com o texto-piloto editado nesta pesquisa, a “História...” de P. M. Gândavo. O resultado desta experiência, no que toca especificamente os objetivos do projeto Memórias do Texto, é uma repercussão no sentido de uma melhor conceituação da proposta do Seminário. Voltarei a esta experiência na seção 3.

Um terceiro ponto a ser destacado remete à minha participação, no início de maio, em um concurso público para uma vaga de docente na Universidade de São Paulo, na área de Filologia e Língua Portuguesa. O resultado imediato do concurso foi negativo, uma vez que meu perfil acadêmico não foi considerado adequado para o cargo. Entretanto, considero que esta experiência teve um desdobramento muito positivo e diretamente relevante para o desenvolvimento deste trabalho de pesquisa. Em função dos estudos realizados para a preparação das provas, reuni uma extensa bibliografia na área da Filologia e da Crítica Textual (listada na seção 4.3.), com a qual tinha pouco contato anterior, em função da minha formação acadêmica mais voltada para a lingüística. O estudo dessas obras de referência, além de possibilitar uma sistematização terminológica para os procedimentos de transcrição e edição dos textos do Corpus, está se revelando como central na elaboração da reflexão teórica planejada neste projeto de pesquisa, ao desenhar um melhor contorno conceitual para a minha reflexão sobre o tema das Memórias do Texto.

A seguir, apresento uma descrição pontual de todas as atividades acadêmicas realizadas no período.

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |16|

Page 17: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

2 .2 Resumo Pontua l2.2.1 Participação em Eventos Científicos

1. “Anotação Xml e Transformação Xslt aplicadas a documentos históricos”Seção da I Oficina de Anotação – Projeto CorPorAUniversidade Federal da Bahia (Ufba), 19 a 22 de abril, 2006

2. “Metadata and XML standards at work: a corpus repository of Historical Portuguese texts”. Comunicação à V International Conference on Language Resources and Evaluation (LREC 2006). Com T. Trippel.Gênova, 22 a 28 de maio, 2006.

3. “A Anotação da variação de grafia no Corpus Histórico do Português Tycho Brahe: Frentes abertas para estudos do léxico” Participação na mesa-redonda “Linguística computacional e Léxico”,V Encontro de Corpora. Universidade Federal de São Carlos (UFSCar). São Carlos, novembro de 2005.

4. “Memórias do Texto”. Participação na mesa-redonda “Bibliotecas e bancos de dados digitais de literatura”, II Simpósio Nacional de Literatura e Informática. Universidade Federal de Santa Catarina (UFSC), Universidade Estadual do Rio de Janeiro (UERJ), Universidade de Brasília (UnB). Florianópolis, outubro de 2005.

5. “Novas perspectivas para antigas questões: A periodização do português revisitada”.Com Charlotte Galves e Cristiane Namiuti. Comunicação à sessão “Estruturas Gramaticais do Português Europeu”, VI Jornada Alemã de Lusitanistas.(Viagem financiada pela Fundação C. Gulbenkian e Instituto Camões)Leipizg, setembro de 2005.

2.2.2 Publicações em Meio Impresso2.2.2.1 Em Capítulo de Livro

1. Lingüística Histórica. Em “Introdução às Ciências das Linguagem: Língua, Sociedade e Conhecimento”. José Horta Nunes, e Claudia Pfeiffer (Orgs.). Campinas, Pontes.

2.2.2.2 Em Periódicos Internacionais

1. The Change in clitic placement from Classical to Modern European Portuguese: Results from the Tycho Brahe Corpus. Com Charlotte Galves e Helena Britto. Em “Journal of Portuguese Linguistics: Special Issue on variation and change in the Iberian languages: the Peninsula and beyond”. Vol 4 , n.1. 2006.

2. “Clitic placement and the position of subjects in the history of European Portuguese”. Com Charlotte Galves. Em T. Geerts, I. Van Ginneken & H. Jacobs (orgs.): “Romance Languages and Linguistic Theory: selected papers from ‘Going Romance’ 2003”. John Benjamins, pp. 93-107. 2005.

2.2.2.3 Em Atas de Encontros Científicos

1. “Metadata and XML standards at work: a corpus repository of Historical Portuguese texts”. Com T. Trippel. Em “Papers from the V International Conference on Language Resources and Evaluation (LREC 2006)”.

2. “Novas perspectivas para antigas questões: A periodização do português revisitada”. Com Charlotte Galves e Cristiane Namiuti. Em “Atas da VI Jornada Alemã de Lusitanistas”. No prelo.

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |17|

Page 18: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

2.2.3 Experiência Docente2.2.3.1 Cursos Regulares Correntes

Seminário Temático em Lingüística Histórica (LL 424)Pós-graduação, Instituto de Estudos da Linguagem, Universidade Estadual de Campinas,março a junho, 2006.

2.2.3.2 Cursos Regulares Ministrados

Lingüística Histórica (LL 132)Pós-graduação, Instituto de Estudos da Linguagem, Universidade Estadual de Campinas, agosto a dezembro, 2005.

2.2.3.4 Cursos Extra-curriculares Ministrados

1. Anotação XML: estruturas, edição, transformações.I Oficina de Anotação – Projeto CorporaUniversidade Federal da Bahia (Ufba)19 a 22 de abril, 2006

2. Contato Lingüístico e Mudança Sintática, III Escola de Verão em Lingüística Formal da América do Sul (EVeLin 2005)16 a 21 de janeiro, 2006.

3. Lingüística Histórica, II Escola de Verão em Lingüística Formal da América do Sul (EVeLin 2004) 08 a 13 de janeiro, 2005.

2.2.3.5 Participação em Bancas Examinadoras

Membro de Comissão Julgadora de Defesa de Doutorado em Lingüística Candidata: Zenaide de Oliveira Novais Carneiro. Título da Tese: “Cartas Brasileiras (1808-1904): Um Estudo Lingüístico-Filológico”.Instituto de Estudos da Linguagem, Universidade Estadual de Campinas,13 de dezembro de 2005.

2.2.3.6 Suplência a Bancas Examinadoras

1. Suplente de Comissão Julgadora de Defesa de Doutorado em Lingüística Candidata: Norma Lúcia Fernandes de Almeida. Título da Tese: “Sujeito nulo e morfologia verbal no português falado por três comunidades do interior da Bahia”. Instituto de Estudos da Linguagem, Universidade Estadual de Campinas,14 de dezembro de 2005.

2. Suplente de Comissão Julgadora de Defesa de Doutorado em LingüísticaCandidata: Silvia Regina Cavalcante. Título da Tese: “O Uso de SE com Infinitivas na História do Português: Do Português Clássico ao Português Europeu e Brasileiro Modernos”.Instituto de Estudos da Linguagem, Universidade Estadual de Campinas,27 de janeiro de 2006.

2.2.4 Indicação a PrêmiosTese de Doutoramento (“Língua Barroca: Sintaxe e História do Português nos 1600”)indicada pelo Instituto de Estudos da Linguagem, Universidade Estadual de Campinas para o prêmio da ANPOLL 2006 como melhor tese de doutoramento defendida no ano de 2004.

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |18|

Page 19: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

3 . P r e p a r a ç ã o d o S e m i n á r i o “ M e m ó r i a s d o T e x t o ”Conforme já esboçado no Projeto de Pesquisa, pretendo organizar um Seminário (com o título provisório “Memórias do Texto”), aberto à comunidade acadêmica. No Projeto, previa-se que o foco do encontro seria a reflexão sobre o texto, a partir de diferentes áreas: linguística computacional, linguística histórica, linguística textual, filologia, teoria literária. Um dos objetivos dessa realização seria pôr à prova a multiplicidade de usos do Corpus Histórico, e fomentar as diversas perspectivas de reflexão que ele pode propiciar.

O decorrer da pesquisa neste ano (em especial, graças à participação em alguns encontros científicos, cf. 3.2), permitiu que que os objetivos do Seminário fossem melhor conceituados, como se expõe a seguir.

3 .1 Esboço Conce i tua l do Seminár ioA idéia central deste seminário era, de início, abordar a multiplicidade de perspectivas que podem se

abrir para o estudo dos textos do Corpus. O objetivo, agora, se tornou mais específico – abordar a

multiplicidade de perspectivas que podem se abrir para o estudo de um dos textos. Escolhi,

inicialmente, a obra oratória de Antonio Vieira, reunida em subseqüentes edições de Sermões. Esta

escolha preliminar tem duas motivações: primeiro, trata-se de uma obra com fortuna crítica

considerável (e uma das vertentes de reflexão é o estudo desta fortuna). Segundo, trata-se de textos

em que sabidamente há uma relação extremamente importante entre as construções sintáticas e o

estilo de escrita, como eu mesma já discuti em Paixão de Sousa, 20041; e como mostrou Galves,

20022 (e uma das vertentes de reflexão é a relação entre a linguagem e o estilo).

O Seminário seria organizado em torno da obra de Vieira, convidando-se os estudiosos que a

examinaram dos pontos de vista histórico, literário, e lingüístico. A questão que unificaria estas

perspectivas seria, justamente, quais as relações possíveis que se abrem entre os diferentes estudos.

Como o estudo da sintaxe desses textos pode se enriquecer pelo contato com o estudo da história

editorial e o estudo literário crítico desta obra? Inversamente, como estudo literário crítico desta

obra pode se enriquecer pelo contato com o estudo da sintaxe desses textos ?

Como ponto aglutinador das discussões, estaria colocada a contribuição do projeto Memórias do

Texto: uma versão dos Sermões sob forma de Hipertexto Crítico, em que se reuniriam diferentes

edições da obra, com os comentários de seus editores. Todas as versões estariam integradas por uma

análise sintático-textual (nos moldes da que estou realizando para o texto de Magalhães de Gandavo,

1 PAIXÃO DE SOUSA, M. C. (2004) – Língua Barroca: sintaxe e história do português nos 1600. Tese de Doutoramento, Instituto de Estudos da Linguagem, Universidade Estadual de Campinas.

2 GALVES, C. (2002) – Syntax and Style: clitic placement in Padre Antonio Vieira. Santa Barbara Portuguese Studies, v. VI, no prelo.

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |19|

Page 20: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

cf. 3.2.3 abaixo). Com base nesta edição eletrônica, os participantes seriam convidados a dar suas

contribuições em suas áreas. A seguir, um esboço estrutural desta idéia.

Seminário Memórias do Texto – Esboço Estrutural

1. Tema central: Os Sermões de António Vieira – Fortuna Crítica e Lingüística.

2. Objetivos: Reunir estudos sobre os Sermões sob diferentes óticas, buscando as fronteiras de sua discussão integrada.

3. Linhas Temáticas: História Editorial; Fortuna Crítica; Linguagem.

4. Modo de Trabalho: Simpósio, com Mesas Redondas Temáticas (sem seções paralelas).

Os participantes receberão o Hipertexto Crítico da Obra, contendo:

- O fac-simile da edição de Miguel Deslandes de 1662 (a partir de <http://purl.pt/292>)- uma transcrição conservadora deste fac-simile- uma edição crítica com o cotejo das seguintes versões (nos Sermões selecionados coincidentes):

VIEIRA, António. Sermões (prefaciado e revisto pelo Rev. Padre Gonçalo Alves). Porto: Livraria Chardron - Lello & Irmão Editores, 1907

PÉCORA, Alcir (ed.), Sermões – Padre Antonio Vieira. São Paulo: Hedra, 2000

- a anotação lingüística do texto

3 .2 At iv idades Prepara tór i a s Rea l i zadas3.2.1 Encontro com o projeto Memórias de Leitura, e II Simpósio de Literatura e Informática

Como preparação para o Seminário, o Primeiro Relatório previa a organização de uma oficina conjunta com a equipe do Projeto Memórias da Leitura (cf. <http://www.unicamp.br/iel/memoria/>), na qual as idéias do projeto Memórias do Texto seriam apresentadas, contando com a colaboração e a experiência daqueles pesquisadores. Esta oficina foi realizada, com grande proveito, em Agosto de 2005. Discutimos ali as possibilidades da reflexão conjunta entre a crítica literária e o trabalho deste projeto, com vistas a um prosseguimento de colaboração (por exemplo, com um trabalho de transcrição do corpus de obras literárias do Projeto Memórias de Leitura, atualmente em formato de fac-similes digitais).

Esta interface com os estudos literários foi consolidada com minha participação no II Simpósio Nacional de Literatura e Informática, em outubro. Minha participação se deu na mesa redonda

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |20|

Page 21: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

“Bibliotecas Digitais”, ao lado de pesquisadores dedicados ao estudo genético de obras literárias. Apontou-se, ali, o potencial da técnica desenvolvida para a edição eletrônica do Corpus no sentido de se elaborarem edições críticas (comparando mais de uma versão editorial de uma obra) e edições genéticas (comparando os diversos estados de autoria de uma obra).

Naquela oportunidade, surgiu para mim a idéia inicial do Hipertexto Crítico, uma edição eletrônica em múltiplas camadas que permitisse o acesso a um mesmo texto sob distintas perspectivas de análise.

3.2.2 Encontro na I Oficina de Anotação

Na I Oficina de Anotação, em Salvador, debatemos as possibilidades de trabalho que unisse a experiência filológica do grupo da UFBa com a experiência da lingüística computacional do nosso grupo na Unicamp (cf. <http://www.ime.usp.br/~tycho/corpora/>). A colaboração entre os dois grupos vem se concretizando na elaboração de um corpus conjunto, com base na edição semi-diplomática das Atas da Irmandade do Rosário, de Klebson Oliveira.

Esta experiência trouxe a abertura de uma perspectiva importante, a de que o sistema de edições eletrônicas desenvolvido neste projeto possa interagir com grupos de pesquisa dedicados aos estudos filológicos e de crítica textual.

3.2.3 Experiência de Anotação Sintática no Seminário Temático de Lingüística Histórica

No âmbito do curso Seminário Temático em Lingüística Histórica, na pós-graduação do IEL, venho trabalhando com os alunos o texto piloto do meu sistema de edição (História da Província de Santa Cruz), como base para um trabalho de análise sintática intensiva.

Esta experiência revelou dois aspectos que considero importantes. O primeiro é que a análise lingüística de um texto pode se beneficiar imensamente da forma de edição proposta neste trabalho, por dois motivos. De um lado, pela fidedignidade da transcrição e qualidade da interpretação do texto – como ocorreria com edições especializadas em geral, em qualquer técnica. Mas além disso, a edição eletrônica traz o benefício adicional da praticidade. Como o trabalho de análise lingüística pode ser realizado diretamente no arquivo eletrônico que contém o texto interpretado, e dali transportado para programas de planilhas para contagem, etc., a tarefa de lidar com o texto se torna muito ágil.

O segundo aspecto revelado foi a potencialidade de se integrar a análise lingüística como mais um nível de edição, no sistema eletrônico aqui concebido. Sejam os resultados da análise automática previstos no Projeto Temático, sejam os resultados de uma análise humana, as sentenças classificadas segundo critérios sintáticos (por exemplo, com a codificação da ordem de constituintes) podem ser re-integradas ao texto originalmente transcrito, graças à correspondência numérica entre as estruturas anotadas. Desenvolverei uma técnica para esta reintegração, como coroamento da experiência do Hipertexto Crítico.

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |21|

Page 22: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

4 . P r e p a r a ç ã o d o A r t i g o “ M e m ó r i a s d o T e x t o ”Como mencionei anteriormente, no decorrer do estudo bibliográfico e das primeiras tentativas de sistematização do artigo sobre os aspectos históricos dos textos, percebi a necessidade de modificar os objetivos gerais da reflexão teórica. De início, propunha um artigo de reflexão historiográfica sobre os textos do Corpus. Neste momento, proponho uma reflexão melhor caracterizada no âmbito da crítica textual, e que seria melhor organizada na forma de um livro. Nesta seção, justifico e explicito esta modificação.

4 .1 Esboço Conce i tua l do Traba lhoOs desenvolvimentos recentes das minhas atividades acadêmicas possibilitaram uma delimitação conceitual mais precisa para o artigo Memórias do Texto – e, de fato, uma delimitação mais precisa do objeto de reflexão desta pesquisa como um todo.

O objeto da minha reflexão central nesta pesquisa é o texto escrito e sua modificação ao longo dos processos de edição – portanto, o objeto de estudo próprio da crítica textual moderna, tal como delimitado por obras de referência como Blecua (1987)3 e Cambraia (2005)4. E, de modo específico, a pesquisa se ocupa dos processos de transformação do texto trabalhado no ambiente eletrônico, ou seja, do texto digital. Ao procurar apresentar este trabalho para outros pesquisadores de áreas afins (em especial, filólogos e estudiosos da genética literária), pude perceber que esta é uma linha de reflexão pouco explorada, no âmbito da qual resta ainda muito a ser trabalhado, dos pontos de vista conceitual e metodológico. A consulta criteriosa a obras de referência na área da crítica textual confirmou esta constatação – são poucos os trabalhos dedicados centralmente ao texto digital, do ponto de vista da crítica textual hoje. Ainda mais escassos, senão inexistentes, são os trabalhos sobre o meio eletrônico como ferramenta para o trabalho filológico e crítico5. Parece, portanto, que o texto digital, embora se tenha constituido como tecnologia de amplo uso, ainda não se constituiu integralmente como objeto de reflexão do ponto de vista da crítica. Suas potencialidades como ferramenta da crítica, de outro lado, também têm sido pouco exploradas.

Tomo este estado de coisas como indicador da relevância e atualidade do tema da minha pesquisa, em seu sentido mais metodológico e teórico. Parece ser mais interessante explorar esta vertente de reflexão, que a vertente historiográfica inicialmente pretendida.

3 BLECUA, Alberto. Manual de crítica textual. Madrid: Castalia, 1987.

4 CAMBRAIA, César Nardelli. Introdução à Crítica textual. São Paulo: Martins Fontes, 2005. .

5 Em Crítica Textual e Informática, capítulo da “Introdução à Crítica Textual” de C. Nardelli Cambraia, o autor aborda esse ponto afirmando que “(...) não se pode negar que a difusão da informática – relativamente recente, se se considerar que sua popularização através de computadores pessoais só se deu em princípios dos anos noventa – tem tido impacto notável sobre o processo de transmissão dos textos” (Cambraia 2005:175); e que “A informática pode ser empregada em todas as etapas da elaboração de uma edição crítica, com maior ou menor proveito, seja no estabelecimento do texto crítico, seja na sua apresentação.” (Cambraia 2005:181). Entretanto, “Apesar de a informática ter-se infiltrado definitivamente no processo de edição de textos, não seria exagero dizer que seus recursos não têm sido efetivamente explorados em toda sua potencialidade no campo da crítica textual aplicada a textos em língua portuguesa. As razões para a subutilização da informática apresentadas por Morrás (1999:189-210) verificam-se com certeza também no domínio lusófono – são elas: falta de capacitação específica relativa à informática no processo de formação dos filólogos; publicações pertinentes restritas a revistas muito especializadas e de leitura pouco acessível a consulentes de outras áreas; defasamento entre os projetos e suas realizações (muitos projetos anunciados não se concretizam); e escassez de resultados tangíveis”. (Cambraia 2005:189)

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |22|

Page 23: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

Penso, portanto, que a contribuição mais interessante que esta pesquisa poderá oferecer, no sentido de um resultado final de reflexão, será um trabalho sobre o meio eletrônico como ferramenta para os estudos filológicos e críticos, enquadrado em uma reflexão conceitual sobre o texto digital.

O trabalho irá partir de uma exploração conceitual do texto digital, para em seguida detalhar uma experiência metodológica a que se denominará o “Hipertexto Crítico”.

Este trabalho se diferenciaria do outro resultado final da pesquisa, o artigo sobre os aspectos técnicos da construção do Corpus – este, já bem encaminhado, em parceria com T. Trippel. No artigo com Trippel, focalizo questões eminentemente técnicas, como a natureza da linguagem de anotação escolhida para o Corpus; os mecanismos de catalogação e buscas; as tecnologias de servidor, etc. - é, portanto, um artigo dirigido ao âmbito de interesses das tecnologias de processamento de textos.

Este outro, aqui delineado, será dirigido ao âmbito de interesses da crítica textual, da filologia, e da lingüística histórica (na sua vertente de ligüística de corpus). Esboça-se a seguir uma estrutura inicial para o trabalho.

Esboço Estrutural

I. O texto digital: exploração conceitual

Propõe-se a pergunta: qual a constituição conceitual do texto digital?

Conceito de trabalho: o texto digital se diferencia do texto impresso ou manuscrito fundamentalmente pela mediação da codificação da informação. Esta diferença é central e constitutiva, e indica que o texto digital deve ser considerado sob uma perspectiva conceitual e metodológica própria.

• Discussão sobre o impacto do texto digital na filologia moderna. • Dimensão instrumental e dimensão teórica do texto digital. • O problema da fixação do texto no meio digital.• Texto digital e linguagem

II. O processamento digital: ferramenta de análise textual

Aqui se explora a dimensão do texto digital como ferramenta para a análise lingüística e como ferramenta para a crítica textual.

II.1 Impactos nos estudos filológico e da crítica textual

• O texto digital como instrumento da crítica. • Desenvolvimento de ferramentas de anotação filológica. • O Hipertexto Crítico.

II.2 Impactos nos estudos lingüísticos

• O texto digital como instrumento da análise lingüística. • Formação de corpora para estudos lingüísticos. • O desenvolvimento de ferramentas de anotação lingüística. • Corpora eletrônicos da língua portuguesa. • O debate sobre a normatização da anotação lingüística.

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |23|

Page 24: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

4 .2 At iv idades Prepara tór i a s Rea l i zadas4.2.1 Elaboração do volume “Edições Crít icas Eletrônicas: Fundamentos e Diretrizes”

Ao longo do processo de preparação da I Oficina de Anotação, percebi que seria interessante apresentar o sistema de preparação de textos do Corpus em duas partes – fundamentalmente, fazendo com que a explicação sobre os procedimentos técnicos específicos do Corpus fosse precedida de uma pequena explanação sobre o que é o processamento de textos no meio eletrônico. Preparei, com este objetivo, um pequeno artigo, sob o título “O texto digital”. O artigo foi apresentado na seção inicial do encontro, e obteve grande receptividade. O perfil dos pesquisadores ali presentes era de especialistas da área filológica, dedicados à edição de textos históricos, alguns deles responsáveis por edições de grande renome. Sua receptividade foi, portanto, muito gratificante. E de fato, pude perceber que a partir da apresentação de alguns conceitos básicos sobre o processamento digital, o curso intensivo sobre o sistema de anotação XML e de transformações XLST teve um nível muito elevado de aproveitamento da parte dos participantes.

Diante deste resultado muito positivo, pareceu interessante modificar o sistema anterior do Manual de Preparação de Textos do Corpus, acrescentando uma parte preliminar de introdução conceitual. Por sugestão de membros da minha equipe técnica, separei a documentação em dois volumes; de um lado, o Manual de Procedimentos contém informações técnicas de referência (e pode ser consultado de modo ágil pela equipe sempre que necessário); de outro lado, o volume com os fundamentos conceituais e as diretrizes das edições eletrônicas, que funcionaria como introdução ao Manual de Procedimentos.

Neste volume, com o título “Edições Críticas Eletrônicas: Fundamentos e Diretrizes”, foram aproveitados os principais pontos explorados no pequeno artigo “O texto digital”. Absorveu-se, ainda, a parte introdutória do Manual anterior, quando se expunha uma visão geral do sistema de versões do Corpus. Além disso, acrescentaram-se seções mais detalhadas e específias sobre as normas de transcrição e de edição seguidas no Corpus.

Trata-se, ainda, de um trabalho em progresso. Para seu desenvolvimento, venho contando com a colaboração da aluna Gilcéclia de Menezes, bolsista de Capacitação Técnica; o objetivo de seu trabalho de capacitação é o auxílio ao desenvolvimento das diretrizes de edição dos textos – que ficarão a seu cargo a partir deste ponto. Ainda na parte das diretrizes de edição, em breve poderei contar também com a colaboração dos pesquisadores do PHPB da Bahia. Como resultado da Oficina de Anotação, o grupo está preparando uma edição modernizada do corpus “Atas da Irmandade do Rosário”. É nossa perspectiva que os dois grupos trabalhem conjuntamente no sentido do estabelecimento de normas de edição comuns.

O resultado deste processo de elaboração do volume de Diretrizes e Fundamentos será certamente muito valoroso para a elaboração final do trabalho proposto por esta pesquisa.

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |24|

Page 25: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

4.2.2 Elaboração do Artigo: “Critical Hipereditions: New Challenges for Text-Crit ique”

O artigo “Critical Hipereditions: New Challenges for Text-Critique” será apresentado durante o seminário internacional Literaturas: del Texto al hipertexto, organizado pelo “Grupo de Investigación Literaturas Españolas y Europeas del Texto al Hipertexto (LEETHI) de la Universidad Complutense de Madrid”, e pelo “Comité sobre Literatura Comparada en la Era Digital (LCDA) de la Asociación Internacional de Literatura Comparada”. Os objetivos do seminário são assim estabelecidos:

1. Valorar el impacto del hipertexto y el hipermedia en el ámbito literario.

2. Evaluar prospectivamente la presencia de las literaturas en Internet, analizando la estructuración institucional de portales.

3. Estudiar las relaciones de transferencia entre las diferentes literaturas a través de la nueva cultura cibernética.

4. Analizar el alcance de la nueva tecnología sobre la cultura de los individuos en la formación de identidades plurales.

(cf. http://www.ucm.es/info/leethi/seminario/cfp-esp.htm)

Minha comunicação, aceita para a mesa Teorias del Hipertexto, seguirá o seguinte resumo:

“The upsurge of text production and circulation in digital environments has brought renewed relevance to some of the tasks traditionally carried out in the field of text-critique – in particular, the tasks of establishing the original form of texts, tracing back their subsequent cycles of transformations/alterations, and certifying the autenticity or authorship of texts. Yet “hipertext” is an object still to be fully explored, conceptually and methodologically, in this field. This exploration can start with a basic question: what makes digital texts singular in relation to other forms of writing as regards the material process of their production; the conditions for their reception; the potential cycles of alteration they may endure along the chain of transmission; and the implications of this processing cycle, as a whole, in the nature of the texts? This presentation will explore some lines for this conceptual debate, arguing that digital text production is a breaking point in the history of texts as cultural objects, rather than an incremental point in the evolution of text-production techniques. Digital processing is not a new instrument, but a new process of information codification. With manuscript or printed texts, information codification is processed directly by producers-receivers, given their command of a writing system (albeit with the support of mechanical instruments, such as pens or presses). With digital texts, information codification processing is mediated by artificial intelligence (apart from the support of an instrument, the computer). This mediation poses methodological challenges for text-critique. The field´s scope of action must expand to include this intermediate cycle of procedures (ie.: artificial codification) when considering endogenous or exogenous text alterations. I will present here an experience towards approaching this challenge: the “Critical Hiperedition”, which allows us to control processing marks in digital texts, via hipertext markup languages (more precisely, XML).”

Como se nota, no resumo toco algumas das questões desde o início consideradas centrais nesta pesquisa – como a questão dos ciclos potenciais de alteração dos textos no processo de sua digitalização, e a questão da possibilidade de se “rastrear” tais alterações.

Espero, com a elaboração do artigo completo e sua apresentação, chegar a uma sistematização adequada dessas idéias até aqui esboçadas.

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |25|

Page 26: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

4.2.3 Bibliografia Estudada1. ABREU, Márcia (org). Leitura, história, e história da leitura. São Paulo: Fapesp/Mercado de Letras, 2002.

2. ACIOLI, Vera Lúcia Costa. A Escrita no Brasil colônia: um guia para leitura de documentos manuscritos. Recife: UFPe/Massangana, 1994.

3. ANSELMO, Artur. História da Edição em Portugal. Vol 1: Das origens até 1536. Porto: Lello & Irmão, 1991.

4. BARBOSA, Gerônimo Soares. Grammatica philosophica da lingua portugueza ou Princípios da grammatica geral applicados á nossa linguagem, 1822. Biblioteca Nacional de Lisboa: edição fac-similar, <http://bdn.bn.pt/memorias>, 20/08/2003.

5. BARRETO, Joam Francisco. Ortografia da lingua portugueza, 1671. Biblioteca Nacional de Lisboa: edição fac-similar, <http://bdn.bn.pt>, 20/03/2003.

6. BARRETO, Luis Felipe. Caminhos do saber no renascimento português. Lisboa: Imprensa Nacional, 1986.

7. BLECUA, Alberto. Manual de crítica textual. Madrid: Castalia, 1987.

8. BRITO, Gomes de: Noticia de livreiros e impressores de Lisbôa na 2ª metade do seculo XVI. Lisboa: Imp. Libanio da Silva, 1911.

9. BUESCO, Maria Leonor Carvalhão. Gramáticos portugueses do século XVI. Lisboa: MEC, 1978.

10. BUESCO, Maria Leonor Carvalhão. Historiografia da língua portuguesa (século XVI). Lisboa: Sá da Costa, 1984.

11. CAFEZEIRO, Edwaldo Machado. O Texto e a Crítica Textual Hoje. Philologus - Revista do Círculo Fluminense de Estudos Filológicos e Lingüísticos, ano 5, n. 14. <http://www.filologia.org.br/revista/artigo/5(14)77-81.html>

12. CÂMARA JÚNIOR, Joaquim Mattoso. Dicionário de Filologia e Gramática Referente à Língua Portuguesa. Rio de Janeiro: Jose Olympio, s/d.

13. CAMBRAIA, César Nardelli. Introdução à Crítica textual. São Paulo: Martins Fontes, 2005 (Coleção Leitura e Crítica).

14. CARVALHO, Rosa Borges Santos. A Filologia e seu Objeto: Diferentes perspectivas de estudo. Philologus - Revista do Círculo Fluminense de Estudos Filológicos e Lingüísticos, ano 9, n. 26, Rio de Janeiro. <http://www.filologia.org.br/revista/artigo/9(26)03.htm>

15. CASTRO, Ivo (org). História da Crítica Textual - Materiais de Estudo. Apostila preparada para o Seminário de Lingüística Portuguesa Histórica, Faculdade de Letras de Lisboa. Lisboa: mimeo, 1989.

16. CASTRO, Ivo. Curso de história da língua portuguesa. Lisboa: Universidade Aberta, 1991.

17. CATÁLOGO: Caminhos do Português: exposição comemorativa do ano europeu das línguas. Biblioteca Nacional (org). Lisboa: Biblioteca Nacional, 2001.

18. CHARTIER, Roger. Cultura escrita, literatura e história. Tradução de Ernani Rosa. Porto Alegre: Artmed, 2001.

19. CRUZ, Maria Augusta Lima. Diogo do Couto e a Década 8a da Ásia: Edição crítica e comentada de uma versão inédita. Vols I e II. Lisboa: Imprensa Nacional - Casa da Moeda, 1993.

20. CUESTA, Pilar Vasquez. A Língua e a cultura portuguesas no tempo dos Filipes. Lisboa: Coleção Saber/Publicações Europa-América, 1986.

21. CUNHA, Antônio Geraldo da. Índice do vocabulário português medieval. Vols 1 e 2. Rio de Janeiro: Fundação Casa de Rui Barbosa, 1988.

22. DESLANDES, Venâncio: Documentos para a história da tipografia portuguesa nos séculos XVI e XVII. Lisboa: Imp. Nac.-Casa da Moeda, 1988.

23. DIAS, João José Alves; MARQUES, A.H. de Oliveira & RODRIGUES, Teresa F. Álbum de Paleografia. Lisboa: Estampa, 1987.

24. EISENSTEIN, Elizabeth. A Revolução da cultura impressa. Tradução de Osvaldo Biato. São Paulo: Ática, 1998.

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |26|

Page 27: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

25. EMILIANO, António H. A. Sobre a questão d´'os mais antigos textos escritos em português'. Em CASTRO, Ivo & DUARTE, Inês (orgs.): Razões e Emoção - Miscelânea de estudos em homenagem a Maria Helena Mira Mateus. Vol. 1. Lisboa: Imprensa Nacional - Casa da Moeda, 2003.

26. FÁVERO, Leonor Lopes. As Concepções lingüísticas no século XVIII. Campinas: Editora da Unicamp, 1996.

27. HIGOUNET, Charles. História Concisa da Escrita. Tradução de "L´Écriture", 10a edição, Presses Universitaires de France, 1997. São Paulo: Parábola, 2003.

28. LAPA, Rodrigues.Historiadores quinhentistas. Lisboa: Seara Nova, 1972.

29. MACHADO FILHO, Américo Venâncio Lopes. A Pontuação em manuscritos medievais portugueses. Salvador: Edufba, 2004.

30. MACHADO, Andréa Abrate Coimbra; Gomes, Nataniel dos Santos. Hipertexto: Uma possibilidade de crítica textual. Philologus - Revista do Círculo Fluminense de Estudos Filológicos e Lingüísticos, ano 11, n. 31, Rio de Janeiro. <http://www.filologia.org.br/revista/artigo/11(31)05.htm>, 15.03.2006.

31. MARQUILHAS, Rita. A faculdade das letras: Leitura e escrita em Portugal no século XVII. Tese de Doutoramento, Universidade de Lisboa, 1996.

32. MARQUILHAS, Rita. Norma gráfica setecentista: Do autógrafo ao impresso. Coimbra: Instituto Nacional de Investigação Científica (INIC), 1991.

33. MARTINS, Ana Maria. Emergência e generalização do português escrito: de D. Afonso Henriques a D. Diniz. Em Caminhos do Português: exposição comemorativa do ano europeu das línguas - Catálogo. Biblioteca Nacional (org). Lisboa: Biblioteca Nacional, 2001.

34. MATTOS E SILVA, Rosa Virgínia e MACHADO FILHO, Américo Venâncio Lopes (orgs). O Português quinhentista: Estudos lingüísticos. Salvador: Edufba, 2002.

35. MEGALE, Heitor & CAMBRAIA, César Nardelli. Filologia Portuguesa no Brasil. Delta, vol. 15, número especial:1:22. São Paulo, 1999.

36. MEGALE, Heitor. A Demanda do Santo Graal: Das origens ao códice português. São Paulo: Fapesp/Ateliê Editorial, 2001.

37. MELO, Gladstone Chaves de. Iniciação à Filologia e à Lingüística Portuguesa. 6a Edição. Rio de Janeiro: Ao Livro Técnico, Coleção Lingüística e Filologia, 1981.

38. NORONHA, Tito de: A imprensa portuguesa durante o seculo XVI. Porto: Imprensa Portuguesa, 1874.

39. SAID ALI, Manuel. Gramática Histórica da Língua Portuguesa, 2.ª ed. melhorada e aumentada de Lexicologia e Formação das palavras e Sintaxe do Português Histórico, São Paulo, Companhia Melhoramentos de São Paulo, s/d; 3.ª ed. Rio de Janeiro: Livraria Acadêmica, 1964.

40. SANTOS, Antonio Ribeiro dos: Memoria para a história da typografia portugueza do seculo XVI. Lisboa, 1814.

41. SARAIVA, António José & LOPES, Oscar. História da literatura portuguesa. Lisboa: Porto Editora, 17a edição corrigida e atualizada, 1996.

42. SARAIVA, António José. O Crepúsculo da Idade Média em Portugal. Lisboa: Gradiva, 1988.

43. SARAIVA, António José. Para a história da cultura em Portugal. Vol. II. Lisboa: Gradiva, 1985.

44. SERRÃO, Joaquim Veríssimo. Cronistas do século XV posteriores a Fernão Lopes. Lisboa: Biblioteca Breve, 2a edição, 1989.

45. SILVA NETO, Serafim. Manual de Filologia Portuguesa. 3a Edição. Rio de Janeiro: Presença/MEC, 1977.

46. SILVA, José Pereira da. A Metodologia da Crítica Textual: Análise de algumas edições críticas. Philologus - Revista do Círculo Fluminense de Estudos Filológicos e Lingüísticos, ano 3, n.8, Rio de Janeiro. <http://www.filologia.org.br/revista/artigo/3(8)16-27.html>, 15.03.2006.

47. TAVANI, Giuseppe. Antecedentes históricos. In: I. Castro, I. Duarte & I. Leiria (orgs.), A Demanda da ortografia portuguesa. Lisboa: Sá da Costa, 1987.

48. VITERBO, Sousa: O movimento tipográfico em Portugal no século XVI : apontamentos para a sua história . Coimbra: Imp. da Universidade, 1924 .

IV . Deta lhamento dos Resu l t ados : Es t ru turação da Ref lexão Teór i ca |27|

Page 28: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

V. P e r s p e c t i v a s

1 . O b j e t i v o s G e r a i sLembro aqui a idéia que constitui a motivação principal desta pesquisa, conforme exposta no projeto do trabalho:

“Um corpus histórico eletrônico pode ser concebido como um conjunto de textos escritos em épocas passadas e reunidos em torno de uma determinada concepção de língua, com o objetivo fundamental de constituir um corpo robusto e tecnologicamente trabalhável de informações que possibilitem análises aprofundadas sobre os diferentes estágios da língua. Os elementos que compõem este corpo de informações percorrem um longo caminho até sua transformação em arquivos computacionalmente estruturados. Neste percurso, os diferentes estágios de processamento imprimem modificações que podem constituir informações importantes para a compreensão do significado histórico e linguístico dos textos. Os rastros deixados nos documentos no caminho entre o momento em que são escritos (à pena de ganso, em pergaminhos...) e sua instrumentação computacional constituem o que chamarei aqui de memórias do texto. Tais memórias podem ser capturadas e codificadas tecnologicamente, e contribuir para a construção do conhecimento que buscamos no legado desses textos”.

No Primeiro Relatório desta pesquisa, lembrei também este trecho do Projeto de pesquisa, para afirmar que “O início de uma reflexão teórica neste sentido será o objetivo central do segundo ano da pesquisa”.

Estando próximo o final deste segundo ano, penso que este objetivo central se concretizou sobretudo na forma dos primeiros passos da reflexão sobre o Texto Digital, e no desenho da idéia do Hipertexto Crítico.

Esta reflexão e esta idéia se formaram a partir da preparação de alguns dos trabalhos realizados neste ano e apresentados em encontros científicos. Mais recentemente, a preparação do volume Edições Críticas Eletrônicas: Fundamentos e Diretrizes trouxe uma maior clareza na sistematização dessas idéias – e sobretudo, revelou uma vertente de união entre os trabalhos mais técnicos e a reflexão teórica proposta neste projeto.

Avalio, de fato, que o presente estágio da pesquisa representa seu momento de amadurecimento. Sobre o fundamento dos avanços técnicos obtidos nos primeiros dois anos, e graças ao aprofundamento da reflexão teórica iniciado neste segundo ano em especial, será possível construir resultados profícuos, que justifiquem o percurso percorrido até este momento.

Nesta perspectiva, parece-me relevante prosseguir a pesquisa por mais um ano, período no qual esses resultados poderão ser apresentados de modo concreto – sob a forma da elaboração do livro Memórias do Texto, e da realização do Seminário.

Estes produtos se aliariam ao produto primeiro desta pesquisa – o Corpus Histórico reestruturado – de forma a fazer cumprir a meta primordial deste projeto: mostrar que a construção de um corpus eletrônico pode servir a múltiplos propósitos. Ou, como se mencionou no projeto de pesquisa, mostrar que o destino dessa reunião de textos pode ser ampliado, aliando-se ao interesse linguístico-computacional intrínseco deste material interesses de outras áreas do conhecimento, e do público em geral (conferindo-lhe assim uma propriedade de preservação e difusão de documentos de grande valor histórico e cultural).

V. P e r s p e c t i v a s |28|

Page 29: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

2 . P l a n o d e P r o c e d i m e n t o sO segundo ano de pesquisas seria fundamentalmente dedicado à elaboração do livro e à realização do seminário, de acordo com o plano inicial a seguir, e dentro do Cronograma apresentado em V.3 adiante.

2 .1 Ges tão dos Traba lhos da Equ ipe Técn icaAo longo deste terceiro ano, minha participação junto à equipe técnica poderá ser traduzida em efetiva coordenação, uma vez que as bolsistas estão agora bastante independentes, podendo realizar boa parte do trabalho de maneira autônoma. Ainda assim é necessária uma proximidade com a equipe, para que os trabalhos sejam apropriadamente supervisonados. O desenvolvimento do Hipertexto Crítico (cf. 2.2 abaixo) será conduzido no ambiente de trabalho da equipe, permitindo esta proximidade e colaboração.

2 .2 Desenvo lv imento do Hipe r t ex t o Cr í t i c oPara alcançar os dois objetivos centrais neste período (a elaboração do livro e a realização do seminário), é primordial dar início ao desenvolvimento do Hipertexto Crítico de forma concreta. As bases técnicas para a elaboração de edições nestes moldes já estão lançadas, pelo sistema de anotação já aplicado ao Corpus. Como menciono na seção IV dos Fundamentos e Diretrizes, no plano técnico o desenvolvimento do Hipertexto Crítico depende apenas da elaboração de um novo sistema de apresentação, que permita reunir em um mesmo documento HTML (de apresentação) todas as camadas de edição anotadas em XML.

Para desenvolver este sistema, estou partindo da edição eletrônica já pronta dos Sermões de Antonio Vieira, disponível no Corpus. A edição-fonte para este documento foi a de Gonçalo Alves, de 1907. Pretendo agora adicionar, à transcrição desta edição, uma transcrição paralela, feita diretamente a partir do fac-simileda edição de 1662 disponível na Biblioteca Nacional de Lisboa (<http://purl.pt/292>). A comparação das duas edições orientará desenvolvimento técnico do formato Hipertexto Crítico. Nos primeiros meses, desenvolverei uma versão-piloto do Hipertexto Crítico, com um dos Sermões apenas.

A idéia do Hipertexto Crítico engloba também, como já mencionei, uma camada de anotação lingüística. Assim, depois da transcrição do fac-simile, e sua edição interpretativa, procederei à elaboração da camada de anotação sintática do texto. Para isto poderei contar com a experiência dos colaboradores do Projeto Temático, especialistas em sistemas automáticos de anotação (embora, num primeiro momento, a idéia seja realizar esta anotação manualmente). Em especial, espero contar com a colaboração do Professor Anthony Kroch, da Universidade da Pensilvânia (que coordena o sistema de anotação sintática do Corpus do Inglês Médio naquela instituição), em sua próxima visita ao Brasil como colaborador do Projeto.

V. P e r s p e c t i v a s |29|

Page 30: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

2 .3 Organ ização e Rea l i zação do Seminár io Com base no Hipertexto Crítico dos Sermões, iniciarei o processo de estruturação efetiva do Seminário nos moldes expostos em IV.3 acima.

Poderei apresentar a edição crítica e a idéia do Seminário a estudiosos da obra de Vieira e da sintaxe do português seiscentista, convidando-os para participar do encontro.

Prevejo que o evento poderá se realizar no segundo semestre de 2007.

2 .4 El aboração do L ivroParalelamente, prosseguirei a pesquisa teórica sobre o texto digital na perspectiva da crítica textual, com vistas à elaboração do trabalho nos moldes expostos em IV.4 acima.

Um primeiro passo neste sentido será a minha participação no seminário Literaturas: del Texto al hipertexto, em setembro. Na preparação do artigo a ser apresentado, sistematizarei as idéias até aqui esboçadas; e prevejo que a experiência da participação irá enriquecer a discussão que proponho para o livro.

Prosseguirei, ainda, com a pesquisa bibliográfica já iniciada, aprofundando-a e resenhando-a com vistas à composição do livro.

V. P e r s p e c t i v a s |30|

Page 31: I. Relatório de Atividades - IME-USPtycho/participants/psousa/memorias/relat_2006/pdf/... · • A seção III apresenta um detalhamento dos resultados quanto à estruturação

p r o j e t o m e m ó r i a s d o t e x t o – r e l a t ó r i o d e p e s q u i s a - j u n h o , 2 0 0 6

3 . C r o n o g r a m a

Final do Segundo ano de pesquisa Junho a Agosto, 2006:

• Preparação do artigo “Critical Hipereditions: New Challenges for Text-Critique” e de sua apresentação no seminário internacional Literaturas: del Texto al hipertexto.

• Desenvolvimento de uma versão-piloto do Hipertexto Crítico dos Sermões (um Sermão a ser selecionado)

Terceiro ano de pesquisa

Setembro a Dezembro, 2006

• 21 de setembro: Apresentação do artigo “Critical Hipereditions: New Challenges for Text-Critique” no seminário internacional Literaturas: del Texto al hipertexto.

• Desenvolvimento do Hipertexto Crítico dos Sermões

• Pesquisa e estudo da bibliografia relevante para a elaboração do livro

Janeiro a Agosto, 2007

• Preparação da versão definitiva do Hipertexto Crítico dos Sermões

• Organização do Seminário

• Elaboração do livro, e organização de uma proposta editorial

V. P e r s p e c t i v a s |31|