1 "Memória, Rede, Mudança Social" / SP, Brasil 14.ago.2003 O Ciclo de Tratamento...

Preview:

Citation preview

1"Memória, Rede, Mudança Social" / SP, Brasil

14.ago.2003

O Ciclo de Tratamento Informático das Histórias de Vida: da recolha à disponiblizaçãoa experiência do Núcleo Português do MP

Pedro Rangel Henriques

Jorge Gustavo Rocha

Universidade do Minho

Braga - Portugal

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 2

MotivaçãoPara transformar um conjunto de Histórias de Vida num Museu

Virtual, acessível pela Internet, onde o acervo possa ser explorado interactivamente nas suas múltiplas vertentes

É necessário :

1. Proceder à anotação (estruturação) dos documentos usando uma notação normalizada

2. Analisar o problema: Identificar os Requisitos; Sistematizar o Processo de Transformação dos documentos

3. Desenvolver as Ferramentas adaptadas à Anotação escolhida

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 3

Objectivo da Comunicação

À luz da experiência do NPMP,

Propor uma abordagem Ciclo de Vida dos documentos,

Sistema de Anotação (para representação dos doc.s)

Conjunto de Ferramentas

para criar automaticamente e manter um acervo dinâmico que possa ser explorado, com eficácia, em diferentes perspectivas e com fins diversos, satisfazendo

um conjunto vasto de requisitos

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 4

Plano da Comunicação

Enquadramento / Contexto de trabalho• Histórias de Vida: caracterização• Museu da Pessoa: o conceito• O Núcleo Português do MP

Requisitos Funcionais dum Museu Virtual Ciclo de Vida dos Documentos (HV) Anotação das HV em XML Ferramentas de Suporte

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 5

Caracterização do contexto de trabalhoHistória de Vida

As Histórias de Vida são vistas como documentos que contêm depoimentos, na 1ª ou 3ª pessoa, de Contadores de Histórias;

ao reportarem as suas vidas, os Narradores evocam eventos exteriores e outros temas sócio-culturais.

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 6

Caracterização do contexto de trabalhoHistória de Vida

Assim, em cada história,

para além do perfil pessoal, há um conjunto de representações que a pessoa faz do meio e época em causa,

que podem servir para identificação de algumas problemáticas e reconstrução de um universo social

e como tal tem de ser destacadas

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 7

Caracterização do contexto de trabalhoMuseu da Pessoa - A ideia base

A partir do registo de depoimentos em audio ou vídeo

criar um espaço virtual que congregue um infindável número de histórias de vida

para disponibilizar informações na Internet; produzir Bases de Dados, CD-ROM’s, Publicações em papel e Documentários em vídeo..

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 8

Caracterização do contexto de trabalhoMuseu da Pessoa - A ideia base

Assim um Museu da Pessoa é:

MP = Projs + Thesaurus + Gloss + etc.

Projs = conj( Projecto )

Projecto = Sinopse + Projs + HVs + Anexos

HV = FichId + MBio + Historia + Anexos

Historia = conj( Episodio )

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 9

NPMP: Núcleo Português do Museu da Pessoa - constituição

O Núcleo Português do Museu da Pessoa (NPMP):

envolve um grupo de docentes do Departamento de Informática da Universidade do Minho (onde está sediado)

conta com a colaboração de docentes do Departamento de Comunicação Social

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 10

NPMP: Núcleo Português do Museu da Pessoa - actividades

Além de se empenhar em solidificar e alargar a sua actividade base (cerca de 5 proj’s) com novos projectos e iniciativas (EV,etc.) ,

juntou-se ao Museu da Pessoa Brasileiro para formar uma rede de núcleos, o Instituto Museu_da_Pessoa.Net

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 11

NPMP: Núcleo Português do Museu da Pessoa - princípios

Assente num sólido conjunto de convicções e objectivos, o NPMP traçou os seguintes princípios de trabalho e linhas de acção:

tornar o acervo o mais acessível possível: Internet, CD-ROMs, livros, etc.;

criar vários mecanismos eficientes que facilitem a captação e registo de novas histórias;

definir e usar formatos comuns (adoptando normas internacionais), de modo a facilitar intercâmbio de histórias e de ferramentas;

manter, a nível dos formatos e das ferramentas, independência de plataformas e de aplicações;

………

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 12

NPMP: Núcleo Português do Museu da Pessoa - princípios

...... construir e partilhar ferramentas que facilitem o

trabalho; construir estruturas classificativas comuns; manter o maior número possível de ligações

entre documentos, para que a riqueza exploratória seja máxima.

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 13

Plano da Comunicação

Enquadramento / Contexto de trabalho Requisitos Funcionais dum Museu Virtual Ciclo de Vida dos Documentos (HV) Anotação das HV em XML Ferramentas de Suporte

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 14

Requisitos Funcionais dum Museu Virtual(Tradicionais)

Captação / Aquisição do acervo, Arquivo

• Classificação / Catalogação• Armazenamento e Conservação

Exibição / Divulgação Pesquisa (elementar) e Navegação por percursos

(limitada)

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 15

Requisitos Funcionais dum Museu Virtual(Próprias – nível da Divulgação)

• Disponível 24h/dia, 8dias/semana• Possível em suporte digital

Na Internet (usando Browsers WWW) CD-ROM Documentário Vídeo Outros formatos

• Possível em suporte papel Livros Almanaques Calendários Outros formatos

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 16

Requisitos Funcionais dum Museu Virtual(Próprias – nível Exploração na Internet)

• pesquisa por termos• navegação seguindo links, ou conceitos• enriquecimento dinâmico do acervo:

inserção de comentários diversos nas HV inserção de histórias em linha

• reconfiguração automática do museu (geral ou personalizada):

ranking de HV (orig. nos leitores) outras estratégias (orig. nos conservadores)

eventual/. baseadas no historial das visitas

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 17

Requisitos Funcionais duma Rede de Museus

• Mapeamento de conceitos, via Thesaurus multi-língua

• Procuras Distribuídas• Partilha automática da Informação sobre

os Leitores registados• Mecanismos de Reunião/Síntese de

Informação

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 18

Plano da Comunicação

Contexto de trabalho Requisitos Funcionais dum Museu Virtual Ciclo de Vida dos Documentos: tratamento

das HV Anotação das HV em XML Ferramentas de Suporte

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 19

Ciclo de Vida dos Documentos (tratamento das HV)

Cada Depoimento (Documento Multimedia)

passa, depois de recolhido, por uma série de etapas de tratamento/transformação,

até se tornar num texto classificado, resumido, cronologicamente referenciado e devidamente ligado a outros textos e materiais com ele relacionados

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 20

Ciclo de Vida dos Documentos (tratamento das HV)

Fases do processamento das Histórias de Vida: F1) Captação

F2) Tratamento

F3) Divulgação

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 21

Ciclo de Vida dos Documentos (tratamento das HV)

F1) Captação1.1 Criação da Ficha de Identificação da HV

(meta-informação)

1.2 Registo do depoimentoa) Gravação vídeo

b) Gravação áudio

c) Digitação directa

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 22

Ciclo de Vida dos Documentos (tratamento das HV)

F2) Tratamento do Depoimento2.1 Tratamento da História

2.2 Tratamento do Som

2.3 Tratamento dos Fotos e Doc.’s

2.4 Tratamento do Vídeo

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 23

Ciclo de Vida dos Documentos (tratamento das HV)

F2.1) Tratamento da História2.1.1 Transcrição

2.1.2 Revisão do texto transcrito

2.1.3 Edição, Anotação e Classificação

2.1.4 Redacção da Mini-biografia

2.1.5 Indexação da História+MBio anotada

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 24

Ciclo de Vida dos Documentos (tratamento das HV)

F2.2) Tratamento do Som2.2.1 Conversão para MP3

2.2.2 Marcação (opc.)

2.2.3 Indexação

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 25

Ciclo de Vida dos Documentos (tratamento das HV)

F2.3) Tratamento das Fotos e anexos2.4.1 Digitalização (JPEG ou outro)

2.4.2 Limpeza e processamento de Imagem

2.4.3 Legendagem legenda e

meta-informação para Catalogação

2.4.4 Indexação

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 26

Ciclo de Vida dos Documentos (tratamento das HV)

F2.4) Tratamento do Vídeo2.4.1 Digitalização/Conversão (AVI ou outro)

2.4.2 Marcação (opc.)

2.4.3 Indexação

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 27

Ciclo de Vida dos Documentos (tratamento das HV)

Arquivo resultante:• Ficha de Identificação da HV (XML)• História de Vida original• História de Vida editada (XML)• Mini-Biografia (XML)• Fotos e Anexos (JPEG + XML)• Som indexado (MP3 + XML)• Vídeo (AVI + XML)

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 28

Ciclo de Vida dos Documentos (tratamento das HV)

F3) Divulgação3.1 Publicação em HTML (site www na Internet)

3.2 Publicação em PostScript / PDF Livro de cada HV

Livro do Projecto

Almanaques, Calendários, etc.

3.3 Publicação em CD-ROM

……….

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 29

Plano da Comunicação

Contexto de trabalho Requisitos Funcionais dum Museu Virtual Ciclo de Vida dos Documentos (HV) Anotação das HV em XML

• Anotação• Potencialidades• Edição e Validação• Processamento

Ferramentas de Suporte

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 30

Anotação das HV em XMLAnotação (conceito)

Anotar é “acrescentar” um texto com palavras especiais, as marcas, que:• Definem a sua estrutura (delimitam blocos lógicos)• Dão informação quanto à formatação• Fornecem dados quanto à interpretação

Um texto amorfo ganha estrutura podendo ser trabalhado sistematicamente

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 31

Anotação das HV em XMLAnotação (conceito)

Anotar um texto, para o transformar num documento, implica :• Decidir as classes de marcas a incluir• Definir a estratégia de anotação• Escolher as marcas

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 32

Anotação das HV em XMLAnotação (potencialidades)

fica-se com uma base documental com os documentos originais independentes de plataforma ou ferramenta

disponíveis paraformatação (visualização/impressão)pesquisa e criação de índicesanálises linguísticas e sócio-culturais diversas (ortografia, estilos, análises de assinaturas, etc.) ...

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 33

Anotação das HV em XMLAnotação (a linguagem XML)

A meta-linguagem XML é um standard para criar Linguagens de Anotação específicas para cada situação (família de documentos):• Estabelece o critério de abertura/fecho de

marcas e a forma de aninhamento• Diz como se podem definir novas marcas

(os elementos) e seus atributos

As definições são expressas através de um DTD ou de um XML-Schema

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 34

Anotação das HV em XMLAnotação (a linguagem XML)

A Anotação dos Depoimentos requer

a criação de um novo dialecto de XML específico para essa família de documentos: o “MP.dtd”

que permita anotar as Histórias, as Mini-Biografias, as Fichas de Identificação e vários Catálogos

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 35

Anotação das HV em XMLAnotação (a linguagem XML)

Para Anotar os Depoimentos foi necessário escolher:• Etiquetas estruturais (Projecto, História,

Episódio, FichaId, Foto, etc.)• De meta-informação (entrevistador,

entrevistado, data e local da entrevista, etc.)• Interpretativas (nomes, datas, locais, etc.)

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 36

Anotação das HV em XMLExemplo 1 (estrutura+meta-info)

<bi>

<projecto>Memórias do Trabalho</projecto>

<depoente>José Vieira</depoente>

<biografia>José Vieira nasceu em 1920 em Resende…</biografia>

<profissao>lavrador; feitor; jardineiro</profissao>

<nascimento local=“Resende” ano=“1920” mes=“10” dia= />

</bi>

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 37

Anotação das HV em XMLExemplo 2 (estrutura)

<hv>

<titulo>José Vieira: de lavrador a jardineiro no Porto</titulo>

……………

<ascendencia>

<p>Meu pai era José Bonifácio… Minha mãe, Emilia da Silva…</p>

</ascendencia>

………………

</hv>

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 38

Anotação das HV em XMLExemplo 3 (estrutura+meta-info)

<fotos>

<foto ficheiro=“004-F-07.jpg”>

<onde>Ribeira</onde>

<quando>1950</quando>

<quem>Ao lado esquerdo, Francisco Lopes… </quem>

<facto>As cheias do rio Douro que …</facto>

</foto>

……………

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 39

Anotação das HV em XMLExemplo 4 (interpretação)

Ele foi preso pela <ref tipo = “Instituição”>PIDE</ref>

…no tempo da <expressao tipo=“designação cautelosa usada para referir a pide”>outra senhora</expressao>

O famoso <ref tipo=“Personalidade”>Cardeal Cerejeira</ref>

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 40

Anotação das HV em XMLEdição e Validação

Edição – identificação dos Elementos (inserção das “marcas” abertura/fecho) e adição dos Atributos/valores aos elementos (em função do contexto)

Fase:• Anotação posterior à introdução do texto• Anotação durante a escrita do texto

Ajuda:• Sem declaração do DTD• Com Conhecimento do DTD

Validação – verificação da anotação face às regras gerais de XML e do DTD específico

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 41

Anotação das HV em XMLEdição e Validação

Características desejáveis para um Editor:• Associação fácil do DTD/XML-Schema ao novo

documento• Escrita ágil do novo texto base, ou fácil abertura dum

existente• Indicação dos Elementos/Atributos que se podem

escolher em cada momento• Indicação dos Valores possíveis para cada Atributo • Integração dum Parser (com validação automática ou

explícita)

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 42

Anotação das HV em XMLProcessamento

Uma vez que a Anotação é estática (não produz qq. resultado)

O processamento visa transformar o documento anotado:• Formatar para publicação (PS, PDF, HTML, etc.)• Mudar formato• Pesquisar• Extrair informação

Existem já disponíveis muitas e boas ferramentas para processar XML

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 43

Anotação das HV em XMLProcessamento

As ferramentas para processar baseiam-se em Sistemas de Regras de Transformação da forma

Padrão Acção

em que o padrão se expressa em termos dos Elementos/Atributos XML

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 44

Plano da Comunicação

Contexto de trabalho Requisitos Funcionais dum Museu Virtual Ciclo de Vida dos Documentos (HV) Anotação das HV em XML Ferramentas de Suporte

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 45

Ferramentas de Suporte

Cada uma das fases do Ciclo de Vida dos Depoimentos

tem de ser suportada por ferramentas informáticas que agilizem a sua execução.

Essas ferramentas, de domínio público ou desenvolvidas especificamente, devem tirar partido do facto das HV estarem anotadas em XML

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 46

Ferramentas de Suporte

Ferramentas usadas no NPMP: Escriba: editor equipado com comandos

para auxiliar a transcrição XML-Spy: editor de XML para fazer a

anotação e edição MP2HTML (DAG): processador que constrói

o site www a partir do Arquivo MP2Book (SmallBook): processador que

produz os mini-livros de HV’s a partir do Arquivo

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 47

Ferramentas de Suporte

Outras ferramentas usadas no NPMP: Gerador de índices; MPMiner: analisador de texto com

extracção de datas, locais, nomes próprios e outros;

Library::simple: ferramenta de pesquisa para suporte a bibliotecas digitais;

Conversores de formatos: vários, open-source

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 48

ConclusãoNo contexto da Exploração dos Depoimentos (HV)

com vista à construção dum Museu Virtual sobre a Internet (integrável numa Rede de Museus),

Propôs-se: o uso de uma linguagem específica XML para

armazenamento integral dos documentos a sistematização do ciclo de tratamento dos

documentos

visando aumentar a automatização da transformação e as potencialidades de exploração

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 49

Evoluçãoa nível tecnológico

Reconhecer a Internet como espaço privilegiado para enriquecimento: uso do Wiki como suporte ao novo site

Incrementar a automatização do acesso ao acervo: uso de WebServices e Topic-Maps

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 50

Evoluçãoa nível de funcionalidades

Concluir a implementação de alguns requisitos singulares dos requisitos de rede

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 51

Equipe

Docentes do Dep. Informática• Jorge Rocha• José João Dias de Almeida• Pedro Rangel Henriques

Consultores do Dep. Comunicação (ICS)• Carolina Leite• Branco da Cunha / Angelo Peres

Estagiários / Tarefeiros

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 52

Colaboradores Alberto Simões Paulo Zagalo

Sónia Moreira Dario Silva Susana Correia Susana Queijo

Alunos finalistas da LCS (discipl. de Projecto)

14.ago.2003

"Memória, Rede, Mudança Social" / SP, Brasil 53

Edição/Validação de RPs em XML

Alternativas:• XML-Spy (Altova)• X-Metal (SoftQuad)• Document Editor (Altova)

Por satisfazer bem todos os requisitos a escolha recaiu sobre o XML-Spy

Recommended