40
Arquivo.pt Preservar a Web: Porquê? Para quem? Daniel Gomes [email protected] 2018-04-13

Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Arquivo.pt

Preservar a Web: Porquê? Para quem?

Daniel Gomes

[email protected]

2018-04-13

Page 2: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

“Gazeta de Lisboa” foi 1º jornal impresso português, iniciado em 1715

Page 3: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

“Gazeta de Lisboa” foi suspenso em 1762.

300 anos depois as suas publicações continuam acessíveis

Page 4: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

“Diário Digital” foi o 1º jornal português exclusivamente online, iniciado em 1999

Page 5: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

“Diário Digital” desapareceu em 2017

Page 6: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Após apenas 17 anos, como acedemos às publicações do “Diário Digital”?

Page 7: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Facto: A Web tem substituído a Imprensa

Galerias de fotografias

(publicadas em Blogs)

Blogs pessoais

Notícias(Blogs

temáticos)

E-books(derivados de

textos de Blogs)

Page 8: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Contudo, esta valiosa informação desaparece rapidamente

Page 9: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

das páginas da Web desaparecem ou mudam passado apenas 1 ano.

80%

Page 10: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)
Page 11: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Serviço gratuito de preservação fornecido a autores da Web• Só preserva informação de acesso público

• Respeita restrições de recolha impostas (robotstxt.org)

– Autores podem abdicar do serviço de preservação gratuito após a recolha da página.

Page 12: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

5 000 000 000cinco mil milhões de ficheiros da web preservados

…desde 1996

Page 13: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Exemplos de páginas preservadas

Page 14: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

A primeira página portuguesa (90’s)

Page 15: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Eventos internacionais

Revolução Egípcia de 2011: revolução baseada na web, revolução arquivada da web

Os artefactos originais são páginas da Web!

Page 16: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Como pesquisar informação arquivada?

Page 17: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Pesquisa por URL:Histórico de um endereço

Page 18: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

www.RTP.pt (2006)

Page 19: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

www.RTP.pt (1999)

Page 20: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

www.RTP.pt (1998)

Page 21: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Reprodução de páginas preservadas: Navegar entre versões e seguir ligações

Page 22: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Guardar página completa em vez de “Print Screen”

Page 23: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Pesquisar noutros arquivos

Page 24: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Problema com pesquisa por URL

Os utilizadores não sabem o endereço exacto da página que continha a informação que necessitam.

Page 25: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Inovação do Arquivo.pt:pesquise textos de páginas do passado

Page 26: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Pesquisa avançada

• 2001

• “Vasco Matos Trigo”

• Antes de 1999

Page 27: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

2001: programa do passado acerca do futuro:-)

Page 28: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Arquivo.ptCasos de uso

Page 29: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Gestão: documentação/auditoria de projeto concluído

“Estava tudo no site”

Page 30: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Portfólio/CV

“O meu melhor trabalho foi um site que já não existe.”

• 60% dos sites desaparecem após apenas 2 anos.

Page 31: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Investigação em todas as áreas: recursos indisponíveis

Page 32: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Quanto vale o Arquivo.pt?

Quanto vale para vós?– Recuperar trabalho perdido

– Pesquisar e aceder a informação única

– Aceder rapidamente a informação histórica

– Preservar resultado do vosso trabalho

Page 33: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Design + Desenvolvimento = 5 600 €/site

Há 20 anos era mais caro.

Page 34: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Criação de conteúdo =

68 €/página

Page 35: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Estimativa de investimento na criação do património preservado pelo Arquivo.pt

5,6 Msites x 5 600 € = 31 320 M€

2 730 Mpáginas x 68 € =185 640 M€

Total do património preservado =

216 960 M€

PIB Portugal 2016185 034 M€

Page 36: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Informação é Património!

Os sites são Património

A informação publicada nos sites é valiosa

Preservar informação é responsabilidade de todos

Page 37: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Arquivo.ptInformações & Formações

Page 38: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Formações Arquivo.pt

• Novas formas de pesquisar o passado (módulo A)– Qualquer utilizador da Internet

• Como publicar informação preservável para o futuro (módulo B)– Autores de conteúdos para a Web e responsáveis

por websites

• Acesso e processamento automático de informação preservada da Web (módulo C)– Informáticos e investigadores Big Data

arquivo.pt/forma

Page 39: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Inscreva-se na lista de email para se manter atualizado acerca de formações

• Só para informações importantes(ex. formações, novas coleções e funções, colaborações, bolsas).

• Pode sair quando quiser

Page 40: Preservação da web política · Os artefactos originais são páginas da Web! Como pesquisar informação arquivada? Pesquisa por URL: Histórico de um endereço. (2006) (1999)

Informação digital é património.

Arquivo.pt é um serviço gratuito de preservação oferecido aos autores da Web.

Um “Google” para o passado!