FESABID`11 – Málaga – 25 de mayo 2011Captura de webs relacionados con la lengua vasca Componer...

Preview:

Citation preview

FESABID`11 FESABID`11 –– MMáálaga laga –– 25 de mayo 201125 de mayo 2011““El archivo de Internet: bibliotecas que piensan en el futuroEl archivo de Internet: bibliotecas que piensan en el futuro””

Ondarenet = acrónimo de

OndareOndareDigitalarenDigitalarenArtxibategiArtxibategi

ElektronikoaElektronikoa

ONDARENET: capturando la web vasca

Tendencias de ediciTendencias de edicióón en Espan en Españña (2010)a (2010)18.500 producción de libros en otros soportes

95.959 títulos publicados en papel

1.314.431 sitios web con dominio .es

0

20.000

40.000

60.000

80.000

100.000

120.000

2006 2007 2008 2009 2010

Producción delibros en soportepapelProducción delibros en otrossoportesTotal

Fuente: Ministerio de Cultura

http://www.mcu.es/libro/MC/PEE/estadisticas/globalesEvo.html

Fuente: Red.es y Webhosting.info

http://www.nic.es/estadisticas/article/293

¿¿ququéé capturar?capturar?

OndarenetSe capturan :

-Dominios .es, .com, .org, .biz, .eu, que se generan en el País Vasco o que están relacionados con su cultura, sociedad, lengua,…

-Euskera y castellano.

-Las capturas se programan en función de su importancia: diaria, semanal,… pero se procura hacer una captura anual.

ppááginas webginas web

herramientas de comunicaciherramientas de comunicacióónn

ficheros asociadosficheros asociadosdocumentos

imágenes

videos

software de capturasoftware de capturaToolkit propuestopor el International Internet Preservation Consortium (IIPC)

software de capturasoftware de captura

¿¿por qupor quéé ondarenet?ondarenet?

7,234 km²2.155.546 habitantes. Dos lenguas oficiales: euskera y castellano

Captura de webs relacionados con la lengua vasca

Componer una colección de recursos digitales

Conocer el presente en el futuro

Preservar y conservar el conocimentosobre el País vasco

¿¿por qupor quéé ondarenet?ondarenet?

Capturas Capturas ondarenetondarenet (hasta mayo 2011)(hasta mayo 2011)

Nº DE DOCUMENTOS

IMÁGENES; 3263736; 17%

TEXTO; 16421224; 83%

VIDEO; 3414; 0%AUDIO; 21839; 0%

AUDIOVIDEOIMÁGENESTEXTO

19.717.721 documentos

1.766 url’s capturadas

839.160 Mb almacenados

archivando la webarchivando la web

Orígenes, iniciativas y acceso a la información

1996 1996 –– los pioneroslos pionerosWeb archive (EEUU)

Kulturarw3 (Suecia)

Kulturarw3 – The Swedish Web Archive

Allan Arvidson, The National Library of Sweden, las características de este proyecto serían:

•Se capturan:- Dominios .se-Dominios .nu, ”nu” en sueco significa “ahora”.-Otros dominios pero si el servidor está ubicado

geograficamente en Suecia.-Lengua?

- ley de depósito legal sueca, las consultas de las capturas solo se pueden realizar en la Biblioteca Nacional de Suecia.

Kulturarw3 – The Swedish Web Archive

Algunos datos:

• 1997

- 6.8 millones de archivos- 160 GB

• 2007-2008

- 270 millones de archivos- 11500 GB

EskerrikEskerrik askoasko

httphttp://://www.euskadi.netwww.euskadi.net//ondarenetondarenet

Muchas graciasMuchas gracias

FESABID`11 FESABID`11 –– MMáálaga laga –– 25 de mayo 201125 de mayo 2011““El archivo de Internet: bibliotecas que piensan en el futuroEl archivo de Internet: bibliotecas que piensan en el futuro””

Recommended