El Archivo de la Web Española a un clic

La Biblioteca Nacional de España y varios centros de conservación de las Comunidades Autónomas han implementado la primera fase del portal desde el que será posible acceder a la colección formada por los sitios web archivados (incluidos blogs, foros, cuentas de Twitter, imágenes, vídeos, etc.) que se recolectan con el objetivo de preservar el patrimonio documental español en Internet.

La Biblioteca comenzó a capturar páginas y sitios web españoles albergados en el dominio .es, así como en otros dominios y subdominios genéricos (.com, .edu, .gob, .org, .net, etc.), en 2009, con la ayuda de la organización sin ánimo de lucro Internet Archive, inspirada  en las Directrices para la preservación del patrimonio digital de la UNESCO (2003) y en la Recomendación de la Comisión Europea de 24 de agosto de 2006 sobre la digitalización y la accesibilidad en línea del material cultural y la conservación digital. Desde 2011, los sitios web y las publicaciones en línea son considerados objeto de depósito legal (Ley 23/2011, de 29 de julio, de depósito legal), y como tal la BNE y los centros de conservación de las Comunidades Autónomas tienen la obligación de preservarlos como parte de sus colecciones patrimoniales.

En esta fase de prueba, la consulta sólo está disponible por URL,  pero se prevé que más adelante una nueva versión permita realizar búsquedas por materias, títulos, y a texto completo. Por ello, es posible que en la recuperación de la información encontremos numerosos enlaces rotos, debido tanto a la imposibilidad de preservar toda la información publicada en Internet como a la obsolescencia y volatilidad de la tecnología que se utiliza para su recolección.

La Biblioteca Nacional, con el fin de guardar la mayor cantidad de información web posible, y consciente del problema que plantea la exhaustividad y tamaño de Internet, ha optado por un modelo mixto de recolección de páginas web, que combina capturas masivas con otras más selectivas, siguiendo la metodología utilizada por parte de otras bibliotecas nacionales en el mundo.

 

Las capturas selectivas se dividen a su vez en tres grupos principales: temáticas, de evento y de riesgo. Entre las primeras hasta la fecha se dispone de las siguientes:

Por su parte las de evento incluyen acontecimientos de especial relevancia para la sociedad española, bien por su valor cultural, científico, artístico, social y político, su trascendencia para la investigación futura sobre la historia, la sociedad y la cultura españolas y/o que hayan tenido gran repercusión pública e impacto social:

Por último, el grupo de riesgo incorpora aquellos sitios web con amenaza de desaparición, y por tanto, de pérdida de información.

Nos encontramos por tanto ante un interesante proyecto colaborativo, que pretende recopilar, divulgar y preservar en la medida de lo posible el patrimonio documental existente en Internet. No obstante, la difusión de estos contenidos no es totalmente en acceso abierto, puesto que podría colisionar con la Ley de Propiedad Intelectual. Por ello se han dispuesto ordenadores diseñados especialmente para ello tanto en la Biblioteca Nacional como en las bibliotecas habilitadas por las Comunidades Autónomas que participan en el proyecto.

 

 

 

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*