La British Library commence l'archivage numérique du Web britannique

05 avril 2013 à 18h07
0
La bibliothèque nationale du Royaume-Uni vient d'annoncer le lancement de sa « récolte » de fichiers numériques britanniques, en vue d'enregistrer et d'indexer de nombreux contenus pour les préserver pour les générations futures. Une opération de très grande envergure.

00FA000005891704-photo-british-library.jpg
« Si vous voulez un aperçu de la vie aujourd'hui au Royaume-Uni, vous devez regarder sur le Web » explique au Telegraph Lucie Burgess, qui mène le projet développé par la British Library. L'objectif de l'organisme : enregistrer des milliards de pages Web, de magazines et de livres électroniques pour les stocker au même titre que les ouvrages traditionnels, en vue de les conserver en lieu sûr.

« Nous avons déjà perdu beaucoup d'éléments, notamment concernant les attentats de Londres du 7 juillet 2005, ou la crise financière de 2008 » estime Lucie Burgess, pour qui il ne faut pas attendre pour se lancer dans la démarche de sauvegarde. « Ce matériel est tombé dans un trou noir numérique, parce que nous n'avons pas été en mesure de le récupérer ». Une perte qui inclut également les réactions sur les réseaux sociaux.

La démarche, qui sera lancée samedi, concernera 4,8 millions de domaines britanniques, qui seront « aspirés » automatiquement. Un milliard de pages Web devraient être « moissonnées » par ce biais durant les trois prochains mois : il en faudra ensuite deux de plus pour que la British Library traite les données, et supprime notamment les contenus liés à des sites étrangers, ou encore d'archiver les tweets. La pratique est légale : le Royaume-Uni la prépare depuis 2003, année de la ratification du Legal Deposit Libraries Act, qui autorise l'archivage de données numériques au titre de la préservation.

Après cette première récolte, la bibliothèque nationale du Royaume-Uni effectuera des mises à jour régulières de ses bases de données. Le projet, en développement depuis deux ans, a déjà coûté 3 millions de livres sterling à l'organisme. « La préservation et le maintien d'une trace de tout ce qui a été publié constitue une ressource inestimable pour les chercheurs d'aujourd'hui et de demain » estime le ministre de la culture britannique Ed Vaizey. Les informations récoltées seront accessibles gratuitement pour les visiteurs de plusieurs bibliothèques partenaires à travers le Royaume-Uni : à noter que la BT n'a pas expliqué comment et où elle comptait stocker les données récoltées.

Audrey Oeillet

Journaliste mais geekette avant tout, je m'intéresse aussi bien à la dernière tablette innovante qu'aux réseaux sociaux, aux offres mobiles, aux périphériques gamers ou encore aux livres électroniques...

Lire d'autres articles

Journaliste mais geekette avant tout, je m'intéresse aussi bien à la dernière tablette innovante qu'aux réseaux sociaux, aux offres mobiles, aux périphériques gamers ou encore aux livres électroniques, sans oublier les gadgets et autres actualités insolites liées à l'univers du hi-tech. Et comme il n'y a pas que les z'Internets dans la vie, j'aime aussi les jeux vidéo, les comics, la littérature SF, les séries télé et les chats. Et les poneys, évidemment.

Lire d'autres articles
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ? Suivez-nous pour ne rien rater de l'actu tech !
google-news

A découvrir en vidéo

Rejoignez la communauté Clubic S'inscrire

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

S'inscrire

Commentaires

Haut de page

Sur le même sujet