La British Library commence l'archivage numérique du Web britannique

01 juin 2018 à 15h36
0
La bibliothèque nationale du Royaume-Uni vient d'annoncer le lancement de sa « récolte » de fichiers numériques britanniques, en vue d'enregistrer et d'indexer de nombreux contenus pour les préserver pour les générations futures. Une opération de très grande envergure.

00FA000005891704-photo-british-library.jpg
« Si vous voulez un aperçu de la vie aujourd'hui au Royaume-Uni, vous devez regarder sur le Web » explique au Telegraph Lucie Burgess, qui mène le projet développé par la British Library. L'objectif de l'organisme : enregistrer des milliards de pages Web, de magazines et de livres électroniques pour les stocker au même titre que les ouvrages traditionnels, en vue de les conserver en lieu sûr.

« Nous avons déjà perdu beaucoup d'éléments, notamment concernant les attentats de Londres du 7 juillet 2005, ou la crise financière de 2008 » estime Lucie Burgess, pour qui il ne faut pas attendre pour se lancer dans la démarche de sauvegarde. « Ce matériel est tombé dans un trou noir numérique, parce que nous n'avons pas été en mesure de le récupérer ». Une perte qui inclut également les réactions sur les réseaux sociaux.

La démarche, qui sera lancée samedi, concernera 4,8 millions de domaines britanniques, qui seront « aspirés » automatiquement. Un milliard de pages Web devraient être « moissonnées » par ce biais durant les trois prochains mois : il en faudra ensuite deux de plus pour que la British Library traite les données, et supprime notamment les contenus liés à des sites étrangers, ou encore d'archiver les tweets. La pratique est légale : le Royaume-Uni la prépare depuis 2003, année de la ratification du Legal Deposit Libraries Act, qui autorise l'archivage de données numériques au titre de la préservation.

Après cette première récolte, la bibliothèque nationale du Royaume-Uni effectuera des mises à jour régulières de ses bases de données. Le projet, en développement depuis deux ans, a déjà coûté 3 millions de livres sterling à l'organisme. « La préservation et le maintien d'une trace de tout ce qui a été publié constitue une ressource inestimable pour les chercheurs d'aujourd'hui et de demain » estime le ministre de la culture britannique Ed Vaizey. Les informations récoltées seront accessibles gratuitement pour les visiteurs de plusieurs bibliothèques partenaires à travers le Royaume-Uni : à noter que la BT n'a pas expliqué comment et où elle comptait stocker les données récoltées.
Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
0
0

Actualités du moment

Sosh rétablit l'Internet en option sur son forfait à 10 euros/mois
Infos US de la nuit : la Note 8 à Londres, du nouveau pour les forums, Amazon qui investit
Revue de Web : jouer à StarCraft II avec les yeux, c'est possible
Live Japon : des techniques
Mozilla présente un nouveau système de paiement pour le Web
Le stockage in-memory pourrait profiter de la baisse des prix
Guide voyages : Google cède la marque Frommer’s à son fondateur
Sonnet Echo 15 : station d'accueil Thunderbolt à graveur DVD et disque dur
BD numérique : Izneo contraint par Apple à supprimer 1500 titres de son application
Orange maintient le contrat avec The Phone House jusqu'en décembre 2014
Haut de page