0
Après sa tribune remarquée dans LeMonde où il dénonçait la stratégie de Google, le directeur de la BNF a dévoilé son propre service de numérisation de la presse
Conservation des contenants ou des contenus ? Après sa tribune remarquée dans le quotidien LeMonde où il dénonçait la stratégie de Google d'indexation de millions de livres, le directeur de la Bibliothèque Nationale Française, Jean-Noël Jeanneney, a dévoilé son propre service de numérisation de la presse écrite.
En complément des 76 000 textes et 80 000 images numérisés dans Gallica, la bibliothèque numérique, la BNF a donc décidé de mettre en place un plan de 5 ans visant à numériser 27 des principaux titres de la presse française (Le Figaro, Le temps, La Croix, L'Humanité, etc..) depuis la Monarchie de juillet (mi XIXe siècle) jusqu'à la Libération soit un total de 2,1 millions de pages supplémentaires pour un budget total de 3,5 millions d'euros.
Pour des raisons tant légales qu'économiques et soucieuse de conserver la disposition graphique originale, la BNF a opté pour une numérisation de la presse sous forme d'images et non sous forme de textes bien qu'une recherche plein texte reste techniquement possible grâce au choix du format Acrobat d'Adobe. La publication "plein texte" semble envisagée mais ne devrait pas se faire avant quelques années.
Très vieille institution française créée sous le roi Francois Ier, la BNF devrait donc proposer aux internautes dès l'année prochaine des documents d'une grande valeur historique mais ne bouleversera certainement pas l'univers de la presse sur le Net. Entre l'absence des version numériques des livres ou des journaux (non réclamé lors du dépôt légal) et un projet d'archivage du web en attente de textes officiels, la BNF se limite pour le moment à être un "musée du livre" mais certainement pas la base de données numérique globale et francophone qui sera capable de rivaliser avec Google, MSN ou Yahoo...
Conservation des contenants ou des contenus ? Après sa tribune remarquée dans le quotidien LeMonde où il dénonçait la stratégie de Google d'indexation de millions de livres, le directeur de la Bibliothèque Nationale Française, Jean-Noël Jeanneney, a dévoilé son propre service de numérisation de la presse écrite.
En complément des 76 000 textes et 80 000 images numérisés dans Gallica, la bibliothèque numérique, la BNF a donc décidé de mettre en place un plan de 5 ans visant à numériser 27 des principaux titres de la presse française (Le Figaro, Le temps, La Croix, L'Humanité, etc..) depuis la Monarchie de juillet (mi XIXe siècle) jusqu'à la Libération soit un total de 2,1 millions de pages supplémentaires pour un budget total de 3,5 millions d'euros.
Pour des raisons tant légales qu'économiques et soucieuse de conserver la disposition graphique originale, la BNF a opté pour une numérisation de la presse sous forme d'images et non sous forme de textes bien qu'une recherche plein texte reste techniquement possible grâce au choix du format Acrobat d'Adobe. La publication "plein texte" semble envisagée mais ne devrait pas se faire avant quelques années.
Très vieille institution française créée sous le roi Francois Ier, la BNF devrait donc proposer aux internautes dès l'année prochaine des documents d'une grande valeur historique mais ne bouleversera certainement pas l'univers de la presse sur le Net. Entre l'absence des version numériques des livres ou des journaux (non réclamé lors du dépôt légal) et un projet d'archivage du web en attente de textes officiels, la BNF se limite pour le moment à être un "musée du livre" mais certainement pas la base de données numérique globale et francophone qui sera capable de rivaliser avec Google, MSN ou Yahoo...