Qui sont les acteurs de la numérisation ? (suite)
Google
Google a été un des premiers à se lancer dans la bataille de la numérisation. Ses premières déclarations remontent à 2003. Le projet Google nommé « Océan » se distingue par son ampleur et ses ambitions. Les annonces font ainsi état d'une volonté de numérisation de 14 millions d'ouvrages. Des accords ont été conclus avec des universités réputées comme Harvard, Stanford, celle du Michigan, d'Oxford et de New York. On peut être pris de vertige devant l'ampleur du projet annoncé, dont la réalisation est évaluée à quelques 300 ans ! Le projet Google est double et s'articule autour de deux entités : Google Print et Google Editor.
Google Print
Ce service s'adresse aux bibliothèques. Les bibliothèques confient à Google les livres qu'elles souhaitent voir numériser. Elles reçoivent en retour un double numérique de leurs ouvrages. Elles peuvent ensuite l'utiliser librement, à condition de ne pas en faire d'utilisation commerciale.
Google Editor
Ce service s'adresse aux éditeurs détenteurs d'un numéro ISBN. Elle les invite à signer un contrat, puis à envoyer leurs livres pour qu'ils soient scannés et mis en ligne. Le moteur de recherche donne ensuite accès à un résumé (4e de couverture, biographie de l'auteur ou introduction) et à une portion de l'ouvrage comprise entre 20 et 100 % du contenu, en fonction de la volonté de l'éditeur. La page de recherche affiche également un lien vers le site de l'éditeur, et Google prévoit une rémunération liée aux revenus publicitaires générés par la présence d'encarts publicitaires. Pour tous ces ouvrages, Google bloque les fonctions « imprimer », « couper », « copier » et « enregistrer » pour les pages consultées.
De nombreuses erreurs et abus (numérisation et mise en ligne d'ouvrages sans accord préalable des ayant droits) ont conduit ces derniers mois Google devant les tribunaux. À présent, les éditeurs ont la possibilité de faire retirer (pour les ouvrages déjà numérisés) ou d'exclure (pour ceux qui ne sont pas déjà) du programme les ouvrages de leur choix. Les clauses du contrat que les lie à Google Print ainsi que les questions les plus courantes peuvent être consultées depuis
cette page.
Même si Google se montre plutôt informatif concernant le cadre juridique de son programme, il reste malgré tout difficile de s'y retrouver ! La « machine Google Print » est complexe, et répond à un double objectif :
- Générer du trafic via le moteur de recherche en augmentant le nombre des pages disponibles.
- Générer des revenus grâces aux liens sponsorisés présents sur les pages de consultation des ouvrages. Ces revenus sont partagés avec les éditeurs, lorsque ceux-ci adhérent au programme Google Print. Mais il n'est pas évident d'aller plus loin dans le détail sur cette partie. Google ne divulgue pas la répartition exacte des gains, et les informations de type « rapport » (taux de clics et revenu total) communiquées aux éditeurs sont confidentielles.
Rappel chronologique
Le projet Google Print en version Bêta est officiellement ouvert.
Google Print marque une pause. Google se heurte à plusieurs groupes d'auteurs et d'éditeurs lui reprochant de violer la loi sur le droit d'auteur en numérisant les pages de certains de leurs ouvrages sans véritable autorisation préalable.
Google Print fait l'objet de poursuites judiciaires de la part de « L'Authors Guild » (association qui représente plus de 8 000 auteurs aux États-Unis). D'après Nick Taylor, responsable de l'Authors Guild, « Google Print est une véritable et robuste violation des droits d'auteurs. Ce n'est ni à Google, ni à d'autres personnes de décider si tel ou tel ouvrage peut être copié. Ce droit revient aux auteurs et aux possesseurs des droits d'auteurs ». Une seconde plainte sera déposée quelques temps plus tard devant le tribunal fédéral de Manhattan, et pour les mêmes raisons, par « l'Association of American Publishers » (AAA).
À l'occasion de la foire du livre de Francfort, Google annonce l'ouverture de son service en Europe. Il existe désormais huit versions pour chacun des pays suivants : Italie, Allemagne, Hollande, Autriche, Suisse, Belgique, Espagne et France.
La numérisation reprend après presque de trois mois de pause.
MSN / Microsoft
Le moteur de recherche de Microsoft se lance à son tour dans la bataille. Le 25 septembre dernier, la firme de Redmond a dévoilé son projet
MSN Book Search. Elle rejoint ainsi l'OCA (Open Content Alliance), dont fait déjà partie son rival
Yahoo, en apportant quelques 5 millions de dollars susceptibles de servir à la numérisation de 150 000 livres. La version Bêta de MSN Book Search est attendue pour début 2006. Elle donnera accès aux contenus tombés dans le domaine public, dans leur intégralité et gratuitement. Concernant les livres protégés par le droit d'auteur, Microsoft réfléchit à la façon de facturer leur consultation.
Le 4 novembre dernier, Microsoft a indiqué avoir conclu un accord direct avec la British Library pour numériser l'équivalent de 100 000 ouvrages. Cet accord permet à cette dernière d'accélérer son programme initié en juin, et qui prévoit la mise à disposition de nombreux contenus : CD-ROM, journaux, livres numérisés, etc. Microsoft envisage cet accord qui implique un investissement de 2,5 millions de dollars comme un investissement à long terme. Il compte d'une part sur un partenariat durable avec la British Library, tandis qu'il envisage d'autre part de proposer à d'autres entreprises, les technologies développées pour ce projet (numérisation, classement, gestion de contenu, etc.).
Open Content Alliance
L'Open Content Alliance (OCA) est une association à but non lucratif basée à San Francisco, mise en place à l'initiative d'institutions culturelles, d'industriels et d'organismes gouvernementaux. L'
OCA regroupe des bibliothèques, des archives et des maisons d'éditions autour d'un objectif commun : la construction d'une immense bibliothèque numérique à même de contrer le projet Google Print. Cette bibliothèque fournira un accès libre aux ouvrages numérisés et permettra d'effectuer des recherches sur l'ensemble des contenus, et de les télécharger gratuitement. Au commencement du projet, le contenu (constitué aussi bien de livres que de sons ou de vidéos), sera fourni par les universités de Californie et de Toronto, le National Archives du Royaume-Uni, l'éditeur O'Reilly Media et l'European Archive.
Adobe, HP et Yahoo prendront en charge l'aspect technique du projet et feront éventuellement des contributions financières.
Cette bibliothèque virtuelle contiendra des œuvres du domaine public mais aussi certaines soumises aux droits d'auteurs, numérisées avec l'accord des ayants-droit. Les 18 000 premiers ouvrages correspondant à la sélection de l'université de Californie devraient être mis en ligne vers la fin 2006. Ils seront hébergés par l'association
Internet Archive dont la vocation est constituer une bibliothèque de sites Internet. Les projets MSN et Yahoo! s'inscrivent dans le cadre de l'OCA.
Yahoo!
Le projet de Yahoo! s'inscrit dans le cadre défini par l'Open Content Alliance (OCA). Yahoo assure la réalisation du moteur de recherche du site de l'OCA. Le contenu de cette bibliothèque numérique sera par ailleurs accessible par le moteur de recherche Yahoo!