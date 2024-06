Quand les géants américains de la tech ont voulu développer des modèles de langage, qui alimentent leurs IA, ils ont dû leur offrir des volumes de données extrêmement impressionnants. Leurs équivalents hexagonaux, tels que Mistral, suivent le même chemin, et cherchent toutes les données en français qu'ils peuvent récolter pour muscler leurs IA. Et dans ce domaine, on fait difficilement mieux que la BNF et l'INA !