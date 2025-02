Et pour réussir, DeepSeek a une recette qui lui est propre. D'abord, dans sa philosophie de recrutement. La société cherche en effet moins des ingénieurs expérimentés capables de développer des produits pouvant être commercialisés que des chercheurs extrêmement brillants sortant à peine des grandes universités du pays, comme Tsinghua ou l'université de Pékin. Et contrairement à ce qui se fait au sein des géants du numérique chinois, ces chercheurs ont toute latitude pour mener des recherches peu orthodoxes.

Enfin, les restrictions américaines sur les GPU imposées aux entreprises chinoises ont obligé DeepSeek à innover pour trouver des façons plus efficaces d'entraîner ses modèles de langage, avec moins de matériel de pointe. « Ils ont optimisé l'architecture de leurs modèles à l'aide d'une batterie d'astuces techniques : schémas de communication personnalisés entre les puces, réduction de la taille des champs pour économiser de la mémoire et utilisation innovante de l'approche "mix-of models" (mélange de modèles) » a ainsi résumé l'analyste chez Mercator Institute for China Studies, Wendy Chang.

Le fait de développer un modèle open source aide par ailleurs l'entreprise à attirer plus d'utilisateurs et de contributeurs, et en conséquence de rattraper une partie de son retard sur les rivaux occidentaux. Une méthode gagnante ?