Le géant chinois de l'IA DeepSeek n'a pas encore sorti son nouveau modèle de langage R2. Et ce serait à cause de Huawei.
DeepSeek s'est fait un nom dans le monde de l'intelligence artificielle en janvier dernier en lançant son puissant modèle R1. Depuis, la start-up chinoise a moins fait parler d'elle, alors que l'on attendait la suite R2 pour le printemps dernier, ce qui n'a finalement pas eu lieu. Et cette non-sortie aurait en fait une raison bien précise.
DeepSeek enregistre du retard en essayant d'utiliser les puces de Huawei
L'écosystème tech chinois est encore loin d'être au point. C'est ce que nous montre cette nouvelle information du Financial Times, qui affirme avoir obtenu de plusieurs sources la raison pour laquelle DeepSeek est en retard dans le lancement de son modèle d'IA R2.
D'après le média anglophone, ce serait dû au choix fait initialement (et poussé par les autorités chinoises) d'entraîner R2 en utilisant des processeurs Huawei Ascend, à la place de leurs équivalents habituels produits par NVIDIA. Un choix qui aurait généré des problèmes techniques persistants, et donc, un retard dans le lancement.
NVIDIA reste pour le moment indispensable
Depuis, toujours selon la même source, DeepSeek a fait le choix de revenir aux puces NVIDIA pour l'entraînement de son modèle, alors qu'il utilise dorénavant les puces de Huawei pour l'inférence. Par ailleurs, un étiquetage des données plus long qu'attendu aurait aussi entraîné du retard. R2 devrait finalement sortir dans les semaines à venir.
Cette information est d'autant plus intéressante qu'elle arrive au moment où l'on apprend que le gouvernement chinois pousse pour que ses entreprises tech évitent le plus possible d'utiliser les puces H20 de NVIDIA dans leurs activités. Mais s'il s'agit certainement d'une question de sécurité nationale pour Pékin, les problèmes enregistrés par DeepSeek tendent eux à montrer que, pour le moment, la seconde économie mondiale n'a pas encore d'alternative viable à NVIDIA.
