La start-up chinoise publie son modèle le plus massif en deux variantes, Pro et Flash. Le fait marquant n'est pas la taille, mais le silicium : 100 % Huawei, zéro NVIDIA.

OpenAI venait à peine de présenter GPT-5.5, mercredi 23 avril, que DeepSeek a dégainé le lendemain. La start-up de Hangzhou a mis en ligne DeepSeek-V4 Preview, un modèle open source décliné en deux versions distinctes : Pro et Flash. Le tout entraîné et déployé sur les puces Ascend de Huawei, sans recourir au moindre GPU NVIDIA.
Deux variantes, deux philosophies : le mastodonte et le couteau suisse
DeepSeek a fait le choix de scinder son V4 en deux configurations. La variante Pro embarque 1 600 milliards de paramètres au total. Grâce à l'architecture Mixture-of-Experts, seuls 49 milliards sont activés par requête. La variante Flash, plus compacte, affiche 284 milliards de paramètres dont 13 milliards actifs. Les deux partagent une fenêtre de contexte d'un million de jetons.

- Compréhension avancée du langage naturel
- Réponses adaptées à des contextes variés
- Disponible en plusieurs langues
Pro cible les tâches complexes et les capacités agentiques avancées. Flash vise l'inférence rapide et bon marché, un segment où DeepSeek avait déjà bousculé l'industrie avec ses versions précédentes. Les deux sont accessibles via le site DeepSeek, en mode « Instant » ou « Expert », ainsi que par API.
Le calendrier mérite un aparté. Ce V4 devait sortir en février, puis en mars. Une version intermédiaire, V4-Lite, avait brièvement fait surface le 9 mars. La raison de ces reports tient en un acronyme : CANN. Migrer l'intégralité du code d'entraînement depuis l'écosystème CUDA de NVIDIA vers le cadriciel maison de Huawei a pris des mois. Un chantier colossal, et la sortie du V4 confirme que le pari a fini par aboutir.
Un modèle frontier sur silicium chinois : le vrai signal derrière les specs
Le sujet central dépasse la course aux benchmarks. DeepSeek V4 est le premier modèle d'IA de classe frontier entraîné intégralement sur des puces chinoises. Jusqu'ici, même les laboratoires les plus avancés de Pékin dépendaient de GPU NVIDIA pour leurs modèles lourds.
DeepSeek a poussé la logique plus loin en refusant de transmettre son V4 à NVIDIA et AMD pour optimisation. Une pratique pourtant habituelle dans l'industrie. L'entreprise a préféré offrir cette fenêtre d'avance aux fabricants chinois. Hangzhou ne cherche plus à contourner les restrictions américaines sur l'export de puces : elle construit une filière parallèle.
Le timing ajoute une couche de lecture. Le mémo de la Maison-Blanche accusant la Chine de « pillage industriel par distillation » date du mercredi 23 avril. Vingt-quatre heures plus tard, DeepSeek publie un modèle open source qui retourne l'argument de la dépendance technologique. GPT-5.5, lancé la veille par OpenAI, n'aura eu que quelques heures de monopole médiatique.
Reste à confirmer que le V4 tient ses promesses sur le terrain (les premiers tests indépendants se font attendre). Mais qu'un modèle de cette envergure tourne sur du matériel Huawei pose une question que les contrôles à l'export n'avaient pas anticipée aussi vite.