Alibaba vient de dévoiler la Qwen Robot Suite, sa première suite de modèles d’IA destinée aux robots autonomes. Tongyi Lab, la division recherche du groupe, en a développé trois composants distincts, dont un modèle vidéo du monde physique sans concurrent à ce jour. La firme chinoise a lancé des tests auprès d’une sélection de clients entreprises d’Alibaba Cloud.

Le 16 juin, Tongyi Lab, la division recherche d’Alibaba, a publié la Qwen Robot Suite, sa première suite de modèles d’IA destinée aux robots physiques. Comme vous pouvez le voir dans la publication sur X.com ci-dessous, Tongyi Lab a découpé l’intelligence du robot en trois couches, chacune confiée à un modèle distinct. Pour la navigation, le laboratoire a développé Qwen-RobotNav, un modèle d’analyse spatiale et de calcul de déplacement. Tongyi Lab a conçu Qwen-RobotWorld pour prédire l’évolution d’une scène physique avant toute action mécanique. C’est le modèle vidéo du monde de la suite. Pour l’exécution physique, le laboratoire a développé Qwen-RobotManip sur l’architecture Qwen3.5-4B, un modèle destiné aux bras robotiques.
DAMO Academy, la division recherche de DAMO d’Alibaba, a publié RynnBrain en open source sur GitHub dès février. DAMO Academy l’a bâti sur Qwen3-VL pour doter les robots d'une perception spatiale ancrée dans le monde physique. Alibaba a lancé des tests auprès d'une sélection de clients entreprises d'Alibaba Cloud et c'est tout ce que l’on sait. Pas de nom, pas de méthodologie.
Tongyi Lab a entraîné Qwen-RobotManip sur 38 000 heures de données de manipulation
Parmi les trois modèles, Qwen-RobotManip a fait l’objet du jeu de données le plus volumineux. Tongyi Lab y a injecté plus de 38 000 heures de données d’entraînement, dont des captations en vue subjective et des jeux open source issus de robots réels. Sur le benchmark RoboChallenge Table30 v1, catégorie généraliste, Alibaba revendique la première place pour Qwen-RobotManip, avec un taux de réussite de 45 % et un score de processus de 59,83, soit 20 % au-dessus du deuxième.
DAMO Academy distribue RynnBrain en quatre variantes, dont deux versions denses à 2 et 8 milliards de paramètres, une version mixture-of-experts à 30 milliards, et des modèles spécialisés par usage : planification, navigation et raisonnement spatial. Dans une démonstration de DAMO Academy, un robot identifie un fruit et le dépose dans un panier.
Au sommet Alibaba Cloud de Hangzhou en mai, Liu Weiguang, vice-président senior d’Alibaba Cloud, a déclaré qu’Alibaba couvrait seule, en Chine, l’ensemble de la pile IA, des puces aux applications agentiques.
Alibaba a conçu Qwen3.7-Max pour des agents autonomes sur de longues durées
Pour la couche de raisonnement, Alibaba a retenu Qwen3.7-Max, que Tongyi Lab a lancé le 20 mai. Contrairement aux modèles Qwen open source antérieurs, Qwen3.7-Max ne circule qu’en accès API, au tarif de 2,50 dollars (2,24 euros) par million de tokens en entrée et 7,50 dollars (6,72 euros) par million de tokens en sortie, via Alibaba Cloud Model Studio. Tongyi Lab l’a conçu pour des tâches longues, en conditions de production.
Lors d’un test de stress interne sur une plateforme matérielle inédite, Qwen3.7-Max a tenu 35 heures sans interruption, avec 1 158 appels d’outils et 432 évaluations de noyaux. Au terme de ce cycle, la vitesse d’inférence du processeur Zhenwu M890, le dernier accélérateur IA d’Alibaba, avait progressé d'un facteur dix. Alibaba a produit ces chiffres en interne. Aucun organisme indépendant ne les a vérifiés à ce stade.
Sur le benchmark Apex Math (raisonnement mathématique), Alibaba revendique 44,5 points pour Qwen3.7-Max, contre 34,5 pour Claude Opus 4.6 Max et 38,3 pour DeepSeek V4-Pro Max. Par ailleurs, les développeurs peuvent l’intégrer à des environnements comme Claude Code ou Qwen Code via le protocole MCP, sans reconfiguration spécifique.
En janvier, des développeurs avaient téléchargé les modèles Qwen 700 millions de fois sur Hugging Face. Des tiers en avaient dérivé 180 000 versions dans 119 langues. Tongyi Lab a publié la suite complète en juin 2026.
Source : GNT