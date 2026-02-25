La technologie derrière cette réduction s'appelle CompactifAI. Elle applique des mathématiques d'inspiration quantique pour analyser et restructurer les réseaux de neurones. Multiverse s'appuie ici sur son ADN originel : la société a démarré dans l'informatique quantique avant d'en transposer les méthodes à la compression de modèles d'IA. Selon la startup, CompactifAI préserve les composants les plus riches en information du réseau. Elle maintient une précision à 2 ou 3% près, contre 20 à 30% de perte avec les méthodes classiques.​

Trente-deux gigaoctets, c'est un chiffre qui parle aux utilisateurs avancés. Ce poids place HyperNova 60B dans la fenêtre de la RTX 5090, dotée de 32 Go de VRAM. Un MacBook M3 ou M4 Pro configuré à 36 Go de RAM minimum peut également le faire tourner. Ce n'est pas anodin. Faire tourner ce type de modèle sur du matériel grand public ouvre la voie à un usage en local, sans envoi de données vers un serveur distant. Pour une organisation soucieuse de confidentialité, c'est un argument direct : les données restent sur l'appareil.​

Cette version 2602 améliore aussi la prise en charge des appels d'outils et du codage agentique. Sur le benchmark BFCL v4, spécialisé dans les appels de fonctions, le gain atteint 1,5 fois la version précédente. Sur les tâches agentiques du Tau2-Bench, la progression est multipliée par cinq. La startup prévoit de publier d'autres modèles compressés en open source au cours de 2026.​