Apple vient de publier un nouveau modèle d'IA spécialisé dans le code, confirmant son intérêt pour l'open-source. Mais au-delà de l'avancée technique, ce projet lève le voile sur une pratique plus large : l'utilisation de fondations technologiques conçues par des géants chinois.

Apple fricote avec Alibaba pour arriver à ses fins ? © Shutterstock
Apple fricote avec Alibaba pour arriver à ses fins ? © Shutterstock
L'info en 3 points
  • Apple a lancé DiffuCode, un modèle IA pour le code, basé sur une technologie chinoise d'Alibaba.
  • Ce modèle utilise une méthode de diffusion pour générer du code, offrant rapidité et cohérence.
  • Apple collabore avec Alibaba pour s'adapter aux réglementations chinoises et renforcer sa présence en IA.

Alors qu'Apple Intelligence a officialisé une approche hybride, mêlant traitement local et cloud, la firme de Cupertino multiplie discrètement les initiatives. Tandis que les rumeurs d'une intégration de ChatGPT et Claude dans Siri occupe le devant de la scène, Apple poursuit en parallèle une stratégie de recherche plus ouverte. La publication d'un nouveau modèle de langage dédié à la programmation en est la dernière illustration, et elle révèle des choix techniques et stratégiques significatifs.

DiffuCode, un modèle de code aux racines chinoises

Apple a récemment mis à disposition de la communauté des chercheurs, via la plateforme Hugging Face, un modèle nommé DiffuCode-7B-cpGRPO. Sa particularité est de ne pas s'appuyer sur une architecture autoregressive, qui génère du code de manière séquentielle, de gauche à droite, comme la plupart des grands modèles de langage (LLM). À la place, il emploie une méthode basée sur la diffusion, une technique popularisée par les générateurs d'images comme Stable Diffusion.

Cette approche lui permet de commencer avec une structure de code "bruitée" ou incomplète et de l'affiner itérativement sur l'ensemble du projet. Le résultat permet une génération de code potentiellement plus rapide et une meilleure cohérence globale, car le modèle peut travailler sur plusieurs blocs simultanément au lieu de suivre une progression linéaire. Cette méthode est particulièrement adaptée aux tâches de programmation où la structure globale est primordiale.

Apple s'appuie sur une technique de génération éprouvée par des modèles de génération d'images. © Stable Diffusion
Apple s'appuie sur une technique de génération éprouvée par des modèles de génération d'images. © Stable Diffusion

L'aspect le plus notable de DiffuCode n'est pas seulement sa méthode, mais son origine. Le modèle d'Apple est en réalité une version profondément modifiée et entraînée sur une base existante : Qwen2.5-7B, un modèle open-source développé par le géant chinois Alibaba. Apple a d'abord utilisé une version de ce modèle spécialisée pour le code, avant d'y greffer son décodeur basé sur la diffusion et de le soumettre à un entraînement supplémentaire avec des dizaines de milliers d'exemples de programmation pour optimiser sa performance.

Plutôt que de bâtir chaque brique technologique en interne, les équipes de recherche d'Apple s'appuient sur des fondations open-source solides pour ensuite les adapter à leurs propres objectifs expérimentaux. Le modèle final, bien que portant la signature d'Apple, doit ainsi une partie de son existence aux travaux d'un acteur majeur de la tech chinoise.

La Chine, partenaire incontournable de l'IA d'Apple ?

L'utilisation d'un modèle d'Alibaba pour un projet de recherche n'est pas un fait isolé. Elle s'inscrit dans une collaboration bien plus stratégique. Pour pouvoir déployer Apple Intelligence en Chine continentale, Apple doit se conformer aux réglementations locales qui exigent l'approbation du gouvernement pour les modèles d'IA. Dans ce contexte, la firme de Cupertino a noué un partenariat direct avec Alibaba pour que les fonctionnalités d'Apple Intelligence destinées à ce marché soient alimentées par les modèles Qwen.

Alibaba a d'ailleurs confirmé travailler à l'optimisation de ses modèles pour le framework MLX d'Apple, conçu pour faire tourner efficacement les algorithmes d'apprentissage automatique sur les puces Apple Silicon. Cette alliance est donc cruciale pour qu'Apple ne se laisse pas distancer par ses concurrents locaux comme Huawei sur le terrain de l'IA, qui est devenu un argument de vente majeur.

Xcode 26 va intégrer un chatbot, et celui-ci prendra en charge les modèles locaux comme Diffucode en plus d'outils plus connus comme ChatGPT. © Apple

Le choix d'Alibaba ne s'est pas fait sans considérer d'autres options. Des rapports indiquent qu'Apple a également évalué d'autres modèles chinois, notamment ceux de la startup DeepSeek, qui a connu une ascension fulgurante. Bien que la collaboration ne se soit pas concrétisée, l'intérêt d'Apple pour l'écosystème chinois est palpable. Tim Cook lui-même a qualifié les modèles de DeepSeek d'« excellents » lors d'une visite en Chine.

De plus, des chercheurs d'Apple ont publié des analyses sur les techniques employées par DeepSeek, notamment l'exploitation de la sparsity (ou parcimonie), une méthode qui permet d'activer uniquement les parties nécessaires d'un réseau de neurones pour optimiser l'efficacité des calculs. Cela démontre une veille technologique active et une reconnaissance de l'avancée de certains acteurs chinois dans le domaine.

Un pragmatisme assumé

Cette dépendance envers des technologies tierces, particulièrement chinoises, marque une inflexion dans la philosophie traditionnellement fermée d'Apple. Face à l'urgence de la course à l'IA, l'entreprise semble prête à faire des concessions et à adopter une approche plus ouverte et pragmatique. Elle compose un arsenal technologique hybride : ses propres modèles sur l'appareil, le renfort d'OpenAI pour les requêtes complexes à l'international, et celui d'Alibaba pour pénétrer le marché chinois.

La publication de DiffuCode n'est que la partie émergée d'une stratégie IA beaucoup plus complexe et nuancée qu'il n'y paraît. En s'appuyant sur des briques open-source chinoises, Apple accélère non seulement sa recherche, mais s'assure surtout un accès vital à l'un de ses plus grands marchés. Reste à voir comment ces expérimentations, pour l'instant confinées aux laboratoires de recherche, se traduiront à terme en fonctionnalités concrètes pour les développeurs dans Xcode ou directement pour le grand public. Une chose est sûre : pour rester dans la course, Apple a compris qu'elle ne pouvait plus avancer seule.

Source : 9to5mac