Google vient de lancer Gemma 4, sa quatrième génération de modèles d'IA ouverts, sous licence Apache 2.0. Quatre tailles disponibles, du smartphone au serveur, et pour la première fois dans l'histoire de la gamme, un accès vraiment libre, sans condition d'utilisation maison.

Depuis le lancement de la première génération Gemma en 2024, les développeurs ont téléchargé ces modèles plus de 400 millions de fois et généré plus de 100 000 variantes communautaires. Google n'était cependant pas allé jusqu'à proposer une vraie licence open source : les versions précédentes fonctionnaient sous des conditions d'utilisation propriétaires, avec la possibilité pour Google de révoquer l'accès d'un utilisateur à tout moment.
On n'est plus du tout dans le même discours avec Gemma 4, la grande cousine de Gemini. La licence Apache 2.0, standard dans l'industrie du logiciel libre, autorise désormais n'importe qui à télécharger, modifier, redistribuer et commercialiser le modèle, sans redevance ni clause cachée. Seule obligation : mentionner l'attribution.
Gemma 4, un modèle pensé pour tourner sans Internet
Gemma 4 fonctionne entièrement hors ligne, sur le matériel de l'utilisateur, sans envoyer la moindre donnée vers les serveurs de Google.
Gemma 4 se décline en quatre tailles : E2B, E4B, 26B MoE (Mixture of Experts) et 31B Dense. Les deux premières sont conçues pour les appareils mobiles et embarqués : smartphones Android, Raspberry Pi, NVIDIA Jetson ,avec une consommation mémoire volontairement réduite et selon l'annonce de Google, une latence quasi nulle.
Les deux plus grands modèles, eux, visent les stations de travail et les serveurs locaux. Le 31B Dense tient non quantifié sur un seul GPU NVIDIA H100 de 80 Go, et en version quantifiée sur des cartes grand public. Le 26B MoE n'active que 3,8 milliards de ses paramètres lors de l'inférence, ce qui lui confère une vitesse de génération bien supérieure à celle d'un modèle dense équivalent.
Sur le classement Arena AI, le 31B Dense pointe à la troisième place mondiale pour le traitement de texte, le 26B MoE à la sixième. Des positions inattendues pour des modèles de cette taille, face à des systèmes vingt fois plus lourds.
Côté fonctionnalités, Gemma 4 traite nativement vidéo, images, et pour les variantes E2B et E4B, l'audio en entrée. La fenêtre de contexte monte à 256 000 tokens pour les grands modèles, soit de quoi ingérer un référentiel de code entier en une seule requête. Le modèle gère plus de 140 langues et supporte nativement les appels de fonctions et la sortie JSON structurée, deux éléments indispensables aux pipelines d'agents autonomes.
La fin d'une licence qui bridait les entreprises
Ce changement débloque vraiment le potentiel commercial de Gemma. Jusqu'ici, les conditions d'utilisation Google interdisaient certains usages et permettaient une résiliation unilatérale. Ce type de clause suffit à faire fuir n'importe quelle entreprise qui envisageait d'intégrer un modèle d'IA pour ses produits critiques ou ses infrastructures sensibles.
Avec la bascule vers Apache 2.0, aucun risque que Google coupe l'accès rétroactivement. Clément Delangue, cofondateur et directeur général de Hugging Face, a d'ailleurs salué le geste de Google:
« La sortie de Gemma 4 sous licence Apache 2.0 est une étape majeure. Nous sommes ravis de soutenir la famille Gemma 4 sur Hugging Face dès le premier jour ».
Google entend par ailleurs répondre directement aux modèles chinois open weights. Moonshot AI, Alibaba et Z.AI ont sorti ces derniers mois des modèles ouverts qui rivalisent avec GPT-5 ou Claude.
Si vous avez envie de tester, Gemma 4 est accessible dès maintenant via Google AI Studio, Hugging Face, Kaggle ou Ollama.
Source : Mashable