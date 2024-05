Dans l'arsenal technologique de Google, les modèles Gemini 1.5 Flash et Pro tiennent désormais une place de choix et c'est sur ce dernier que se basent toutes les démos les plus impressionnantes de cette keynote. Présentée pour la première fois en début d'année, cette nouvelle itération de Gemini s'appuie sur une architecture MoE (Mixture of Experts) pour proposer des performances proches de ses concurrents en raisonnement, mais surtout une mémoire d'un million (!) de tokens, bien loin devant les 128k de GPT-4o et de Claude. Gemini 1.5 Flash, quant à lui, se présente comme une version quantisée de son grand frère, optimisée pour des tâches de faible latence et de haute fréquence.