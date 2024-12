L'adaptation de cette technologie au sein de TensorRT-LLM a nécessité des modifications substantielles de la part des équipes NVIDIA. Le framework a été enrichi de nouveaux opérateurs et fonctionnalités pour accommoder des modèles et des méthodes de décodage plus élaborés.

Cette avancée technique s'inscrit dans la stratégie d'Apple d'enrichir son écosystème d'IA, notamment avec un Siri nouvelle génération et ses fonctionnalités Apple Intelligence. Les développeurs exploitant des GPU NVIDIA bénéficieront d'une génération de texte plus véloce tout en optimisant leur empreinte énergétique.

Les évaluations menées sur des modèles de production massifs révèlent non seulement une accélération notable mais aussi une diminution significative de la consommation énergétique, un aspect crucial pour l'industrie.