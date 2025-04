MattS32

Mais justement, pour avoir moins de token, faut réduire les politesses…

Rajouter un merci à la fin de la conversation, c’est 2 tokens supplémentaires en entrée. Et faire une réponse derrière, si elle n’est pas réduite à sa plus simple expression, c’est des dizaines de tokens à générer. Et rajouter un « s’il te plait », c’est 5 tokens supplémentaires.

Y a pas de miracle, la seule solution pour réduire ces tokens, c’est d’éliminer ces parties.

Et il n’y a rien de gênant à ce que les conversations avec un LLM ne soient pas identiques à celles avec un humain. La finalité du LLM, c’est de répondre à une demande de l’utilisateur. Ce n’est pas un autre humain avec qui on sociabilise, c’est une machine. Il n’y a que si on lui demande explicitement de produire un dialogue le plus réaliste possible qu’il devrait ajouter les fioritures habituelles d’une conversation entre humains.

Tu ne dis pas merci à ta voiture à la fin d’un trajet, y a pas de raison de le dire à un ordinateur quand il a répondu à ta question.