MattS32

Mixer plusieurs langues avec les LLM, c’est pas franchement un exploit, la plupart le font très bien.

D’ailleurs c’est même une technique d’attaque pour tenter de contourner les filtres d’entrée des LLM accessibles au public : le filtre d’entrée est souvent un modèle bien plus basique, voire pas une IA du tout (du genre juste une black list de mots…), et en mixant des syllabes du même mots dans différentes langues on peut parvenir à faire quelque chose qui aura le même effet que le mot d’origine pour le LLM, mais passera à travers le filtre.

Par exemple, si le filtre interdit le mot « journal » (et donc, « Zeitung » en allemand), on peut éventuellement arriver à le contourner avec « Jourtung », que le LLM interprétera comme sémantiquement très proche de « journal » et « Zeitung ».