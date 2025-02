MattS32

Dans un modèle open-weight, ce qui est ouvert c’est ce qui est nécessaire à l’utilisation du modèle, en particulier les données qui sont générées par le processus d’entrainement (qui sont des poids, d’où open-weight).

Dans un modèle vraiment open-source, on a aussi accès au code qui permet de faire l’entrainement.

Dans le premier cas, on n’a qu’un contrôle limité sur les biais éventuels du modèle. Par exemple, un modèle qui n’aurait été entraîné qu’avec des écrits d’avant 1960 il ne va pas du tout faire les même réponses que le même modèle entraîné exclusivement sur des écrits de 50 dernières années. On pourra partiellement effacer certains biais en faisant du renforcement, mais ça ne les effacera pas complètement, et surtout, il est difficile de faire du renforcement contre un biais qu’on n’a pas forcément identifié.

Dans le second cas, on peut, si on a les ressources nécessaires (parce que ça nécessite beaucoup de calcul, pour un LLM à plusieurs milliards de paramètres un bon entrainement c’est des mois de travail avec plusieurs milliers de GPU), choisir exactement les données d’apprentissage qu’on veut, ce qui donne un contrôle total sur le modèle.