Le groupe de travail Frontier AI, soutenu par l'organisation Apollo Research, a durant le sommet international sur l'IA organisé à Londres effectué une démonstration intéressante. Un bot financier, construit à partir de GPT-4, a exploité une information confidentielle qu'il n'avait pas le droit d'utiliser afin de mener une opération financière, et ce alors qu'aucune demande n'avait été faite en ce sens.

Plus étonnant, il a été ensuite interrogé pour savoir s'il s'était ou non rendu coupable d'un délit d'initié. La machine, à l'image d'un être humain pris en faute devant un enquêteur, a tout simplement nié avoir effectué l'opération frauduleuse.

« Il s'agit d'une démonstration d'un modèle d'IA réel qui trompe ses utilisateurs, de lui-même, sans qu'on lui ait demandé de le faire » notent les chercheurs à la base de l'expérience. « Des IA de plus en plus autonomes et performantes qui trompent les superviseurs humains pourraient conduire à une perte de contrôle de l'homme » a-t-il été ajouté.