Pour autant, il ne s'agit pour lui que d'« astuces ». Yann LeCun cherche de son côté depuis un certain temps à mener une approche plus globale, avec des modèles « basés sur le monde ». Soit des modèles disposant de capacités cognitives plus élevées que les IA génératives – avec pour objectif, de les rendre capable de produire des abstractions.

Cette manière d'envisager l'IA a déjà donné naissance en février dernier au modèle V-JEPA, un modèle IA qui n'est pas génératif, et qui apprend en trouvant quelle est la partie manquante ou cachée d'une vidéo. « L'idée de base est qu'il ne faut pas prédire au niveau du pixel. Vous entraînez un système à exécuter une représentation abstraite de la vidéo afin de pouvoir faire des prédictions dans cette représentation abstraite, et avec un peu de chance, cette représentation éliminera tous les détails qui ne peuvent pas être prédits » avait-il expliqué. Une meilleure voie ?