🔴 French Days en direct 🔴 French Days en direct

Cette puissante IA en langue arabe et au potentiel exceptionnel

30 septembre 2023 à 09h30
21
© Ganesh.V / Wikimedia Commons
© Ganesh.V / Wikimedia Commons

Jais-Chat est un modèle de langage en arabe qui parvient à faire de l'ombre à certains gros poissons de l'industrie.

Vous avez forcément déjà entendu parler de ChatGPT, mais connaissez-vous son concurrent Jais-Chat ? Baptisée d'après le nom d'une montagne située aux Émirats arabes unis, cet agent conversationnel boosté à l'IA s'impose comme la référence du genre en langue arabe.

Meilleur que Llama 2 et Bloomz

Ce chatbot est l'œuvre de la société américaine Cerebras Systems, spécialisée en intelligence artificielle, en collaboration avec Inception, une filiale du groupe d'investissement G42 appartenant à Abu Dhabi.

Jais-Chat impressionne par ses performances très au-dessus de la moyenne. Son modèle de langage a réussi à battre ceux qui sont considérés comme des pointures du domaine dans différents tests, comme les questionnaires à choix multiples de l'Université de Californie à Berkeley et le HellaSwag de l'Institut Allen.

Jais-chat a notamment surpassé le modèle linguistique Llama 2 développé par Meta, populaire chez les développeurs, car open source contrairement au GPT-4 d'OpenAI dont les API sont payantes. Autre référence des modèles de langage open source, Bloomz a également dû s'incliner face à Jais-Chat.

© Cerebras
© Cerebras

13 milliards de paramètres

Pour arriver à ces résultats, Cerebras et Inception ont fait le choix de limiter Jais-Chat à deux langues : l'anglais et l'arabe. L'ensemble de données sur lequel il s'est entraîné est composé à 29 % d'arabe, 59 % d'anglais et 12 % de code.

Avec 13 milliards de paramètres, le modèle est loin des 175 milliards de GPT-3, mais parvient tout de même à tirer son épingle du jeu grâce à une base de données soigneusement sélectionnée et à la limitation à deux langues.

« Ce qui était intéressant, c'est que l'arabe améliorait aussi l'anglais », explique Andrew Feldman, co-fondateur et PDG de Cerebras, lors d'un entretien accordé à ZDNET. « Nous avons fini par obtenir un modèle aussi performant que Llama en anglais, bien que nous l'ayons entraîné sur environ un dixième des données », fait-il savoir.

L'anglais domine le Web, et donc les modèles de langage

Il est possible d'écrire les prompts dans Jais-Chat aussi bien en anglais qu'en arabe, et le chatbot peut répondre également dans ces deux langues. L'utilisateur peut par exemple écrire en anglais, mais préciser qu'il souhaite une réponse en arabe.

« Nous donnons à 400 millions d'arabophones une voix dans l'IA. C'est cela de démocratiser l'IA. C'est la langue principale de 25 pays », déclare Andrew Feldman, qui tacle ainsi gentiment les autres entreprises qui parlent de démocratiser l'IA, mais qui se copient toutes les unes les autres.

L'anglais est largement privilégié par les IA génératives. « Les plus grands ensembles de données reposent sur le scraping de l'Internet, et celui-ci est principalement en anglais », regrette Andrew Feldman. Une étude de Meta publiée en 2022 indiquait que 63,7 % des sites web sont en langue anglaise, alors que seuls 25,9 % des internautes la parlent.

Pour obtenir de meilleures performances dans les autres langues, les modèles de langage vont devoir changer de stratégie.

ChatGPT
  • Chat dans différentes langues, dont le français
  • Générer, traduire et obtenir un résumé de texte
  • Générer, optimiser et corriger du code

Créé par OpenAI, ChatGPT est un chatbot avancé propulsé par le modèle linguistique de dernière génération GPT-4. En exploitant des technologies d'apprentissage en profondeur et d'intelligence artificielle, ce chatbot a la capacité de déchiffrer et de comprendre les demandes des utilisateurs. Grâce à son habileté à générer du texte de manière ingénieuse, ChatGPT offre des réponses adaptées et pertinentes, garantissant une interaction de chat fluide et une expérience utilisateur optimisée.

Créé par OpenAI, ChatGPT est un chatbot avancé propulsé par le modèle linguistique de dernière génération GPT-4. En exploitant des technologies d'apprentissage en profondeur et d'intelligence artificielle, ce chatbot a la capacité de déchiffrer et de comprendre les demandes des utilisateurs. Grâce à son habileté à générer du texte de manière ingénieuse, ChatGPT offre des réponses adaptées et pertinentes, garantissant une interaction de chat fluide et une expérience utilisateur optimisée.

Source : ZDNet

Alexandre Schmid

Gamer et tech enthusiast, j’ai fait de mes passions mon métier. Diplômé d’un Master en RNG sur Hearthstone. Rigole aux blagues d’Alexa.

Lire d'autres articles

Gamer et tech enthusiast, j’ai fait de mes passions mon métier. Diplômé d’un Master en RNG sur Hearthstone. Rigole aux blagues d’Alexa.

Lire d'autres articles
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ? Suivez-nous pour ne rien rater de l'actu tech !
google-news

A découvrir en vidéo

Rejoignez la communauté Clubic S'inscrire

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

S'inscrire

Commentaires (21)

dredd
-Jai-Chat, peux-tu me citer les caractéristiques d’une démocratie ?<br /> «&nbsp;Ne voudriez-vous pas plutôt que je vous parle de football ?&nbsp;»
fg03
Je me demande pourquoi les étudiants se font chier à apprendre des langues vivantes.<br /> Bientôt on sera tous connecté à une interface IA-langagière pour se parler en temps réel et se comprends de plus en plus finement malgré les expressions idiomatiques.
gamez
tu peux poser cette question à plein d’autres pays dont les démocraties imparfaites.<br /> finalement les pays démocratiques à part entière ne représentent qu’une minorité dans le monde.
Werehog
Je trouve ça fascinant de voir l’impact des performances et de la « qualité » d’un apprentissage en l’imitant paradoxalement la quantité de choses qu’il traite. C’est très malin et une vraie leçon pour les sociétés technologiques qui partent toujours à la recherche du « toujours plus »
dredd
Ouais bon t’as des démocratie imparfaites et t’as les pays arabes. C’est le championnat des minimes de Saint-Fromage face à la Champion League à ce niveau. Ils sont pas seuls dans le carré de tête mais ça diminue en rien leur perf.
gamez
dredd:<br /> Ouais bon t’as des démocratie imparfaites et t’as les pays arabes.<br /> Même en réunissant les démocraties imparfaites et à part entière, les pays non-démocratiques représentent 57% des pays du monde, on est loin des seuls pays arabes.
Etre_Libre
Une démocratie est un magnifique système, éventuellement dirigé par des 49.3 ; afin que ça reste «&nbsp;officiellement&nbsp;» une démocratie.
tux.le.vrai
et à l’inverse, quelle est la part des démocraties parmis les pays arabes ? (ou plutôt musulmans)
tux.le.vrai
il se trouve que le gouvernement n’a pas de majorité absolue à l’assemblée.<br /> Avec un 49.3, le gouvernement prends le risque de se faire renverser à chaque vote.<br /> Personne n’a contesté la légitimité des élections en France.
dredd
Oui c’est bien. Sauf que je m’en fous vu que je commente un article sur les pays arabes. Quand on aura un article sur la Chine, la Russie, Israël et tous les autres, je te promet de tout faire pour placer une blagounette.
MattS32
tux.le.vrai:<br /> Avec un 49.3, le gouvernement prends le risque de se faire renverser à chaque vote.<br /> Personne n’a contesté la légitimité des élections en France.<br /> +1. Et j’aurais même tendance à dire que beaucoup de 49.3 arrangent les oppositions en faisant passer des lois auxquelles elles sont favorables mais ne l’assument pas pour des raisons électoralistes…<br /> Sinon, comment expliquer que face à un 49.3 les oppositions déposent parfois 3 ou 4 motions de censure «&nbsp;concurrentes&nbsp;» et ne votent que la leur (alors qu’il n’y a AUCUNE raison valable de ne pas voter une motion de censure déposée par un autre parti si on est d’accord avec le fait que le gouvernement a abusé de son pouvoir), ne laissant ainsi à aucune motion de censure de chance d’être votée…
Yorgmald
Le truc où tu as peur de poser une question sans subir une fatwa car un mot ne va pas convenir.<br /> Il y a un réf à une autre info du site.
gamez
dredd:<br /> Oui c’est bien. Sauf que je m’en fous vu que je commente un article sur les pays arabes<br /> bah non, c’est un article sur les capacités d’une IA
gothax
Sauf que tes propos sont à la limite du racisme et font abstractif à l’histoire mais bon surtout tu es hors sujet …<br /> Bravo à cette IA mais cela ne va pas me convaincre d’en utiliser
gamez
oui je connais les tournures du type 100% des gagnants du loto ont tenté leur chance… pour ne pas prendre en compte tous les joueurs <br /> mais dis moi, quel est le rapport avec l’article?
dredd
C’est vrai mais j’ose imaginer que plus d’arabes que de japonais vont l’utiliser donc blague toujours valide.
gamez
dredd:<br /> C’est vrai mais j’ose imaginer que plus d’arabes que de japonais vont l’utiliser donc blague toujours valide.<br /> c’est aussi que ça n’a aucun rapport avec l’article, je ne comprends pas quel cheminement fait que tu sortes cette blague à cet article en particulier, c’est bizarre quoi.<br /> la capacité de cette IA prend en compte les nuances d’une langue difficile, c’est cette capacité qui est mise en valeur.<br /> bref
dredd
Pardon ? Tu ne vois pas le rapport entre une IA en arabe et les pays arabe ? Tu ne vois pas le parallèle que je fais avec l’IA de Baidu qui détourne la conversation dès qu’on parle de Xi Jinping ? Tu penses que cette IA va être financée et vendue à des clients si elle ne respecte pas certaines «&nbsp;règles&nbsp;» ?<br /> Je sais pas qui est bizarre. Par contre je sais où tu voudrais m’emmener mais tu fais fausse route
Mr-Ragga
c est AUSSI BIDON QUE chat gpt ? qui refuse que tu supprime ton compte !!!
Mr-Ragga
Fabriqué par la Macronie
backsec
Ce qui m’interpelle surtout dans votre commentaire (et souvent de d’autres dans les sujets évoquant des pays dits «&nbsp;arabes&nbsp;»), c’est l’évocation des modèles démocratiques/sociaux qui y sont appliqués alors que le sujet de l’article porte simplement sur une technologie et surtout ses perf.
backsec
Non non c’est bien «&nbsp;pays arabes&nbsp;» (définit par le peuple majoritaire, la culture, l’histoire…), pas «&nbsp;pays musulmans&nbsp;». Même lorsqu’on parle de «&nbsp;religion d’État&nbsp;» dans certains pays, il ne s’agit que d’une confession majoritaire (même si imposée dans certains pays), inscrite dans la constitution.<br /> Autrement, ne prononcez plus le nom «&nbsp;Angleterre&nbsp;» mais plutôt «&nbsp;pays protestant&nbsp;».
dredd
Parce que moi ce qui m’intéresse c’est aussi les pays arabes et en fait je fais ce que je veux de mes commentaires.<br /> Encore une fois, vous vous plantez si vous pensez qu’il y a derrière mon message autre chose que ce qu’il est à savoiur une critique justifiée et raisonnée. Et que je prenne l’occasion d’une I.A. EN ARABE, pour le faire, ben pourquoi pas.
backsec
Je ne préjuge pas d’une opinion dégradante de ta part pour les peuples arabes, j’y ai plutôt vu un sarcasme sur le «&nbsp;contrôle&nbsp;» de ces peuples : une censure appliquée par un gouvernement sur l’IA en question.<br /> Ma remarque porte plutôt sur le fait que l’article décrit les capacités impressionnantes de cette IA faite par (notamment) par des arabes. Mais comme souvent lorsqu’on évoque un pays arabe, on rapporte les choses à certains aspects hors sujet qui ne plaisent pas dans leurs modèles sociaux selon les critères «&nbsp;occidentaux moralisateurs&nbsp;» (même si parfois objectivement à raison). Voire souvent même (ce qui n’est pas ton cas) à l’Islam, même si il n’a pas été évoqué le sujet de la religion, comme si un arabe ne pouvait être vu en tant que personne mais juste en tant que religieux.<br /> C’est en gros l’association systématique d’idées clichées qui paraît inadaptée, surtout que ce n’est pas le sujet de l’article. Les pays arabes, ce sont aussi des gens sans problèmes, des technologies, de la culture, etc. Et ici l’article parle d’une technologie et sa capacité. Après quant au sort qui lui sera consacré, on verra, peut-être en reparlerons-nous dans un futur article traitant d’une nouvelle actualité de cette IA (une IA censurée peut-elle encore être qualifiée d’IA dès lors que son apprentissage, sa vision et son expression sont limités ?).<br /> Il est déjà arrivé que sur Clubic soit évoqué un pays du moyen orient pour une histoire de censure sur internet de mémoire. Là on touche bien à un pays et à son modèle de société (imposé ou non), le tout associé à la technologie.
dredd
Oui, tout ce que tu dis est souvent très vrai. Mais parfois, la critique est justifiée et ne souffre pas de biais. Dans mon chef, quand je critique, c’est par amour, pas par mépris.<br /> Yahya alcha3b al3arabi !
tux.le.vrai
merci pour cette précision.
tux.le.vrai
et bien je répondais à ton affirmation<br /> «&nbsp;Même en réunissant les démocraties imparfaites et à part entière, les pays non-démocratiques représentent 57% des pays du monde, on est loin des seuls pays arabes.&nbsp;»<br /> par<br /> «&nbsp;et à l’inverse, quelle est la part des démocraties parmis les pays arabes ?&nbsp;»<br /> tu parlais plus non plus d’IA !<br /> et je prends en compte tous les joueurs.<br /> quelle est la part des démocraties parmis les pays arabes ?" je reprécise<br /> «&nbsp;quelle est la part des démocraties parmis TOUS les pays arabes ?&nbsp;»<br /> alors vu que tu critiques ma question plutôt que d’y répondre voici des réponses<br /> Le Point – 19 Aug 21<br /> Les pays arabes et la démocratie&nbsp;: une équation impossible&nbsp;?<br /> TRIBUNE. La question mérite d’être posée alors que depuis plus de 60&nbsp;ans qu’ils sont souverains, les pays arabes cherchent le chemin de la démocratie.<br /> ici, tu n’a plus qu’à vérifier sur la carte<br /> fr.wikipedia.org<br /> Indice de démocratie<br /> L'indice de démocratie (en anglais&nbsp;: Democracy Index) est une évaluation annuelle du niveau de la démocratie des États dans le monde, créée par le groupe de presse britannique The Economist Group. Cette étude publiée pour la première fois en 2006, analyse la situation de 165 pays et deux territoires, dont 166 États souverains et 164 membres de l'Organisation des Nations unies (ONU).<br /> Le calcul est fondé sur 60 critères regroupés en cinq catégories&nbsp;: le processus électoral et le pluralisme, les li...<br />
Voir tous les messages sur le forum
Haut de page

Sur le même sujet