Deezer développe une IA qui détecte le contenu audio "explicite", une première !

30 avril 2020 à 15h17
0
Parental_Advisory.jpg

La plateforme de streaming musical française utilise une IA maison pour identifier les termes injurieux des chansons.

Il y a quelques mois, Deezer dévoilait Spleeter, une technologie permettant d'isoler les pistes vocales et instrumentales d'un morceau, ce qui revenait à diviser un titre en deux, voire en cinq pistes distinctes. Saluée par le monde de la tech et de la musique, l'IA a été exploitée par la plateforme qui a indiqué, mercredi, être en train de développer un tout nouveau système d'analyse par mots-clés des morceaux de son immense catalogue.


Définir les contours de ce qu'est un contenu explicite

Alors qu'à ce jour, seuls les humains décident si une chanson doit être étiquetée comme explicite ou non, Deezer s'est demandée si un système informatique ne pouvait pas le faire automatiquement, en analysant la musique. Mais il s'agit d'une tâche complexe « qui nécessite une compréhension de haut niveau des attentes culturelles et implique beaucoup de subjectivité ».

Le système développé par Deezer fait ainsi appel à l'IA Spleeter de façon à détecter les mots et termes « explicites » des titres de la plateforme. Par « explicites », le service précise qu'il entend les termes injurieux et/ou non convenus. Deezer explique toutefois que pour le moment, il n'y a pas de consensus général autour de ce qui doit être considéré comme explicite ou non.

Selon les sources, les cultures et les contenus, la qualification d'un contenu explicite diffère. Généralement, les titres ou albums identifiés comme étant explicites contiennent la mention « Parental Advisory - Explicit lyrics ». Citant Wikipedia, Deezer note qu'« un langage fort (termes sexuels etc.), les représentations de la violence et le discours discriminatoire relèvent de ce qui ne doit pas être entendu par les enfants dans une chanson et doivent donc être marqués comme explicites ».


Un système basé sur le machine learning mais pas encore pleinement opérationnel

C'est la première fois qu'un service de streaming développe une telle fonctionnalité de détection des termes explicites basée sur l'audio uniquement. Le système se base sur du machine learning (de l'apprentissage automatique), utilisé pour détecter les mots-clés d'un dictionnaire cible, établi au préalable. Sa décision d'étiqueter une chanson comme explicite se base ensuite sur la présence ou l'absence des mots-clés.

Pour l'instant, la fonctionnalité n'est pas tout à fait au point, mais les premiers résultats sont jugés « prometteurs » en interne, et aucun des systèmes boostés à l'IA n'arrive aujourd'hui à la cheville des humains. « Il s'agit d'un fait important à prendre en compte, notamment lorsque l'on tient compte de la sensibilité de la tâche. À ce stade, il n'est pas réaliste d'automatiser complètement un processus de décision pour l'étiquetage de contenu explicite », note Manuel Moussallam, directeur de recherche et développement chez Deezer.

Deezer confirme ainsi que l'innovation ne sera pas directement intégrée dans l'application, mais servira à améliorer, à terme, la plateforme et ses services de recommandation.

Source : Deezer
Modifié le 30/04/2020 à 18h43
Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
0
0

Actualités du moment

Le Raspberry Pi 4 enfin pris en charge par RetroPie (dans sa nouvelle bêta)
Coronavirus : le paiement NFC sans contact a fait un bond de 40% selon Mastercard
Facebook : un usage en hausse mais une inquiétude sur les résultats à venir
Windows : un lanceur d'applications ressemblant à Spotlight (macOS) arrivera via PowerToys
Burnout Paradise Remastered sortira en juin sur Switch
Redmi Note 9, Note 9 Pro et Xiaomi Mi Note 10 Lite : tout savoir sur les nouveaux modèles annoncés aujourd'hui
Reddit lance un outil de chat pour ses subreddits
L'usage de Microsoft Teams bondit : 75 millions d'utilisateurs quotidiens
La manette Xbox One sans fil noir avec l'adaptateur à prix cassé
Elon Musk considère le confinement
Haut de page