Deezer développe une IA qui détecte le contenu audio "explicite", une première !

Parental_Advisory.jpg

La plateforme de streaming musical française utilise une IA maison pour identifier les termes injurieux des chansons.

Il y a quelques mois, Deezer dévoilait Spleeter, une technologie permettant d'isoler les pistes vocales et instrumentales d'un morceau, ce qui revenait à diviser un titre en deux, voire en cinq pistes distinctes. Saluée par le monde de la tech et de la musique, l'IA a été exploitée par la plateforme qui a indiqué, mercredi, être en train de développer un tout nouveau système d'analyse par mots-clés des morceaux de son immense catalogue.


Définir les contours de ce qu'est un contenu explicite

Alors qu'à ce jour, seuls les humains décident si une chanson doit être étiquetée comme explicite ou non, Deezer s'est demandée si un système informatique ne pouvait pas le faire automatiquement, en analysant la musique. Mais il s'agit d'une tâche complexe « qui nécessite une compréhension de haut niveau des attentes culturelles et implique beaucoup de subjectivité ».

Le système développé par Deezer fait ainsi appel à l'IA Spleeter de façon à détecter les mots et termes « explicites » des titres de la plateforme. Par « explicites », le service précise qu'il entend les termes injurieux et/ou non convenus. Deezer explique toutefois que pour le moment, il n'y a pas de consensus général autour de ce qui doit être considéré comme explicite ou non.

Selon les sources, les cultures et les contenus, la qualification d'un contenu explicite diffère. Généralement, les titres ou albums identifiés comme étant explicites contiennent la mention « Parental Advisory - Explicit lyrics ». Citant Wikipedia, Deezer note qu'« un langage fort (termes sexuels etc.), les représentations de la violence et le discours discriminatoire relèvent de ce qui ne doit pas être entendu par les enfants dans une chanson et doivent donc être marqués comme explicites ».


Un système basé sur le machine learning mais pas encore pleinement opérationnel

C'est la première fois qu'un service de streaming développe une telle fonctionnalité de détection des termes explicites basée sur l'audio uniquement. Le système se base sur du machine learning (de l'apprentissage automatique), utilisé pour détecter les mots-clés d'un dictionnaire cible, établi au préalable. Sa décision d'étiqueter une chanson comme explicite se base ensuite sur la présence ou l'absence des mots-clés.

Pour l'instant, la fonctionnalité n'est pas tout à fait au point, mais les premiers résultats sont jugés « prometteurs » en interne, et aucun des systèmes boostés à l'IA n'arrive aujourd'hui à la cheville des humains. « Il s'agit d'un fait important à prendre en compte, notamment lorsque l'on tient compte de la sensibilité de la tâche. À ce stade, il n'est pas réaliste d'automatiser complètement un processus de décision pour l'étiquetage de contenu explicite », note Manuel Moussallam, directeur de recherche et développement chez Deezer.

Deezer confirme ainsi que l'innovation ne sera pas directement intégrée dans l'application, mais servira à améliorer, à terme, la plateforme et ses services de recommandation.

Source : Deezer
Modifié le 30/04/2020 à 18h43
Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
0
0

Actualités récentes

Belle affaire pCloud pour famille : 2 To de stockage cloud à prix cassé
Marvel Cinematic Universe : le guide complet pour regarder (ou non) les films et séries du MCU dans le bon ordre
E3 2021 : des stands virtuels et d'autres animations dématérialisées au programme
Un revenu universel en crypto-monnaie : douce utopie ou vraie bonne idée ?
PS5 : Sony travaille en ce moment sur plus de 25 exclusivités
Test Sony Bravia XR-55X90J : une alternative intéressante aux téléviseurs OLED ?
FLoC : Brave, DuckDuckGo, GitHub, WordPress… Pourquoi une telle levée de boucliers contre Google ?
PS5 : Sony dévoile deux nouveaux coloris pour la manette DualSense
Cent ans après : la carte de crédit, produit d'une utopie
Test ASRock B560M Steel Legend : parce que le Z590 n'est pas forcément indispensable
Haut de page