The Atlantic a publié un outil de recherche gratuit développé par le journaliste Alex Reisner, qui rend consultables quatre bases de données rassemblant plus de 21 millions de morceaux utilisés ou susceptibles d’avoir été utilisés pour entraîner des modèles de génération musicale par IA. Tout·e artiste ou producteur·rice peut y chercher son nom et savoir si ses enregistrements y figurent.
LAION-DISCO-12M et trois autres bases de données de l’outil
La plus grande base de données est LAION-DISCO-12M, publiée en novembre 2024 par LAION, une association allemande à but non lucratif. Elle recense environ 12 millions de morceaux issus de YouTube et ne contient que des liens vers des vidéos YouTube et leurs métadonnées, pas les fichiers audio. LAION précise que la base a été publiée à des fins de recherche académique et déconseille tout usage commercial. La deuxième base de données, Sleeping-DISCO-9M, regroupe environ 9 millions de morceaux issus de plateformes commerciales et est hébergée sur Hugging Face. Deux bases de données plus petites, d’environ 100 000 morceaux chacune, complètent l’ensemble, dont la Free Music Archive, publiée en 2017 à partir de contenus sous licences Creative Commons pour la recherche en traitement automatique de la musique, et une base extraite de Spotify. Google et Stability AI ont par ailleurs déjà confirmé avoir utilisé la Free Music Archive dans des travaux de recherche.
Contexte juridique et portée de l’outil de The Atlentic
La RIAA a déposé depuis juin 2024, au nom d’UMG, Sony Music Entertainment et Warner Music Group, au moins douze poursuites contre Suno et Udio pour violation massive de droits d’auteur. À noter également que la présence d’un nom dans les résultats ne constitue pas une preuve d’utilisation effective, tout comme l’absence de résultat ne garantit pas qu’une musique n’a pas figuré dans d’autres bases non référencées.
Consulter la base de donnée LAION-DISCO-12M, la base de données Sleeping-DISCO-9M, la base de données Free Music Archives, et la base de données issue d’une extraction Spotify
