Cette application, et toutes les autres du même genre, ne seront-elles pas bientôt ringardisées par des outils d'IA de resynthèse de voix réelles clonées ? Pouvoir faire chanter de vrais textes, et pas juste des phonèmes sans signification, sur une voix plus humaine que ces synthèses robotiques ? Je pense d'ailleurs que l'intérêt ne serait pas de cloner parfaitement des voix connues, et encore moins de personnes vivantes, surtout avec les problématiques de droits, mais d'avoir des voix "dans le style de".
Une recherche de 2s et le premier lien me retourne cet exemple pour du texte parlé.
Autre exemple :