Se connecter
Se connecter

ou
Créer un compte

ou
FR
EN

réactions à la news Un nouveau système de correction de pitch à base d'IA

  • 24 réponses
  • 17 participants
  • 2 089 vues
  • 21 followers
Sujet de la discussion Un nouveau système de correction de pitch à base d'IA
1096.jpg
Dénommé Diff Pitcher, ce nouveau programme de correction de pitch a été créé par des chercheurs de l'université Johns Hopkins.


Lire la news


Ce thread a été créé automatiquement suite à la publication d'une news pour ce produit. N'hésitez pas à poster vos commentaires ici !

Hushman

Suivez moi sur Instagram : @hushman_audiofanzine

2
3
Prometteur ! Les 2 exemples audio ici sont assez extrêmes, et donc le résultat manque forcément de naturel, mais c'est vraiment très prometteur. Et semble surpasser les concurrents. Impressive !

Caca In -> Caca Out

4
Ah, s'il y a bien un domaine où l'IA peut parfaitement prendre sa place c'est en effet celui-ci...
5
Oui, ça sent le sapin pour Autotune et Melodyne sur les usages correctifs.

__________________________________________________________________________________
Le GIEC chiffre à 3,3 milliards le nombre de victimes du réchauffement climatique. On en parle ?

 

6
A tester effectivement. Par contre, dans les exemples, la personne qui a effectué les corrections a du tout laisser en automatique avec les potards à fond. Y'a moyen de faire beaucoup mieux avec les outils actuels si on le fait en manuel. Après, cet outil devrait permettre de faire gagner beaucoup de temps.
7
Disons que c'est le problème de beaucoup d'outils basés sur de l'IA connectiviste : en général, on a pas trop de paramètres et ça bosse tout seul...

__________________________________________________________________________________
Le GIEC chiffre à 3,3 milliards le nombre de victimes du réchauffement climatique. On en parle ?

 

8
Rien en devrait empêcher que l'AI fasse le plus gros de la besogne et que l'interface nous propose des outils qui peuvent nous permettre de prendre la main pour affiner le résultat.
9
Pour le moment je ne vois pas en quoi c'est supérieur aux outils actuels. Hate de voir la suite.
10
Mais comment vont faire les rappeurs (et Cher?!!) qui, eux, ont BESOIN de l'effet autotune..! :surpris:

Plus serieusement,
la demo est quand meme bluffante par rapport au produit concurrent..
meme si on se dit que (peut-etre) ils n'ont surement pas fait beaucoup d'efforts de reglages/edition,
la correction via l'IA travaillera plus vite pour un niveau équivalent ou superieur.
Et c'est là le principal.
J'en vois qui s'inquietent du manque de controle que l'on aura avec les outils IA, mais c'est le principe! Une intelligence qui travaille à notre place pour faire plus vite, aussi bien, voire mieux
Et si cette promesse est tenue pourquoi vous voudriez encore des reglages supplementaires?
Ce sera de toute facon superieur à ce que vous faisiez avec les softs "usine à gaz"

Je vous l'accorde, du coup on perd la possibilité d'utiliser certains outils de maniere detournée et créative...
Et ca rejoint finalement ma petite boutade du debut :mrg:
(mais dans le cas d'Autotune..est-ce si grave finalement? ;) )
11
Alors pour concurrencer autotune pour un rappeur, sûrement, mais melodyne pour une chanteuse pop je n'y crois pas du tout... on aura toujours besoin de différents réglages pour chaque note pour un rendu plus naturel...
12
...sauf si l'intelligence(A) comprend ce que c'est "naturel" :clin:
13
On ne "perd" rien car tu peut avoir les deux, et utiliser chacun pour un rôle différent...

(-;  Be Funky  ;-)

Soundcloud

14
Ou j'ai raté quelque chose dans cette "démo" ou mon aversion naturelle pour l'emploi du terme d'intelligence artificielle à toutes les sauces me joue des tours et fausse mon oreille, mais je n'entends rien qui soit meilleur que ce que l'on peut faire avec Melodyne, ni même équivalent d'ailleurs…Cela me semble tout au plus être un axe de travail/recherche et il va falloir encore attendre un peu (ou longtemps) pour voir si c'est vraiment le début d'une nouvelle ère ou si c'est encore une nouvelle façon de surfer sur la vague marketing à deux balles de la soi-disante IA.
15
J'ai douté aussi, cela dit, on entend mieux la différence sur le dernier exemple, en fin de vidéo.

(-;  Be Funky  ;-)

Soundcloud

16
Ben outre l'IA, l'énorme progrès c'est surtout que visiblement, la techno est accessible en open source. Ça veut dire que, comme pour les algos de démixage qu'on voit fleurir un peu partout en ce moment, la correction de pitch va se généraliser autrement qu'en louant des algos à untel ou unetelle. Et le match contre un Melodyne peut se jouer là aussi, sur le terrain du prix.

Quant au fait qu'il n'y ait pas de réglage en première intention, imaginez ce que ça peut donner pour du grand public dans un GarageBand : soundainement, Jennifer ou Kevin chantent juste sans même avoir conscience qu'un algo y veille. Imaginez même ce que ça implique sur une machine à Karaoké si le truc pouvait fonctionner en temps réel...

__________________________________________________________________________________
Le GIEC chiffre à 3,3 milliards le nombre de victimes du réchauffement climatique. On en parle ?

 

17
Tout cela a-t-il même encore du sens dès le moment où Kevin peut faire générer from scratch un poste sur la plateforme à la mode du moment qui le montre en train de chanter juste ?
18
Citation :
sur une machine à Karaoké si le truc pouvait fonctionner en temps réel...

Ah mince, ça va tuer les canards des karaokés :mrg: :facepalm:

(-;  Be Funky  ;-)

Soundcloud

19
Vu le temps que je passe dans Melodyne, ça m'intéresse énormément si ce truc peut faire la même chose en 2 min.
J'ai récupéré le code ici
https://github.com/haidog-yaqub/DiffPitcher?tab=readme-ov-file
J'y comprends rien du tout.
C'est quoi le pytorch ? Dans quoi il faut implémenter le code ?
20
Citation de Hakim+K :
Vu le temps que je passe dans Melodyne, ça m'intéresse énormément si ce truc peut faire la même chose en 2 min.
J'ai récupéré le code ici
https://github.com/haidog-yaqub/DiffPitcher?tab=readme-ov-file
J'y comprends rien du tout.
C'est quoi le pytorch ? Dans quoi il faut implémenter le code ?
Ca semble être écrit en Python -> https://www.python.org/
Pytorch est une library fournissant des fonctionnalités de ML : https://pytorch.org/

[ Dernière édition du message le 02/02/2024 à 16:18:45 ]

21
Bluffant...
Reste à voir le processus maintenant, et la qualité du fichier de sortie... Avec Melodyne on fait du super boulot, mais c'est extrêmement chronophage... Si une IA peut mâcher ne serait-ce que le travail de dégrossissage, je prends... Tu passes ta piste dans Diff Pitcher, et si besoin tu passes au polish dans Melodyne...

Je suis curieux quant à la consommation CPU et autres petites exigences techniques...
22
Pour le karaoké, faudrait développer une IA qui chante juste à notre place :mrg:
23
Il y a de l'IA nous sommes sauvés : plus besoin de savoir chanter, plus besoin de connaitre la justesse, plus besoin de réfléchir. Restons donc dans notre canapé à découvrir le monde selon BFMTV en prennant du bide grace à un robot qui nous apporte de la bière.
24
Je ne vois pas le rapport entre réfléchir et savoir chanter ou connaître la justesse.

Ensuite, pour ce qui est de savoir chanter, cela ne se limite pas à chanter juste. Il y aura toujours une différence entre ceux qui savent chanter et les casseroles, mêmes si ces dernières seront rendues "justes", au moins sur les enregistrements. Le meilleur chanteur ou la meilleure chanteuse n'est pas celui ou celle qui chante le plus juste, mais celui ou celle qui sait véhiculer des émotions, des messages dans sa voix, interpréter et porter des paroles avec intention et humanité. ça, l'IA n'y changera rien.

Quand on écoute de la musique datant d'avant les correcteur de hauteur, on s'aperçoit qu'énormément de chanteurs et de chanteuses n'étaient pas parfaitement justes (parfois loin s'en fallait) et qu'ils ne faisaient pas de la mauvaise musique pour autant.
Aujourd'hui, notre oreille est habituée à des intonations quasi parfaites qui font qu'il devient plus dur de sortir une oeuvre phonographique dont les voix ne sont pas parfaitement ajustées.

Sinon, on peut faire la comparaison avec les instruments virtuels. Par exemple, moi qui ne puis plus faire de guitare, il m'arrive d'utiliser des guitares virtuelles dans certaines productions. On peut se dire que celles-ci permettent à n'importe qui de faire un enregistrement de guitare sans savoir jouer de la guitare. Pourtant, aucune de ces guitares virtuelle, aussi bonnes soient-elles, ne remplacera un bon guitariste avec son feeling, sa palette de jeu et son son personnel.

D'une façon générale, les machines de types grooveboxes et l'informatique musicale ont permis à des gens de faire de la musique sans avoir passé des milliers d'heures dans des conservatoires, écoles de musique ou à bosser leur instrument. Il n'empêche que seuls celles et ceux qui ont un vrai sens musical et travaillent sur la durée sortent des choses intéressantes.

C'est pas parce qu'il suffit que je fasse un chèque pour louer une voiture de rallye que je pourrais faire les temps d'un Sebastien Loeb.

Bon, je rejoins les constats sur la comparaison hasardeuse de la vidéo avec le "pitch correction" réglé avec les pieds pour bien souligner le contraste.
25
Comment fait-on pour utiliser Diff Pitcher ? On peut l'intégrer dans Cubase ? Comment ça marche svp ?