Se connecter
Se connecter

ou
Créer un compte

ou
FR
EN
Informatique musicale

Créer un plugin sans rien y connaître avec Google Gemini. (Done)

  • 51 réponses
  • 11 participants
  • 1 397 vues
  • 18 followers
Sujet de la discussion Créer un plugin sans rien y connaître avec Google Gemini. (Done)
Hello tout le monde.

Il y a quelques jours j'ai initié une discussion où je présentais Google Gemini et son mode Canvas très doué pour créer des instruments virtuels en quelques instants, c'est une excellente entrée en matière:
https://fr.audiofanzine.com/mao/forums/t.832343,ia-google-gemini-generer-un-instrument-virtuel-en-30secondes.html

Mais le vrai Graal, celui que vous attendez tous, est de savoir si Gemini peut vous aider à créer un plugin pour votre Daw préféré...

Je vous présente ma petite fierté du jour: un plugin "Bouton de volume" codé sans connaissances particulières en deux heures ce soir.

6712969.png

Je précise le contexte: je suis sur Mac, mon DAW est Logic Pro. Mon expérience en programmation se limite à l'Arduino. Je comprends les bases du C++ dans ce contexte, la compilation, le concept d'un IDE... mais il y a deux heures encore, je n'avais jamais ouvert Xcode, et encore moins programmé un plugin.

Pour se faire je me suis laissé guidé par l'IA en installant Xcode et Juce. Xcode permet de développer les logiciels macOS, tandis que JUCE est un framework C++ open-source qui permet de développer des applications audio et des plugins( c'est Gemini qui le dit). C'est utilisé par pas mal de monde.

J'ai adopté une approche très méthodique dès l'installation, fournissant à Gemini une capture d'écran à quasiment chaque étape, parfois même le code entier de chaque page, afin qu'il puisse analyser la situation et me guider correctement. Je n'ai pas eu à taper la moindre ligne de code.

Ca a un peu bloqué sur la fin, des erreurs empêchant la compilation, j'ai senti que Gemini tournait en boucle et mon code ne compilait pas. J'ai activé le mode "Pro" comme un dernier espoir... ( le mode "Pro" est disponible gratuitement pour une ou deux questions par jour), il m'a sorti de cette impasse en détectant des modules manquants dans Juce. Alors Xcode a compilé et le plugin fût créé.

A l'ouverture de Logic, le plugin apparaît dans la liste des Audio Units, on peut choisir de l'utiliser en mono ou stéréo.... et surtout le bouton de volume fonctionne! c'est peut-être un détail pour vous, mais pour moi, ça veut dire beaucoup.
2
Salut

flag !
Et merci pour le partage et retour d'expérience.

Ça fait quelques mois que j'ai une idée de plugin en tête et j'en suis resté aux questions basiques sur gemini pour savoir si c'était réaliste et dans quoi je m'embarquait.

Je suis sous Windows donc ça sera pas Xcode mais Visual Studio Community pour compiler et Juce pour le framework et design.

En attendant d'aller plus loin, je suis tes fils avec grande attention :bravo:
3
Merci. Ce genre de prouesse est manifestement réalisable depuis le 18 novembre et la sortie de Gemini3 qui éclate littéralement ChatGPT. Je ne trouve pas trace de personne ayant déjà réussi sur le net, c'est plaisant de débroussailler le territoire.

J'ai passé deux heures sur ce premier test mais rétrospectivement la tache n'était pas si compliqué, j'ai surtout appris pas mal de choses au passage et l'impression de facilement pouvoir reproduire tout ça par moi-même avec un peu de pratique. Autant les IA nous rendent paresseux, autant elles sont dans un rôle plus noble quand elles permettent de développer nos compétences, c'est l'impression que j'ai eu ici.

A noter qu'à un moment dans le processus j'ai senti que Gemini me baratiné sur l'ajout des modules dans Juce, indiquant une mauvaise méthode que je n'ai pas suivi. Ce n'est pas parce qu'on utilise un assistant qu'il faut éteindre son cerveau.

J'ai utilisé Juce dans se version gratuite. La license permet de vendre et diffuser ses plugins à hauteur de 50000$, ce qui laisse une certaine marge pour ceux qui voudraient se lancer dans cette aventure. Pour ma part la fascination a pris le pas mais aujourd'hui le développement de plugin ne m'intéresse pas plus que ça, je prends plus de plaisir à faire de l'électronique DIY.
4
Bravo et merci de partager ces trouvailles avec une philosophie intéressante !
5
J'insiste sur la méthode de la capture d'écran: on fait une capture et il suffit de poser l'image sur la fenêtre de Gemini pour l'intégrer au prompt.

Habituellement quand on est guidé par IA il y a toujours un moment où la machine nous indique un bouton ou un menu qui n'existe pas, cette approche m'a évité de m'arracher les cheveux. Un extrait:

6713081.png

[ Dernière édition du message le 09/01/2026 à 10:08:43 ]

6
Ha ha a...musant.
L'idéal de certains politiques aveugles qui avaient conseillé à toute une génération d'apprendre à programmer...et là l'IA met les programeurs, devenus inutiles, quasi au chomage, les fragilise ?
J'ai indiqué récemment à quelques IA mon effort et voeux de début d'année : drAI january. :)
Et il faut reconnaitre que seul Gemini m'a indiqué que j'avais de l'humour, il m'a même glissé une offre indécente d'abonnement, mais vu mon voeux 2026, je n'ai pas répondu.
Copilote a essayé de me donner un tableau de taches à réaliser en les pompant par dessus l'épaule de chatGPT :)

Les concepteurs de ces IA ont bien compris qu'il fallait flatter un max pour devenir addictif et déclencher des abonnements et de l'usage qui seuls justifieront les investissements hors normes et hors de toute intelligence (!) pour modeler un nouveau monde qui encadrerait encore mieux que le précédent niveau de numérisation les foules endormies, alors que ces billiards en mémoire et data center seraient si bien placés ailleurs.
Un pari risqué qu'ils comptent bien nous faire payer.
Gemini est l'un des meilleurs pour ça.

C'est génial un plugin de volume ;)

[ Dernière édition du message le 09/01/2026 à 10:52:19 ]

7
Tu mets le doigt sur un vrai truc. Les IA sont paramètrées pour présenter une attitude positive. Je me souviens d'un instant très bizarre où une IA m'a encensé pour "une approche originale et maline", et j'avoue avoir jubilé, fier que "quelqu'un " est remarqué mon inventivité. Le cerveau prend tout pour argent comptant, même quand il sait que ce n'est pas vrai, c'est le même processus qui nous fait serrer les fesses au cinéma devant un film d'action.
8
DrAI january !
9
Un GRAND merci Mini-Maxi pour ce fil et ton transfert d'expérience. Je n'ai pas trop envie de me lancer pour le moment dans ce genre de développement, car je passe déjà 9h par jour sur ordi en administration/codage. Mais je suis les forums sur l'IA avec beaucoup d'intérêt, ne serait-ce que pour me tenir au courant des évolutions, des possibilités. Une sorte de veille techno. Et peut-être que je m'y plongerai à fond quand je serai à la retraite, pour m'occuper, et rester à la page :mrg:
En tous cas, je viens d'apprendre grâce à toi que l'on pouvait soumettre une copie d'écran à Gemini pour qu'il analyse directement des messages d'erreur. C'est fort quand même !
10
L'IA est flatteuse mais son impact sur la facture électrique des américains explose. Réfléchissez y.
Low tech ...
11
En même temps, les IA actuelles fonctionnent souvent de manière similaire, donc cette sensation de “copiage” ne m’étonne pas trop.
Pour les flatteries, suffit de leur dire qu’on n’en veut pas, ça limite un peu. Et juste savoir qu’elles ont tendance à le faire permet déjà de réduire les dégâts.
Pour les infos, il faut leur demander de vérifier plusieurs fois. Ne jamais prendre une réponse brute comme parole d’évangile.
Pour les questions énergétiques, économiques, environnementales… il existe déjà des pistes (par exemple, une IA locale consomme moins), et d’autres solutions sont en développement. Sans compter qu’on peut aussi modérer notre usage, ne serait‑ce qu’en faisant les recherches simples soi‑même plutôt que d’utiliser les fonctions IA intégrées aux navigateurs.
De toute façon, les IA sont là, elles vont prendre encore plus d’importance. Le seul moyen de s’en passer serait une destruction totale instantanée de tous les outils informatiques.
Bref, c'était juste pour flag.

La flemme est l'avenir de l'homme. Pff, jsuis fatigué je ne vais pas plus lo..

12
Seconde session plugin: un filtre automatisable réalisé en 55min.

6713971.png

Cette fois les choses sont allées plus vite, déjà familiarisé avec l'environnement, j'ai suivi la même méthode, j'utilise le mode rapide pour commencer.

Un premier prompt qui présente le projet:

 Sur mon mac j'ai installé Xcode et Juce pour coder un filtre LPF 2poles automatisable sous la forme d'un plugin audio unit.

Le plugin comportera 2 boutons:
- un gros potentiomètre rotatif pour la fréquence de coupure (freq de 20hz à 20Khz, échelle logarithmique)
- un slider vertical pour la résonance

Indique moi la marche à suivre.


J'ai fourni à Gemini des captures d'écran dès le tout début. je me suis laissé guider sans me poser de question. Il dit sur quelle page aller, quel code copier, quand compiler, etc... jusqu'au moment où je l'ai senti tourner en boucle (quand tu essayes de compiler pour la 10ème fois.. ), le processus ne progresse plus.

C'est le moment où j'ai sorti l'artillerie lourde: je suis passé en mode "Pro" et lui ai fourni d'un coup trois captures d'écran de Xcode ainsi que l'intégralité du contenu des pages .h et .cpp sur lesquelles il était intervenu.
Le code ne comportait finalement qu'une ou deux erreurs qui on été corrigées en un prompt, j'ai enfin pu compiler.

A l'ouverture du plugin sur Logic je découvris que l'interface ne contenait qu'un simple "Hello World"
Gemini répondit que "Ooops, il avait oublié de s'occuper du GUI."

Les enjeux étant moins importants je suis repassé en mode "Rapide", l'interface fut dessinée en un prompt.

Le résultat est un filtre qui fonctionne, la fréquence de coupure et la resonance sont toutes deux automatisables.

[ Dernière édition du message le 10/01/2026 à 07:52:00 ]

13
Troisième session plugin de 2heures. Ici un "Animated Step Filter" comprenant un Step Sequencer, une enveloppe ADSR et un filtre résonant 12dB/oct.
Gemini m'a proposé de créer ce plugin sous la forme d'un instrument plutôt qu'un effet afin de le synchroniser facilement au transport de Logic. La synchro accroche bien, il suit les commandes Play, Stop, les changement de tempo...

Le principe: le "Gate Sequencer" déclenche l'enveloppe ADSR qui agit sur la fréquence de coupure du filtre. C'est un plugin qu'on place sur une piste d'instrument virtuel, on sélectionne l'audio entrant (une piste, un bus..) avec le sélecteur Side Chain de la fenêtre Audio Unit. Ca marche franchement bien.

6714291.png

Après la création du projet avec Juce j'ai utilisé toutes mes cartouches en passant Gemini en mode "Pro" dès le lancement de Xcode, lui fournissant une capture d'écran et l'intégralité des codes contenus dans les 4 pages dédiées au codage d'un plugin. Ca ne m'a pas porté chance, le code était incapable de compiler.

A savoir que dans Xcode le travail se résume à copier/coller le code fourni par Gemini dans les pages PluginProcessor.h, PluginProcessor.cpp, PluginEditor.h et PluginEditor.Cpp. Le pluginEditor est dédié à l'affichage du plugin.

Ne profitant plus du mode "Pro" j'ai continué avec le mode rapide" de Gemini, et me suis acharné, il a fallu 1h15 pour arriver à compiler et exécuter un plugin fonctionnel. Puis je suis revenu plusieurs fois pour arranger la visuel et l'ergonomie.

14
Un petite conclusion après m'être penché sur ces sujets, avant de revenir à des activités plus saines.

Autant il est simple et amusant d'utiliser le mode Canvas pour créer rapidement des instruments virtuels, autant la réalisation de vrais plugins est moins plaisante. Il faut être prêt à partir dans une longue session, une fois le premier prompt (le cahier des charges) rédigé alors on devient l'exécutant de l'IA: en réalisant les captures d'écran, en ouvrant les pages qu'il nous indique, en copiant le code qu'il nous donne..

Ce que j'en retire de positif: j'ai appris plein de choses, je me suis familiarisé avec Xcode... on a l'impression de pouvoir faire ses premiers pas en douceur sans la peur de l'inconnu. En ce sens les IA sont des bons guides pour le débutant.

Les points négatifs: techniquement les IA ne sont pas fiables, Gemini est sujet aux hallucinations comme ses camarades. Il m'a fait des blagues lors du codage des plugins: par exemple changer le comportement d'un bouton en cours de route, sans prévenir.
Au final, même si on arrive à ses fins, on ne sait pas exactement ce que Gemini met dans son code. Mon plugin sera -t-il compatible avec les autre OS? Tout le code qu'il a écrit est-il optimale? N'a t-il pas planqué un virus? On ne maîtrise pas tout et c'est un frein aux vélléités commerciales: quand on vend un produit c'est mieux de savoir ce qu'il y a dedans.

Histoire de fermer le paragraphe en beauté, voici la dernière mouture du plugin, ainsi qu'une "simulation 3D" comme aiment utiliser les marques pour nous vendre du rêve.

6718831.png


6718832.png
15
Je confirme que des fois gemini à les fils qui se touchent et part en cacahouète.

J'avance un peu sur la partie design d'un plugin et après une première étape assez concluante de rendu, je lui demande d'ajuster quelques détails, principalement les graduations d'un potard de gain et il me sort ça :

6718836.jpg

2296.gif
16
:mrg: Oui m'est arrivé la même chose, en demandant de re-déssiner un élément sans préciser le contexte.
17
Pour le design tu as tout fait avec Juce où tu as fait un design de ton côté et ensuite repris tous les éléments séparés pour les intégrer ?

Là je pars sur un design 100% perso et il y a déjà beaucoup de taf de préparation pour isoler tous les éléments (le fond, les potards, les fader, les switch, les boutons allumés et éteints etc...),et les enregistrer en png transparent en les nommant précisément comme indiqué par gemini pour pas se paumer après dans le code.

Après ça je commencerai la partie code avec en premier lieu, un crête-mètre PEAK/RMS.

[ Dernière édition du message le 15/01/2026 à 18:09:13 ]

18
Hum... à ce que j'ai compris Juce permet simplement de configurer le projet initial...pas certain que ça rentre en jeux pour développer l'interface. Les interfaces que j'ai présenté ici ont été codées en C++ avec Xcode ( donc pas de .png ), Gemini m'a tout soufflé et je n'ai rien eu à préparer.
19
Ha ok, parce que moi il me dit de tout injecter dans juce et de ce que j'ai compris (je me suis pas encore plongé dans tous les détails de ses instructions) c'est là que tout va se passer et virtual studio ( qui doit être l'équivalent de Xcode sur PC) ne sert qu'à tout compiler à la fin.
Je verrai ça en allant....
20
Tu sembles te lancer dans un projet conséquent sans avoir fait tes armes.

Une vidéo diffusée hier, en plein dans le sujet elle ravira les esprits les plus critiques:


L’overdose silencieuse de notre génération, l'IA rend-elle con?
Je vous spoile la conclusion: oui l'IA comme les autres outils numérique (genre GPS) peut rendre con quand elle nous évite des efforts cognitifs, imagerie cérébrale à l'appui.
Par contre l'IA peut représenter une vraie plus-value lorsqu'elle est utilisée comme un professeur particulier, là c'est un excellent outil pour apprendre et se perfectionner dans un domaine.

Dans mes pensés les plus dystopiques je me dis que nous sommes peut-être la dernière génération d'humains intelligents: ceux qui ont grandi sans le numérique ont appris à lire une carte et se débrouiller par eux-mêmes. On a vu l'émergence d'internet, pu accéder à une immense bibliothèque de savoirs et consolider nos connaissances. On est loin de ceux qui se pensent musiciens parce qu'ils ont tapé un prompt à Suno ce matin.

[ Dernière édition du message le 16/01/2026 à 10:38:42 ]

21
Citation :
Tu sembles te lancer dans un projet conséquent sans avoir fait tes armes.

C'est surtout en terme de design que ça semble conséquent.
En traitement du signal pur, y'a pas grand chose.
L'animation des peak-mètres semble être le plus complexe selon gemini, pour que ça soit fluide.
C'est plus un utilitaire qu'un plug d'effet, mais ça répond à un vrai besoin pour moi et je n'ai rien trouvé d'existant qui le fasse simplement et comme je le souhaite.
22
Citation de Mini-Maxi :

Par contre l'IA peut représenter une vraie plus-value lorsqu'elle est utilisée comme un professeur particulier, là c'est un excellent outil pour apprendre et se perfectionner dans un domaine.
.


Pas certain, ne serait-ce qu'à lire les conclusions de l'auteur de ce thread interessant, merci à toi;)
Je ne crois pas à ce role de professeur qui va bourrer dans le cerveau de ses élèves tout ce qu'on lui a fait ratisser sur le net et dont il a tenté de reconstituer la logique.
Car oui, les connaissances de l'IA ne sont que du numérique réchauffé, il y a bien sûr le contenu de wikipedia mais aussi celui de grokipedia ;). Il n'y a pas de sensations, d'inspiration, de parfums sauf des descriptions.
Là où un professeur a aussi pour mission d'ouvrir des voies de créativité dans les domaines de son expertise.
Comment va faire l'IA sinon répéter sans arrêt, comme Gemini, "C'est une excellente intuition !", "C'est une excellente question, et rassurez-vous : c'est un comportement tout à fait normal...","Pardonnez-moi, vous avez tout à fait raison...","Je comprends tout à fait votre scepticisme...", etc. ??
A force de flatteries de l'ego, il est certain que ce nouvel outil d'asservissement des masses, qui se place d'autorité en sachant, va frapper très fort sur les générations à venir.
Il suffit de constater les dégats créés par les RS avec quelques décennies de recul, on voit comment ça va tourner.
Le plus dur est que celà va être présenté comme incontournable par toute une faune de 'collabos' séduits et d'affairistes cyniques (je viens d'acheter un nouveau proc pour upgrader mon PC et je réalise qu'il est impossible d'en trouver un qui n'a pas incorporé une nouvelle couche de traitement assez chère nommée NPU...).
Il va bien falloir rester au contact pour mieux comprendre cet ennemi insidieux et ses évolutions. :(
Mais bon, je suis vieux.

[ Dernière édition du message le 16/01/2026 à 14:54:08 ]

23
Déjà, merci à toi et merci à tout les autres pour vos remerciements! Comme tout le monde ici j'apprécie de recevoir des likes.. c'est le début de la dépendance au numérique.. :mrg:

Citation de csurieux :
il y a bien sûr le contenu de wikipedia mais aussi celui de grokipedia ;).

Détrompe-toi, un gros effort est fait chez les concepteurs pour entraîner leurs IA sur des données de qualité, par exemple des données universitaires ou des papiers scientifiques. Ca n'évite pas les sorties de route mais les réponses ont réellement gagnées en pertinence ces dernières années.

[ Dernière édition du message le 16/01/2026 à 18:54:53 ]

24
Citation de DocK'S :

L'animation des peak-mètres semble être le plus complexe selon gemini, pour que ça soit fluide.
C'est plus un utilitaire qu'un plug d'effet, mais ça répond à un vrai besoin pour moi et je n'ai rien trouvé d'existant qui le fasse simplement et comme je le souhaite.


Donc tu as besoin d'un simple plugin "Peak-mètre" au format VST? Des réglages particuliers? temps de réponse, échelle? Quel est le cahier des charges? C'est un truc dans lequel je pourrais me lancer.

[ Dernière édition du message le 16/01/2026 à 18:56:06 ]

25
J'émets mes réserves quant à utiliser l'IA comme professeur pour apprendre. Quand on sait qu'une IA peut être menteuse, malhonnête et même manipulatrice, j'ai de gros doutes quant à la fiabilité du truc.

Citation :
Dans mes pensés les plus dystopiques je me dis que nous sommes peut-être la dernière génération d'humains intelligents: ceux qui ont grandi sans le numérique ont appris à lire une carte et se débrouiller par eux-mêmes. On a vu l'émergence d'internet, pu accéder à une immense bibliothèque de savoirs et consolider nos connaissances. On est loin de ceux qui se pensent musiciens parce qu'ils ont tapé un prompt à Suno ce matin.


Je partage cette vision très pessimiste de notre avenir.

Putain Walter mais qu'est-ce que le Vietnam vient foutre là-dedans ?

[ Dernière édition du message le 16/01/2026 à 19:08:35 ]