Se connecter
Se connecter

ou
Créer un compte

ou
FR
EN
Informatique musicale

Créer un plugin sans rien y connaître avec Google Gemini. (Done)

  • 11 réponses
  • 7 participants
  • 267 vues
  • 13 followers
Sujet de la discussion Créer un plugin sans rien y connaître avec Google Gemini. (Done)
Hello tout le monde.

Il y a quelques jours j'ai initié une discussion où je présentais Google Gemini et son mode Canvas très doué pour créer des instruments virtuels en quelques instants, c'est une excellente entrée en matière:
https://fr.audiofanzine.com/mao/forums/t.832343,ia-google-gemini-generer-un-instrument-virtuel-en-30secondes.html

Mais le vrai Graal, celui que vous attendez tous, est de savoir si Gemini peut vous aider à créer un plugin pour votre Daw préféré...

Je vous présente ma petite fierté du jour: un plugin "Bouton de volume" codé sans connaissances particulières en deux heures ce soir.

6712969.png

Je précise le contexte: je suis sur Mac, mon DAW est Logic Pro. Mon expérience en programmation se limite à l'Arduino. Je comprends les bases du C++ dans ce contexte, la compilation, le concept d'un IDE... mais il y a deux heures encore, je n'avais jamais ouvert Xcode, et encore moins programmé un plugin.

Pour se faire je me suis laissé guidé par l'IA en installant Xcode et Juce. Xcode permet de développer les logiciels macOS, tandis que JUCE est un framework C++ open-source qui permet de développer des applications audio et des plugins( c'est Gemini qui le dit). C'est utilisé par pas mal de monde.

J'ai adopté une approche très méthodique dès l'installation, fournissant à Gemini une capture d'écran à quasiment chaque étape, parfois même le code entier de chaque page, afin qu'il puisse analyser la situation et me guider correctement. Je n'ai pas eu à taper la moindre ligne de code.

Ca a un peu bloqué sur la fin, des erreurs empêchant la compilation, j'ai senti que Gemini tournait en boucle et mon code ne compilait pas. J'ai activé le mode "Pro" comme un dernier espoir... ( le mode "Pro" est disponible gratuitement pour une ou deux questions par jour), il m'a sorti de cette impasse en détectant des modules manquants dans Juce. Alors Xcode a compilé et le plugin fût créé.

A l'ouverture de Logic, le plugin apparaît dans la liste des Audio Units, on peut choisir de l'utiliser en mono ou stéréo.... et surtout le bouton de volume fonctionne! c'est peut-être un détail pour vous, mais pour moi, ça veut dire beaucoup.
2
Salut

flag !
Et merci pour le partage et retour d'expérience.

Ça fait quelques mois que j'ai une idée de plugin en tête et j'en suis resté aux questions basiques sur gemini pour savoir si c'était réaliste et dans quoi je m'embarquait.

Je suis sous Windows donc ça sera pas Xcode mais Visual Studio Community pour compiler et Juce pour le framework et design.

En attendant d'aller plus loin, je suis tes fils avec grande attention :bravo:
3
Merci. Ce genre de prouesse est manifestement réalisable depuis le 18 novembre et la sortie de Gemini3 qui éclate littéralement ChatGPT. Je ne trouve pas trace de personne ayant déjà réussi sur le net, c'est plaisant de débroussailler le territoire.

J'ai passé deux heures sur ce premier test mais rétrospectivement la tache n'était pas si compliqué, j'ai surtout appris pas mal de choses au passage et l'impression de facilement pouvoir reproduire tout ça par moi-même avec un peu de pratique. Autant les IA nous rendent paresseux, autant elles sont dans un rôle plus noble quand elles permettent de développer nos compétences, c'est l'impression que j'ai eu ici.

A noter qu'à un moment dans le processus j'ai senti que Gemini me baratiné sur l'ajout des modules dans Juce, indiquant une mauvaise méthode que je n'ai pas suivi. Ce n'est pas parce qu'on utilise un assistant qu'il faut éteindre son cerveau.

J'ai utilisé Juce dans se version gratuite. La license permet de vendre et diffuser ses plugins à hauteur de 50000$, ce qui laisse une certaine marge pour ceux qui voudraient se lancer dans cette aventure. Pour ma part la fascination a pris le pas mais aujourd'hui le développement de plugin ne m'intéresse pas plus que ça, je prends plus de plaisir à faire de l'électronique DIY.
4
Bravo et merci de partager ces trouvailles avec une philosophie intéressante !
5
J'insiste sur la méthode de la capture d'écran: on fait une capture et il suffit de poser l'image sur la fenêtre de Gemini pour l'intégrer au prompt.

Habituellement quand on est guidé par IA il y a toujours un moment où la machine nous indique un bouton ou un menu qui n'existe pas, cette approche m'a évité de m'arracher les cheveux. Un extrait:

6713081.png

[ Dernière édition du message le 09/01/2026 à 10:08:43 ]

6
Ha ha a...musant.
L'idéal de certains politiques aveugles qui avaient conseillé à toute une génération d'apprendre à programmer...et là l'IA met les programeurs, devenus inutiles, quasi au chomage, les fragilise ?
J'ai indiqué récemment à quelques IA mon effort et voeux de début d'année : drAI january. :)
Et il faut reconnaitre que seul Gemini m'a indiqué que j'avais de l'humour, il m'a même glissé une offre indécente d'abonnement, mais vu mon voeux 2026, je n'ai pas répondu.
Copilote a essayé de me donner un tableau de taches à réaliser en les pompant par dessus l'épaule de chatGPT :)

Les concepteurs de ces IA ont bien compris qu'il fallait flatter un max pour devenir addictif et déclencher des abonnements et de l'usage qui seuls justifieront les investissements hors normes et hors de toute intelligence (!) pour modeler un nouveau monde qui encadrerait encore mieux que le précédent niveau de numérisation les foules endormies, alors que ces billiards en mémoire et data center seraient si bien placés ailleurs.
Un pari risqué qu'ils comptent bien nous faire payer.
Gemini est l'un des meilleurs pour ça.

C'est génial un plugin de volume ;)

[ Dernière édition du message le 09/01/2026 à 10:52:19 ]

7
Tu mets le doigt sur un vrai truc. Les IA sont paramètrées pour présenter une attitude positive. Je me souviens d'un instant très bizarre où une IA m'a encensé pour "une approche originale et maline", et j'avoue avoir jubilé, fier que "quelqu'un " est remarqué mon inventivité. Le cerveau prend tout pour argent comptant, même quand il sait que ce n'est pas vrai, c'est le même processus qui nous fait serrer les fesses au cinéma devant un film d'action.
8
DrAI january !
9
Un GRAND merci Mini-Maxi pour ce fil et ton transfert d'expérience. Je n'ai pas trop envie de me lancer pour le moment dans ce genre de développement, car je passe déjà 9h par jour sur ordi en administration/codage. Mais je suis les forums sur l'IA avec beaucoup d'intérêt, ne serait-ce que pour me tenir au courant des évolutions, des possibilités. Une sorte de veille techno. Et peut-être que je m'y plongerai à fond quand je serai à la retraite, pour m'occuper, et rester à la page :mrg:
En tous cas, je viens d'apprendre grâce à toi que l'on pouvait soumettre une copie d'écran à Gemini pour qu'il analyse directement des messages d'erreur. C'est fort quand même !
10
L'IA est flatteuse mais son impact sur la facture électrique des américains explose. Réfléchissez y.
Low tech ...
11
En même temps, les IA actuelles fonctionnent souvent de manière similaire, donc cette sensation de “copiage” ne m’étonne pas trop.
Pour les flatteries, suffit de leur dire qu’on n’en veut pas, ça limite un peu. Et juste savoir qu’elles ont tendance à le faire permet déjà de réduire les dégâts.
Pour les infos, il faut leur demander de vérifier plusieurs fois. Ne jamais prendre une réponse brute comme parole d’évangile.
Pour les questions énergétiques, économiques, environnementales… il existe déjà des pistes (par exemple, une IA locale consomme moins), et d’autres solutions sont en développement. Sans compter qu’on peut aussi modérer notre usage, ne serait‑ce qu’en faisant les recherches simples soi‑même plutôt que d’utiliser les fonctions IA intégrées aux navigateurs.
De toute façon, les IA sont là, elles vont prendre encore plus d’importance. Le seul moyen de s’en passer serait une destruction totale instantanée de tous les outils informatiques.
Bref, c'était juste pour flag.

La flemme est l'avenir de l'homme. Pff, jsuis fatigué je ne vais pas plus lo..

12
Seconde session plugin: un filtre automatisable réalisé en 55min.

6713971.png

Cette fois les choses sont allées plus vite, déjà familiarisé avec l'environnement, j'ai suivi la même méthode, j'utilise le mode rapide pour commencer.

Un premier prompt qui présente le projet:

 Sur mon mac j'ai installé Xcode et Juce pour coder un filtre LPF 2poles automatisable sous la forme d'un plugin audio unit.

Le plugin comportera 2 boutons:
- un gros potentiomètre rotatif pour la fréquence de coupure (freq de 20hz à 20Khz, échelle logarithmique)
- un slider vertical pour la résonance

Indique moi la marche à suivre.


J'ai fourni à Gemini des captures d'écran dès le tout début. je me suis laissé guider sans me poser de question. Il dit sur quelle page aller, quel code copier, quand compiler, etc... jusqu'au moment où je l'ai senti tourner en boucle (quand tu essayes de compiler pour la 10ème fois.. ), le processus ne progresse plus.

C'est le moment où j'ai sorti l'artillerie lourde: je suis passé en mode "Pro" et lui ai fourni d'un coup trois captures d'écran de Xcode ainsi que l'intégralité du contenu des pages .h et .cpp sur lesquelles il était intervenu.
Le code ne comportait finalement qu'une ou deux erreurs qui on été corrigées en un prompt, j'ai enfin pu compiler.

A l'ouverture du plugin sur Logic je découvris que l'interface ne contenait qu'un simple "Hello World"
Gemini répondit que "Ooops, il avait oublié de s'occuper du GUI."

Les enjeux étant moins important je suis repassé en mode "Rapide", l'interface fut dessinée en un prompt.

Le résultat est un filtre qui fonctionne, la fréquence de coupure et la resonance sont toutes deux automatisables.

[ Dernière édition du message le 10/01/2026 à 00:58:14 ]