Concepteur de logiciels très haut de gamme, l’Ircam vient de créer une structure de développement et de commercialisation d’outils issus de ses recherches, l’Ircam Lab. Première sortie, Ircam Lab TS, une application d’étirement/compression temporels et de transposition. Revue de détails.
Outil technique au cœur de la trousse à outils de base de nombreux sound designers musique ou cinéma, permettant toutes les interventions, de la transformation la plus extrême à l’ajustement à l’image près, le logiciel de time-stretch (compression/expansion temporelles, étirement/compression, bref tous les synonymes fonctionnent) est devenu depuis l’avènement de l’audionumérique quasi incontournable. Il est de plus assez souvent couplé avec un processus de transposition pouvant atteindre des valeurs assez élevées.
Bien sûr, on n’a pas attendu le numérique pour jouer avec la hauteur et la vitesse : nos grands expérimentateurs de la bande magnétique, qu’ils soient français ou d’outre-Rhin, ont ainsi pleinement profité des possibilités offertes par cette dernière, inventant du même coup de nombreux procédés toujours utilisés actuellement, la seule différence étant qu’on les met en œuvre d’un simple clic suivi d’un temps de calcul généralement extrêmement rapide.
L’une des grandes limites de la bande, en revanche, c’est l’impossibilité de ralentir ou accélérer de l’audio sans en modifier sa hauteur, ni de modifier sa hauteur sans le ralentir/accélérer (penser à l’effet Varispeed). Mais c’est aussi valable dans le monde de l’audionumérique, puisqu’on y est d’ailleurs toujours confronté lorsque l’on utilise la fonction basique d’un échantillonneur : après import d’un échantillon, lorsque l’on monte ou descend une gamme chromatique, la vitesse de lecture du sample est accélérée ou ralentie d’autant pour reproduire les différentes hauteurs. Il faut alors utiliser un outil qui garde la longueur constante si l’on monte ou descend la hauteur, ou qui garde la hauteur constante si l’on ralentit/accélère.
Les divers éditeurs qui se sont spécialisés dans ce type de traitement ont tous une solution plus ou moins personnelle pour la compression/expansion temporelle et le pitch-shift, par exemple le vocodeur de phase, le time domain harmonic scaling, l’interpolation par recoupement, la resynthèse granulaire, la resynthèse additive, les réseaux neuronaux, la transformée en ondelette discrète, le traitement indépendant ou automatique des formants, etc. Voir par exemple cette page Wikipedia (en anglais). Et le comparatif réalisé pour Audiofanzine il y a maintenant presque six ans jour pour jour (en tenir compte donc, notamment en ce qui concerne les nombreuses améliorations étant intervenues depuis).
|
L’un des maîtres du genre est l’Ircam, ayant créé comme base de son fameux Audiosculpt, le SuperVP (Super Vocodeur de Phase) qu’il définit comme : « une bibliothèque et un exécutable pour le traitement, la transformation et l’analyse des sons en temps différé et en temps réel. SuperVP est basé sur une implémentation du vocodeur de phase étendu utilisant en interne une représentation temps fréquence du son. SuperVP permet un ensemble important d’effets de transformation de sons avec une très haute qualité. Les transformations accessibles sont dilatation/compression temporelle avec et sans préservation des transitoires, transposition avec et sans préservation du timbre, filtrage, synthèse croisée, séparation et remixage des composantes transitoires, bruitées et sinusoïdales, traitements et réassemblages des composantes sources et filtres du son, débruitage, etc. »
Cherchant à rendre plus accessibles au public ses logiciels, l’Institut vient de créer une nouvelle structure de développement et de commercialisation d’outils issus de ses recherches, l’Ircam Lab. Premier produit, l’Ircam Lab TS, « TS » pour « Transpose/Stretching », bénéficiant donc des algorithmes et processus d’Audiosculpt. Test.
Introducing Ircam Lab TS
Installation on ne peut plus simple via glisser-déposer dans le dossier Applications depuis la fenêtre ouverte depuis le .dmg, l’autorisation l’est tout autant (via un numéro de série), et l’on est immédiatement à pied d’œuvre au sein de l’application (attention, TS n’est disponible que sur Mac, processeur Intel et OS 10.6 minimum, en version standalone, pas de plug-ins, mais ces derniers seraient-ils pertinents ?). Un petit tour via les Preferences afin de régler les entrées/sorties, le MIDI (on peut piloter l’application via son contrôleur préféré, voire plusieurs contrôleurs, avec affichage optionnel des messages MIDI entrants, mâtin…) et les types de format d’export (Wave, AIFF, de 16 à 32 bits).
Le logiciel est proposé à un prix d’introduction de 99 dollars, puis il passera à 200 dollars.
En action
L’interface est on ne peut plus simple : une grande fenêtre unique au centre de laquelle le fichier à traiter sera glissé (quelques rares occasions de plantage) ou chargé via les menus, voire enregistré depuis l’interface audio ou un routage interne (Soundflower, JackOS, etc.) et des commandes réparties dans le haut de la fenêtre. Une fois le fichier chargé, la visualisation offre deux modes (sonogramme et forme d’onde) et apparaissent en bas le choix de l’affichage de l’un et/ou l’autre canal, la proportion d’affichage entre spectrogramme et forme d’onde via un curseur, le choix de couleurs et un seuil d’affichage en fonction des dB (deux curseurs ajustables pour une fourchette variable entre –120 à 0 dB). On peut aussi choisir d’afficher une vue des données précises (note, note MIDI, canal, fréquence, volume, durée) et un analyseur de fréquences (avec visualisation linéaire ou en dB).
En haut, on dispose de fonctions classiques de transport, de différents réglages de gestion de l’audio (dont le Transient Preservation qui fait toute la différence), de l’analyse (dotée de très nombreuses options et très performante, notamment dans son retour utilisateur) et des fonctions habituelles de Transpose, ajustement des Formants (avec possibilité de lier les deux réglages) et de Stretch via deux curseurs, le taux habituel et un multiplicateur. Un Tape Mode est aussi disponible.
Afin de se rendre compte des possibilités du logiciel, nous avons repris les mêmes fichiers que ceux utilisés lors du comparatif déjà mentionné.
Voici les résultats (75, 90, 110, 133, 200 et 400 % en ne réglant que le paramètre Stretch, –12, –5, –2, +2, +5, +12 demi-tons).
Sur la basse, stretch.
Sur la batterie, stretch.
Sur les cordes, stretch.
Sur la voix, stretch.
Sur le mix complet, stretch.
Puis Pitch pour la basse.
Puis avec Formant lié à la transposition
Très intéressant aussi, en dehors des fonction de Time Stretch/Pitch Shift, le module permettant de séparer les composantes d’un signal : Transient pour les attaques, Sinus pour le contenu tonal et Noise pour les partiels inharmoniques (ces deux dernières pouvant être liées). Deux réglages, Relax et Error permettent d’affiner la reconnaissance/sélection. Disons-le tout de suite, c’est assez bluffant, et cela ouvre des possibilités assez incroyables de création de sons.
Prenons les Drums : grâce à un réglage approprié, on peut arriver à ce type de résultat.
Autre exemple, à partir d’une note de clavinet : on entendra d’abord l’original, puis les sons résultant de l’activation unique de chaque élément dans l’ordre, puis différentes variations couplées à des réductions de tempo (j’ai coupé la durée des derniers sons, qui dépassaient à deux une heure…).
Bilan
Il n’y a aura pas de suspense, les exemples le montrent : TS est une véritable tuerie, ce qui n’étonnera pas ceux qui auront déjà eu la chance de pratiquer Audiosculpt. Dans le domaine du time stretch/pitch shift, il existe bien sûr des concurrents (presque) à la hauteur, comme Time Factory de Prosoniq (pas le même prix, et majoritairement offline), ou Amazing Slow Downer (utilisant des algos de… l’Ircam). Le RX4 de iZotope offre aussi l’intégration du très bon Radius, leur propre algo, et un Desconstruct qui permet certaines séparations intéressantes du signal (on peut aussi dans un autre genre penser à son iRis). Mais le module de séparation des composantes de TS est vraiment, si ce n’est totalement unique, en tout cas d’une efficacité et d’une simplicité sans pareilles. Créer des sonorités inouïes (revenons à l’étymologie du terme…) se fera en un clin d’œil. Tout juste peut-on lui reprocher sa gestion des fichiers Wave et AIFF uniquement, même si l’on peut comprendre que TS ne gère pas les codecs destructifs (MP3, certains AAC, etc.) tant ces derniers abîment l’audio ; mais il devrait au moins pouvoir ouvrir les FLAC, ALAC et compagnie. Et il faudra faire attention à surveiller le volume de sortie après modifications, certains réglages pouvant faire saturer le fichier original.
Bref. Difficile de donner à l’Ircam Lab TS un Award Innovation (même si le logiciel est tout récent, les moteurs à l’œuvre sont plus anciens). En revanche, le Valeur Sûre lui va comme un gant. Le prix d’introduction est une occasion unique de foncer. Foncez !