Faisant figures d'OVNI à l'époque des premières versions d'AltiVerb, les processeurs à convolution sont aujourd'hui mis à toutes les sauces. Qu'est ce que la convolution ? A quoi ça sert ? Comment ça marche et quelles sont ses limites ? Ce sont là autant de questions auxquelles ce dossier entend répondre.
|
Introduction
Acoustic Mirror, Altiverb, Rayverb, Pristine Space, IR-1 v2 / IR-360, Q-Clone, SIR, Convo Boy, Wizooverb W5… On ne compte plus le nombre de processeurs à convolution sortis depuis quelques années. Désormais, les vénérables institutions que sont Logic, Sound Forge, Audition ou encore Samplitude, sont d’ailleurs elles-mêmes livrées, en standard, avec de tels plug-ins.
Une mode marketing ? Pas si l’on en croit les utilisateurs, ingés sons en tête, qui, en dépit du matériel auquel ils ont accès, s’émerveillent devant la qualité obtenue par les réverbs à convolution, entre autres…
Bref, le mot est sur toutes les lèvres, les plug-ins sur tous les disques durs, au point qu’on en oublierait presque la question qui taraude le débutant qui débarque : « Au fait, ça sert à quoi un processeur à convolution ? ».
La convolution : pour quoi faire ?
Disons pour faire simple qu’un processeur à convolution permet de reproduire un traitement acoustique en se basant sur une sorte d’empreinte témoin. Exemple concret : vous voudriez savoir comment sonnerait votre symphonie pour pipeau des Alpes si elle était jouée dans la basilique Saint-Pierre de Rome. Deux solutions s’offrent à vous : la première consiste à prendre l’avion jusqu’en Italie et convaincre les hautes autorités du Vatican de vous laisser faire vos prises de son : c’est pas gagné…
Deuxième solution : enregistrer ou télécharger une 'impulsion’ (sorte d’empreinte acoustique) de ladite basilique qui vous permettra, via un processeur à convolution, de faire sonner vos pistes audio comme si vous aviez posé un couple de micros sur l’autel. Le tout, sans bouger de chez vous, avec une qualité audio optimale et sans avoir à vous signer chaque fois que vous passez devant le Fils de l’Homme. Plutôt intéressant, non ?
Or, cette technologie ne se limite pas à la recréation de réverbérations : on peut tout à fait l’utiliser pour reproduire la 'signature acoustique’ d’un ampli, d’un micro, d’un égaliseur ou pour s’aventurer dans le sound design le plus barré. Bref, c’est un monde de possibilités qui s’ouvre à l’utilisateur, le tout pour un investissement relativement modeste, si l’on considère qu’on trouve des processeurs à convolutions à tous les prix (du gratuit au pas trop cher) et que nombre d’impulsions sont disponibles en toute gratuité sur le net…
Les choses étant claires pour les béotiens, il convient maintenant de se pencher plus en détail sur la technologie en elle-même, sur ses principes, enjeux et ses applications concrètes, tous ces aspects pour lesquels je laisse la parole à l’ami Wolfen…
Los Teignos
Théorie mathématique
Pour commencer ce dossier, nous allons nous pencher un petit peu sur la théorie mathématique qui se cache derrière ce terme barbare de convolution… Et si ça ne vous intéresse pas, ou que vous êtes allergiques aux maths, je vous conseille de passer directement au chapitre suivant qui sera beaucoup plus concret !
L’opération de convolution directe
La convolution est une opération qui consiste à faire une sorte de multiplication de deux signaux x(t) et h(t) au moyen d’une intégrale dans le domaine analogique :
Cette opération s’écrit de façon plus explicite et plus facile à calculer dans le domaine numérique, qui est celui qui nous intéresse, où un signal n’est plus défini à n’importe quel instant t mais sur une division de la seconde en échantillons k, dont le nombre est égal à la fréquence d’échantillonnage (par exemple, en 44.1 KHz, il y a 44 100 échantillons par seconde, et donc 44 100 valeurs d’amplitude) :
Le signal x(t) représente le signal d’entrée ou signal à traiter, y(t) le signal de sortie traité, et h(t) est la réponse impulsionnelle du système. On l’obtient en envoyant comme signal d’entrée x(t) une impulsion de Dirac, c’est à dire un signal d’amplitude infinie et de durée nulle. Une propriété importante de ce signal est que sa réponse fréquentielle, obtenue avec une Transformation de Fourier, est composée de toutes les fréquences à une amplitude identique…
Il va de soit qu’un tel signal n’existe pas dans la réalité, on peut juste s’en rapprocher en utilisant un son très bref et très violent comme un coup de feu, ou un signal numérique avec une valeur non nulle sur le premier échantillon et zéro partout ailleurs…
Toutefois, l’application directe de cette formule nécessite un grand nombre de calculs puisque pour chaque échantillon, il faut calculer autant de produits que d’échantillons dans le plus court des deux signaux… Donc si on convolue un signal de 20 secondes et un autre de 5 secondes, le tout en 44.1 KHz, on doit calculer au maximum 5 × 44 100 soit 220 050 produits, avant de les sommer… Ce qui équivaut à 5 × 44 100 × 44 100 soit 9 724 050 000 produits par seconde en plus des sommes ! Et encore, on ne considère qu’un seul canal… Heureusement, le produit de convolution possède une propriété intéressante qui va beaucoup accélérer les calculs !
Utilisation de la FFT (Fast Fourier Transform)
En effet, le produit de convolution peut se traduire par une simple multiplication entre les Transformées de Fourier dites Discrètes (dans le domaine numérique) de nos signaux, pour le calcul d’un échantillon donné…
Et la Transformée de Fourier Discrète, ou plutôt sa déclinaison Transformée de Fourier Rapide FFT (Fast Fourier Transform), qui est une opération pas mal utilisée en numérique, est beaucoup moins gourmande en temps de calcul que le calcul brutal des coefficients de la convolution… On remplace donc le calcul direct de la convolution par celui d’une FFT, d’un produit, et d’une FFT inverse.
Pour rappel, la Transformée de Fourier est une opération qui convertit un signal représenté de façon classique (amplitude par rapport au temps) en un signal représenté en amplitude par rapport à la fréquence. Elle est basée sur le théorème de Fourier indiquant que tout signal périodique peut être modélisé par une somme de sinusoïdes de fréquences différentes, et permet de calculer les fameuses représentations spectrales de n’importe quel signal.
Performances et latence avec la FFT
La FFT est quand même une opération complexe à effectuer d’un point de vue algorithmique, et peut être menée de différentes façons, chacune apportant ses propres optimisations sur la précision ou sur le temps de calcul. Ces détails ne seront bien sûr pas détaillés ici, et si vous êtes intéressés par le sujet, je vous invite à jeter un œil à la page des liens à la fin du dossier…
Il y a une chose à retenir sur la formulation des FFT, qu’on ne trouve pas avec celle du produit de convolution basique, c’est que le calcul du signal de sortie à un instant donné nécessite la connaissance du signal d’entrée à cet instant et à des instants supérieurs, du fait du passage d’une représentation amplitude/temps à une représentation amplitude/fréquence…
Par conséquent, en plus de la charge CPU provoquée par l’exécution des calculs, qui se voit énormément réduite par l’usage de la FFT, une latence ajoutée à la sortie devient inévitable, ce qui nécessite des optimisations supplémentaires (quitte à sacrifier de la précision et à augmenter la charge CPU) pour faire fonctionner les algorithmes en quasi temps réel, avec une latence acceptable ajoutée à celle de la carte son… Cette latence est déterminée explicitement par le développeur de l’algorithme, qui divise l’opération de FFT sur tout le signal en opérations sur des blocs d’échantillons de nombre te donc de durée constants, égale à la latence ajoutée par l’algorithme…
Néanmoins, certains développeurs ventent sur leurs réverbérations à convolution des modes de fonctionnement dits « zéro latence »… Impossible à moins de faire des mesures de savoir si la latence obtenue est vraiment nulle ou si c’est un raccourci pour désigner une latence très basse. Pourtant, il semble qu’il est possible de concevoir des FFT sans latence ajoutée, en tenant compte du fait que la latence de la carte son avec les meilleurs drivers ASIO qui soient n’est jamais nulle, ce qui laisse un peu de marge pour réaliser les calculs sans ajouter de latence, en prenant des dispositions particulières…
Principe de la réverbération à convolution
A présent, nous allons voir ensemble comment on peut tirer parti de l’opération mathématique de convolution pour obtenir des réverbérations logicielles, et ce qui a amené des scientifiques à considérer cette méthode de simulation de réverbération…
Modélisation de la réverbération
La réverbération est un phénomène acoustique que les musiciens connaissent très bien, qui peut être facilement détecté dans des espaces particuliers comme les salles de concerts, les églises, ou des pièces composées de surfaces fortement réfléchissantes. Lorsqu’une source sonore émet des ondes acoustiques dans un espace, celles-ci sont réfléchies et atténuées en fonction de leur fréquence selon les caractéristiques de l’espace en question, et l’auditeur reçoit alors une multitude d’échos plus ou moins rapprochés qui se fondent entre eux et produisent le phénomène de réverbération.
Le précurseur dans la caractérisation de ce phénomène fut Wallace Clement Sabine (1868–1919), connu pour une équation qui porte son nom, et comme auteur des premières publications sur le sujet. Il a observé que la réverbération dépendait de la géométrie de l’espace, de son volume, du caractère réfléchissant des matériaux constituant les parois, et même de l’humidité ambiante. Depuis, de nombreux scientifiques se sont intéressés au phénomène, en vue de le simuler de façon artificielle à l’aide de méthodes numériques, tandis que des ingénieurs du son s’amusaient à créer des chambres de réverbérations pour les studios d’enregistrement, qu’apparut les réverbérations mécaniques à plaques ou à ressorts…
Avant même de s’intéresser à la convolution, il était naturel pour caractériser la réverbération d’une salle de partir de sa réponse impulsionnelle (encore elle), obtenue en utilisant un bruit fort et en observant l’enregistrement de ce son dans l’espace considéré. Cet enregistrement permettait de distinguer différentes phases dans la production du phénomène :
Comme vous pourrez le constater, cette classification est toujours d’actualité, la plupart des réverbérations numériques ayant des fonctions de paramétrage du pré retard, et de la durée des premières réflexions / réflexions tardives (« predelay », « early reflections » et « late reflections » en anglais). Parfois, on parle aussi de la queue de réverbération (« reverb tail ») pour les réflexions fusionnées… Un autre paramètre que l’on utilise pour caractériser la réverbération d’une salle et qui a été introduit par Sabine est le RT60, qui est la durée que met l’énergie sonore d’un son après son extinction pour perdre le millionième de son énergie initiale soit une perte de 60 dB…
Au milieu des années 70 sont apparus les premiers réverbérateurs numériques, grâce aux travaux de Manfred Schroeder des Bell Telephone Laboratories, qui se sont inspirés de cette modélisation du phénomène. Le principe était de recréer les différentes phases acoustiques de la réverbération à l’aide d’échos de plus ou moins forte densité, en utilisant des cellules de retard et des filtres numériques. On vit aussi apparaître des algorithmes de réverbération simulant des guides d’ondes, des approches géométriques… Puis on parla de réverbération à convolution, ce qui était commode compte tenu de l’approximation du phénomène en utilisant les réponses impulsionnelles. Je vais d’ailleurs sans arrêt dans la suite de ce dossier faire des comparaisons entre les réverbérations à convolution et les autres types de réverbérations plus « classiques », dites algorithmiques car basées sur des algorithmes numériques et non sur des enregistrements de réponses impulsionnelles…
Réverbérations à convolution
Revenons un peu dans le concret : la convolution va multiplier deux signaux spécifiques, le premier signal étant la piste à traiter, l’instrument en cours d’enregistrement par exemple, et le deuxième signal la réponse impulsionnelle du système que l’on veut modéliser. Ce système est l’association d’une entité à simuler (en général la réverbération d’un environnement quelconque, mais pas seulement comme nous allons le voir) et de tous les paramètres liés au matériel de prise de son (choix des microphones, placement des microphones, préampli micro, convertisseurs A/N…).
Cette réponse impulsionnelle, stockée en général dans un fichier WAV (qu’on appelle aussi impulse ou IR pour impulse response) et destinée à être chargée dans la réverbération à convolution, peut être obtenue en utilisant un son composé de toutes les fréquences audibles, comme un coup de feu, et en enregistrant la réponse d’une salle à ce bruit avec le matériel de prise de son. Cet enregistrement, lorsqu’il est « convolué » au signal entrant venant d’un instrument de musique par exemple, va donner l’illusion très convaincante que l’instrument à été enregistré dans la même salle.
On aura également accès à quelques possibilités de contrôle sur le rendu, similaires à celles des réverbérations classiques, pour améliorer ou personnaliser le résultat de la convolution, autres que l’habituel rapport Dry/Wet (rapport en dB ou en pourcentages entre le signal traité et le signal d’origine). On retrouve ainsi les paramètres habituels de réglage de la réverbération, par exemple l’égalisation globale, l’atténuation fréquentielle des réflexions ou humidité de la pièce (« damping » en anglais), la spatialisation, la réverbération inversée (mode « reverse »)…
Malheureusement, du fait que la méthode de simulation n’est plus algorithmique mais basée sur des enregistrements statiques, certains types de paramétrages seront difficiles à mettre en œuvre, car il faut « traiter » l’impulse pour arriver au résultat désiré, ne serait ce que pour modifier la durée et la densité de la réverbération. Cette rigidité est un des désavantages de la réverbération par convolution, qui commence à être compensé grâce à diverses opérations sur les impulses qui permettent de délimiter sur les différentes phases du phénomène acoustique (premières réflexions et réflexions fusionnées) et de modifier leur forme. Néanmoins, le rendu après traitement des impulses perd toujours un peu de réalisme…
Applications de la convolution
Les réverbérations à convolution ont eu à l’origine pour but de fournir des réverbérations logicielles parmi les plus naturelles qu’il soit possible d’obtenir, et la plupart des impulses que l’on peut trouver vont dans ce sens. Néanmoins, l’opération de convolution dans le domaine de la musique n’est pas du tout limitée à la simulation de réverbérations de salles, ce qui fait des logiciels de réverbérations à convolution de formidables outils de simulation en général ou de bidouillage sonore. Vous allez à présent voir toutes les applications possibles de cet outil.
Réverbérations
Tout d’abord, il faut bien savoir que la convolution permet de simuler n’importe quel type de réverbération… En utilisant les moyens de captures d’impulses classiques (voir chapitre sur le sujet), il est possible de capturer la réverbération de n’importe quel espace, qu’on a coutume de séparer en deux catégories : salles classiques (hall, églises, salles de concert…) et post-production (espaces domestiques, lieux publiques, voitures, espaces extérieurs, éléments insolites…).
Pour l’anecdote, j’ai lu dans une interview d’un des développeurs de Audio Ease, qui ont commercialisé la réverbération à convolution Altiverb, qu’ils avaient récupéré les réponses impulsionnelles de divers « éléments insolites » comme des écouteurs de walkman, des tuyaux, des petits baffles, des pots, et surtout la réponse impulsionnelle d’un casque en métal, qui a servi pour un passage dans « Le Seigneur des Anneaux » de Peter Jackson !
Réverbérations artificielles
De plus, il est possible de capturer la réponse impulsionnelle de n’importe quel dispositif créant une réverbération artificielle, que ça soit des réverbérations à plaques, à ressorts, des réverbérations produites par des algorithmes numériques, des chambres à écho… On peut s’amuser à récupérer la réverbération d’une caisse de guitare acoustique, voire la résonance d’un piano, pour « réchauffer » un peu le rendu d’un piano acoustique virtuel basé sur des samples.
On peut même capturer la réverbération produite par certains réverbérateurs numériques en racks dont on vante souvent les caractéristiques sonores, à l’aide de quelques réponses impulsionnelles de rien du tout, le tout sans avoir l’appareil à la maison… Et si en fait, il était possible de reproduire le fonctionnement de n’importe quel appareil, puisque les réponses impulsionnelles permettent de reproduire la réponse fréquentielle de ceux-ci ?
Systèmes en général
La réponse est oui… et non. Le problème avec cette modélisation utilisant les réponses impulsionnelles et la convolution, est qu’elle ne tient pas compte de phénomènes dynamiques, qui font varier la réponse fréquentielle en fonction du temps. On est donc en général obligés de faire appel à des technologies supplémentaires de celles des processeurs de convolution classiques, et il apparaît aussi la nécessité d’enregistrer plusieurs impulses de la même entité.
De plus, il faut savoir que tous les systèmes sans exceptions font intervenir des phénomènes dynamiques à des degrés différents, mais qui peuvent heureusement dans certains cas être occultés, ceux-ci n’ayant pas une influence suffisante pour rendre impossible la simulation avec un bon degré de réalisme. Pour la réverbération par exemple, celle-ci peut être totalement ignorée, alors que pour un compresseur ou de la distorsion, la simulation ne fonctionnera pas du tout. Dans d’autres cas, comme pour la simulation de HP, il est possible de passer outre. Pour plus de détails au sujet de la reproduction de la dynamique, je vous invite à aller voir le chapitre concerné du dossier…
Simulateurs de HP (les guitaristes, venez par là !)
La simulation de HP est l’application de la convolution qui m’a donné envie de m’y intéresser ! Et j’invite tous les guitaristes à lire attentivement ce qui va suivre…
Dans ce contexte, la convolution va permettre de capturer le fonctionnement d’enceintes quelconques (en l’occurrence un baffle d’ampli guitare). Ainsi, un préampli guitare directement branché dans un carte son complété d’une réverbération à convolution avec l’impulse adéquate permet de marcher sur les plates bandes des simulateurs tels que le Line6 POD XT ou le Behringer V-Amp 2… Si vous ne me croyez pas, jugez plutôt du mp3 suivant, enregistré avec mon Lag TL1 Spitfire acheté d’occasion à 100 euros, avec une impulse de HP extraite de la librairie de Native Instruments Kontakt 2, et le paramètre Dry du plug-in à 0%, ce qui est obligatoire pour cette application :
Son du Spitfire direct et traité avec la simulation de HP par convolution
Mais contrairement aux enceintes qui sont censées fournir une reproduction fidèle du signal qu’on leur envoie, les baffles pour amplis ont une réponse qui n’est pas linéaire à 100%. Donc le résultat sonnera naturel comme vous avez pu l’entendre mais ne sera pas aussi proche de la réalité que dans le cas des réverbérations à convolution…
Sound Design…
Enfin, on va à présent s’éloigner un petit peu de tout ce qui est réalisme… Imaginez ce que vous pourriez obtenir comme effets intéressants si vous utilisiez des impulses à tort et à travers sur vos enregistrements, voire des impulses modifiées de façon violente, des impulses créées artificiellement, ou carrément n’importe quel son ?
Imaginez le rendu d’une guitare électrique convoluée avec une impulse de nappes de synthés, une piste électro avec un son de cymbales ou un sample de caisse claire avec beaucoup de réverbération… Pour l’exemple, je vous conseille de vous amuser avec les librairies d’impulses pour sound design de Spirit Canyon Audio, ou le soft d’effets spectraux basés sur les FFT et la convolution DelayDots SpectrumWorx…
Enfin, je vous conseille très fortement d’expérimenter toutes sortes de sons bizarroïdes à la place des impulses : cela peut donner des résultats vraiment intéressants ! Evitez néanmoins les sons de durée importante, pour ne pas trop augmenter la charge CPU utilisée par votre plug-in de convolution, sans oublier que certains d’entre eux ont des limitations sur la durée maximum des impulses.
Traitements spectraux
Enfin, en dernière catégorie d’application de la convolution, nous avons tout ce qui est traitements spectraux purs, qui sont apparus grâce à la montée en puissance des CPU. Ceux-ci peuvent être effectués à l’aide de plug-ins de réverbération à convolution et d’impulses, mais aussi avec des logiciels conçus uniquement dans ce but, qui permettent de faire du sound design (avec encore DelayDots SpectrumWorx par exemple), de l’aide au mixage en détectant les recouvrements de fréquence entre deux sources audio et en appliquant du filtrage automatiquement pour y remédier (le très intéressant Elevayta Space Boy), de l’égalisation basée sur les impulses d’appareils professionnels (Tritone Digital Hydratone, Tritone Digital ValveTone '62 et Waves Ltd. Q-Clone) et la modification de la réponse fréquentielle d’un signal audio en fonction de celle d’un autre, parfois en temps réel (avec Voxengo CurveEQ, Elevayta Clone Boy, Elevayta FreEq Boy…).
Utilisation pratique des réverbérations à convolution
Concrètement, il existe des plug-ins de réverbération à convolution que vous pourrez utiliser dans votre séquenceur favori (ainsi que des racks d’effets sur lesquels je ne vais pas trop m’étendre, comme le Sony DRE S777, car ils sont largement dépassés en termes de performances et coûtent un prix incroyable). Pour les faire fonctionner, il faut juste les placer sur vos pistes comme un plug-in de réverbération classique, puis charger le fichier impulse au format WAV qui vous intéresse depuis votre disque dur. Et c’est tout…
Comme quoi, si la chose peut faire peur au début et sembler compliquée sur le principe, elle s’utilise assez simplement. Ensuite, libre à vous de bidouiller les paramètres supplémentaires de votre plug-in de convolution préféré pour affiner l’utilisation de l’impulse.
Performances
Venons-en maintenant au sujet qui fâche : les performances. On a vu que le produit de convolution était une opération assez gourmande en calculs, et la charge CPU nécessaire pour faire fonctionner une réverbération à convolution n’est pas du tout négligeable. Pire : certains plug-ins ne sont pas utilisables en temps réel, à cause d’une latence importante ajoutée à la latence de la carte son, même si ce défaut n’est pas aussi embêtant qu’il en a l’air avec la compensation automatique de délai qu’on trouve désormais dans la plupart des séquenceurs.
Ainsi, à moins d’avoir une bête de course, il est préférable de ne pas utiliser beaucoup d’instances de ce genre de plug-ins dans un même projet, voire de faire des rendus de toutes les pistes qui les utilisent. Alors bien entendu, selon l’utilisation, il faudra plutôt utiliser une réverbération classique à algorithmes, surtout lorsqu’il n’est pas nécessaire d’avoir une réverbération réaliste, comme le freeware DaSample Glaceverb. Et même pour les autres applications de la convolution, il y aura toujours des solutions alternatives à considérer… Sachez toutefois que les « gros » plug-ins commerciaux intègrent toutes sortes de fonctions de gestion des performances, permettant de choisir la latence voulue et quelques optimisations jouant sur la qualité des traitements comme la troncature brutale de la queue de réverb à un niveau en dB donné…
D’ailleurs en parlant des applications autres que la réverbération, je trouve dommage que les réglages proposés par la plupart des plug-ins soient extrêmement orientés réverbération… Lorsque ces derniers atteignent une certaine complexité, il devient même pénible d’utiliser une simulation de baffle, étant donné qu’il y a une certaine quantité d’effets à désactiver pour que ça fonctionne. Je pense en particulier à Waves Ltd. IR-1 à ce sujet… Dans ces cas-là, autant se débrouiller avec des logiciels plus simples, dont sont qui sont gratuits.
Autre chose : dans diverses discussions sur Noisevault.com (qui, je le rappelle, est « le » site traitant de tout ce qui a trait à la convolution) reviennent souvent des comparaisons entre le rendu sonore final sans effet ajouté de chaque plug-in… Je n’ai pas l’intention de rentrer dans ce genre de détails subjectifs, même ils s’appuient parfois sur des mesures, car je considère que pour une même impulsion, on obtient des résultats assez similaires, et que ce genre de détails n’est, en définitive, pas à même de départager les différents plug-ins. Si ce genre d’informations vous intéresse, je vous conseille donc de jeter un œil au forum de Noisevault.com.
Les logiciels de convolution
Faisons à présent un petit tour d’horizon des principaux plug-ins de réverbération à convolution du marché, à commencer par les plug-ins gratuits :
Knufi SIR (VST) : il est freeware, fonctionne sur Windows, et possède pas mal de réglages (pré délai, égalisation 5 bandes, enveloppe de volume sur les impulsions, time stretching et troncature en pourcentage de la longueur de l’impulsion, mode reverse, deux canaux avec gestion de la spatialisation stéréo, et surtout contrôle automatique du gain de l’impulse). Son seul défaut est que pour l’instant, dans sa version 1.010, il apporte une latence non négligeable de 8960 samples (203 ms en 44.1 KHz). Mais c’est un plug-in qui vous rendra beaucoup de services et qui sera tout à fait convenable pour la plupart de vos besoins, en plus d’être une bonne introduction au monde des réverbérations à convolution…
Redstate Sound Revolverb Lite (VST) : un autre plug-in freeware sous Windows, qui possède le strict minimum de réglages (Dry/Wet, pré délai) mais qui a l’avantage de fonctionner en mode zéro latence. Par contre, c’est une version BETA qui semble avoir été abandonnée par son éditeur, et qui fonctionne assez aléatoirement selon la configuration (carte son, processeur…). Certains ont de la chance et le font tourner sans trop de problèmes (comme moi, regardez mon profil pour le détail de ma configuration), et d’autres n’arrivent pas en tirer quoique ce soit… Note : le téléchargement sur le site officiel ne fonctionnant plus, je vous conseille d’aller sur le forum associé à la fiche produit du plug-in pour l’essayer…
Elevayta Convo Boy LITE (VST) : une version donationware de Elevayta Convo Boy assez performante, que je vous conseille aussi fortement d’essayer, avec une latence de 92.8 ms en 44.1 KHz et qui possède presque toutes les fonctions de la version commerciale sauf l’égalisation et la gestion de différentes latences.
Passons maintenant aux versions commerciales, qui sont la plupart du temps livrées avec des librairies d’impulses, et qui se distinguent des convolutions gratuites par la variété des réglages qu’elles proposent :
Waves Ltd. IR-1 (VST/DX/HTDM/RTAS/AU/MAS/AudioSuite) : il fonctionne sur Mac et PC, est livré avec une librairie d’impulses conséquente sur 2 CD. Il existe en 3 versions différentes, à savoir la stéréo classique, une version light moins chère avec le minimum de réglages, et la version 360 qui fonctionne en surround, la librairie d’impulses ayant été enregistrée en versions stéréo et 5.1 via une technologie propriétaire de Waves Ltd. appelée SIRRTM (pour Spatial Impulse Response Rendering). La latence peut être modifiée par l’utilisateur en fonction de ses besoins, et descend jusqu’à 512 samples (11 ms en 44.1 KHz) dans les formats.
Quant aux réglages possibles du rendu, IR-1 en possède une très grande variété : modification de la longueur de réverbération de l’impulse, des paramètres de réverbération (résonance, décorrélation des canaux, enveloppes, temps de réverbération, taille de la salle, modification des premières réflexions et de la queue de réverb, filtrage global et humidité, mode reverse…). De plus, le logiciel peut importer des impulses au format WAV extérieures, voire des enregistrements faits par l’utilisateur en utilisant le « swept sine » de Waves. Ceux-ci seront alors déconvolués automatiquement (voir le chapitre suivant pour plus de détails)… En résumé, IR-1 est un produit complet, mais qui se distingue par un prix très élevé (quoique plus abordable pour la version light) et la complexité du paramétrage.
Audio Ease Altiverb 5 (VST/HTDM/RTAS/AU/MAS/AudioSuite) : cette réverbération à convolution incontournable ne tourne malheureusement que sur Mac OS X pour l’instant… Le plug-in possède les fonctionnalités habituelles des réverbérations à convolution pour jouer sur l’égalisation, l’humidité, les performances (avec le choix entre un mode « zéro latence » et un mode faible charge CPU) et sur la forme de l’impulse utilisée pour réduire le temps de réverbération ou la taille de la pièce simulée. Parmi les originalités, on notera la présence d’un système de spatialisation intéressant qui permet de modifier sur un schéma le positionnement virtuel du microphone et des canaux de la source sonore, le tout en stéréo ou en surround avec des contrôles de volume sur chaque canal.
Il est lui aussi livré avec une grosse bibliothèque d’impulses, dans un format propriétaire qui n’autorise pas l’import/export avec les formats classiques, ainsi que des logiciels pour créer ses propres impulses avec la méthode de la déconvolution. Le site de Audio Ease permet en outre de télécharger de nouvelles impulses officielles toutes les semaines, et donne accès à un forum de partage d’impulses entre utilisateurs…
Maintenant, je vais m’étendre un peu sur l’aspect ergonomique, qui est le détail qui tue sur ce plug-in ! Déjà, je trouve l’interface très bien foutue, avec la possibilité de faire apparaître un texte explicatif de chaque paramètre en passant la souris au dessus et surtout, je trouve que la cohésion entre tous les éléments du logiciel, c’est-à-dire du moteur de convolution, de la banque d’impulses et des paramètres utilisables, est absolument époustouflante grâce entre autres au diagramme « cascade » (amplitude/fréquence/temps) en temps réel du rendu de l’impulse et des traitements, qui peut être déplacé dans tous les sens à la souris. Mieux, celui-ci se modifie instantanément de façon claire à chaque fois que l’utilisateur déplace un potard… Et pour continuer dans la série des « gadgets » bien pensés, chaque impulse est accompagnée de photos voire de vidéos en Quicktime VR du lieu où elles ont été enregistrées, ainsi que de précisions écrites en tout genre. Il y a aussi une série de boutons qu’on peut assigner à des sons, joués automatiquement ou sur commande au choix, permettant d’entendre le rendu des paramètres en cours sans avoir à faire intervenir le séquenceur hôte.
Ajoutons à cela la gestion de presets qui sauvegardent une impulse avec des réglages précis, en plus de la possibilité de choisir les impulses séparément (disponibles à chaque fois en plusieurs versions, enregistrées de différentes manières et en nombres de canaux différents). Autre détail intéressant, l’accès à 10 mémoires facilement automatisables de tous les réglages, qui commutent rapidement. Si je vous ai mis l’eau à la bouche, je vous conseille de jeter un œil à la vidéo de présentation du logiciel sur le site officiel de Audio Ease : ça en vaut vraiment la peine.
Wizoo Sound Design WizooVerb (VST/AU/RTAS) : Ce plug-in fonctionne sur Mac et PC en faible latence avec réglage des performances, et existe en deux versions : W2 (stéréo) et W5 (surround). Il exploite la technologie HDIR (High Definition Impulse Response) qui, utilisée sur la bibliothèque d’impulses livrées avec le logiciel, permet de rendre plus réaliste les opérations sur les différentes phases de la réverbération. Autre atout, la technologie AIR (Acoustic Impulse Rendition) fabrique un modèle de réverbération algorithmique (donc non basé sur la convolution) à partir des impulses qu’on lui fournit, qu’elles soient internes à WizooVerb ou importées au format WAV, ce qui permet d’obtenir une qualité de rendu à mi-chemin entre les algorithmes classiques et la convolution, avec des performances meilleures et des capacités de contrôle augmentées. Sinon, le plug gère le true stéréo et possède des réglages optimisés pour les technologies HDIR et AIR, en plus des habituels EQs, temps de réverbération, taille de la salle, humidité, mode reverse, gestion des performances avec un mode zéro latence, enveloppes sur l’impulse…
Trillium Lane Labs TL Space (TDM/HTDM/RTAS/AudioSuite) : Disponible pour ProTools uniquement pour Mac et PC (ce qui garantit une latence très faible), ce plug-in est livré avec une librairie de 700 Mo d’impulses de réverbs et de sound design au format WAV. Il fonctionne en stéréo et en surround, possède un égaliseur multi-bandes, des paramètres de modification de l’impulse (longueur de la réverbération, contrôle des premières réflexions et de la queue de réverbération, humidité, mode reverse)…
Voxengo Pristine Space (VST) : Ce plug-in fonctionne sous Windows uniquement, gère jusqu’à 8 canaux dont le fonctionnement est personnalisable, permet la gestion des performances (longueur de la latence qui peut descendre jusqu’à 64 samples soit 1.5 ms en 44.1 KHz ou mode zéro latence, mais qui ne peut être utilisé que sous certaines conditions), possède un égaliseur, des réglages basés sur des enveloppes (volume, panning, longueur de l’impulse, filtrage), un système de mémoires automatisable, un mode reverse, une gestion automatique du gain, la possibilité de tronquer les impulses chargées… Il n’est pas livré avec une bibliothèque d’impulses comme ses camarades (reconnaît les formats WAV et AIFF), et affiche nettement moins d’ambition, mais il ne joue pas dans la même cour et se trouve à un prix nettement plus abordable… Notez que Voxengo Analogflux Suite est livré avec une version légère de Pristine Space limitée à deux canaux et quelques impulses de réverbération « Vintage ».
Elevayta Convo Boy (VST) : Convo Boy fonctionne sous Windows uniquement, gère deux canaux, possède un égaliseur 7 bandes, un mode reverse intéressant, le paramétrage de l’humidité, du filtrage, de la spatialisation et des performances (troncature de l’impulse en dessous d’un certain niveau en dB, gestion de la latence qui peut descendre jusqu’à 20 ms en 44.1 KHz). Sachez aussi qu’il est le moins cher des plug-ins commerciaux. Dépourvu de bibliothèque d’impulses, il reconnaît les formats WAV et AIFF.
Il existe aussi des processeurs de convolution en plug-ins dédiées à la simulation de HP pour amplis guitare/basse électrique :
Voxengo Boogex (VST) : c’est un freeware pour Windows qui sert avant tout à modéliser un ampli guitare, avec un contrôle de gain, un égaliseur, des contrôles de tonalité, de phase… et un étage simulation de baffle utilisant la convolution (avec une latence de 2.1 ms en 44.1 KHz !) s’appuyant sur des impulses internes ou extérieures aux formats WAV et AIFF.
Cockos Incorporated Jesusonic (DX) : un multi-effet légèrement orienté guitare, freeware, pour Windows, qui peut être utilisé en stand-alone, en plug-in DirectX, en plug-in Winamp 5, ou encore avec Cockos Incorporated Ninjam (excellent logiciel freeware permettant de jammer en utilisant une connexion Internet), qui inclut une section de simulation de baffles pour ampli guitare en utilisant la convolution et 6 impulses au format WAV.
Enfin, nous allons parler de logiciels s’éloignant du concept de base mais quand même plus ou moins liés à la réverbération :
La suite Aurora 4.0 : ce n’est pas une suite de plug-ins à proprement parler mais plutôt des extensions pour Cool Edit et Adobe Audition, qui fournissent toutes les fonctionnalités utiles pour faire de la convolution, via un traitement classique qui s’ajoute à l’éditeur mais aussi des analyses, des traitements liés à la création d’impulses (déconvolution et création de swept sine dont je parle dans le prochain chapitre), et toutes sortes d’outils pour les chercheurs en synthèse binaurale, en procédures de mesure en chambres anéchoïques… La version téléchargeable sur le site officiel est d’ailleurs pleinement fonctionnelle mais possède une limitation qui fait planter l’éditeur hôte à chaque utilisation d’un traitement de Aurora avec 25% de chances (spécial comme protection, mais heureusement Adobe Audition a une fonctionnalité intéressante, celle de relancer une session plantée dans l’état où on l’a laissée !).
Prosoniq Rayverb (VST) : ce n’est pas vraiment une réverb à convolution, Rayverb analyse les impulses qu’on lui donne ou n’importe quel fichier WAV et créé en utilisant le Inverse Raytracing un modèle de réverbération de salle qui colle le plus possible à la source. Ce modèle est ensuite modifiable via de nombreux paramètres (géométrie de la salle, égalisation, positionnement de la source sonore dans l’espace, temps de réverbération…) et il est alors possible d’exporter le nouveau modèle sous forme d’impulses au format WAV, ou de l’utiliser directement en temps réel avec néanmoins une latence importante de 8947 samples (203 ms en 44.1 KHz).
On trouve aussi un paquet de softs de traitement en rapport avec la convolution et plus généralement servant à faire toutes sortes de mesures et traitements acoustiques pour de la recherche, un peu à la manière d’Aurora. Si ça vous intéresse, il existe deux logiciels utilisables gratuitement qui sont SoundHack pour Mac et Liberty Instruments Praxis pour Windows XP…
Enfin, précisons que certains logiciels sont livrés avec des réverbérations à convolution, qui en général ne peuvent pas être utilisées dans d’autres contextes. Je ne m’étendrai donc pas trop dessus, car ceux qui ont les logiciels associés les connaissent mieux que moi, et parce les autres n’y auront pas accès à moins d’acheter le logiciel. On trouve donc des réverbérations à convolution dans les programmes suivants : Native Instruments Kontakt 2, Sonic Foundry/Sony Media Software Sound Forge, Tascam GigaStudio 3, Bias Peak Pro 5, Magix Samplitude 8 Pro et Magix Sequoia 8, Apple Emagic Logic Pro 7, Steinberg Nuendo 3, Synapse Audio Orion 6 Platinum… Je me contenterai juste de quelques mots à propos de la librairie d’impulses de Kontakt 2 (au format WAV) qui est une des seules à ma connaissance (avec l’ Acoustic Mirror de Sound Forge, premier logiciel qui intégra une réverbération à convolution) à inclure des impulses de HP pour ampli de guitare électrique, en plus des impulses de réverbération habituelles, ou encore des impulses spécifiques pour le sound design.
Réponses impulsionnelles
A présent, nous allons parler d’une composante aussi importante que la partie logicielle des processeurs de convolution, à savoir les réponses impulsionnelles ou impulses : vous saurez ainsi tout sur les technologies utilisées pour les créer, et les endroits où en récupérer.
Ou trouver des impulses ?
La plupart des logiciels commerciaux comme nous avons pu le voir sont livrés avec leurs librairies d’impulses, parfois dans un format propriétaire (comme Audio Ease Altiverb), ce qui signifie que les grosses librairies d’impulses spécialement enregistrées pour le soft ne sont pas exportables vers d’autres plug-ins de convolution… De plus, certains ne peuvent importer les formats classiques des impulses.
Pour tous les logiciels qui acceptent les formats WAV et AIFF, la référence en la matière est la librairie du site NoiseVault.com. Vous y trouverez une bonne quantité d’impulses, classées par catégories, de très bonne qualité en général et mises à jour régulièrement. Faites également un tour sur les forums de vos plug-ins de convolution préférés, et sur la liste de liens suivante :
- https://www.echochamber.ch/
- http://www.cksde.com/f_6.htm
- https://www.voxengo.com/product/pspace/
- https://www.voxengo.com/impulses/
- http://www.acoustics.net/content.asp?id=96
- http://www.samplicity.com/download/index.html
- http://www.synaudcon.com/sacirxchange.htm
- http://www.spiritcanyonaudio.com/
- http://homepage.hispeed.ch/zidee/
- https://www.xs4all.nl/~fokkie/IR.htm (attention la moitié est au format Altiverb uniquement)
D’ailleurs, il commence à apparaître des librairies d’impulses vendues telles quelles sans logiciel de convolution, provenant des développeurs Numerical Sound, Samplicity, CKSDE ou Spirit Canyon Audio, sans oublier Garritan qui a annoncé une librairie pour la fin de l’année 2005, et Vienna Symphonic Library en 2006 (ça promet !)
Précisons aussi que le développeur Spirit Canyon Audio propose des librairies d’impulses spécialement conçues pour le sound design : Spectral Relativity, Kaleidoscopy et Sanitarium. Au programme : des impulses de réverbs assez bizarroïdes et des impulses de modulations. Une poignée d’impulses de démonstration ainsi que des mp3s plutôt intéressants sont téléchargeables sur leur site…
- Numerical Sound Pure Space Classical & Mystical, Pure Space Film & Sacred
- Samplicity Synthetic Reverbs Volume 1
- Spirit Canyon Audio Spectral Relativity, Kaleidoscopy, Sanitarium
- Cyber Kitchen Sound Design Enterprise Old Analog Delay 1, Mixverb 1, Drum Echo…
L’enregistrement des impulses
Il est possible d’enregistrer des réponses impulsionnelles personnalisées avec un peu de moyens et de bon sens, ainsi que la connaissance des différentes techniques utilisées pour la création des bibliothèques d’impulses commerciales. Pour enregistrer une impulse, on a besoin d’une source sonore, et de matériel de prise de son. Le résultat sera très fortement dépendant des conditions d’enregistrement, de la réponse fréquentielle de la source, de la réponse fréquentielle et du placement des microphones. Ainsi, il est absurde de penser qu’une salle par exemple possède une seule et unique réponse impulsionnelle…
Il existe deux grandes façons de procéder à la capture de l’impulse, chacune ayant ses contraintes et ses champs d’application, détaillées ci-dessous…
Simulation d’une impulsion de Dirac
On peut utiliser une source sonore qui se rapprochera au maximum d’une impulsion de Dirac théorique, c’est-à-dire d’un son très fort et très court couvrant un maximum de fréquences. Cette méthode est très utilisée pour enregistrer la réverbération d’une salle, en utilisant un tir de revolver ou l’explosion d’un ballon de baudruche. En enregistrant le résultat, on obtient directement la réponse impulsionnelle de la salle. Par contre, un gros désavantage de cette méthode est que celle-ci va être colorée par les imperfections de la source, qui ne sera jamais tout à fait une impulsion de Dirac…
Méthode basée sur la déconvolution
On peut aussi utiliser un son quelconque connu couvrant un maximum de fréquences, l’utiliser comme source, enregistrer, et procéder à une déconvolution. Cette opération consiste à calculer la réponse impulsionnelle en fonction du signal utilisé comme source et du signal enregistré. Cette méthode donne des résultats plus précis que la précédente, car on a plus besoin d’approximer une impulsion de Dirac et on a donc moins de coloration ajoutée.
Pour procéder à la capture de l’impulse en elle-même, deux possibilités se présentent : soit on envoie le signal source sur des enceintes aussi neutres que possible avec un fort volume pour l’enregistrer avec un microphone, soit, dans le cas où l’entité est un appareil quelconque, on envoie le signal source directement en entrée de l’appareil. On peut ainsi le récupérer électriquement en sortie ou en utilisant un microphone dans le cas d’un baffle (dans ce cas il faut veiller à ce que les niveaux et les impédances du signal source et de l’appareil à enregistrer soient compatibles).
Le signal source le plus couramment utilisé pour cette méthode de capture est une sinusoïde d’amplitude constante qui balaye toutes les fréquences utiles pour générer une réponse impulsionnelle (swept sine en anglais). Cela signifie que cette bande de fréquences doit inclure les fréquences audibles (entre 20 Hz et 20 KHz), ainsi que des fréquences supérieures si on veut obtenir une impulse échantillonnée sur une fréquence plus importante que 44.1 KHz (sachant que d’après le théorème de Shannon bien connu en Traitement du Signal, on doit échantillonner à une fréquence au moins deux fois supérieure à la plus grande fréquence utile du signal).
La durée du swept sine choisie va avoir également une influence, quoique légère, sur la forme de la réponse impulsionnelle enregistrée. Plus celle-ci sera importante, et plus le rapport signal sur bruit de la réponse impulsionnelle sera important et donc intéressant. Mais d’un autre côté, le rallongement du signal source provoque des apparition de distorsions sur les enregistrements, dues aux variations de pression de l’air dans le milieu d’après Waves Ltd., qui propose d’après certains calculs la durée optimale de 15 secondes.
Une fois que vous avez sous la main l’enregistrement et le signal source, il faut utiliser un logiciel pour procéder à la déconvolution. Waves Ltd. IR-1 ou Audio Ease Altiverb 5 fournissent par exemple cette fonctionnalité, tandis que Voxengo a commercialisé le logiciel Deconvolver totalement dédié à la déconvolution (dont la version démo est tout à fait fonctionnelle et pas trop contraignante). Il existe aussi un logiciel freeware disponible sur le site de Christian W. Budde, auteur de l’excellent égaliseur paramétrique freeware Posihfopit, ainsi que CATT GratisVolver, encore en freeware (dont le fonctionnement est bien expliqué ici, entre autres). Il suffit de donner à ces logiciels les deux signaux nécessaires et ils génèrent automatiquement la réponse impulsionnelle.
Lorsqu’on a enregistré une impulse, il est parfois nécessaire de procéder à quelques traitements comme la suppression du silence avant et après l’enregistrement ou la normalisation de toutes les prises qu’on a pu effectuer. Cela peut vite devenir un cauchemar lorsqu’on a beaucoup d’impulses à traiter… Heureusement, certains logiciels comme Voxengo Deconvolver (encore lui !) possèdent une fonction qui applique ces traitements en série sur plusieurs fichiers. Pour les autres, l’utilisation du freeware NoiseTime Silence Remover (silence et normalisation en série) fera très bien l’affaire.
Comme matériau de base, vous trouverez une swept sine enregistrée en 96 KHz / 24 bits sur une bande de fréquences allant de 20 Hz à 32 KHz dans la section de téléchargement du site officiel de Waves Ltd. (accessible après avoir fourni quelques informations) ou plusieurs de longueurs différentes en 44.1 KHz / 16 bits sur SonyMediaSoftware.com (dans la rubrique de téléchargement de la démo de Sound Forge 8).
Il est également possible de créer des swept sine sur mesure par exemple avec les logiciels dédiés MakeATestTone ou Sweep Generator (livré avec Altiverb) de Audio Ease, avec Voxengo Deconvolver (décidément !), ou encore avec la suite Aurora pour Adobe Audition et Cool Edit…
Une remarque importante : les signaux utilisés pour la déconvolution doivent obligatoirement être échantillonnés à la même fréquence et être à la même résolution en bits pour que la manipulation fonctionne. Si vous avez besoin de convertir les fréquences d’échantillonnage de beaucoup de fichiers à la fois, vous pouvez enfin utiliser le logiciel freeware Voxengo r8brain.
Techniques supplémentaires de captures d’impulses
Il faut savoir que le placement des micros lors des prises de son, ainsi que leur directivité va énormément influencer le son obtenu sur l’impulse… Ainsi, les ténors du plug-in de réverbération à convolution, qui se sont occupés des prises de son pour leurs librairies d’impulses, ont utilisées diverses techniques extraites de recherches en acoustique…
Un terme qu’on voit apparaître chez Voxengo et Wizoo Sound Design, est le terme de « true stéréo » : il consiste à créer une image stéréo de la réponse impulsionnelle de la salle en enregistrant quatre impulses en mono, deux qui seront utilisées pour le canal gauche et deux pour le canal droit du rendu final.
Waves Ltd. Utilise, selon les salles à enregistrer, des techniques qui se distinguent par le type de micros utilisés, leur positionnement l’un par rapport à l’autre… J’ai vu d’ailleurs sur une vidéo qu’ils utilisaient des tables tournantes sur lesquelles étaient placés les micros, et qu’ils faisaient tourner de 24° pour chaque capture…
Il existe ensuite toutes sortes de techniques visant à supprimer les distorsions parasites et à optimiser le rapport signal sur bruit, qui sont en général jalousement gardées par les entreprises du domaine de la convolution. Ainsi, on n’a accès qu’à quelques informations sommaires sur la technologie HDIR (High Definition Impulse Response) développée par Wizoo Sound Design, qui en plus intègre une capture d’informations précises sur les impulses enregistrées visant à optimiser les traitements sur les différentes phases du phénomène de réverbération…
Coloration des réponses impulsionnelles
Une dernière petite chose à préciser qui me semble importante, concerne l’enregistrement d’une entité quelconque à l’aide d’un microphone… Forcément, les conditions de capture vont avoir pour effet de colorer la réponse impulsionnelle obtenue, et on aura parfois besoin d’obtenir des impulses aussi neutres que possibles à ce sujet. Heureusement, il existe différentes techniques pour pallier à cet effet.
Par exemple, le microphone peut se modéliser par sa réponse fréquentielle : ainsi, en appliquant une égalisation particulière, on peut faire des corrections sur les impulses enregistrées pour simuler un microphone qui aurait une réponse fréquentielle neutre… Il est également possible de simuler un positionnement de microphone différent de l’original utilisé sur une impulse à l’aide d’algorithmes modifiant les différentes phases de la réverbération sur l’impulse : Audio Ease a utilisé une telle technologie sur son Altiverb 5, dont on a un aperçu très intéressant sur la vidéo de présentation du logiciel.
D’ailleurs, le processeur de déconvolution de Altiverb est livré avec des presets de corrections pour divers moniteurs utilisés en source sonore, référencés par rapport à l’enceinte de monitoring Genelec S30. Si la capture de la réponse impulsionnelle est réalisée avec une enceinte reconnue par le logiciel, il est possible de rendre cette réponse plus neutre.
Ensuite, il faut savoir que le phénomène de réverbération doit être atténué au maximum pour la captures des impulses de certaines entités, comme les enceintes ou les baffles d’amplis guitare. L’intérêt ? Exercer un meilleur contrôle de leur sonorités, ce qui n’interdit pas de rajouter de la réverbération par la suite. Pour cela, on réalise les captures dans ce qu’on appelle une chambre anéchoïque, qui est conçue de telle façon qu’elle supprime toutes les réflexions des ondes acoustiques (et électromagnétiques) grâce à des matériaux très fortement absorbants, agencés dans une géométrie particulière (en général avec des pointes). La réverbération d’une telle salle peut être considérée comme nulle… Néanmoins, il faut aussi veiller à ce que l’humidité (l’atténuation fréquentielle due au parcours des ondes dans la salle) soit neutre fréquentiellement autant que possible.
Note : la déconvolution pourrait également servir à supprimer la réverbération d’un enregistrement si on possède la réponse impulsionnelle de cette réverbération…
Méthode MLS (Maximum Length Sequence)
On peut aussi utiliser un signal MLS comme source au lieu d’une swept sine, qui se définit comme une séquence binaire à peu près aléatoire, d’impulsions d’amplitude égale et de zéros, et procéder à une déconvolution par des moyens un peu différents de ceux employés jusqu’à maintenant (la FFT traditionnelle peut être utilisée mais le processus sera plus précis et plus rapide à calculer en utilisant la Transformée Rapide dite de Hadamard ou FHT pour « Fast Hadamard Transform »).
Cette façon de faire est beaucoup plus complexe que ce qu’on a pu voir, et nécessite du matériel plus performant pour la prise de son et l’envoi du signal source, ainsi que les parties logicielles nécessaires pour générer des signaux MLS et procéder à la déconvolution, que l’on ne peut trouver que sur des logiciels de mesure de recherche (comme ceux dont j’ai parlé à la fin du chapitre précédent).
Par contre, la méthode MLS possède un grand avantage, elle permet, en faisant plusieurs captures successives basées sur le même signal MLS, d’obtenir une réponse impulsionnelle avec un rapport signal/bruit croissant avec le nombre de captures. De plus, la méthode d’extraction du bruit rend possible la capture d’impulses dans des milieux très bruités…
Autres types de création d’impulses
Il existe aussi des logiciels qui permettent de synthétiser des réponses impulsionnelles par algorithmes numériques, comme Voxengo Impulse Modeler (dont la démo pas trop limitée permet l’export des impulses) qui permet de « dessiner » une géométrie de salle et de calculer la réponse impulsionnelle éventuelle de cette salle, exportable au format WAV… Le plug-in Prosoniq Rayverb permet aussi ce type de bidouillages ainsi que l’export des impulses générées.
Bidouillage des impulses
Autre point intéressant, vous êtes libres d’effectuer toutes sortes de traitements sur vos impulses avant de les utiliser avec votre plug-in de convolution, outre la normalisation et la suppression de silences qui servent juste à les utiliser proprement. Et les possibilités sont infinies… On pourrait s’amuser à les compresser, à les égaliser, à faire du pitch shifting, à faire des collages d’impulses les unes à la suite des autres ou de manière plus violente avec des inversions du sens de lecture, à leur appliquer par convolution un traitement basé sur une autre impulse, à les réchauffer avec diverses simulations de lampes… On peut aussi utiliser un des logiciels de traitement spectral dont j’ai parlé précédemment dans les applications de la convolution, comme Voxengo CurveEQ, en prenant la courbe de réponse fréquentielle d’une impulse pour l’appliquer sur une autre, ce qui peut être particulièrement utile pour rendre plus réaliste des impulses artificielles…
Sampling et droits d’exploitation
Je vais engager un débat glissant avec ces quelques lignes, mais je ne peux pas me permettre de zapper cet aspect là lié à la convolution…
Forcément, quand on parle d’enregistrer des réponses impulsionnelles d’entités autres que des espaces acoustiques, on rentre dans le débat qui fait rage de nos jours avec le téléchargement illégal de musique par exemple, à savoir celui des droits de sur la propriété intellectuelle. En effet, il est possible de simuler à peu près n’importe quoi comme on a pu le voir à l’aide de la convolution. Il suffit pour cela d’envoyer un signal en entrée d’un système et d’enregistrer ce qui en sort… Rien n’empêche donc, à priori, de « sampler » une réverbération en rack voire carrément un logiciel de convolution ! Au moins pour l’enregistrement des salles, le problème est réglé puisqu’il faut demander des autorisations et présenter le but de la manœuvre, quitte à s’acquitter parfois de droits d’utilisation de la salle pendant le temps nécessaire à l’enregistrement…
Personnellement, je pense que quelque soit l’appareil samplé, il y a une violation des droits de la propriété intellectuelle, surtout lorsque les réponses impulsionnelles sont par la suite commercialisées avec un logiciel. Maintenant, on va dire qu’il y a une courbe de tolérance sur les produits samplés, on sera plutôt dans le vert en samplant une vieille réverb vintage qui n’est plus commercialisée en ne précisant pas son nom au fichier impulse, et on sera violemment dans le rouge en récupérant les impulses de Altiverb à l’aide de méthodes de captures… Mais il va falloir que cette question soit un jour réglée, surtout avec l’avènement des applications de la convolution autres que la réverbération de salles…
Gestion de la dynamique
Comme je disais dans le chapitre sur les applications possibles de l’opération de convolution, les techniques employées jusqu’à maintenant ne tiennent pas compte des modifications dynamiques de la réponse fréquentielle des systèmes modélisés… Ces phénomènes dynamiques sont de plusieurs types, la réponse fréquentielle pouvant être personnalisable par l’utilisateur, les phénomènes pouvant être provoqués par des modulations, ou par un fonctionnement non linéaire du système. Je me dois d’ailleurs de préciser qu’aucun de ces phénomènes dynamiques ne peut être modélisé avec les processeurs de convolution dont j’ai parlé jusqu’à maintenant.
Systèmes à réponse fréquentielle personnalisable
La modification de la réponse fréquentielle globale du système par l’utilisateur, en tournant un potard par exemple sur une machine, ne peut être reproduite que si on enregistre des dizaines d’impulses pour différents réglages. Ce n’est pas toujours commode à mettre en place, car il faut suffisamment d’impulses pour que la simulation de l’appareil ne soit pas trop rigide. On se voit mal par exemple utiliser un seul réglage d’égaliseur sur l’ensemble d’un mixage.
On pourrait également utiliser du morphing entre différentes impulses ce qui servirait à limiter le nombre d’impulses nécessaires pour simuler l’appareil. Si on reprend l’exemple de l’égaliseur, l’enregistrement d’une dizaine d’impulses pour 10 positions du gain et le recours à du morphing pour modéliser les positions intermédiaires devrait permettre de simuler le gain sur une seule bande. Comme les égaliseurs sont en général multi-bandes, on pourrait ensuite enregistrer les impulses générées par les positions de chaque bande, les autres étant en position neutre, tandis que par morphing on pourrait simuler des combinaisons de positions sur chaque bande. Pour l’automation des paramètres dans un séquenceur, on pourrait enfin se baser sur les algorithmes de convolution non linéaire que nous allons détailler après et qui permettent de changer l’impulse au cours du temps.
D’ailleurs, j’ai une grande nouvelle à vous annoncer : il existe déjà des plug-ins de ce type ! Ceux-ci permettent de simuler des égaliseurs justement à l’aide de la convolution : Tritone Digital HydraTone & ValveTone '62, et Waves Ltd. Q-Clone. Je n’ai pas trouvé beaucoup d’informations techniques sur ces derniers. Je ne pourrais donc pas vous dire s’ils fonctionnent selon les principes que j’ai énoncés, qui sont juste issus de réflexions d’internautes de NoiseVault.com… Je sais juste que les produits de Tritone Digital sont basés sur des impulses d’égaliseurs professionnels, en partie du moins, et que Waves Q-Clone a une approche assez différente… En effet, sa fonction première est de simuler les égaliseurs professionnels que vous possédez déjà (même si il est livré avec quelques impulses « anonymes » de bonne facture), grâce à son moteur de convolution et son logiciel de capture qui vous guide pas à pas, ce qui permet d’appliquer l’effet de votre machine sur toutes les pistes nécessaires…
Systèmes avec modulations
Les modulations AM ou FM à basse ou haute fréquence donnent lieu à des problèmes pas du tout triviaux pour être reproduits par convolution. Pour que cela puisse fonctionner, il faudrait des changements de réponse impulsionnelle aux états extrêmes de la modulation concernée, et des courbes d’interpolation entre celles-ci qui suivent la forme d’onde modulante… De plus le changement devrait se produire à la même vitesse que la modulation, ce qui risque de complexifier les algorithmes de FFT et de faire significativement grimper la charge CPU. En plus, il faudrait ajouter un de ces éléments pour chaque oscillateur, savoir quand et à quelle vitesse les déclencher… Bref un bon gros bazar qui montre les limites de la convolution ! Pour simuler un filtre résonant, il vaudrait donc mieux programmer directement des algorithmes de modulation…
Systèmes à réponse non linéaire
Enfin, on a tout ce qui est fonctionnement non linéaire, c’est-à-dire agissant sur le volume global du signal en plus de sa réponse fréquentielle, comme avec les compresseurs, la distorsion, et tout ce qui fait intervenir des lampes ou la notion de « grain ». Cela ne peut pas être modélisé par la convolution classique car la réponse fréquentielle du système ne sera pas unique et va dépendre de la dynamique du signal d’entrée, de son gain, de ses fréquences, et de sa phase.
Pire : quelque soit l’entité simulée, il faut savoir qu’il existe toujours un phénomène de non linéarité plus ou moins conséquent qui est occulté par la simulation utilisant la convolution… Cette non linéarité sera très peu présente voir nulle pour la réverbération, mais elle sera perceptible sur tout le reste, y compris sur les entités qui peuvent être simulées de façon acceptable avec la convolution et dont j’ai pu parler avant.
Pour les simulations de baffles d’amplis guitare par exemple, ceux-ci possèdent un caractère non linéaire qui n’est pas toujours négligeable, ce qui explique que le rendu de cette application de la convolution soit meilleur avec des sons saturés qu’avec des sons clairs. Néanmoins, un baffle n’a pas autant de non linéarité qu’un compresseur, et les résultats seront tout à fait exploitables et intéressants quelque soit le son à traiter ! On sera juste plus ou moins proche du réalisme… Donc essayez avant de juger (et rabattez-vous sur des plug-ins classiques comme Matthias Becker Cortex ou Simulanalog Guitar Suite en freeware si vous n’êtes pas convaincus par la convolution).
D’ailleurs, en parlant d’amplis, lorsque cette application de la convolution a commencé à se faire connaître, les guitaristes de tout poil et de tout horizon ont d’entrée posé la question sur la faisabilité de la simulation de leurs amplis en entier avec la convolution, et pas juste de la partie baffle… Question à laquelle on répondait par un « non » massif. Jusqu’à qu’un produit miracle commence à faire parler de lui…
Le Sintefex FX8000 Replicator et la Convolution Dynamique
Le Sintefex FX8000 Replicator se fit connaître en 2001, et fut le premier appareil à fonctionner grâce à une technologie brevetée appelée la Convolution DynamiqueTM… Cet appareil en rack permet de simuler le fonctionnement d’égaliseurs et de compresseurs haut de gamme, samplés dans la mémoire de l’appareil au moyen d’impulses, et surtout qui tient compte de la non linéarité de ces appareils.
Le principe de la Convolution Dynamique est le suivant : au lieu d’enregistrer une seule impulse pour avoir une réponse fréquentielle unique, on va en enregistrer une grosse quantité avec pour chacune un niveau de signal source utilisé pour procéder à la capture qui soit différent… Ensuite, pour procéder à la convolution dynamique sur un signal quelconque, une fonction dépendante du niveau du signal va déterminer l’impulse utilisée pour chaque convolution, qui va varier en fonction du temps… Par exemple, une certaine impulse serait utilisée pour un signal d’entrée de niveau –6 dB, une autre impulse pour –5 dB, encore une autre pour –4 dB etc.
Tous les détails techniques sur cette technologie peuvent être trouvés sur le site de Sintefex, au format PDF sous forme de publications, accessibles à n’importe quel public, ce qui n’engage pas à grand chose étant donné que la technologie est brevetée ! Cela signifie qu’il faut obtenir des autorisations pour l’utiliser dans un produit commercial ou même en licence libre… En plus, le texte déposé dans le brevet est suffisamment vague pour interdire toute utilisation d’un algorithme qui se rapproche du principe de fonctionnement du Replicator, en particulier concernant le principe de la capture d’impulses à différents niveaux…
Plus loin dans la convolution non linéaire…
D’ailleurs, les techniques utilisées par Sintefex pour tenir compte de la non linéarité sont assez perfectibles… J’ai parlé de morphing précédemment et je pense que cette technique pourrait donner un rendu sonore beaucoup plus convainquant que la technique qui consiste à prendre les impulses telles quelles si le niveau d’entrée du signal est compris dans un intervalle précis. En plus, cette même technique a un gros défaut, qui est qu’elle ne tient pas compte des niveaux d’entrée précédant un changement de la réponse impulsionnelle à un instant donné. En clair, elle ne tient pas compte de la dynamique du signal d’entrée mais uniquement de son amplitude aux instants de calcul, ce qui est plutôt embêtant pour la modélisation de la distorsion d’un ampli. Ce défaut pourrait être en partie réglé par l’usage des séries de Volterra, un outil mathématique qui peut se définir comme une version complexifiée de la simple opération de convolution, et qui a déjà fait ses preuves théoriquement pour la modélisation de non linéarités, mais qui n’est pas triviale à mettre en oeuvre. Cette technique trouverait une application directe dans la gestion des enveloppes que l’on trouve dans les compresseurs, le passage du régime linéaire à un régime limité ne se faisant pas brutalement…
En tout cas, j’attends avec impatience que certains développeurs sortent des logiciels basés sur la Convolution Dynamique ou sur d’autres techniques pour les mêmes applications. Je ne suis pas arrivé à savoir si le fait qu’aucun logiciel de ce type ne soit déjà sorti soit du aux problèmes liés au brevetage (surtout que Focusrite a déjà sorti un produit basé sur la Convolution Dynamique de Sintefex via un accord, le Liquid Channel, même s’ils sont les seuls) ou si c’est du à des difficultés technologiques concernant la récupération des impulses et le moteur de convolution non linéaire, qui demande beaucoup plus de puissance que la convolution classique.
Surtout que les applications de cette technologie pourraient vraiment phénoménales, selon l’algorithme de convolution non linéaire utilisé, outre la simulation des compresseurs haut de gamme qui existe déjà, elle permettrait de simuler à peu près n’importe quoi, comme par exemple des amplis ou préamplis guitare à lampe, avec un réalisme enterrant tous les autres types de simulation, les heureux possesseurs du Replicator ayant l’air heureux du réalisme de leur machine, malgré les limitations du principe de fonctionnement… De quoi faire rêver à peu près tous les home-studistes !
Et maintenant, un exemple assez intéressant de ce que permettrait la démocratisation de la convolution non linéaire, proposé par JoneSmice : imaginez une salle de répétitions pas forcément grande dans laquelle on doit faire rentrer un groupe et enregistrer les sessions avec une bonne qualité. Avec la convolution non linéaire, il serait possible de remplacer tout le matériel du guitariste par des petites boîtes, ou alors mieux de proposer du matériel hybride où chaque élément d’un ampli guitare (le préampli, la partie amplification de puissance, et le baffle) pourraient être remplacés séparément par de la convolution en utilisant un reamp (pour convertir un signal ligne en signal haute impédance), des boîtes de DI (pour envoyer le signal en sortie de l’instrument sur une table de mixage ou dans une carte son), des Load Box (pour récupérer le signal en sortie de l’amplificateur de puissance et l’atténuer à un niveau ligne)…
On pourrait en plus « déconvoluer » le matériel présent, en procédant à la capture d’impulses permettant de le modéliser à l’aide de combinaisons de reamp / DI / Load Box, et ainsi il serait possible en enregistrant l’ampli avec un micro de changer l’ampli utilisé sur l’enregistrement de la session ! Cela pourrait même être fait en temps réel pour proposer des retours aux musiciens par casque, ce qui serait intéressant pour réduire le volume sonore des répétitions, en utilisant par exemple une batterie acoustique la plus silencieuse possible avec des triggers et des samples…
Conclusion
Quoi dire d’autre pour conclure ce dossier sinon que les technologies à base de convolution seront partout dans un proche avenir, et permettront d’augmenter encore l’importance des ordinateurs dans les studios d’enregistrement, les possibilités des home studios, ainsi que le niveau de réalisme des futures systèmes de modélisation…
Déjà aujourd’hui, l’application de la convolution aux réverbérations donne aux mixages amateurs ou professionnels des sonorités extraordinaires de réalisme, ce qui a provoqué l’intérêt des studios de production de films. Les autres applications de la convolution classique commencent à peine à faire parler d’elles, mais ce n’est que le début…
De plus, les technologies liées à la convolution progressent à pas de géant grâce à la puissance des ordinateurs présents sur le marché depuis quelques années. Les techniques de captures d’impulses ont ainsi fait l’objet de nombreuses et intéressantes recherches, comme peuvent en témoigner les sites Internet d’Audio Ease, Waves Ltd. ou Wizoo Sound Design.
On pourrait imaginer une super réverbération à convolution qui permettrait de modéliser de façon complètement personnalisable chaque élément séparé de la chaîne de prise de son et de l’entité à modéliser, dans le même genre que l’exemple de la salle de répétitions sur mesure. Et surtout, nous verrons sûrement la démocratisation de la convolution des phénomènes dynamiques, ainsi que l’extension des domaines d’application de ces technologies, peut-être même hors ondes acoustiques.
Concluons en beauté avec cette citation pleine d’à-propos de JoneSmice :
« C’EST PAS POUR RIEN QUE CONVOLUTION
RIME AUSSI BIEN AVEC REVOLUTION »
|
Liens et bibliographie
Voici la liste des livres et des pages Internet que j’ai utilisés pour concevoir ce dossier, autant de ressources qui vous permettront de chercher des informations plus précises dans les domaines qui vous auront intéressés.
Bibliographie
- Le Livre des Techniques du Son volume 1, sous la direction de Denis Mercier, en français, éditions DUNOD (2002)
- L’audionumérique, par Curtis Roads, en français, éditions DUNOD (2002)
- DAFX Digital Audio Effects, édité par Udo Zölzer, en anglais, éditions John Wiley & Sons (2002)
- Principes fondamentaux des Télécommunications, par Pascal Clerc et Pascal Xavier, éditions Ellipses (1998)
Liens généraux sur la convolution
- NoiseVault, la référence sur la convolution avec des impulses et un forum très intéressant
- Wikipédia, une encyclopédie en ligne dans plusieurs langages avec des de DSP et d’acoustique
- Une série de publications de Angelo Farina en acoustique et DSP entre autres
- Une autre série de publications par David Griesinger sur la réverbération par convolution
- Des articles sur la capture de la non linéarité, les prises de son, les algorithmes de convolution…
- Une série d’articles sur la capture d’IR, des aspects de traitement du signal, de l’acoustique
Traitement du signal et FFT
- Une applet Java expliquant le principe de la convolution directe
- Le site des convolutions BruteFIR et AlmusVCU open source avec des explications sur le code
- MusicDSP, dédié à la programmation en traitement du signal
- Un cours gratuit et très complet de traitement du signal
- DSP Dimension, des tutoriaux et du code de traitement du signal
- Un algorithme de FFT open source avec une page de liens très intéressante
- Un site d’explication du principe de la FFT assez général
- Un autre site d’explication de la FFT avec beaucoup de détails sur les différents algorithmes
Acoustique, réverbération et capture des impulses
- Un article sur la prise de son d’une salle de concert pour différentes techniques de spatialisation
- La même chose pour une autre salle de concert avec les fichiers de mesures
- Un article rapide sur les techniques de capture des IR, utilisées par Waves Ltd.
- Quelques infos en fichiers PDF sur l’utilisation pratique de logiciels de déconvolution
- Un article sur la méthode MLS de capture d’impulses, par Angelo Farina
- Un autre lien sur le principe et les caractéristiques de la méthode MLS
Modélisation de la non linéarité