Passer de la haute résolution au format 16 bits/44 kHz est un sale boulot, mais il faut bien que quelqu'un le fasse.
Pour la production de musique, le format audionumérique de destination possède généralement une taille de mot de 16 bits et une fréquence d’échantillonnage de 44,1 kHz. Les vieux systèmes réalisaient les traitements internes en 16 bits/44,1 kHz, ce qui n’était pas sans poser problème : à chaque opération (changement du niveau, insertion d’un égaliseur, etc.), le résultat des calculs appliqués était arrondi en 16 bits. Après une succession d’opérations, ces approximations s’accumulaient et engendraient une sorte de « flou sonore ».
L’étape technologique suivante a permis d’augmenter la résolution interne des systèmes audionumériques. Les opérations mathématiques produisant un résultat « excédant » les 16 bits n’étaient plus un problème car les traitements internes en 24, 32, 64 et même 128 bits étaient devenus monnaie courante. Tant que l’audio restait dans le système, le dépassement de la résolution n’était plus un problème.
De nos jours, les systèmes d’enregistrement sur disque dur écrivent et lisent en 24, 32 ou 64 bits et le reste de vos équipements (console numérique, synthés numériques, etc.) possède également une résolution interne suffisamment élevée. Pourtant, malgré l’introduction de certains formats audio à haute résolution, votre production sera très vraisemblablement diffusée sous ses formes plus populaires, c’est-à-dire à partir d’un CD audio ou d’un fichier mp3 en 16 bits/44,1 kHz.
Qu’est-il advenu des « bits supplémentaires » ? Avant l’avènement du dithering, ils étaient tout bonnement écartés (imaginez dans quel état étaient ces pauvres bits, surtout après avoir été appelés « bits de poids faible » pendant toute leur vie). Concrètement, cela se manifestait par exemple par des queues de reverb coupées de façon abrupte dès qu’elles passaient sous la limite des 16 bits. Vous avez peut-être déjà entendu un genre de « bourdonnement » à la fin d’un fondu de sortie (fade out) ou d’une queue de reverb… Il s’agit du son des bits supplémentaires qui ont été impitoyablement « muselés ».
Le dithering à la rescousse
Le dithering est un concept qui, dans son expression la plus simple, ajoute un bruit aux signaux de niveau extrêmement faible en utilisant les données des bits de poids faible (LSB) pour influer sur le son des bits de poids fort (MSB). Un peu comme si leur esprit survivait dans le son de l’enregistrement malgré leur disparition.
Le fait d’amputer des bits est appelé troncature. Certains grands partisans du dithering affirment que cette technique élude en quelque sorte le processus de troncature. Mais c’est une idée fausse. Avec ou sans dithering, lorsqu’un signal en 24 bits finit sur un CD en 16 bits, huit bits ont été tronqués et ne sont plus audibles. Néanmoins, il y a une différence entre le dithering et la troncature bête et méchante.
Le problème de la troncature
Dans un signal tronqué, la raison pour laquelle vous entendez une sorte de bourdonnement à la fin d’un fondu réside dans le fait que le bit de poids le plus faible, qui essaie de suivre le signal, passe alternativement de 0 à 1. Ce bourdonnement est appelé bruit de quantification parce qu’il apparaît pendant le processus de quantification de l’audio, c’est à dire quand le flux audio est transformé en pas distincts. Dans un enregistrement en 24 bits, le niveau est échelonné sur 256 pas (en raison des 8 bits de poids faible sous les 16 bits). Mais une fois que l’enregistrement a été tronqué, la résolution ne permet plus de reproduire tous ces changements de niveau.
Toutefois, gardez bien à l’esprit que la différence se fait sur les signaux de niveau très faible. Pour un mix punk-rock-indus dans lequel tous les niveaux sont dans le rouge, il est probable que vous n’aurez même pas besoin d’une résolution de 16 bits. Mais si vous essayez d’enregistrer fidèlement l’acoustique d’un lieu jusque dans sa moindre résonance, vous aurez besoin d’une bonne résolution pour les portions de signal de niveau très réduit.
Fonctionnement du dithering
Partons d’un signal enregistré en 24 bits afin de raisonner à partir d’un exemple concret. Le processus de dithering ajoute un bruit aléatoire aux huit bits de poids le plus faible parmi les 24 bits. Ce bruit n’est pas le même dans les deux canaux pour ne pas dégrader la séparation stéréo.
Il peut sembler bizarre qu’ajouter du bruit puisse améliorer le son. Pourtant, on utilisait déjà un procédé analogue avec le signal de bias (prémagnétisation) des magnétophones à bande analogique. En effet, les bandes analogiques ne sont linéaires (sans distorsion) que sur une partie relativement étroite de leur courbe d’hystérésis. Tout le monde sait que de la distorsion apparaît quand on entre trop fort sur la bande. En revanche, beaucoup ignorent le fait que sous un certain niveau, le signal peut être également horriblement distordu. La prémagnétisation ajoute un signal sonore imperceptible, car hors du spectre audible, dont le niveau se situe à la limite inférieure de la région linéaire. Les signaux de niveau réduit sont ajoutés au signal de prémagnétisation de sorte que ce dernier les amplifie pour qu’ils atteignent la région linéaire de la bande où ils seront reproduits sans distorsion.
De même, le fait d’ajouter du bruit aux huit bits de poids faible augmente leur amplitude et transpose les informations qu’ils contiennent dans les bits de poids plus élevé. Ainsi, la partie la plus faible de la plage dynamique n’est plus en corrélation directe avec le signal original mais résulte de la combinaison du bruit et des informations présentes dans les huit bits de poids faible. Ce procédé réduit le bruit de quantification qui est remplacé par une sorte de « chuintement » doux modulé par les informations de niveau réduit. À l’écoute, l’avantage le plus perceptible concerne les fondus, qui deviennent plus doux et réalistes, mais également la reproduction des détails sonores.
Bien que l’ajout de bruit semble être a priori une mauvaise idée, le bénéfice psycho-acoustique final est réel. Étant donné que le bruit ajouté par le processus de dithering possède une réponse en fréquence et un niveau constants, nos oreilles arrivent facilement à en extraire le contenu (le signal). Nous avons vécu suffisamment longtemps avec du bruit pour qu’un niveau d’environ 90 dB soit tolérable, tout spécialement si cela nous permet de percevoir une dynamique subjective plus grande.
Mais ce n’est pas tout : il existe différents types de bruit de dithering plus ou moins perceptibles. Le dithering peut être large bande, auquel cas la distorsion est rapportée à son minimum tandis que le bruit est légèrement plus audible. Inversement, un dithering sur une bande plus étroite entraînera un bruit perçu plus faible mais laissera passer une très légère distorsion.
Sculpter le bruit
Le plugin de mastering iZtope Ozone possède une section de dithering qui propose différents types de dithering, des options permettant de sculpter le bruit, la possibilité de réduire la résolution de 8 à 24 bits et tout un choix de montants de dithering.
Pour rendre le dithering encore plus discret, les outils de structure du bruit (noise shaping) répartissent le bruit dans le spectre audio de sorte que sa plus grande partie soit cantonnée aux régions où notre système auditif est le moins sensible (notamment les hautes fréquences). Certaines courbes de structure du bruit sont extrêmement complexes et présentent des creux importants dans les régions où nos oreilles sont les plus sensibles (généralement, le médium).
Une fois encore, cela rappelle le bias des bandes analogiques qui se situe généralement autour des 100 kHz, bien loin du spectre audible. Bien entendu, de telles fréquences sont inaccessibles dans un système qui échantillonne à 44,1 ou même 96 kHz, mais différents algorithmes de noise shaping poussent le signal de dithering aussi haut que possible, juste sous la fréquence de Nyquist qui correspond à la moitié de la fréquence d’échantillonnage, autrement dit à la fréquence la plus haute que le système peut enregistrer et restituer.
Les fabricants utilisent différents algorithmes de structure du bruit… Certains outils permettent de sélectionner les algorithmes de dithering et de structure du bruit, autrement dit vous pourrez choisir la combinaison qui donne le meilleur résultat en fonction de la musique sur laquelle vous travaillez. Tous les algorithmes ne sont pas équivalents, donc leur rendu sonore sera différent.
Les règles du dithering
La règle d’or du dithering consiste à ne pas traiter deux fois le signal. Le dithering doit être effectué uniquement lorsque vous convertissez la source audio à haute résolution dans le format CD final.
Par exemple, si vous souhaitez traiter un fichier 16 bits contenant déjà un dithering dans un éditeur audio à haute résolution, l’éditeur en question devrait normalement préserver le signal de dithering. Dans ce cas, au moment de reporter la version éditée en 16 bits, effectuez simplement le transfert des données sans appliquer de dithering.
Un autre problème peut éventuellement apparaître si vous demandez à un studio de mastering ou à une société de pressage de faire un fondu enchaîné avec deux fichiers en 16 bits contenant un dithering. Des artefacts peuvent apparaître lors du fondu enchaîné des deux fichiers. Il vaut mieux commencer par faire le crossfade, puis ajouter le dithering au résultat.
Vérifiez également que la fonction de dithering des différentes applications que vous utilisez est désactivée par défaut ou qu’elle n’a pas été activée accidentellement puis enregistrée dans les préférences. Généralement, il vaut mieux désactiver la fonction de dithering et ne l’utiliser que lorsque vous en avez besoin.
À ce sujet, notez que Cubase (à partir de SX) possède un plugin de dithering UV22 conçu par Apogee. Vous pouvez l’insérer dans la sortie master. Mais n’oubliez pas sa présence au moment où vous déciderez d’ajouter un plugin tel que le Waves L1-Ultramaximizer+ car il possède également une fonction de dithering qui est activée par défaut lorsque vous insérez le plugin. Par conséquent, vérifiez bien que vous n’appliquez pas de dithering deux fois de suite et désactivez cette fonction dans chaque outil utilisé.
Si vous insérez le plugin de dithering de Cubase, il sera activé par défaut. Assurez-vous donc que tous les autres plugins de mastering que vous avez ajoutés n’appliquent pas de dithering (sur la capture d’écran, le dithering Waves est éteint). Ou désactivez la section de dithering de Cubase et utilisez plutôt l’algorithme d’un autre plugin.
La meilleure façon de constater les avantages du dithering est d’amplifier au maximum certains signaux de niveau très réduit puis de comparer les performances des différents algorithmes de dithering et de structure du bruit. Si votre musique possède une réponse dynamique naturelle, un dithering adapté peut effectivement adoucir le son et lui garantir l’absence de distorsion de quantification lorsque vous réduisez la résolution à 16 bits.
Originellement écrit en anglais par Craig Anderton et publié sur Harmony Central.
Traduit en français avec leur aimable autorisation.