Se connecter
Se connecter

ou
Créer un compte

ou
Pédago
146 réactions

Tout savoir sur le dithering - Le dithering fait du bruit

Passer de la haute résolution au format 16 bits/44 kHz est un sale boulot, mais il faut bien que quelqu'un le fasse.

Pour la produc­tion de musique, le format audio­nu­mé­rique de desti­na­tion possède géné­ra­le­ment une taille de mot de 16 bits et une fréquence d’échan­tillon­nage de 44,1 kHz. Les vieux systèmes réali­saient les trai­te­ments internes en 16 bits/44,1 kHz, ce qui n’était pas sans poser problème : à chaque opéra­tion (chan­ge­ment du niveau, inser­tion d’un égali­seur, etc.), le résul­tat des calculs appliqués était arrondi en 16 bits. Après une succes­sion d’opé­ra­tions, ces approxi­ma­tions s’ac­cu­mu­laient et engen­draient une sorte de « flou sonore ».

 

L’étape tech­no­lo­gique suivante a permis d’aug­men­ter la réso­lu­tion interne des systèmes audio­nu­mé­riques. Les opéra­tions mathé­ma­tiques produi­sant un résul­tat « excé­dant » les 16 bits n’étaient plus un problème car les trai­te­ments internes en 24, 32, 64 et même 128 bits étaient deve­nus monnaie courante. Tant que l’au­dio restait dans le système, le dépas­se­ment de la réso­lu­tion n’était plus un problème.

 

De nos jours, les systèmes d’en­re­gis­tre­ment sur disque dur écrivent et lisent en 24, 32 ou 64 bits et le reste de vos équi­pe­ments (console numé­rique, synthés numé­riques, etc.) possède égale­ment une réso­lu­tion interne suffi­sam­ment élevée. Pour­tant, malgré l’in­tro­duc­tion de certains formats audio à haute réso­lu­tion, votre produc­tion sera très vrai­sem­bla­ble­ment diffu­sée sous ses formes plus popu­laires, c’est-à-dire à partir d’un CD audio ou d’un fichier mp3 en 16 bits/44,1 kHz.

 

Qu’est-il advenu des « bits supplé­men­taires » ? Avant l’avè­ne­ment du dithe­ring, ils étaient tout bonne­ment écar­tés (imagi­nez dans quel état étaient ces pauvres bits, surtout après avoir été appe­lés « bits de poids faible » pendant toute leur vie). Concrè­te­ment, cela se mani­fes­tait par exemple par des queues de reverb coupées de façon abrupte dès qu’elles passaient sous la limite des 16 bits. Vous avez peut-être déjà entendu un genre de « bour­don­ne­ment » à la fin d’un fondu de sortie (fade out) ou d’une queue de reverb… Il s’agit du son des bits supplé­men­taires qui ont été impi­toya­ble­ment « muse­lés ».

 

Le dithe­ring à la rescousse

 

Le dithe­ring est un concept qui, dans son expres­sion la plus simple, ajoute un bruit aux signaux de niveau extrê­me­ment faible en utili­sant les données des bits de poids faible (LSB) pour influer sur le son des bits de poids fort (MSB). Un peu comme si leur esprit survi­vait dans le son de l’en­re­gis­tre­ment malgré leur dispa­ri­tion.

 

Le fait d’am­pu­ter des bits est appelé tron­ca­ture. Certains grands parti­sans du dithe­ring affirment que cette tech­nique élude en quelque sorte le proces­sus de tron­ca­ture. Mais c’est une idée fausse. Avec ou sans dithe­ring, lorsqu’un signal en 24 bits finit sur un CD en 16 bits, huit bits ont été tronqués et ne sont plus audibles. Néan­moins, il y a une diffé­rence entre le dithe­ring et la tron­ca­ture bête et méchante.

 

Le problème de la tron­ca­ture

 

Dans un signal tronqué, la raison pour laquelle vous enten­dez une sorte de bour­don­ne­ment à la fin d’un fondu réside dans le fait que le bit de poids le plus faible, qui essaie de suivre le signal, passe alter­na­ti­ve­ment de 0 à 1. Ce bour­don­ne­ment est appelé bruit de quan­ti­fi­ca­tion parce qu’il appa­raît pendant le proces­sus de quan­ti­fi­ca­tion de l’au­dio, c’est à dire quand le flux audio est trans­formé en pas distincts. Dans un enre­gis­tre­ment en 24 bits, le niveau est éche­lonné sur 256 pas (en raison des 8 bits de poids faible sous les 16 bits). Mais une fois que l’en­re­gis­tre­ment a été tronqué, la réso­lu­tion ne permet plus de repro­duire tous ces chan­ge­ments de niveau.

 

Toute­fois, gardez bien à l’es­prit que la diffé­rence se fait sur les signaux de niveau très faible. Pour un mix punk-rock-indus dans lequel tous les niveaux sont dans le rouge, il est probable que vous n’au­rez même pas besoin d’une réso­lu­tion de 16 bits. Mais si vous essayez d’en­re­gis­trer fidè­le­ment l’acous­tique d’un lieu jusque dans sa moindre réso­nance, vous aurez besoin d’une bonne réso­lu­tion pour les portions de signal de niveau très réduit.

 

Fonc­tion­ne­ment du dithe­ring

 

Partons d’un signal enre­gis­tré en 24 bits afin de raison­ner à partir d’un exemple concret. Le proces­sus de dithe­ring ajoute un bruit aléa­toire aux huit bits de poids le plus faible parmi les 24 bits. Ce bruit n’est pas le même dans les deux canaux pour ne pas dégra­der la sépa­ra­tion stéréo.

 

Il peut sembler bizarre qu’ajou­ter du bruit puisse amélio­rer le son. Pour­tant, on utili­sait déjà un procédé analogue avec le signal de bias (préma­gné­ti­sa­tion) des magné­to­phones à bande analo­gique. En effet, les bandes analo­giques ne sont linéaires (sans distor­sion) que sur une partie rela­ti­ve­ment étroite de leur courbe d’hys­té­ré­sis. Tout le monde sait que de la distor­sion appa­raît quand on entre trop fort sur la bande. En revanche, beau­coup ignorent le fait que sous un certain niveau, le signal peut être égale­ment horri­ble­ment distordu. La préma­gné­ti­sa­tion ajoute un signal sonore imper­cep­tible, car hors du spectre audible, dont le niveau se situe à la limite infé­rieure de la région linéaire. Les signaux de niveau réduit sont ajou­tés au signal de préma­gné­ti­sa­tion de sorte que ce dernier les ampli­fie pour qu’ils atteignent la région linéaire de la bande où ils seront repro­duits sans distor­sion.

 

De même, le fait d’ajou­ter du bruit aux huit bits de poids faible augmente leur ampli­tude et trans­pose les infor­ma­tions qu’ils contiennent dans les bits de poids plus élevé. Ainsi, la partie la plus faible de la plage dyna­mique n’est plus en corré­la­tion directe avec le signal origi­nal mais résulte de la combi­nai­son du bruit et des infor­ma­tions présentes dans les huit bits de poids faible. Ce procédé réduit le bruit de quan­ti­fi­ca­tion qui est remplacé par une sorte de « chuin­te­ment » doux modulé par les infor­ma­tions de niveau réduit. À l’écoute, l’avan­tage le plus percep­tible concerne les fondus, qui deviennent plus doux et réalistes, mais égale­ment la repro­duc­tion des détails sonores.

 

Bien que l’ajout de bruit semble être a priori une mauvaise idée, le béné­fice psycho-acous­tique final est réel. Étant donné que le bruit ajouté par le proces­sus de dithe­ring possède une réponse en fréquence et un niveau constants, nos oreilles arrivent faci­le­ment à en extraire le contenu (le signal). Nous avons vécu suffi­sam­ment long­temps avec du bruit pour qu’un niveau d’en­vi­ron 90 dB soit tolé­rable, tout spécia­le­ment si cela nous permet de perce­voir une dyna­mique subjec­tive plus grande.

 

Mais ce n’est pas tout : il existe diffé­rents types de bruit de dithe­ring plus ou moins percep­tibles. Le dithe­ring peut être large bande, auquel cas la distor­sion est rappor­tée à son mini­mum tandis que le bruit est légè­re­ment plus audible. Inver­se­ment, un dithe­ring sur une bande plus étroite entraî­nera un bruit perçu plus faible mais lais­sera passer une très légère distor­sion.

 

Sculp­ter le bruit

 

 

iZotope Ozone

Le plugin de maste­ring iZtope Ozone possède une section de dithe­ring qui propose diffé­rents types de dithe­ring, des options permet­tant de sculp­ter le bruit, la possi­bi­lité de réduire la réso­lu­tion de 8 à 24 bits et tout un choix de montants de dithe­ring.


 

Pour rendre le dithe­ring encore plus discret, les outils de struc­ture du bruit (noise shaping) répar­tissent le bruit dans le spectre audio de sorte que sa plus grande partie soit canton­née aux régions où notre système audi­tif est le moins sensible (notam­ment les hautes fréquences). Certaines courbes de struc­ture du bruit sont extrê­me­ment complexes et présentent des creux impor­tants dans les régions où nos oreilles sont les plus sensibles (géné­ra­le­ment, le médium).

 

Une fois encore, cela rappelle le bias des bandes analo­giques qui se situe géné­ra­le­ment autour des 100 kHz, bien loin du spectre audible. Bien entendu, de telles fréquences sont inac­ces­sibles dans un système qui échan­tillonne à 44,1 ou même 96 kHz, mais diffé­rents algo­rithmes de noise shaping poussent le signal de dithe­ring aussi haut que possible, juste sous la fréquence de Nyquist qui corres­pond à la moitié de la fréquence d’échan­tillon­nage, autre­ment dit à la fréquence la plus haute que le système peut enre­gis­trer et resti­tuer.

 

Les fabri­cants utilisent diffé­rents algo­rithmes de struc­ture du bruit… Certains outils permettent de sélec­tion­ner les algo­rithmes de dithe­ring et de struc­ture du bruit, autre­ment dit vous pour­rez choi­sir la combi­nai­son qui donne le meilleur résul­tat en fonc­tion de la musique sur laquelle vous travaillez. Tous les algo­rithmes ne sont pas équi­va­lents, donc leur rendu sonore sera diffé­rent.

 

Les règles du dithe­ring

 

La règle d’or du dithe­ring consiste à ne pas trai­ter deux fois le signal. Le dithe­ring doit être effec­tué unique­ment lorsque vous conver­tis­sez la source audio à haute réso­lu­tion dans le format CD final.

 

Par exemple, si vous souhai­tez trai­ter un fichier 16 bits conte­nant déjà un dithe­ring dans un éditeur audio à haute réso­lu­tion, l’édi­teur en ques­tion devrait norma­le­ment préser­ver le signal de dithe­ring. Dans ce cas, au moment de repor­ter la version éditée en 16 bits, effec­tuez simple­ment le trans­fert des données sans appliquer de dithe­ring.

 

Un autre problème peut éven­tuel­le­ment appa­raître si vous deman­dez à un studio de maste­ring ou à une société de pres­sage de faire un fondu enchaîné avec deux fichiers en 16 bits conte­nant un dithe­ring. Des arte­facts peuvent appa­raître lors du fondu enchaîné des deux fichiers. Il vaut mieux commen­cer par faire le cross­fade, puis ajou­ter le dithe­ring au résul­tat.

 

Véri­fiez égale­ment que la fonc­tion de dithe­ring des diffé­rentes appli­ca­tions que vous utili­sez est désac­ti­vée par défaut ou qu’elle n’a pas été acti­vée acci­den­tel­le­ment puis enre­gis­trée dans les préfé­rences. Géné­ra­le­ment, il vaut mieux désac­ti­ver la fonc­tion de dithe­ring et ne l’uti­li­ser que lorsque vous en avez besoin.

 

À ce sujet, notez que Cubase (à partir de SX) possède un plugin de dithe­ring UV22 conçu par Apogee. Vous pouvez l’in­sé­rer dans la sortie master. Mais n’ou­bliez pas sa présence au moment où vous déci­de­rez d’ajou­ter un plugin tel que le Waves L1-Ultra­maxi­mi­zer+ car il possède égale­ment une fonc­tion de dithe­ring qui est acti­vée par défaut lorsque vous insé­rez le plugin. Par consé­quent, véri­fiez bien que vous n’ap­pliquez pas de dithe­ring deux fois de suite et désac­ti­vez cette fonc­tion dans chaque outil utilisé.

 

 

Dithering dans Cubase

Si vous insé­rez le plugin de dithe­ring de Cubase, il sera activé par défaut. Assu­rez-vous donc que tous les autres plugins de maste­ring que vous avez ajou­tés n’ap­pliquent pas de dithe­ring (sur la capture d’écran, le dithe­ring Waves est éteint). Ou désac­ti­vez la section de dithe­ring de Cubase et utili­sez plutôt l’al­go­rithme d’un autre plugin.


 

La meilleure façon de consta­ter les avan­tages du dithe­ring est d’am­pli­fier au maxi­mum certains signaux de niveau très réduit puis de compa­rer les perfor­mances des diffé­rents algo­rithmes de dithe­ring et de struc­ture du bruit. Si votre musique possède une réponse dyna­mique natu­relle, un dithe­ring adapté peut effec­ti­ve­ment adou­cir le son et lui garan­tir l’ab­sence de distor­sion de quan­ti­fi­ca­tion lorsque vous rédui­sez la réso­lu­tion à 16 bits.

 

Origi­nel­le­ment écrit en anglais par Craig Ander­ton et publié sur Harmony Central.

Traduit en français avec leur aimable auto­ri­sa­tion.


Vous souhaitez réagir à cet article ?

Se connecter
Devenir membre