Vous avez sûrement remarqué que la fidélité de restitution du son à partir d'une cassette n’est pas toujours de bonne qualité, notamment à cause de la présence de bruit de fond (appelé souffle), particulièrement gênant. Le système Dolby NR (Noise Reduction) a été conçu dans le but de supprimer ce bruit. Nous allons détailler son principe de fonctionnement.
Le procédé de filtrage de bruit du Dolby NR est assuré par un compander (pour compressor / expander, soit en français : compresseur / expanseur), qui opère en deux temps :
1. Lors de l’enregistrement d’un signal sur une cassette, le compander compresse le son, c’est à dire qu’il augmente le niveau sonore des sons faibles par rapport aux sons forts. On obtient donc le schéma suivant :
2. Lors de la lecture de la cassette, c’est la partie expanseur qui est utilisée : il va réduire le bruit de fond de la cassette. En effet, en réduisant le niveau sonore des sons faibles afin de le remettre à celui d’origine (i.e. avant le traitement par le compresseur), il réduit aussi le niveau sonore du bruit présent sur la cassette. Voici le schéma de fonctionnement de l’expanseur :
On obtient donc finalement un son dont le souffle est beaucoup plus faible.
Le compander
Admettons que l’on ait à copier de la musique sur une cassette, en voulant supprimer le souffle, et sans système Dolby NR.
Compression…
Pour éviter que les passages de musique de faible niveau sonore ne soient couverts par le bruit de fond, il faut augmenter le niveau d’enregistrement. Cependant, nous ne pouvons pas le laisser à un niveau élevé indéfiniment car lors des passages de musiques forts, cela entraînerait une forte distorsion sonore. Il faudrait en fait augmenter le niveau sonore lorsque la musique est faible et le diminuer lorsqu’elle redevient forte.
… et expansion
Admettons maintenant que notre enregistrement soit compressé. Il faut abaisser le volume pendant les passages initialement faibles pour que la musique redevienne conforme à l’original (c’est le rôle de l’expanseur).
Par le système énoncé ci-dessus, on constitue ainsi un système manuel de Noise Reduction. Il suffit maintenant de le remplacer par un système électronique, appelé compander large bande. Celui-ci fonctionne donc de la manière suivante : pour les signaux forts, il ne doit rien changer (figure 1) tandis que pour les sons faibles, il doit réduire le souffle (figure 2).
Ci-contre, figure 1 Principe de fonctionnement du compander large bande sur les signaux forts. |
Ci dessus, figure 2 Principe de fonctionnement du compander large bande sur les signaux faibles |
Cependant, un problème réside toujours : le souffle de la cassette reste présent pendant les passages de musiques fortes. En effet, le système de Noise Reduction ainsi conçu ne supprime pas la présence du souffle pendant les passages forts. Nous avons donc une « modulation » de bruit, c’est à dire une variation du niveau sonore du bruit tout au long de la cassette. Mais est-ce réellement gênant ?
Prenons l’exemple suivant : nous pouvons identifier le bruit de la pluie qui tombe avec le bruit qui est présent sur une cassette. Généralement, le bruit de la pluie ne nous gène pas pour la perception des bruits environnants. En effet, nous nous habituons très vite à un bruit constant, et seul le changement ou l’arrêt de ce bruit attire notre attention. En d’autres termes, nous sommes sensibles aux changements sonores imprévisibles (qui signifient instinctivement pour l’homme un danger).
Donc, quelle que soit la raison, une variation du niveau sonore du souffle d’une cassette est beaucoup plus gênante que sa présence à un niveau sonore constant. Or un compander, de par son principe de fonctionnement, fait justement varier le niveau sonore du souffle. Il semble donc au premier abord que cette modulation du bruit soit assez gênante.
Pourtant, il existe un procédé se basant sur les caractéristiques de l’oreille humaine et permettant de rendre cette variation du bruit imperceptible pour l’homme : le masquage.
Le masquage de fréquences
Le schéma suivant représente le seuil d’audition de l’oreille humaine (i.e. le niveau au dessus duquel l’oreille humaine commence à percevoir un son). La courbe « a » correspond au seuil d’audition dans un environnement silencieux, tandis que la courbe « b » correspond au seuil d’audition d’un son quelconque en présence d’un signal dont les fréquences s’étalent autour de 500 Hz, et d’assez forte amplitude.
On peut remarquer que le seuil à partir duquel l’oreille humaine perçoit un son dépend énormément de la fréquence ce ce son. En effet, nous percevons beaucoup plus facilement un son faible à 4 kHz qu’à 50 Hz ou 15 kHz. De plus, à partir de 25 kHz, quel que soit le niveau sonore, l’oreille humaine ne perçoit plus aucun son.
Considérons maintenant la courbe en présence du signal sonore de 500 Hz. On voit très nettement qu’en présence de ce signal, il est difficile de percevoir d’autres sons d’une fréquence voisine des 500 Hz. C’est cette augmentation du seuil qui est nommé masquage : en présence d’un signal de 500 Hz, un bruit d’une fréquence proche de 500 Hz est masqué. Ce bruit peut donc augmenter sans que l’oreille humaine ne le perçoive à condition de ne pas dépasser le seuil délimité par la courbe b. Cependant, dans les autres parties du spectre sonore (par exemple à 5 KHz), le bruit qui était audible sans le signal de 500 Hz, le restera tout autant en sa présence.
Comment utiliser le masquage pour le système de réduction de bruit ? Comme nous l’avons vu, le masquage d’un son ne se produit pas forcement lorsqu’un signal fort est présent ; tout dépend du spectre de ce signal (c’est à dire des fréquences qui le composent). Ainsi, si un système de réduction de bruit est uniquement sensible au niveau sonore, la variation du bruit est inévitablement audible.
Un tel système, c’est à dire un compander large bande, est un bon système sur de la musique telle que du rock ou un orchestre symphonique, car ces styles de musique contiennent une multitude de fréquences différentes, et la variation du bruit sera masquée dans de nombreuses fréquences. D’autre part, pendant les passages silencieux, le compander fournira une réduction du bruit totale.
Par contre, sur des instruments jouant en solo, les résultats sont différents. Le compander large bande réagira de la même façon qu’avec du rock, c’est à dire permettra au bruit d’augmenter durant les passages forts. Cependant, contrairement au rock, des instruments jouant seuls reproduisent seulement une petite partie du spectre sonore, ce qui donne une courbe de masquage ressemblant plus à celle de la courbe b. Cela signifie que l’augmentation du niveau du souffle sera audible, car certaines des fréquences du spectre de ce souffle ne seront pas masquées.
Pour créer un système de réduction de bruit parfait, le système Dolby NR doit donc non seulement être sensible au niveau sonore de la musique, mais aussi à son spectre. Afin de fournir une réduction du souffle constante, le système Dolby doit permettre une réduction du bruit à toutes les fréquences où il n’y a pas de signaux d’amplitude élevée, et donc pas de possibilité de masquage. Par contre, le niveau sonore du bruit peut augmenter aux alentours des fréquences des sons de forte amplitude, à condition qu’il reste en dessous du seuil du masquage.
Il faut maintenant garder à l’esprit que le bruit est réduit par l’augmentation du gain durant l’enregistrement, puis sa réduction pendant la lecture. On ne peut augmenter le gain des fréquences où sont présents des signaux de fortes amplitudes, sous peine de voir apparaître un phénomène de saturation du signal, nuisant alors à la qualité de la musique enregistrée. Heureusement, grâce au phénomène de masquage, nous n’avons justement pas besoin d’augmenter le gain pour ces fréquences.
Par conséquent, en l’absence de signal, le système de réduction de bruit idéal devra appliquer un gain de niveau constant pendant l’enregistrement, et le réduire ensuite durant la lecture de la cassette, afin de supprimer le bruit. Ensuite, lorsqu’un son fort d’une fréquence particulière survient, le gain doit être réduit pour cette fréquence et dans son voisinage proche, afin d’éviter la saturation. C’est ce qui est appelé « le principe du dernier traitement ».
Ce schéma montre le gain que fournit le compresseur lorsqu’aucun signal n’est présent (courbe a) et lorsqu’un signal de 500 Hz est présent (courbe b). On a donc bien à 500 Hz et dans son voisinage proche une réduction du gain.
Durant la lecture de la cassette (et donc de l’expansion), le phénomène inverse doit se produire, c’est à dire que le niveau sonore de toutes les fréquences doit être remis à celui d’origine, avant le passage dans le compresseur. On obtient donc ce schéma.
Ainsi, le niveau sonore du souffle ne varie que pour des fréquences égales et proches des signaux d’amplitudes forts, où l’effet de masquage se produit. Dans toutes les autres zones du spectre, le souffle reste réduit à un niveau constant.
Grâce à ce système, il n’y a donc plus de variation de bruit audible.
Problèmes liés à l’électronique
Le système Dolby, comme tout système électronique, a ses limites. Le rôle principal du compresseur est de diminuer le contraste entre le niveau sonore des signaux faibles et celui des signaux forts. Cela signifie que si le signal était faible et devient soudain fort, le compresseur doit réagir en réduisant le gain. Cependant, parce que le compresseur ne sait pas à l’avance que le signal va devenir fort, il va fournir trop de gain pendant un intervalle de temps correspondant à son temps de réponse.
Voici un exemple de ce qui peut se produire :
Ce petit dépassement du gain provoque une distorsion du signal qui est audible. A première vue, il semble que ce problème puisse être facilement résolu en augmentant la vitesse de réponse (le temps d’attaque), rendant la distorsion inaudible. Pour savoir si cela peut fonctionner, il faut considérer un compresseur comme une sorte de modulateur d’amplitude. Quand une onde sinusoïdale est modifiée, par exemple en changeant son amplitude, elle ne reste pas une simple sinusoïde. Elle devient un signal avec un spectre beaucoup plus complexe (contenant plus d’une fréquence). Plus la sinusoïde originale est modifiée, plus les fréquences latérales (en anglais « sidebands ») sont générées. En outre, plus le compresseur agit rapidement, plus la largeur de la bande de fréquences latérales s’agrandit, ce qui a pour conséquence une augmentation du bruit lié à la compression.
C’est donc le principe de la radio AM (amplitude modulation), qui s’applique au compresseur. Le compresseur soumet le signal d’entrée, qui est l’équivalent de la porteuse de la radio AM, à un gain variable. Les amplitudes de chaque fréquence du signal sont ainsi changées, ce qui entraîne l’apparition de fréquences latérales pour chaque fréquence.
Figure 2 : Bande de fréquences utilisées lors d’une attaque lente du compresseur
Figure 3 : Bande de fréquences utilisées lors d’une attaque rapide du compresseur
On a vu que plus le temps d’attaque est rapide, plus les fréquences des sidebands s’éloignent de la fréquence d’origine. Si le temps d’attaque est long, par exemple 10 ms, les sidebands se trouveront près de la fréquence du signal d’origine, comme le montre la figure 2. Elles seront donc masquées par le signal principal. Par contre, du fait du temps d’attaque court, le signal sera sujet à de la distorsion.
Par conséquent, pour un compresseur, le choix du temps d’attaque est un compromis entre une distorsion en aval du signal causéz par l’overshoot et un « click » présent avec des attaques courtes.
A première vue, il semblerait que le « click » causé par une attaque rapide soit enlevé lors de l’expansion, du fait de la complémentarité des deux systèmes (compresseur / expanseur). Cependant, cela voudrait dire que l’expanseur doit générer des sidebands identiques avec des polarités opposées à celles crées par le compresseur. Malheureusement, les deux systèmes n’étant pas parfaits, cela se révèle impossible. Le résultat est donc la présence de ce « clic » caractéristique.
La solution à ces problèmes de temps d’attaque n’est donc pas unique. De telles distorsions peuvent être évitées par une combinaison des deux systèmes. Premièrement, l’overshoot sur les signaux de basses à moyennes amplitudes n’est pas gênant, car il y a très peu de distorsion. On peut donc utiliser une attaque longue sur de tels signaux.
Cependant, elle ne peut être utilisée sur des signaux de grande amplitude, car la distorsion est alors très grande. C’est pourquoi les temps d’attaque doivent pouvoir varier au cours du temps. Ainsi, il est possible de mettre une attaque rapide aux moments où le clic peut être masqué. Cela implique la connaissance du spectre du signal à ces instants, et entraîne aussi le choix d’un temps d’attaque qui permet d’utiliser les avantages du masquage.
En créant un système de réduction de bruit répondant à toutes ces caractéristiques, les laboratoires Dolby ont donné naissance à un système Dolby NR « parfait », celui qui est intégré dans la plupart des chaînes hi-fi. Néanmoins, il faut savoir qu’il existe différents systèmes Dolby NR, avec des degrés d’efficacité également différents. Classés par ordre croissant de performance, les systèmes Dolby sont les suivants :
- le Dolby B
- le Dolby C
- le Dolby S
Le Dolby B est le système le plus fréquemment utilisé, car déjà très efficace, et le moins onéreux. Les autres systèmes sont plutôt utilisés dans le domaine professionnel. Voici leurs différentes caractéristiques :
TECHNOLOGIE | DOLBY B | DOLBY C | DOLBY S |
Système d’encodage et de décodage | OUI | OUI | OUI |
Utilise un (des) Compresseur-Expanseur(s) à gain variable | OUI | OUI | OUI |
Deux Compresseur-Expanseurs à gain variable | NON | OUI | OUI |
Circuit anti saturation | NON | OUI | OUI |
Circuit d’analyse du spectre des hautes fréquences | NON | OUI | OUI |
Circuit d’analyse du spectre des basses fréquences | NON | NON | OUI |
Contrôle des modulations | NON | NON | OUI |
Réduction de bruit pour les basses fréquences | NON | NON | OUI |
Réduction de bruit – Hautes fréquences | 10 dB | 20 dB | 24 dB |
Réduction de bruit – Basses fréquences | 0 | 0 | 10 dB |