Cela pourra sembler étrange à certains de voir figurer la lecture d’échantillons dans les formes de synthèse. En effet, je vous parle, depuis le début de cette série d’articles, de création sonore « à partir de rien », et voici que tout d’un coup déboule la lecture de sons préexistants !
Quelle est donc cette supercherie ? Comme nous l’avons vu dans le précédent article, il faut tout d’abord considérer que cette voie a été choisie par certains en réponse à la complexité trop importante engendrée par la synthèse additive, et qu’en tant que telle la lecture d’échantillons peut donc être perçue comme une évolution naturelle dans la recherche de nouvelles formes de création sonore. Ensuite, il faut souligner que la lecture d’échantillons ne représente que la base de la production sonore : le son échantillonné peut ensuite être, lui aussi, comme une onde produite par un oscillateur, soumis aux autres éléments de la synthèse sonore que sont les filtres, les enveloppes, les LFOs, etc. Enfin, la lecture d’échantillons a totalement révolutionné la manière de faire de la musique de ces dernières décennies, que ce soit à travers la lecture de tables d’ondes sur les synthétiseurs ou bien l’apparition des « samplers » (échantillonneurs) matériels ou virtuels.
Mais voyons d’abord ce qu’est exactement l’échantillonnage, quitte à nous éloigner momentanément de la synthèse à proprement parler…
Échantillonnage
L’échantillonnage est le fait d’enregistrer de manière numérique un signal analogique, via un convertisseur analogique-numérique (CAN – Analogic Digital Converter, ADC, en anglais). Mais pourquoi appeler cela de l’échantillonnage ? Simplement parce que, contrairement à un enregistrement analogique (magnétique sur bande, par exemple) qui va enregistrer le signal en continu, l’enregistrement numérique ne va prélever que des échantillons de signal, à intervalles réguliers.
Ainsi, la norme pour un enregistrement numérique sur CD est un taux d’échantillonnage à 44,1 kHz, codé sur 16 bits. Ce qui signifie que le système va « copier » 44 100 échantillons par seconde du signal original, et que chacun de ces échantillons sera codé par un nombre binaire à 16 positions. Un filtre de lissage est ensuite employé pour homogénéiser la reproduction sonore d’un échantillon à l’autre.
Ce nombre, 44,1 kHz, a été choisi pour la raison suivante. Il a été démontré qu’il faut au moins deux échantillons par cycle d’une forme d’onde donnée (voir articles 2 et 3 de cette série concernant les ondes et leurs cycles) pour que celle-ci soit reproduite correctement par le système de lecture et le convertisseur numérique-analogique (CNA – Digital Analog Converter, DAC, en anglais).
Or, comme la limite supérieure de l’audition humaine est théoriquement de 20 kHz, il faut donc un taux d’échantillonnage d’au moins 40 kHz. Et comme certaines personnes entendent au-delà de cette limite – Rudolph Kœnig, ingénieur à l’origine des normes internationales d’acoustique, entendait jusqu’à 23 kHz – il a été décidé de permettre la reproduction jusqu’à 22 kHz.
Toutefois, ce n’est pas la seule raison.
Fréquence de Nyquist et repli
La fréquence égale à la moitié du taux maximal d’échantillonnage d’un système est appelée fréquence de Nyquist. Et les sons qui dépassent cette fréquence lors d’un enregistrement numérique sont reproduits lors de la lecture dans le domaine des basses fréquences. Ils viennent ainsi « parasiter » le signal. On appelle cela le phénomène de « repli de fréquences ». Et là, il s’avère que les 44,1 kHz de la norme CD peuvent ne pas être encore suffisants.
Exemple : le troisième harmonique d’un son à 12,5 kHz est égal à 37,5 kHz, donc a priori inaudible pour l’être humain. Sauf qu’avec un système à 44,1 kHz, et par le phénomène de repli, il se trouve transformé en un signal à (44,1 – 37,5) = 6,6 kHz, parfaitement audible… et gênant. Il faudrait un système fonctionnant à (37,5 × 2) = 75 kHz pour que cette fréquence ne se replie pas dans le domaine audible.
C’est pourquoi on utilise lors de l’enregistrement un filtre anti-repliement pour éliminer les fréquences supérieures à la fréquence de Nyquist.
Dans certains cas, on peut aussi n’employer en synthèse sonore que des sinusoïdes à partir de 11,025 kHz, afin de ne produire aucune harmonique qui risquerait de se replier.
Quoi qu’il en soit, dans le prochain article, nous nous pencherons plus en détail sur la lecture d’échantillons elle-même et ses champs d’application.