Découvrons dans ce nouveau chapitre deux autres formes de synthèse sonore plus inhabituelles, j'ai nommé les variantes formantique et arithmétique linéaire.
La synthèse formantique
On appelle généralement « formant » un élément sonore caractéristique de la vocalisation humaine ou bien de la production sonore de certains instruments à vent. Il s’agit de pics d’amplitude de certaines fréquences au sein d’un signal sonore. Concernant l’être humain, on peut dire que chaque voyelle est définie par des formants caractéristiques, distinctifs également de la tessiture de la voix qui les formule.
Si les synthèses pulsar et à distorsion de phase vues dans l’article précédent se rapprochaient respectivement de la synthèse granulaire et de la synthèse FM, la synthèse formantique dérive quant à elle d’une part de la synthèse par modèle physique, dont elle reprend les concepts principaux d’excitation et de résonance (voir article 23), mais également de la synthèse granulaire, dont elle reprend le principe d’éléments basiques individuels (voir article 19).
Ces éléments sont les fonctions d’ondes formantiques (FOF), qui forment l’une des principales techniques utilisées dans cette synthèse. Celle-ci a notamment servi de base théorique au développement du logiciel CHANT, élaboré à l’IRCAM par Xavier Rodet, Yves Potard et Jean-Pierre Barrière au tournant des années 80.
Partant du constat que la voix humaine est l’un des « instruments » les plus complexes que l’on puisse rencontrer, le postulat des créateurs de CHANT était que la maîtrise de la modélisation vocale pouvait engendrer celle de la modélisation d’un grand nombre d’autres instruments. Aujourd’hui, cette forme de synthèse est un peu tombée en désuétude. En effet, les applications recourant à des voix de synthèse se basent actuellement beaucoup sur la concaténation (la mise bout à bout…) d’échantillons de phonèmes préenregistrés et reliés artificiellement entre eux (cf les intonations parfois étranges de votre GPS…).
La synthèse arithmétique linéaire
Cette forme de synthèse – qui est plus une manière astucieuse de tirer parti de techniques existantes qu’une véritable nouveauté en soi — a été développée par Roland et implémentée dans son synthétiseur phare, le D-50, sorti en 1987. Elle tire son nom du fait qu’il s’agit d’une méthode reposant sur l’addition de différents éléments sonores, tout en se différenciant fondamentalement de la synthèse additive.
Jusqu’à la date de sortie du D50, les synthétiseurs de la marque, comme la grande majorité de la concurrence, reposaient sur le principe de la synthèse soustractive (voir article 15). Yamaha ayant toutefois fait un carton avec le DX7 et sa synthèse FM quelques années plus tôt, Roland s’est alors en quelque sorte senti obligé de se mettre à niveau, sans pour autant vouloir complètement abandonner la synthèse soustractive qu’il maîtrisait bien. L’idée est alors venue aux ingénieurs de la marque de conserver cette forme de synthèse pour la partie centrale du signal, mais d’y adjoindre des sons échantillonnés pour l’attaque des sons ainsi qu’en complément du son central.
Grâce à cette astuce, il devint possible d’obtenir des sons à la fois réalistes en termes d’attaque (qui est un élément crucial dans l’identification d’un son) grâce aux échantillons, tout en gardant la souplesse de modulation et de « fabrication » du son autorisée par la synthèse soustractive. En passant, elle permettait à Roland d’éviter l’écueil, rencontré malgré leur succès par Yamaha et sa synthèse FM, de rebuter les musiciens par la nécessité d’appréhender une forme totalement nouvelle de synthèse.