De plus en plus obligé de réduire le poids de ses fichiers musicaux, le musicien/ingénieur du son est confronté au choix souvent obscur entre formats, débits et divers paramètres de conversion audio. Et puis déboule le Fraunhofer Pro-Codec de Sonnox. Explications.
Ennemie du musicien, du compositeur, de l’ingénieur du son, la compression de données (pas celle de dynamique !) à fin d’allégement de poids est pourtant de plus en plus répandue. Pourquoi ennemie ? Parce qu’à l’ère du 24 bits (voire 32 bits)/384 kHz, alors que l’on chasse le moindre parasite, le moindre jitter, le moindre clic, le moindre bruit, avec parfois il est vrai le risque de tout rendre stérile, bref, se dire que le mix amoureusement réalisé de nos enregistrements va finir sur un iChoSanEeDo à 128 kb/s (quand ce n’est pas 96…) a de quoi sérieusement déprimer. Car là, il n’est plus question d’enlever des parasites ou des bruits, éléments ajoutés, certes, mais toujours éléments audio (hors phénomènes numériques dus à de mauvais convertos, horloges, etc.), mais bien de destruction d’éléments de l’audio : adieu fréquences, au revoir transitoires, a dio largeur stéréo…
Mais la cible baladeur numérique n’est pas la seule. Internet se développant continuellement y compris au niveau de l’image et donc du son lié (voir par exemple le développement du format web-documentaire), les compositeurs et ingénieurs du son sont amenés de plus en plus souvent à devoir réduire le poids de leurs œuvres, afin de répondre, entre autres, aux contraintes de débit.
Autant dire qu’un outil dédié non seulement à cette compression mais aussi et surtout à la comparaison des formats et débits en temps réel peut s’avérer indispensable. Bien sûr, il existe nombre de logiciels de compression de données audio, dont certains gratuits ou très peu chers. Pensons par exemple sur Mac à l’excellent Max, véritable boîte à outils de la conversion de format audio, gratuite… Mais aucun ne permet de savoir à l’avance ce que va donner la compression de données, ni même d’entendre concrètement (à moins de faire des oppositions de phase entre fichiers sources et fichiers convertis) ce que la réduction de données retire à l’original. Je dis concrètement, parce qu’une oreille exercée entend les modifications subies, mais seulement jusqu’à un certain point. Sachant que les codecs travaillent aussi (surtout ?) sur la psychoacoustique, pouvoir clairement entendre la différence, c’est-à-dire les composantes retirées du fichier original, est parfois salutaire, pour édification personnelle, ou collégiale.
Maintenant, imaginons un plug qui permette de comparer en direct les différents codecs, débits, formats et de convertir facilement ses fichiers en toute connaissance de cause des dégâts effectués sur l’audio d’origine, voire de mixer pour un codec donné en écoutant en temps réel le résultat. Ça tombe bien, vous en avez rêv…, pardon, Sonnox, en collaboration avec l’institut Fraunhofer, a créé le Sonnox Frauhofer Pro-Codec, qui semble à cet égard prometteur. Voyons entendre ça.
Introducing Sonnox Fraunhofer Pro-Codec
Le Pro-Codec est un plug-in aux formats Pro Tools HD, RTAS, Audio Units et VST, compatible Mac (Intel seulement, à partir d’OS 10.5) et Windows (XP ou Windows 7), disponible en ligne sur le site de l’éditeur ou chez un revendeur agréé pour un prix catalogue de 395 euros (le prix varie suivant le site, les éditeurs, etc.).
Téléchargement rapide (l’archive pèse à peu près 25 Mo), installation simple (avec rappel du fait que l’on n’a pas le droit de vendre son plug sans demander…), attention néanmoins de bien télécharger les installeurs pour tous les formats désirés, licence déposée sur clé iLok, on est à pied d’œuvre très rapidement.
Le plug ayant été développé en collaboration avec Fraunhofer IIS, on ne s’étonnera pas d’y retrouver les codecs favoris de l’institut, à savoir les MP3 et AAC, dans de multiples versions que l’on détaillera plus avant.
On ne s’étonnera pas non plus de n’y voir figurer aucun des codecs concurrents, de type Ogg Vorbis, Flac, etc. Je dis concurrent, car le plug s’affiche clairement sous sa bannière Fraunhofer, impliquant par là une exclusive, voire une contrepartie financière. On trouve en effet à la fin du manuel une jolie clause rappelant qu’une tax… pardon, des royalties sont normalement dues en cas d’utilisation commerciale de fichiers convertis en MP3 (il faut compter 3 % des revenus générés par des fichiers MP3 Pro à partir du moment où l’on dépasse 100 000 dollars de revenus. Ouf…). Rien pour le moment en ce qui concerne l’AAC, mais sait-on jamais (la phrase dit : il n’y a pas actuellement de royalties dues pour vente de contenus AAC…).
Principes actifs
Le plug affiche une belle grande fenêtre, regroupant toutes ses fonctions (nombreuses) sous plusieurs onglets. Le plug fonctionne selon trois modes, le mode online qui permet l’écoute en temps réel des codecs (avec quelques limites, on y reviendra), le mode Offline Encode, par lequel on encode les fichiers Wave ou Aiff selon une procédure en temps reporté.
La barre de menu en haut, nommée Preset Manager, permet de gérer les presets, aucun n’étant fourni d’origine (voir encadré).
La partie gauche du plug, Input, montre un afficheur de niveau (entrant) suffisamment étendu, de –63 à 0 dB, pour ajuster précisément le signal d’origine. Autre afficheur, celui de la latence induite par les traitements, latence très variable suivant le codec utilisé, son débit, etc. Attention, le plug n’affiche pas la latence totale, mais bien celle du codec en sélection et change donc en conséquence ; il faudra donc en fonction de l’hôte et de sa gestion de la compensation, fermer et rouvrir le plug (affichage en échantillons ou millisecondes au choix, pratique). Pour finir cette section, un gros bouton Export Settings ouvre une fenêtre flottante dans laquelle on renseignera la destination pour les fichiers convertis, et le type d’infos incluses dans le nom desdits fichiers, du codec au débit en passant par la qualité, le mode, l’indexation et la date et heure. De quoi indexer très proprement ses fichiers, c’est important quand on se retrouve à la tête d’une sonothèque importante.
Sur la droite du plug se trouve une section Output, permettant de choisir entre l’écoute du plug (le codec en cours) et le signal entrant (visualisation via les Led Input et Codec dans le pavé Monitor), le type d’affichage de l’écran principal, soit une analyse FFT soit trois visualiseurs Lissajous affichant respectivement et de droite à gauche l’enveloppe des niveaux entrant et sortant, la phase du signal converti en vert et celle de la différence en rouge, puis cette différence agrandie cinq fois. On consultera l’encadré pour de plus amples informations sur le visualiseur FFT.
Deux boutons, Codec et Diff, basculent du signal converti à l’écoute de la différence (les éléments enlevés du signal par la conversion) en temps réel, une fonction qui s’avère vite indispensable, et notamment dans un cadre qui n’a peut-être pas été prévu par l’éditeur, celui de l’enseignement. Quoi de plus efficace pour expliquer les dégâts de la compression de données audio que de faire entendre tout ce qu’un codec, à un débit donné, enlève ?
Bien évidemment, cette fonction est aussi très utile au musicien ou ingénieur qui peut ainsi réajuster son mix si besoin. Ou pas, restant désespéré par la piètre qualité audio demandée par le client… Si l’on m’avait dit qu’on disposerait un jour d’une fonction permettant l’équivalent d’un mixage temps réel en MP3.
Comment ça marche ?
L’éditeur fournissant à cette adresse tous les documents, je passe sur le détail des débits (suivant les codecs, de 8 à 320 kb/s), des modes (CBR, taux constant, VBR, taux variables) et qualités (de Low à Highest, nous voilà bien avancés…), ainsi que sur la gestion des formats et de l’écoute en fonction des projets dans lesquels on utilisera le plug, et de la fréquence d’échantillonnage desdits projets. Sonnox donne dans ses documents et manuels de nombreux tableaux et exemples résumant parfaitement les possibilités et les limites.Dernière partie du plug (si l’on regroupe les processus off- et online), le choix des codecs. MP3 d’un côté, AAC de l’autre sont déclinés selon plusieurs types : le MP3 tout d’abord, dans sa version de base, mono, stéréo et 5.1, puis dans sa version MP3-HD, mono, stéréo, dite lossless (sans pertes) pour fichiers 16 bits. L’AAC ensuite, en version AAC-LC, HE-AAC et HE-AACv2 mono, stéréo, 5.0 et 5.1, et en version HD-AAC mono, stéréo et 5.1, sans pertes jusqu’à 24 bits.
Signalons juste plusieurs points : d’abord, le plug est compatible avec les sessions en 32 kHz jusqu’au 192 kHz, mais les codecs ne travaillent que dans la fourchette 8 kHz-48 kHz, à l’exception du HD-AAC qui monte à 192 kHz.
D’autre part, l’écoute du MP3-HD n’est pas possible en temps réel ; le plug fera alors entendre un résultat synthétisé reproduisant le comportement du codec. Limité à 16 bits (plus exactement, il est sans pertes jusqu’à 16 bits), le MP3-HD peut traiter des fichiers 24 bits, mais leur appliquera une troncation et un dithering en interne (on peut aussi effectuer ces opérations en amont du plug avec d’autres outils logiciels). Il n’y a pas de problèmes d’écoute avec le HD-AAC. Il est conseillé de placer des traitements de troncation et dithering avant le plug quand on l’utilise au sein d’une DAW travaillant en virgule flottante, en raison de la haute résolution et des valeurs générées par ce type de système. La question ne se pose pas quand on travaille directement (dans un éditeur, par exemple) sur un fichier 16 ou 24 bits, qui lui est censé être en virgule fixe.
Convertissons, convertissons…
Le plug dispose de cinq emplacements, dans lesquels on peut ouvrir cinq codecs à des réglages différents, et passer de l’un à l’autre en temps réel sans saut sonore (génial…), y compris en effectuant une comparaison A-B (grâce à l’onglet A-B, oui), soit le choix entre deux codecs, et le passage de l’un à l’autre toujours sans saut ni bruit, éventuellement en aveugle. Plus fort encore, on dispose aussi d’un mode A-B-X (test en double aveugle aléatoire, via le menu Sonnox), qui permet un véritable test, avec la supériorité sur le hardware permettant ce type de test qu’il n’y a pas de retard, ni de bruits ou coupure de signal quand on passe d’une sélection à une autre (ce n’est pas systématique avec du hardware, mais ça arrive). Le mode affiche aussi le nombre de choix effectués (dans le petit afficheur inférieur), et le bouton Reveal permet d’afficher à la place le taux de réussite dans la reconnaissance du codec. Indispensable…
Autre onglet, Trim, qui offre cinq réglages de niveaux indépendants, un par codec, afin d’ajuster d’éventuelles saturations du signal converti. On sait ce que le filtrage peut provoquer en termes de pics d’amplitude, et donc de saturation ici, c’est un plaisir de pouvoir visualiser et montrer ce que les oreilles entendent sur certaines conversions. Un petit voyant rouge s’allume dès saturation, deux afficheurs indiquent la valeur atteinte, et un Trim dB permet de réduire d’autant le volume du fichier converti.
Dernier onglet, Comp, qui indique lui le taux de compression appliqué par le codec. C’est là encore une fonction très pédagogique, certains débits, et surtout qualités (Highest, Low) n’indiquant rien de précis en termes de compression. Ainsi, on peut vérifier qu’un MP3 ou un AAC-LC à 96 kb/s en CBR appliquent un taux de compression de 1:22, et qu’un MP3-HD et un HD-AAC à 320 kb/s en CBR appliquent un taux de 1:1,3. Cette vérification se fait aussi lors de l’enregistrement, le taux et le nombre d’octets traités et écrits s’affichant dans l’écran principal pour chacun des codecs “armés”. En effet, en mode online, enregistrer cinq conversions différentes à la volée est simple comme bonjour : il suffit d’enclencher les boutons Arm des codecs désirés, puis d’appuyer sur le bouton Record, et les fichiers iront se ranger dans l’emplacement spécifié dans Export Settings. La même opération est aussi valable en mode Offline, avec options quant à l’action du Trim, un même fichier que l’on fait glisser dans l’interface prévue étant converti selon les cinq réglages différents. Le dernier onglet, Decode, ne permet en revanche de traiter qu’un seul fichier à la fois, en partant d’un fichier compressé pour le transformer en Wav ou Aiff 16 ou 24 bits. Cela risque d’être long si l’on a beaucoup de fichiers à convertir… De plus, la conversion de fichiers compressés n’est bien évidemment possible qu’à partir de MP3 et AAC. Pas la peine d’essayer du Flac, Ogg, Ape ou quoi que ce soit d’autre.
À titre d’information, vous trouverez dans le fichier .zip ci-dessous l’extrait « 01-Funky.wav » d’un des morceaux ayant servi au test :
Sonnox Pro-Codec Audio (cliquez pour télécharger)
Puis sa conversion en AAC-LC 128, CBR, Low, soit un rapport de 1:16 (02-Funky_AAC-LC_128kbps.m4a), La même chose en mp3 (03-Funky_mp3_128kbps.mp). Et enfin, enregistré avec AudioHijack, aucun réglage de gain, toutes valeurs neutres (il n’y a hélas pas moyen de l’exporter directement du plug), la différence selon la conversion AAC (04-FunkyDiffAAC.wav) et selon la version mp3 (05-FunkyDiffmp3.wav).
Bilan
Réglons tout de suite les choses qui ennuient : les limites en termes de codecs fournis, l’éventuelle licence, l’impossibilité de convertir en batch les fichiers compressés, et l’impossibilité d’exporter directement la différence, le prix. À part ça, rien à redire ! C’est une excellente idée, un concept original et très utile, en ces temps où la compression de données audio se généralise. Nul doute que le plug aidera de nombreux musiciens et ingénieurs toujours pressés par le temps et les contraintes de production à vérifier de façon précise les dégâts qu’ils sont obligés d’infliger à leur travail, afin de réduire autant que possible les artefacts.
Et d’un point de vue pédagogique, l’outil devrait être présent dans les écoles de son pour expliquer comment (et pourquoi, mais c’est un autre sujet), on déforme l’écoute de toute une génération. On souhaite que tous les formats de compression de données soient intégrés un jour. Où qu’un autre éditeur fasse le même type de plug avec tous les codecs laissés de côté…
En tout cas, Sonnox signe là un plug original et très réussi.