[FAQ] Toutes les réponses à vos questions existentielles sur le 24 bits et le 96 kHz
- 562 réponses
- 93 participants
- 194 987 vues
- 127 followers
Wolfen
La quantification
Le 24 bits est plutôt quelque chose d'intéressant, puisque la hausse de résolution dans ce cas augmente la dynamique sur les enregistrements, ce qui peut être très utile lorsqu'on enregistre avec des préamplis qui ont un niveau de sortie en dessous de 0 dB... C'est complètement inutile par contre sur des instruments virtuels ou du tout numérique, entre autres puisque les séquenceurs (et donc les plug-ins) fonctionnent en interne avec du 32 bits à vigule flottante...
Les fréquences d'échantillonnage
Pour la question de la fréquence d'échantillonnage, l'intérêt pratique d'aller à 88.2 ou 96 kHz, bien qu'il existe, est beaucoup plus faible que celui du 24 bits, ce qui explique que des professionnels recommandent peu souvent à des home-studistes de lâcher le 44.1 kHz, mais demandent toujours du 24 bits.
Ensuite sur un enregistrement seul, à moins d'avoir une oreille d'extra-terrestre, il est impossible d'entendre ou même de visualiser sur un spectrogramme une différence notable dans le domaine de l'audible entre quelque chose d'enregistré avec un microphone et un bon préampli/une bonne carte son en 44.1 kHz et en 96 kHz. Si différence il y a, c'est que la qualité des convertisseurs n'est pas la même.
Quel est donc l'intérêt de ces fréquences d'échantillonnage élevées alors ? Dans une chaine de traitements numériques, bien que les ingénieurs/développeurs mettent des filtres anti-aliasing dans leurs produits (repliement au dessus de la demi-fréquence d'échantillonnage, voir théorème de Shannon/Nyquist), il y a toujours un peu de repliement qui se fait, surtout si certains rigolos n'ont pas mis du tout de dispositifs anti-aliasing, comme sur certains synthétiseurs numériques (ce qui peut être parfois intéressant au niveau sonore, mais très grave sur une simulation d'amplificateur guitare). Augmenter la fréquence d'échantillonnage permet de repousser la limite en fréquence du repliement, et donc de rendre les traitements plus propres. Mais là encore, il est probable que vous ne puissiez pas entendre de différence flagrante...
Enfin, le 48 et le 96 kHz sont des fréquences utilisées plutôt en vidéo. La conversion de fréquence d'échantillonnage étant moins complexe du 88.2 au 44.1 que du 96 au 44.1, il est généralement conseillé de bosser en 88.2, sauf si vous avez vraiment confiance en votre logiciel de conversion. Travailler en 48 par contre est une grosse connerie, parce que ça apporte presque rien au niveau théorique, et que la conversion 48 vers 44.1 peut être source de bordel supplémentaire par rapport au 44.1 direct...
96 kHz et 24 bits dans un home-studio ???
Pour terminer ce monologue, une remarque très importante, discuter des fréquences d'échantillonnage et de la quantification optimales c'est bien, mais il faut déjà avoir du matos derrière, et réaliser des mixages à la hauteur, pour que l'intérêt des résolutions supérieures soit pertinent dans vos projets personnels ! Ne pas savoir mixer correctement ses morceaux et bosser avec du 24 bits/96 kHz me semble être une aberration...
Petite astuce aussi pour savoir si se prendre la tête dans votre cas vaut le coup : faites un enregistrement + mixage avec du 96 kHz/24 bits. Exportez le résultat en WAV, puis convertissez le en 44.1K/16 bits. Modifiez la fréquence d'échantillonage sur tous vos enregistrements et à l'intérieur du projet, puis faites à nouveau un export. Comparez les deux sur votre système d'écoute habituel. Si vous n'entendez pas de différences notables et intéressantes, arrêtez de vous prendre la tête
Développeur de Musical Entropy | Nouveau plug-in freeware, The Great Escape | Soundcloud
Alain E.
Citation : Quand appliquer un traitement de Dithering ?
Une règle simple : il faut appliquer un traitement de Dithering dès que
vous passez à une résolution numérique inférieure. L’exemple le plus évident
est celui de la conversion d’un fichier audio à une résolution inférieure
(par exemple, lorsque vous masterisez un fichier 24 bits sur CD,
support dont la résolution numérique est de 16 bits).
Cependant, même si vous lisez ou effectuez la transformation (Render)
d’un fichier 16 bits à la même résolution, il faut lui appliquer un Dithering
dès que vous utilisez un traitement en temps réel dans WaveLab ! En effet,
WaveLab travaille avec une résolution interne de 32 bits virgule flottante,
ce qui assure une excellente qualité audio. Par conséquent, dès que vous
appliquez un traitement à des données audio, elles sont traitées à cette
résolution supérieure au lieu des 16 bits originaux. Résultat : un Dithering
est indispensable en sortie pour revenir en 16 bits dans les meilleures
conditions.
Des exemples de tels traitements en temps réel ? Modifications de niveau,
tous les effets, mixage de deux clips ou plus dans un Montage, etc. En fait,
la seule situation où un fichier 16 bits est effectivement lu en 16 bits est
lorsque vous le lisez tel quel, sans fondus ni effets, et avec les faders Master
réglés rigoureusement à 0.00 dB (gain unitaire, aucune modification
de niveau, indicateur de niveau Maître désactivé).
Ce qui veut dire qu'il faut appliquer un dithering dans tout logiciel audionumérique travaillent en 32 bit interne lorsque on exporte un projet… même si on garde la résolution initiale…
À moins que la résolution initiale soit en 32 bit bien sur…
Hors sujet : Au fait, quels sont les logiciels qui travaillent en 32 bit flottants ? je sais que c'est le cas dans Cubase, Nuendo, WaveLab… je supose que Protools, Loigic et compagnie le font tous de nos jours!
fritesgrec
B4
Ingé son depuis 20 ans
Franchement quand je suis en mix je me pose d'autres questions
certes mes machines sont de qualité professionnelle
pour la prise de son, bien sur approché le niveau max pour enregistré au max de la dynamique mais pas n'importe comment.
gain du micro, trim de la tranche.
mais plus on pousse plus on a du bruit quoi qu'on fasse.
donc éviter le bruit de la console !
aprés tout dépend du convertisseur qui souvent encaisse moins qu'une console analogique.
travaillant pour le ciné et la tv on est en 48khz.
mais les beta num sont en 20 bits (merci SONY)
si quelqu'un a une idée de la transfo du signal en entrée du betanum je suis intéressé.
dans les audits, encore beaucoup de DD1500 Akai en 16 bits.
pour les prod ciné de plus en plus de 24 bits enfin
surtout pour les bruitages. pour le coup la ca sert vraiment.
pour revenir sur l'histoire de gain, qui rajoute des 00000 sur les bits de poids faibles
chez moi 0+0+0+0+0 égale la tête à t0t0.
par contre on remonte tout le signal et donc le bruit de fond.
Pov Gabou
Un aspect auquel je n'avais jamais pense, c'est le depassement du 0 par le filtre de reconstruction lors de la convertion N/A, alors qu'en numerique, rien ne depasse. Je ne suis pas entierement convaincu, mais c'est quelque chose qui merite reflection.
https://www.soundonsound.com/sos/sep07/articles/digitalmyths.htm
Anonyme
JM
xtsea
J'ai trouvé différentes sources indiquant une compression "naturelle" de la dynamique de notre oreille, à haut volume.
On peut considérer que le seuil de la douleur se trouve aux alentours de 120db, et qu'il y a danger à une exposition prolongée à partir de 100 ou 110db.
Selon les courbes trouvées sur ce site :
http://perso.orange.fr/vb-audio/fr/pub/topo_000/son.htm
On voit bien qu'à 120db la réponse est pratiquement plate, alors que le niveau oscille entre 0 et 60db de pression acoustique pour le seuil d'audibilité entre 20Hz et 20Khz, ce qui correspond d'avantage à nos conditions d'écoute "naturelles" (disons 50db en moyenne).
Celà signifie que nous n'entendons pas la même chose à 60db qu'à 120db, étant donné cette compression de l'oreille (grosse compression des basses et aigues).
J'en viens donc à en déduire qu'entre 20-200Hz et 10-20Khz il y a une forte compression effectuée à 120db par rapport à un niveau moyen à 60db par exemple. Etant donné cette réponse en fréquence modifiée, celà me fait douter de la nécessité d'avoir un enregistrement final à plus de 16bits, soit 96db de dynamique, en terme de qualité du rendu.
A partir du moment ou l'oreille "compresse" fortement (entre 100 et 130db), plutôt les basses et aigues, mais également les médiums (un peu moins), nous perdons beaucoup de résolution. Une musique à 100db paraîtra très proche de la même à 120dB. Au lieu d'avoir par défaut un doublement du volume perçu tout les (environ) 10db, celà s'approcherait plutôt au doublement du volume perçu tout les 30db (simple extrapolation, je n'ai pas de mesures précises pour affiner), lié à cette compression naturelle de l'oreille (+ un mal de crâne et des acouphènes).
Autant je comprends très bien l'interêt de mixer en 20 ou 24bits, autant une dynamique de plus de 100db sur un morceau mixé et masterisé me laisse perplexe. Je fais cette remarque suite à une discussion avec des amis sur le sujet, ou les avis divergeaient, mais sans véritable argumentation concrète, ce que je m'efforce de faire ici.
La question qui en découle évidemment : à quel niveau acoustique sont pré-masterisés les albums par les professionnels de l'audio ? Le volume de travail est-il plutôt à 60,100,120db ? Parce qu'en fonction du volume, la "couleur" du mix va bien changer, modifiant la perception du spectre sonore à forte puissance...
Sans entrer dans des discours sans fin sur ceux qui entendent et ceux qui n'entendent pas la différence 16/24 bits sur le master... Quel est l'avis des pros sur la nécessité (ou non) d'avoir une plus grande résolution au finale ? (J'ai bien dis au final, pas durant le mix et le pré-mastering soyons d'accord, ou 20 bits semblent un minimum.)
Dr Pouet
...discuter de l'oreille humaine dans le thread Comportement de l'oreille humaine
Je vais essayer de répondre là-bas à plusieurs sujets que tu soulèves. Rendez-vous à côté !
neo.azzoui
EN fait la les "super audio Cd" échantilloné à 2.8244MHz mais quatifié sur 1 bit.
Si c'est quantifié sur un seul bit ça veut dire que il n'y a que deux valeurs possibles...
Aussi 24 bits par rapport au 16bits du cd normal on augmente la dynamiquem ias la 1 bit... la dynamique devrait etre a chi** non ?
Enfin je comprend pas du tout comment ça peut marcher donc si y'a kkun qui veut gentiment m'expliquer
Anonyme
- avec un convertisseur 24/96 (par exemple), on donne la valeur absolue du signal codée sur 24 bit, 96000 fois par seconde
- avec le système "1 bit", on donne une valeur relative du signal 2,8244M fois par seconde (échantillon suivant supérieur ou inférieur)
voilà, en très très gros, pour schématiser...
si d'autres plus à même d'expliquer pouvaient se manifester....
neo.azzoui
Parce que sur 16 bits ça nous fait quand meme 65536 valeurs possibles, c'est autre chose non.
Enfin je pense que c'est moi qui n'ai pas tout les elements pour comprendre parce que si sa marche c'est que le problème vient de moi
nonconforme
Les convertisseurs "classiques" et ceux utilisés pour le SACD sont la même techno, à savoir delta sigma, qui fonctionnent sur le principe du sur-échantillonage.
La différence c'est qu'en CD "normal" on code en PCM ce qui implique l'utilisation d'un filtre de décimation en conversion an->num et d'interpolation en num->an. Ces deux filtres n'existent pas sur le format SACD.
Très sincèrement il faudrait que je compulse mes tablettes pour voir quels étaient les soucis de ces filtres (j'imagine un masscre de HF pais bon faut que je révise).
Si quelqu'un veut prendre la main...
Citation : Oui ça j'ai compris mais meme si on a 2.8244M fois la valeur du signal par seconde, si le signal ne peut prendre que 2 valeur je vois pa trop comment ça peut le faire.
La question est : dans la bande audible (et même jusqu'à 100KHz), est-ce que le son peut varier aussi rapidement ? réponse : pas des masses. ;) Si tu divises 2.8244 par 24 (bits), tu tombes sur 171 KHz. Tu divises par deux et tu as ta bande passante sur 24 bits.
Affiliation : Dirigeant Fondateur d'Orosys - Two notes Audio Engineering
guitoo
bill bokey
j'en suis à la page 6 mais je dois retourner bosser, alors en attendant que je revienne voici une question (excusez-moi si la réponse est dans les pages que je n'ai pas encore lues) :
j'utilise Samplitude (9 pour l'instant, 10 dans peu de temps) avec une RME Fireface800 (+ ADI8 DS). sur les conseils de mon ancien batteur je travaille en 48KHz et 32 bit float. est-ce une bonne ou une mauvaise idée ? tout ce que j'enregistre fini de toute façon en 16/44.1 que ce soit sur CD ou en mp3.
à ma place que feriez-vous ?
en tout cas merci pour ce thread très instructif !
Anonyme
nonconforme
Affiliation : Dirigeant Fondateur d'Orosys - Two notes Audio Engineering
Anonyme
JM
Anonyme
bill bokey
donc il faut que je passe en 24/44.1 ?
tant mieux ça prend moins de place sur le DD !!
c'est pas très clair dans ma tête mais je vais suivre vos conseils
merci !
offenbach
Citation : La question qui en découle évidemment : à quel niveau acoustique sont pré-masterisés les albums par les professionnels de l'audio ? Le volume de travail est-il plutôt à 60,100,120db ? Parce qu'en fonction du volume, la "couleur" du mix va bien changer, modifiant la perception du spectre sonore à forte puissance...
il faut lire le livre de Bob Katz où il préconise 83dB, utilisé pour le cinéma. Ce niveau, déterminé expérimentalement, correspond statistiquement à un niveau confortable qui semble ni trop fort, ni trop faible...
Site officiel et boutique en ligne du Studio Delta Sigma https://www.studiodeltasigma.com
offenbach
Citation : Un aspect auquel je n'avais jamais pense, c'est le depassement du 0 par le filtre de reconstruction lors de la convertion N/A, alors qu'en numerique, rien ne depasse. Je ne suis pas entierement convaincu, mais c'est quelque chose qui merite reflection.
la courbe de la forme d'onde devient un escalier en numérique, la plus haute marche étant quelque chose du genre 111111111111111....
Si un signal numérique possède par exemple 2 ou 3 échantillons à la veleur maximale, et que ce qui précède et ce qui suit est bien plus bas, il y a de forte chance que le convertisseur, en interpolant les valeurs (i.e. calculant des valeurs moyennes entre les échantillons en fonction du contexte pour "arrondir" la courbe sortante...) calcule une valeur électrique (dBu) supérieure à celle correspondant à à la marche maximum. D'où un risque de saturation lors de la conversion... il existe des détecteurs (vst) qui simulent le fonctionnement d'un DAC pour répérer les endroits susceptibles de saturer. Par exemple SSL distribue un plug gratuit : X-ISM qui analyse les bits, et détecte les risques...
Site officiel et boutique en ligne du Studio Delta Sigma https://www.studiodeltasigma.com
offenbach
1. Nombre de bit :
Il est clair pour tout le monde, me semble-t-il, qu'un traitement en 24 ou 32 float est meilleur, même si au final on redescent à 16.
2. échantillonage :
la fréquence est le point le plus délicat. La conversion d'une fréquence à un autre est la clé, et selon comment elle est réalisée, cela peut être judicieux d'enregistrer/mixer en 96 ou 192, et rescendre en 44.1 au final. Mais les raisons ne sont pas tout à fait les même que pour le nombre de bit...
supposons un fréquence de base n Hz
que se passe-t-il lorsqu'on convertit à la fréquence n/2 ? On prend un échantillon sur 2 ? (équivalent de la troncature...)
Le dithering sert à palier ce problème pour le nombre de bit, et un bon convertisseur de fréquence devrait faire quelque chose d'un peu équivalent en terme de calcul. Cela pourrait être par exemple : sur-échantilloner le signal à 100*n en calculant les 99 nouvelles valeurs par interpolation du signal original, puis tronquer (diviser) la fréquence à ce moment là, en prenant 1 échantillon tout les 200. Le résultat devrait être, en tout logique supérieur à une troncature simple.
Je pense qu'on peut imaginer d'autre processus de convertion de fréquence d'échantillonage....
Sans parler des effets (reverb par exemple) qui pourrait être calculer en 96 ou 192, puis être ramenée ensuite à 44.1. Il y a là certainement à gagner en terme de qualité.
La vrai question est plutôt de savoir de combien on gagne ? est-ce audible ?
Site officiel et boutique en ligne du Studio Delta Sigma https://www.studiodeltasigma.com
Pov Gabou
Citation :
supposons un fréquence de base n Hz
que se passe-t-il lorsqu'on convertit à la fréquence n/2 ? On prend un échantillon sur 2 ? (équivalent de la troncature...)
non, ce serait quasiment inaudible, tu aurais beaucoup d'aliasing. Pour convertir en frequence, il faut d'abord filtrer le signal (pour qu'il n'y ait plus de frequence au dessus de n/4), et ensuite on tronque.
Citation :
Je pense qu'on peut imaginer d'autre processus de convertion de fréquence d'échantillonage....
Il y en a (a ma connaissance) 2 types: par banc de filtre, ou par interpolation. Mais troncature simple, non, ca ne marche pas, a cause de l'aliasing.
Citation :
Sans parler des effets (reverb par exemple) qui pourrait être calculer en 96 ou 192, puis être ramenée ensuite à 44.1. Il y a là certainement à gagner en terme de qualité.
C'est selon les cas sans interet, utile voir obligatoire. Mais il faut bien etre conscient que rien n'empeche un plug-in de fonctionner a 96 khz si ton projet est a 48 khz (il le fait en interne). En fait, souvent, lorsque tu as des boutons pour regler la qualite (high/low quality), c'est en rapport avec ca, car traiter les effets en 96 khz au lieu de 48 prend deux fois plus de CPU (2x plus d'echantillons a traiter).
C'est particulierement utilise pour les filtres de synthe (a cause des changements de resonance/coupure qui peuvent etre rapides), les compresseurs, certains types d'oscillateurs, etc...
rroland
Pour la fréquence, on est moins certain et les avis divergent.
Simplement parce que ce n'est qu'un seul des éléments. La qualité d'un convertisseur ne se limite pas à sa fréquence d'échantillonnage. Lavry (qui est un des meilleurs constructeurs de convertisseurs) refuse la course à la fréquence. Ce n'est pas comme des chevaux de bagnole ou de vitesse de processeurs en informatique.
D'après les tests que j'ai réalisés, j'ai remarqué que souvent le "petit" matos bossait mieux à des fréquences supérieures. Je crois que c'est Bob Katz qui explique en partie le phénomène par le fait que les problèmes des "petits" convertisseurs se trouvent déplacés dans l'ultra son.
Le problème est que quand on revient au format final (16 bit, 44,1 kHz)la conversion fait parfois perdre plus que ce qu'on avait gagné.
Le gain dans les hautes fréquences me semble un argument peu valable parce qu'en général on place un filtre passe bas qui intervient bien avant 20 kHz (donc qu'est-ce qu'on enregistre tout en haut? du silence?)
Travailler à une fréquence plus élevée donne un temps de latence réduit, cela c'est objectif et vérifiable.
En conclusion, je dirai qu'il vaut mieux surveiller la qualité de ses convertisseurs que la fréquence d'échantillonnage.
Anonyme
Anonyme
Citation : D'après les tests que j'ai réalisés, j'ai remarqué que souvent le "petit" matos bossait mieux à des fréquences supérieures. Je crois que c'est Bob Katz qui explique en partie le phénomène par le fait que les problèmes des "petits" convertisseurs se trouvent déplacés dans l'ultra son.
C'est exactement ça et c'est aussi mon avis, sur le matos qui possède des convertisseurs moyen avec un filtre de repliement pas tres bien conçu, travailler à une fe plus elevée va permettre de "contourner" les faiblesses du convertisseur en quelque sorte. A priori si on fait ensuite la reduction avec du materiel de qualité on n'aura rien perdu.
Pour les autres aspects des haute frequences d'echantillonage je n'ai vraiment pas d'avis pour le moment. Enfin tant que je n'aurais pas obtenu moi meme des resultats qui me feront dire "waou c'est super plus mieux" je continuerais à utiliser du 44.1 (ou 48 pour la video).
Maintenant pour une chorale de chauve souris enregistrer à 176.4 kHz peut avoir ses avantages
- < Liste des sujets
- Charte

