Se connecter
Se connecter

ou
Créer un compte

ou
FR
EN

[FAQ] Toutes les réponses à vos questions existentielles sur le 24 bits et le 96 kHz

  • 562 réponses
  • 93 participants
  • 194 980 vues
  • 127 followers
Sujet de la discussion [FAQ] Toutes les réponses à vos questions existentielles sur le 24 bits et le 96 kHz
Ce thread a pour but de centraliser les informations sur l'intérêt des résolutions élevées en audio, par exemple 24 bits/96 kHz. Je commence par un auto-quote :


La quantification

Le 24 bits est plutôt quelque chose d'intéressant, puisque la hausse de résolution dans ce cas augmente la dynamique sur les enregistrements, ce qui peut être très utile lorsqu'on enregistre avec des préamplis qui ont un niveau de sortie en dessous de 0 dB... C'est complètement inutile par contre sur des instruments virtuels ou du tout numérique, entre autres puisque les séquenceurs (et donc les plug-ins) fonctionnent en interne avec du 32 bits à vigule flottante...


Les fréquences d'échantillonnage

Pour la question de la fréquence d'échantillonnage, l'intérêt pratique d'aller à 88.2 ou 96 kHz, bien qu'il existe, est beaucoup plus faible que celui du 24 bits, ce qui explique que des professionnels recommandent peu souvent à des home-studistes de lâcher le 44.1 kHz, mais demandent toujours du 24 bits.

Ensuite sur un enregistrement seul, à moins d'avoir une oreille d'extra-terrestre, il est impossible d'entendre ou même de visualiser sur un spectrogramme une différence notable dans le domaine de l'audible entre quelque chose d'enregistré avec un microphone et un bon préampli/une bonne carte son en 44.1 kHz et en 96 kHz. Si différence il y a, c'est que la qualité des convertisseurs n'est pas la même.

Quel est donc l'intérêt de ces fréquences d'échantillonnage élevées alors ? Dans une chaine de traitements numériques, bien que les ingénieurs/développeurs mettent des filtres anti-aliasing dans leurs produits (repliement au dessus de la demi-fréquence d'échantillonnage, voir théorème de Shannon/Nyquist), il y a toujours un peu de repliement qui se fait, surtout si certains rigolos n'ont pas mis du tout de dispositifs anti-aliasing, comme sur certains synthétiseurs numériques (ce qui peut être parfois intéressant au niveau sonore, mais très grave sur une simulation d'amplificateur guitare). Augmenter la fréquence d'échantillonnage permet de repousser la limite en fréquence du repliement, et donc de rendre les traitements plus propres. Mais là encore, il est probable que vous ne puissiez pas entendre de différence flagrante...

Enfin, le 48 et le 96 kHz sont des fréquences utilisées plutôt en vidéo. La conversion de fréquence d'échantillonnage étant moins complexe du 88.2 au 44.1 que du 96 au 44.1, il est généralement conseillé de bosser en 88.2, sauf si vous avez vraiment confiance en votre logiciel de conversion. Travailler en 48 par contre est une grosse connerie, parce que ça apporte presque rien au niveau théorique, et que la conversion 48 vers 44.1 peut être source de bordel supplémentaire par rapport au 44.1 direct...


96 kHz et 24 bits dans un home-studio ???

Pour terminer ce monologue, une remarque très importante, discuter des fréquences d'échantillonnage et de la quantification optimales c'est bien, mais il faut déjà avoir du matos derrière, et réaliser des mixages à la hauteur, pour que l'intérêt des résolutions supérieures soit pertinent dans vos projets personnels ! Ne pas savoir mixer correctement ses morceaux et bosser avec du 24 bits/96 kHz me semble être une aberration...

Petite astuce aussi pour savoir si se prendre la tête dans votre cas vaut le coup : faites un enregistrement + mixage avec du 96 kHz/24 bits. Exportez le résultat en WAV, puis convertissez le en 44.1K/16 bits. Modifiez la fréquence d'échantillonage sur tous vos enregistrements et à l'intérieur du projet, puis faites à nouveau un export. Comparez les deux sur votre système d'écoute habituel. Si vous n'entendez pas de différences notables et intéressantes, arrêtez de vous prendre la tête :mrg: Ou allez acheter du meilleur matos... Autre cas : si "les deux sonnent aussi mal", retournez bosser le mixage, en 44.1K/16 bits bien sûr :oops2:

Développeur de Musical Entropy | Nouveau plug-in freeware, The Great Escape | Soundcloud

Afficher le sujet de la discussion
26
:8) bon debat, thanks pour les eclairsicements
FX
27
Et sinon que pensez vous du choix de taffer en 88.2/32bit pour des sons où à priori chaque sample ou piste subira entre 10 et 30 traitements tous assez drastiques et severes et où le résultat final ne doit pas sonner tel de la bouillie ?

Wolfen me disait que le choix du 88.2Khz est à priori une bonne idée pour préserver un temps soit peu la qualité audio.

Par contre pour le 32bit, qu'en pensez vous ?
28
La qualité intrinsèque du 32 est la même que celle du 24, mais le 32 te garanti de ne jamais écrèter tant que tu utilisera des traitements fonctionnant en 32.

JM
29
Ok, donc quand on fait de la zik "qui tape" il vaut mieux utiliser le 32 virgule flottante si on utilise des plugs dont la résolution interne est de 32bit.
30
Je ne suis pas sur que le fait qu'elle "tape" change quoi que ce soit ;)

JM
31
Ben si on cherche à etre le plus souvent le plus proche possible de 0db ça a un interet.

J'entendais cela par "zik qui tape".
32

Citation : C'est une conséquence, pas la raison principale. La raison principale pour laquelle il est préférable (de lapin) de travailler en 24 est le recul du bruit de quantification (bien en dessous des performances des matériels analogiques) et qui permette d'effectuer des traitement en conservant ce bénéfice. Mais on en profite pour en grignoter une partie pour constituer une réserve avant écrètage, c'est de bonne guerre.



Ouh la vilaine tatillonne. :lol: Tu as peut être la réponse : historiquement, on a développé des composants 24 bits parce que les ingés étaient gênés par le bruit de quantification ? Je dois t'avouer que j'ai du mal à différencier à l'oreille un enregistrement 16 bits d'un 24,donc...

Citation : La qualité intrinsèque du 32 est la même que celle du 24, mais le 32 te garantide ne jamais écrèter tant que tu utilisera des traitements fonctionnant en 32.



Pour compléter cette réponse, je donne le cas général des traitements audio. On a un fichier 24 bits qu'on veut traiter avec des effets. Il faut savoir qu'en numérique la multiplication est très utilisée. Or, des multiplications sur 24bits, plusieurs fois réalisées, ça finit rapidement par dépasser la capacité des 24. En passant en 32 flottants, on se donne une très grande marge avant d'atteindre la plus grande valeur codable possible. Et à la fin de tous les calculs, on tronque pour revenir en 24 sur les convertos de sortie.

Le soucis du 32 flottants c'est sa représentation sous forme exponentielle, qui induit des erreurs de calcul. On trouve donc d'ardents défenseurs de formats 80 bits entiers (ou plus !), même si le 32 flottant, je trouve personnellement que ça marche pas mal...

Affiliation : Dirigeant Fondateur d'Orosys - Two notes Audio Engineering

33

Citation :
Le soucis du 32 flottants c'est sa représentation sous forme exponentielle, qui induit des erreurs de calcul.



Le fixe aussi :?!: Franchement, le flottant est utilise dans a peu pres 100 % des applications calcul numerique. J'ai du mal a voir pourquoi l'audio serait special a ce niveau la. Que la resolution puisse poser probleme, soit, quoique le plus souvent tu peux revoir ta topologie de filtre pour eviter les accumulations d'erreur trop importantes (ce que tu dois faire de toute facon avec du fixe. Le fixe au contraire rend plus necessaire ce type de pratiques;).

Apres, pour repondre a N6: ton signal audio est de toute facon converti en 32 bits en debut de la chaine de traitement et je pense vraiment pas que ca change quelque chose que ce soit en 24 bits ou en 16 bits au depart. Apres, le wav 32 bits, ca peut avoir son interet pour echanger entre softs, mais meme la, a savoir si en pratique, c'est super utile...

Et au contraire, pour faire du dre, vu que t'as tres peu de dynamique, ca sert pas grand chose d'avoir des resolutions te permettant des dynamiques de dingue.

Citation :
En passant en 32 flottants, on se donne une très grande marge avant d'atteindre la plus grande valeur codable possible



En soft au moins, ca n'arrive meme jamais, puisqu'en general le signal est normalise entre -1 et 1 (les valeurs au dela peuvent "driver" une disto si distortion il y a, mais si c'est arrive au dernier traitement, t'as de la distortion numerique...)
34
Ok donc en fait le 32bit flottant ça ne sert que pour avoir une plage de dynamique super maousse, ça ne concerne absolument pas le traitement.

Mais si par exemple, tu appliques à chaque fois des effets offline en 32bit dans un projet en 16bit, ton wav fait à chaque fois 32 => 16 => 32 => 16. Nan ?

Auquel cas vu qu'il n'y a pas de dithering lors de l'application de l'effet, si je fais 10 fois cette manip de suite je me retrouve avec plein d'approximation de calcul au final.

Correct ?
35

Citation : Ok, donc quand on fait de la zik "qui tape" il vaut mieux utiliser le 32 virgule flottante si on utilise des plugs dont la résolution interne est de 32bit.


Déjà je crois qu'on n'a pas trop le choix : la plupart des séquenceurs travaillent en interne en 32 bits virgule flottante. La "virgule flottante", comme l'a dit nonconforme est presque plus utile que le plus grand nombre de bits, car il garantit de d'avoir jamais de dépassement de capacité, et d'avoir un nombre de bits utiles constant et élevé (ça doit pas être 32, car pour un nombre de la forme m.10^p les 32 bits doivent contenir à la fois la mantisse m et la puissance de 10 p).

Bon apparemment ça a aussi quelques défauts, mais je pense qu'on arrive vraiment dans l'enculage de mouches.

Citation : Ben si on cherche à etre le plus souvent le plus proche possible de 0db ça a un interet.
J'entendais cela par "zik qui tape".


En fait, par "zik qui tape", et qui pose des problèmes, on entendrait plutôt une zik dont la dynamique est très grande, c'est à dire avec un écart très important entre les volumes les plus faibles et les volumes les plus forts. On va plutôt rencontrer ça dans des musiques acoustiques, enregistrées de la manière la plus fidèle possible (sans compression de dynamique). Par exemple du classique, du jazz, de la musique ethnique.

Typiquement le pire : un ensemble qui sort un volume monstrueux (grand orchestre classique, ensemble de percus tribales) suivi d'un instrument seul entrecoupé de vrais silences. Ca ça va demander une grosse dynamique et donc beaucoup de bits pour tout représenter correctement, et sans avoir de souffle sur les silences.

A l'inverse, des musiques électroniques actuelles, genre techno, hip-hop, électro-jazz, ont généralement des écarts de niveaux assez faibles voire incroyablement faibles (= compression de dynamique très forte). Dans ce cas, le 16 bits du CD sera très très largement suffisant.
36

Citation :
k donc en fait le 32bit flottant ça ne sert que pour avoir une plage de dynamique super maousse, ça ne concerne absolument pas le traitement.



Pour faire simple, le flottant garantit une precision et une dynamique independante du niveau. En fixe, pour caricaturer (pour garder des chiffres simples), si tu es en 8 bits, tu as des valeurs entre -128 et 127. Donc tu as 256 valeurs possibles pour un signal a la crete. Mais si ton signal est nettement plus faible, il va se trouver qu'entre disons -32 et 32, donc avec une resolution effective de 64 valeus (ie 6 bits).

En flottant, t'as pas ce probleme (enfin nettement moins): 32 bits, c'est 23 bits de precision, 1 bit de signe, et 8 bits pour l'exposant. Tu peux voir l'exposant comme une adaptation au niveau.

En normalise (0 dB entre -1 et 1), tu as tes 23 bits de precision (en fait 24, parce qu'un bit est implicite, mais c'est un peu complique). Si tu es a disons 50 dB au dessous, ca veut dire que les valeurs vont etre entre -0.003 et 0.003. Mais 0.003, c'est 3 * 0.001, et le 0.001 est code dans l'exposant. donc que tu sois au niveau -1..1, ou -0.003 .. 0.003, la precision va toujours etre code avec tes 23 bits + 1, et c'est les 8 bits de l'exposant qui fait l'ajustement.

Apres, si tu descends trop bas, ca marche plus, parce que l'exposant n'a que 256 valeurs possibles, et peut pas s'adapter a tous les niveaux... Dans ce cas, le codage numerique est different, le bit implicite ne l'est plus, et tu as ce qu'on appelle un nombre denormal... qui posait tant de problemes sur P4 ! Cependant, ces niveaux sont ultra faibles, et totalement inutilises en audio ( ca correspond a des niveau -200, -300 dB voire pire).

pour resumer, la virgule fixe a une precision qui depend du niveau, alors que le flottant non. Pourquoi utiliser du fixe, alors ? Parce que c'est nettement plus simple a implementer en hardware, et donc nettement plus rapide et moins gourmand en energie (ce qui n'est plus vraiment le cas pour les cpu recents, ou l'unite de calcul flottante a des performances proches du fixe dans certaines conditions que l'on peut considerer comme assez souvent valides pour l'audio). Typiquement, les DSP pas chers, c'est du fixe (synthes, effets: ils utilisent encore presque tous les fameux motorola); on fait maintenant des DSP flottants pas trop chers (c'est utilise dans le materiel haut de gamme aussi; typiquement, certaines SSL faisaient tout en flottant il y a quelques annees, j'imagine que c'est plus repandu maintenant).
37
Ah yes ok !

Merci pour ces explications.

donc dans mon cas le mieux c'est de faire du 88.2Khz/16bit.

Et pour ma question concernant le traitement offline à la chaine ? :oops:
38
Test comparatif 16 / 15 / 14 / 13 bits etc. :

Il s'agit de ce fichier que j'ai réalisé il y a quelques temps.

Je suis parti d'un morceau avec une grande dynamique : "Sarah was 99 years old" de Arvo Pärt, album "Miserere" chez ECM. Le morceau est normalisé, donc ses crêtes sont à zéro dB. Mais en dehors du moment où ça s'énèrve pas mal, il y a de longs passages très doux, dont j'ai pris un extrait : une percu dans une chapelle avec du silence.

Appelons A cet extrait (qui est donc sur 16 bits, 44,1 kHz).
J'ai ensuite fabriqué B en gardant les 9 bits de poids fort de A. puis C en gardant les 11 bits de poids fort de A, D les 12, E les 13, F les 14 puis G les 15.
Le morceau reconstitué est de la forme :

AABBAABB AACCAACC AADDAADD AAEEAAEE AAFFAAFF AAGGAAGG soit des comparaisons :
16/9 bits, puis 16/11 bits puis 16/12, puis 16/13, puis 16/14 et 16/15. Le but était d'entendre le plus facilement possible l'apport du nombre de bits.


J'ai bien conscience que mettre à 0 les bits de poids faibles est assez bourrin. Selon vous (les spécialistes de la théorie du signal), qu'aurait-il mieux valu faire ?

A tous : l'avez-vous écouté ? Qu'en pensez-vous ? (c'est évidemment un cas extrême, dans la plupart des styles de musique un instrument viendrait masquer ce souffle qui ne serait pas gênant).


Des suggestions sur d'autres manières de réaliser ce test ? Ou pour faire d'autres tests ?
39
40
41
:lol:

Faut dire ton sample c'est plutôt pour dépressifs au bord de la falaise.

Y'aurait pas moyen que tu livres le truc en petits morceaux, parce que pour se promener dans ton fichier, tintin ?

J'ai juste écouté sur les HP de mon portable donc je préfère ne pas donner d'avis... :volatil:

D'un point de vue scientifique je ne vois rien à redire à l'expérience : si tu avais eu un convertisseur 12/13/14... bits de caractéristiques identiques à celles du converto qui a servi à faire l'enregistrement tu aurais eu les mêmes résultats (après normalisation à 0dB).

J'oublie peut être quelque chose, si d'autres veulent donner leur avis...

On pourraît aussi s'amuser avec du 24 bits et descendre...

Affiliation : Dirigeant Fondateur d'Orosys - Two notes Audio Engineering

42

Citation : Faut dire ton sample c'est plutôt pour dépressifs au bord de la falaise.


C'est du Arvo Pärt. C'est jamais de la "happy happy music". :oops2:
Il paraît que beaucoup de goths aiment ça.

Citation : Y'aurait pas moyen que tu livres le truc en petits morceaux, parce que pour se promener dans ton fichier, tintin ?


Oui, il faudrait que je le refasse. Mais je ne sais même pas si j'ai encore les outils pour : je l'avais fait avec Cool Edit du temps où j'étais sous Windows, mais maintenant que je suis sous Mac, je n'ai plus d'éditeur audio comparable. Menfin avec Logic (et le plug-in bit crusher) ou Audacity je devrais m'en sortir.

Citation : D'un point de vue scientifique je ne vois rien à redire à l'expérience : si tu avais eu un convertisseur 12/13/14... bits de caractéristiques identiques à celles du converto qui a servi à faire l'enregistrement tu aurais eu les mêmes résultats (après normalisation à 0dB).


Ok.

Citation : J'ai juste écouté sur les HP de mon portable donc je préfère ne pas donner d'avis...


Ca doit effectivement pas être l'idéal. :mrg:
Rien qu'avec un casque tu dois entendre beaucoup plus de choses.

bon moi j'ai fait l'essai avec 3 appareils :
- mon lecteur hi-fi plutôt balèze
- un vieux lecteur portable (en principe d'assez bonne qualité, à l'époque)
- la sortie audio de mon powerbook.
Dans tous les cas, j'entends facilement la distinction entre 16 et 14 bits, et même 15 bits.

J'ai tendance à en déduire que :
- les convertisseurs de ces appareils ont un bruit de fond inférieur à -90dB (puisqu'on distingue 15 et 16 bits)
- pareil pour les ampli-ops placés juste derrière
Et donc que même sur du matos pas très cher, on a déjà une qualité pas du tout ridicule.

Bien sûr:
- ça n'est qu'une mesure parmi des dizaines que l'on pourrait faire pour mesurer la qualité de ces appareils
- c'était pas du matos complètement pourri, il serait intéressant de voir ce que ça donne sur des appareils vraiment "premier prix".
43

Citation :
Oui, il faudrait que je le refasse. Mais je ne sais même pas si j'ai encore les outils pour : je l'avais fait avec Cool Edit du temps où j'étais sous Windows, mais maintenant que je suis sous Mac, je n'ai plus d'éditeur audio comparable. Menfin avec Logic (et le plug-in bit crusher) ou Audacity je devrais m'en sortir.



J'aurais tendance a dire que c'est plutot trivial a programmer, non ? :)
44

Citation : J'aurais tendance a dire que c'est plutot trivial a programmer, non ?


Sûrement, mais : je n'ai jamais manipulé de l'audio en programmation + ces 2 ou 3 dernières années je n'ai fait que du php+SQL. (Dans mon boulot, ça fait pas mal d'années que je ne code plus, je fais du slideware :volatil: ).

Sinon : tu as écouté ? tu en penses quoi (de la méthode suivie, et des résultats observés) ?
45

Citation : Mais si on travaille en 96 kHz vaut mieux enregistrer directement à cette frequence (si on a un converto qui le fait bien, bien sur) plutot que de rajouter une etape de conversion de freq, non ?

Sinon ça serait peut etre bien que ça soit pas limité au home studio si c'est une FAQ. Par exemple tu dis que le 48 n'a aucun interet si c'est pour sortir du 16 / 44.1, mais comme tu le dis aussi c'est la freq utilisée en video et surtout dans pas mal de consoles de mix numerique.



Si tu peux eviter une conversion de plus.

Le 48 kHz est sortie avec les DAT, il est apparu grace au débit possible du support, il permettait aussi de faire du time shiffting sans perte (dans la mesure du raisonnable)

Citation : Pour ceux qui sont equipés en fibre ADAT / console numeriques qui tournent en 24/48 par defaut il vaut mieux quoi alors, faire travailler directement la machine en 44.1 ou enregistrer en 48 et reduire a 44.1 avec un logiciel qui tiens la route ?



Idem, tant qu'à faire, eviter les conversions, c'est jamais bon tout comme les différents passages A=>D ou D=>A
46
Et le DSD? vous en pensez quoi les pros des mathématiques? :) C'est vraiment le truc ultime ou ça induit d'autre problemes?
47
Le DSD dans le milieu de l'audio-numerique, il y a quelques annees, c'etait comme les DJ sont-ils musiciens sur AF.

Perso, le probleme fondamental du DSD, c'est que ca oblige a rechange tout le materiel de A a Z. On comprend pourquoi c'est utile pour Sony, mais a moins d'avoir une reelle difference, je ne vois pas tres bien l'interet.
48
Hello!

Une petite intrusion pour revenir à la base du sujet :

Sur un projet audio qui va finir sur cd, j'utilise la résolution 88,2Khz 32bits (carte motu 896hd/nuendo3), et pour avoir souvent bossé en 44,1Khz 16bits, je vous assure qu'il y a une réelle différence sur les prises elles-mêmes et surtout dans le cas d'un mix avec pas mal de traitements.

Tout dépend de la finalité du projet, de la qualité du matériel, des capacités auditives et de l'expérience de chacun, mais, pour ma part, il existe bien un intérêt, même en home studio à utiliser des hautes fréquences de résolutions.

tchao!
49
Pour moi ça va surtout jouer si les effets que tu appliques font (ou pas) correctement un sur-échantillonnage/filtrage passe-bas/retour en 44,1, pour rejeter loin dans la bande les distorsions amenées par le calcul. Dans le doute, travailler plus haut en fréquence règle de fait le problème.

Pour avoir fait le test en programmation de plug, c'était nettement meilleur en travaillant en direct à des fréquences élevées, mais c'est sans doute parce que nous n'avions pas pris suffisamment de temps pour faire un sur-échantillonnage correct, ou mal dimensionné le filtre passe-bas...

En revanche, avoir des échantillons en 32 flottants, dans la mesure où de toute manière tous les plugs et le séquenceur travaillent dans ce format, je ne vois pas trop l'intérêt. Tes convertos ne t'enverront jamais que du 24 bits entiers.

Affiliation : Dirigeant Fondateur d'Orosys - Two notes Audio Engineering

50
Thanks !