Se connecter
Se connecter

ou
Créer un compte

ou
FR
EN

[FAQ] Toutes les réponses à vos questions existentielles sur le 24 bits et le 96 kHz

  • 562 réponses
  • 93 participants
  • 194 732 vues
  • 127 followers
Sujet de la discussion [FAQ] Toutes les réponses à vos questions existentielles sur le 24 bits et le 96 kHz
Ce thread a pour but de centraliser les informations sur l'intérêt des résolutions élevées en audio, par exemple 24 bits/96 kHz. Je commence par un auto-quote :


La quantification

Le 24 bits est plutôt quelque chose d'intéressant, puisque la hausse de résolution dans ce cas augmente la dynamique sur les enregistrements, ce qui peut être très utile lorsqu'on enregistre avec des préamplis qui ont un niveau de sortie en dessous de 0 dB... C'est complètement inutile par contre sur des instruments virtuels ou du tout numérique, entre autres puisque les séquenceurs (et donc les plug-ins) fonctionnent en interne avec du 32 bits à vigule flottante...


Les fréquences d'échantillonnage

Pour la question de la fréquence d'échantillonnage, l'intérêt pratique d'aller à 88.2 ou 96 kHz, bien qu'il existe, est beaucoup plus faible que celui du 24 bits, ce qui explique que des professionnels recommandent peu souvent à des home-studistes de lâcher le 44.1 kHz, mais demandent toujours du 24 bits.

Ensuite sur un enregistrement seul, à moins d'avoir une oreille d'extra-terrestre, il est impossible d'entendre ou même de visualiser sur un spectrogramme une différence notable dans le domaine de l'audible entre quelque chose d'enregistré avec un microphone et un bon préampli/une bonne carte son en 44.1 kHz et en 96 kHz. Si différence il y a, c'est que la qualité des convertisseurs n'est pas la même.

Quel est donc l'intérêt de ces fréquences d'échantillonnage élevées alors ? Dans une chaine de traitements numériques, bien que les ingénieurs/développeurs mettent des filtres anti-aliasing dans leurs produits (repliement au dessus de la demi-fréquence d'échantillonnage, voir théorème de Shannon/Nyquist), il y a toujours un peu de repliement qui se fait, surtout si certains rigolos n'ont pas mis du tout de dispositifs anti-aliasing, comme sur certains synthétiseurs numériques (ce qui peut être parfois intéressant au niveau sonore, mais très grave sur une simulation d'amplificateur guitare). Augmenter la fréquence d'échantillonnage permet de repousser la limite en fréquence du repliement, et donc de rendre les traitements plus propres. Mais là encore, il est probable que vous ne puissiez pas entendre de différence flagrante...

Enfin, le 48 et le 96 kHz sont des fréquences utilisées plutôt en vidéo. La conversion de fréquence d'échantillonnage étant moins complexe du 88.2 au 44.1 que du 96 au 44.1, il est généralement conseillé de bosser en 88.2, sauf si vous avez vraiment confiance en votre logiciel de conversion. Travailler en 48 par contre est une grosse connerie, parce que ça apporte presque rien au niveau théorique, et que la conversion 48 vers 44.1 peut être source de bordel supplémentaire par rapport au 44.1 direct...


96 kHz et 24 bits dans un home-studio ???

Pour terminer ce monologue, une remarque très importante, discuter des fréquences d'échantillonnage et de la quantification optimales c'est bien, mais il faut déjà avoir du matos derrière, et réaliser des mixages à la hauteur, pour que l'intérêt des résolutions supérieures soit pertinent dans vos projets personnels ! Ne pas savoir mixer correctement ses morceaux et bosser avec du 24 bits/96 kHz me semble être une aberration...

Petite astuce aussi pour savoir si se prendre la tête dans votre cas vaut le coup : faites un enregistrement + mixage avec du 96 kHz/24 bits. Exportez le résultat en WAV, puis convertissez le en 44.1K/16 bits. Modifiez la fréquence d'échantillonage sur tous vos enregistrements et à l'intérieur du projet, puis faites à nouveau un export. Comparez les deux sur votre système d'écoute habituel. Si vous n'entendez pas de différences notables et intéressantes, arrêtez de vous prendre la tête :mrg: Ou allez acheter du meilleur matos... Autre cas : si "les deux sonnent aussi mal", retournez bosser le mixage, en 44.1K/16 bits bien sûr :oops2:

Développeur de Musical Entropy | Nouveau plug-in freeware, The Great Escape | Soundcloud

Afficher le sujet de la discussion
201

Citation : Une dernière question, pour rester dans le sujet. Qu'est-ce serait l'idéal dans mon cas, peut importe le poids, ou quoique ce soit, pour mes montages vidéo?


Citation : Format audio source : 96000 Hz - 24 bits - Stéréo
Format audio du projet : 48000 Hz - 32 bits en virgule flottante - Stéréo

Ce qui est sûr, c'est que je vais continuer de travailler en 96khz, je fais du time stretching, la question ne se pose même pas.


:?!:
Pourtant ces infos semblent montrer que Premiere travaille en interne en 48kHz. Donc logiquement il doit convertir les fichiers dans ce "format" avant de les manipuler. Ne serait-il pas alors meilleur d'enregistrer directement en 48kHz pour éviter une conversion ?

Côté nombre de bits, prends 24 :
- ça laisse plus de marge pour régler les gains des préamps lors de la prise
- c'est le format natif des convertisseurs, autant profiter de leur précision, et de toute façon un convertisseur travaille toujours en virgule fixe
- la conversion 24bits fixe vers 32 bits flottants n'induit aucun perte ; ça offre simplement plus de souplesse au logiciel pour faire les calculs (= headroom sur les bus internes)
- je crois qu'aucun convertisseur ne sait faire du 32 bits. Ca ne servirait de toute façon à rien car les 8 derniers bits ne stockeraient que du bruit électronique (car ça correspond à une plage de -144dB à -192dB, or aucun appareil électronique n'a un bruit de fond aussi faible).
202
C'est logique, sauf que j'étire souvent mes sons, et des fois, beaucoup! Alors je pense même à travailler en 192khz... Et étirer un son en 48khz donne un son horrible.

Mais merci, je vais rester en 24 bits.
203
Bonjour,

Je m'immisce un peu au milieu de la discussion. :??:


Je ne suis pas technicien du son, juste "compositeur" et je souhaite poser une question précise (qui paraitra peut-être naïve aux pros :| ) :

Y a-t-il un intérêt à travailler avec un VST utilisant des samples en 24 bit (par rapport à des samples en 16 bit)?

merci
204
Ben oui, c'est toujours mieux, surtout si le VST a des samples différents selon la vélocité, et que ces samples ne sont pas tous normalisés :clin:

Développeur de Musical Entropy | Nouveau plug-in freeware, The Great Escape | Soundcloud

205
Ok, merci! :bravo:

On m'a également dit que les samples en 24 bit étaient plus "lourd" et que la configuration devait suivre. Qu'en est-il? La différence est-elle si grande?
206
Ben si chaque échantillon est codé en 24 bits au lieu de 16 bits, ça veut dire que le poids total en octets de l'ensemble des samples est multiplié par 1.5

Développeur de Musical Entropy | Nouveau plug-in freeware, The Great Escape | Soundcloud

207
Je ne sais pas si cela a été précisé je n'ai pas eu le courage de lire tout le topic, mais quant à l'intérêt de bosser à une fréquence d'échantillonnages élevé j'aurais voulu apporter ma petite contribution.

Déjà dans l'absolu bosser à 88.2 khz plutôt que 44.1khz permet de diviser la latence par deux. En effet votre carte son estime la taille du buffer en sample , 64 minimum en général. Mais 64 samples passe deux fois plus rapidement en 88.2 que en 44.1.

Ensuite, en sois c'est vrai qu'entre écouter du 44.1 et du 88.2 il peut être très dur d'entendre une différence. par contre dé que l'on commence à travailler dans le domaine temporel il peut être intéressant d'avoir une fréquence d'échantillonnages élevé.

un petit exemple:
Mettons qu'un fichier de 1 seconde soit enregistré avec une fréquence d'échantillonnages de 10 hz, cela tombe bien car on veut pouvoir étudier les fréquence de 0 à 5hz.
Si l'on timestretch ce fichier pour qu'il soit deux fois plus rapide ce ne seront plus que 0.5 secondes qui seront codé en 10hz.
Si l'on désire maintenant faire la manip inverse, étirer le fichier par un facteur de 2 nous récupérerons un fichier de 1 seconde mais qui ne sera plus codé que sur 5 sample. Et on ne pourra étudier les fréquence que de 0 à 2.5 hz ce qui n'est plus convenable.
le timestretch est un exemple, mais vibrato, chorus, phaser peuvent aussi induire ce genre de pertes si le procédé utilisé inclut une ligne de retard à temps variable.

Voila je n'ai aucune source pour avancer ça, mais cela parait logique.




edit: je viens de voir que le coup du timestretch avait déjà été abordé, au temps pour moi :D
208

Citation : Déjà dans l'absolu bosser à 88.2 khz plutôt que 44.1khz permet de diviser la latence par deux. En effet votre carte son estime la taille du buffer en sample , 64 minimum en général. Mais 64 samples passe deux fois plus rapidement en 88.2 que en 44.1.



l'ennui c'est que c'est traiter un certain nombre de samples par seconde qui provoquera des clics, donc les clics apparaitront pour une latence deux fois moindre en 88.

209
Exactement, le coup de la latence plus courte est une erreur assez répandue, car le nombre d'échantillons et donc le nombre de calculs étant doublé, on double la taille du buffer compté en échantillons, et on se retrouve avec la même latence, à peu de chose près.

JM
210
Oui dans tout les cas c'est le nombre de sample traité par seconde qui détermine le seuil à partir duquel il y a apparition de clics.
Mais clics mis à part, je voulais préciser que c'était avec la frequence d'échantillonnages la plus haute que théoriquement la latence était la plus basse.



Citation : on double la taille du buffer compté en échantillons



Je capte pas bien, un buffer est généralement compté en échantillons. Toucher à la frequence d'échantillonnage est distinct de la taille du buffer, toujours compté en un même nombre de sample.

doubler la frequence d'échantillonnage réduit la latence, je peux vous donner un exemple concret. Après ce qui est sur c'est que cela demandera le double de calcul et que cela n'est pas plus avantageux que de diviser la taille du buffer.
211
Si tu double la Fe, et que tu gardes la même taille de buffer, tu divises la latence par deux, on est d'accord. Sauf qu'il faut pour réussir ça que tous les composants de la machine travaillent deux fois plus vite.

Si tu ne changes rien à la bécane, il faudra doubler la taille des buffers, et le gain sera nul.
212
Voila ce que je voulais dire en beaucoup plus clair :D:

213
On est d'accord :D !
214

Citation : Et effectivement, ce qui compte pour avoir plus de dynamique, ce n'est pas la tension absolue en volts, mais le rapport entre l'amplitude maxi et mini que l'on peut retranscrire. Il y a la même différence entre 0,1V et 10V, que entre 0,01V et 1V


Citation : oui pour un log base 10. Mais pas pour un converto signal-nombre (le log arrive après).


C'est quoi ces convertisseurs ? Je suppose que ce n'est pas en audio ? (parce-que les différents types de convertisseurs (sigma-delta, one-bit) mènent au même résultat)

Tu peux expliquer stp ?
215
J'ai fais un contrôleur midi (sur AF d'ailleurs, L'asAir, pitite autopromo en passant), j'ai une carte d'acquisition qui récupère la valeur d'un signal ANALO et le transforme en NOMBRES, et ensuite je fais des calculs sur ces nombres pour étalloner sur la norme MIDI.
[MA MAIN] -analo-> [ACQUISITEUR] -digital pur-> [MIDI] -digital 0:127-> Ordi

Je fais un parallèle probablement houleux, mais je ne vois pas comment ca pourrait être différent en audio : tu as une acquisition du signal ANALO, que tu transforme en NOMBRES et ENSUITE tu fais un calcul (log10, ou log tout court) qui te donne une VALEUR décibel.
[SON] -analo-> [ACQUISITEUR] -digital-> [DECIBEL] -digital 0:160dB-> Ordi

J'espère ne pas faire rire les experts du domaine, mais mon propos c'est que :
l'acquisition peut être améliorée avec une amplitude ANALO plus grande. Parce que pour en revenir à mon Laser, ma carte d'acquisition me donne une amplitude max [0-1428] par exemple. Donc ma résolution est fixée par le matos. Je ne peux pas avoir une meilleur précision AVANT même de passer au MIDI (de toute facon vu la précision du MIDI : 0-->127, aucun intérêt pour moi). Mais imagine une nouvelle version d'OSC qui pousse jusqu'à 2048 la résolution de contrôle : j'aurais besoin d'ACQUISITEURS plus fins. Ou alors d'une amplitude de signal ANALO plus grande...
[MA MAIN] -analo-> [ACQUISITEUR] -digital-> [OSC] -digital 0:2048-> Ordi : résolution(OSC)>résolution(MAIN)

Applique cette "logique" à un signal AUDIO, et tu auras mon propos (émis sous toutes réserves)
216
Bon la conversion en dB ça peut effectivement faire rire. ;)

En fait en audionumérique ce sont bien des nombres correspondant à une amplitude, répartis sur une échelle linéaire, qui sont manipulés dans l'ordi. De plus je suis à peu près sûr qu'il n'y a pas de calcul de conversion après échantillonnage.

Du coup ça fait :
signal analogique -> [convertisseur A/N] -> nombres (linéaires) sur 16 ou 24 bits.

La conversion en dB (donc une échelle logarithmique au lieu de linéaire) se fait juste pour afficher les vu-mètre graphiques. Mais ce sont les nombres originaux (produits par le convertisseur) qui sont stockés et manipulés par les logiciels audio.

Je crois que faire des convertisseurs qui exploitent correctement les 16 bits est une opération maîtrisée et banale. (en convertisseur N/A, rien que la carte son d'un mac portable arrive à exploiter le 16ème bit).

En 24 bits, effectivement je ne crois pas que tous les bits soient significatifs, ou correctement retranscrits / numérisés. Mais de toute façon ça ne doit pas être le facteur limitant, parce-que quand bien même on travaillerait sur +/-10V au lieu de +/-1V (ce qui doit effectivement faciliter un peu les choses), je ne crois pas qu'aucun appareil analogique (micro ou pré-amplificateur) ait un rapport signal bruit supérieur ou égal à 144dB.
Les chiffres doivent plutôt être 90dB pour du bon, 100 du très bon et 110 de l'exceptionnel.


Par ailleurs, concernant le débat sur la dynamique / le mastering :
ce n'est pas parce-que l'on remplace du +/-1V par du +/-10V que l'on va regagner de la dynamique. Ce qui compte c'est d'avoir des variations d'amplitude importantes dans le signal enrégistré (= définition de dynamique), pas que l'amplitude max du signal soit loin de l'amplitude max du convertisseur.

Or les mastering actuels exploitent de moins en moins les possibilités du CD... ;)
217

Citation :
Les chiffres doivent plutôt être 90dB pour du bon, 100 du très bon et 110 de l'exceptionnel.

bon à savoir
218

Citation : Les chiffres doivent plutôt être 90dB pour du bon, 100 du très bon et 110 de l'exceptionnel.



Le moindre préamp micro même haut de gamme va te cracher un max de souffle dès que tu vas pousser un peu les gains, y'a rien à faire c'est comme ça. Donc avec une source peu puissante (une guitare sèche par exemple) et/ou un micro peu sensible, on arrive assez rapidement autour des 70dB de SNR (et encore c'est pas si mal). En sachant qu'à ces niveaux le souffle est très difficilement perceptible.

Affiliation : Dirigeant Fondateur d'Orosys - Two notes Audio Engineering

219
Si je suis globalement d'accord avec Dr Pouet, je dois cependant corriger deux petits détails.

Sur les chiffres de rapport signal/bruit des préamplis ou des micros, on parle plutôt de niveau de bruit équivalent pour un micro, et de niveau de bruit ramené à l'entrée pour un préampli, ce qui amène un rapport signal bruit dépendant du niveau de la source pour un micro, et du niveau de la source et de la sensibilité du micro pour le préampli.

Pour un préampli, cette valeur dépasse -130dBu pour les meilleurs, et pour les micros elle atteint 80dB pour les meilleurs statiques et n'a pas d'objet pour les micros dynamiques.

Si on prend l'exemple d'un Schoeps dont le niveau de bruit équivalent est de 12dB-A et le niveau max de 132dB-A, le rapport signal/bruit peut atteindre 120dB dans le cas le plus favorable, il serait nul si on laissait le micro dans une chambre anéchoïque.

La deuxième chose, c'est l'aspect des tensions que vous évoquez avec Ttone. Si on se place dans le cas d'un convertisseur professionnel aligné pour avoir le 0VU à -18dBFS, avec une sensibilité de +4dB (le cas le plus standard donc), le niveau de tension pour le 0dBFS est de 9,84V (après correction de l'erreur de calcul :| ).

CQFD

JM
220
Il va de soi que les chiffres que j'avançais étaient des mesures de dB non pondérées en dB-A.

Citation : Si on se place dans le cas d'un convertisseur professionnel aligné pour avoir le 0VU à -18dBFS, avec une sensibilité de +4dB (le cas le plus standard donc), le niveau de tension pour le 0dBFS est de 12,4V.



J'ai pas trop suivi. Les composants convertisseurs sont en général alimentés par une tension symétrique en +5,-5V ce qui donne... 5V pour le 0dBFS. Les niveaux ligne +4dB sur 600 ohms sont à 1,23V RMS. Si tu pouvais m'expliquer comment tu arrives à 12.4V je suis preneur. Peut être une erreur de virgule ?

Affiliation : Dirigeant Fondateur d'Orosys - Two notes Audio Engineering

221
Je me plaçais au niveau utilisateur, pas au niveau composants. C'est à dire que je parlais d'un convertisseur boîte et pas de la puce.

Le +4dB donne bien 1,23V, mais correspond à -18dBFS. Ce qui donne 8 x 1,23V pour 0dBFS, soit 9,84V. Pour le 12,4 c'est une erreur de calcul lamentable de ma part :nawak:

JM
222
...oui, entre les entrées audio du boitier aux entrées du convertisseur-IC, il y a un adaptateur de niveau intégré au buffer audio, d'où les différences de niveau électrique
223

Citation : Je me plaçais au niveau utilisateur, pas au niveau composants. C'est à dire que je parlais d'un convertisseur boîte et pas de la puce.

Le +4dB donne bien 1,23V, mais correspond à -18dBFS.

qui fixe ces normes et qui les respecte ?
224

Citation : qui fixe ces normes ?


L'AES fixe les normes dans le domaine audio pro, mais cet alignement est variable en fonction des pays. En l'occurrence il s'agit d'une norme broascast utilisée en France.

Citation : qui les respecte ?

Tous les organismes de radio TV professionnels en France, dans d'autres pays cela peut être 0VU pour -16, voire -14dBFS.

JM
225
Merci, ces normes sont respectées par les fabricants grand public ? (les M-Audio, et compagine...) ? Est ce que Motu, TC et RME sont véritablement exemplaires là dessus (respect des standards, des normes, etc.) ?