Correlation entre la résolution numérique et le niveau analogique?
- 47 réponses
- 8 participants
- 1 962 vues
- 8 followers

fa44

Mon parcours professionnel (électronique générale,informatique) fait que je crois comprendre ce qu'est l’échantillonnage et la résolution.
Dans le domaine de l'audio il a toujours quelque chose de pas clair pour moi : la corrélation entre la résolution et le niveau analogique d'un échantillon de signal.
Je vais essayer d'être plus précis:
16 bits nous offre 65536 niveaux de valeur. Mais quelle est l'amplitude du signal analogique correspondant à la valeur numérique maximale (65536).
1) Est-ce une amplitude théorique universelle absolue de référence normalisée? Ainsi tous les morceaux de musique ont un même référentiel de résolution.
Si oui quelle est cette amplitude théorique universelle (je présume exprimée en volt ou en dBu)?
Dans cette première hypothèse, si on code désormais en 24 bits, l'amplitude théorique universelle absolue de référence demeure t-elle la même (auquel cas la résolution ou "définition" est meilleure) ou elle t-elle élargie?
2) OU Est-ce une amplitude définie pour chaque morceau de musique via une réglage de niveau (un peu comme on le faisait en analogique avec les vu-mètres et les réglages de niveau d'enregistrement sur nos vieilles platines cassettes...)
Dans ce cas, si on a bien toujours 65536 valeurs possibles, la correspondance avec le niveau de signal analogique est différente sur chaque morceau de musique.
Ici le passage en 24 bits coule de source: la "définition" est meilleure pour une amplitude analogique donnée.
Mais alors comment se débrouille le DAC pour savoir à quel niveau de référence restituer le signal analogique?
Ensuite, intervient la dynamique:
Sur ce que j'ai lu, "la dynamique représente le rapport entre le signal le plus fort et le plus faible produit sur un intervalle donné"
Dans le codage numérique chaque bit représente un doublement de la valeur soit gain de 6dB. La dynamique est donc de 96dB en 16 bits et de 144dB en 24 bits.
Et là, j'en viens au rattachement de la dynamique à ma première question sur l'amplitude du signal analogique de référence..
J’espère ne avoir été trop nébuleux.
Merci d'avance pour vos éclairements.
Cordialement
- 1
- 2

Anonyme



Jean-Marc Boulier

Il me semble que la façon dont tu définis la résolution est confuse. Il n'existe pas de définition absolue d'ailleurs, car la résolution est un concept relativement général et qui s'applique dans de nombreux autres domaines (vidéo par exemple). Mais la définition la plus communément admise dans le milieu de l'ingénierie audio est que la résolution est l'ensemble des deux paramètres : fréquence d'échantillonage (en kHz) ET débit (en bits).
Du coup la question que tu poses n'a pas vraiment lieu d'être car le débit est directement lié à la dynamique, mais pas à un niveau. En revanche il existe tout de même un lien car un débit plus élevé apporte l'avantage d'un noise floor plus éloigné du signal enregistré, ce qui permet des manipulations postérieures à l'enregistrement sans perte de qualité audible.
La valeur maximale dans un système audio digital "fixed point" est toujours de 0 dBFS (decibel full scale), est c'est indépendant du débit. Toutefois la plupart des DAW (stations de travail numériques audio) travaillent maintenant en "floating point", permettant d'atteindre des niveaux de plage dynamique extrêmement élevés (bien plus que ce qui est possible physiquement dans la réalité en termes de pression sonore).
Contrairement à ce qui se passe dans la réalité ou une pression sonore de 0 dB (SPL, donc) correspond au seuil INFERIEUR de l'audition humaine, dans le domaine digital 0 dB est une valeur MAXIMALE au-delà de laquelle le signal est écrêté. On mesure donc les niveaux avec des valeurs négatives : par exemple -12 dB c'est 12 dB en-dessous de la valeur maximale possible (dans un système fixed point).
Je ne sais pas si j'ai répondu à toutes tes questions ?
Jean-Marc
[ Dernière édition du message le 01/09/2021 à 16:01:48 ]

Anonyme

L'augmentation de la résolution a une influence sur la diminution du bruit de quantification qui permet de rendre audible (hors du bruit de fond) les signaux faibles. Cela est lié à l'extension du codage par l'ajout de bits de poids faible, d'où en résulte une extension dynamique vers le bas.
Un signal à 0dBfs sera aussi précisément codé en 16 qu'en 24bit. Un convertisseur A/N encaissera le même niveau max en 16 qu'en 24 bit.

Anonyme

Mais le débit est essentiellement la définition (le degré de finesse) avec laquelle les différences de niveau (donc la dynamique) sont reproduites. De la même façon qu'en vidéo, un moniteur LCD 24 bits peut reproduire 16 777 216 couleurs là ou un moniteur 30 bits peut en reproduire 1 073 741 824, les écarts de niveau d'un signal audio sont reproduits avec plus de finesse en 24 bits qu'en 16 bits puisque la gamme dynamique est divisée en un plus grand nombre de valeurs distincts.
Le parallèle audio/image ne fonctionne pas et amène à des erreurs de compréhension.
En 16 et 24 bit, tout ce qui est entre 0dBfs et -96dBfs a la MÊME PRÉCISION !
La gamme dynamique est étagée de façon identique.
Par contre, en 24bit, il y a 8 bits ajoutés en bas, au-dessous des 16bits, au-dessous de -96dBfs.
[ Dernière édition du message le 01/09/2021 à 14:21:39 ]

Jean-Marc Boulier

Jean-Marc

Jan mk2

Mais la définition la plus communément admise dans le milieu de l'ingénierie audio est que la résolution est l'ensemble des deux paramètres : fréquence d'échantillonage (en kHz) ET débit (en bits).
Ça ne doit pas être si communément admis car en près de trente années à faire de l'audionumérique, c'est la première fois que je lis ça. Ce qu'on trouve dans la littérature c'est bien que la résolution est le nombre pas de quantification. La résolution multipliée par la fréquence d'échantillonnage donne le débit. 48 000 échantillons/seconde de 16 bits en mono donnent un débit de 48 000 x 16 = 768 000 bit/s.
Comme le dit Gulistan, il n'y a aucune corrélation entre le niveau en analogique et le niveau de codé en numérique, ça dépend de l'alignement de la bécane. Le schéma de dsikolg donne une idée des alignements courants.
Alan Parson a peut-être dit : "Audiophiles don't use their equipment to listen to your music. Audiophiles use your music to listen to their equipment."

Jean-Marc Boulier

Il faut que je me relise car je n'ai plus l'habitude de m'exprimer en français sur ce sujet et ça me joue des tours ! Concernant le mot resolution, en anglais il est très couramment utilisé (probablement à tort du coup) pour désigner l'ensemble fréquence d'échantillonage et bit depth, ou word length (que j'ai maladroitement traduit par débit, je ne sais pas quel est le bon terme en français). C'est par exemple le cas sur Wikipedia, ou encore sur le papier technique Apple Digital Masters, etc.
Jean-Marc
[ Dernière édition du message le 01/09/2021 à 18:52:58 ]

Anonyme

Il faut vraiment se dire que ce n'est pas une longueur fixe divisée par le pas de quantification (par la profondeur de bits).
C'est une échelle logarithmique ayant pour référence un niveau max :
5v ? ben 24bits pleins.
2,5v on a 23 bits, et ainsi de suite, par extension vers le bas.
(je schématise grossièrement).
Finalement, ce qu'il faut retenir, c'est qu'aucun signal sonore naturel ne sera un sinus simple enregistré à un niveau crête de 0dBfs.
Ce qui, pratiquement, déboule sur un fait essentiel de l'apport du 24 bit :
L’extension dynamique entre 16 et 24 bit se fait par le bas, donc le 24bit permet de coder sur 8 bits supplémentaires ce qui en 16 bit est noyé dans le bruit de quantification. Du coup, pas besoin de pousser fort le niveau de modulation à l'entrée du convertisseur A/N pour garder une dynamique respectable, et du coup remonter le niveau moyen par la suite, en numérique (et en 32 ou 64 bit flottants, on ne dégrade le signal qu'au dessous du bruit de Johnson) sans remonter outrageusement le bruit de quantification.
[ Dernière édition du message le 01/09/2021 à 20:53:44 ]

Jan mk2


Et par exemple, bit depth est souvent traduit hâtivement par "profondeur de bit", qui est un peu tendancieux exprimé oralement si je peux me permettre. Word length a son équivalent en français : longueur de mot en informatique, mais ce terme est un peu tombé dans l'oubli dans le domaine audio, on préfère résolution.
Alan Parson a peut-être dit : "Audiophiles don't use their equipment to listen to your music. Audiophiles use your music to listen to their equipment."
[ Dernière édition du message le 01/09/2021 à 20:57:58 ]

Anonyme

Concernant le mot resolution, en anglais il est très couramment utilisé (probablement à tort du coup) pour désigner l'ensemble fréquence d'échantillonage et bit depth, ou word length (que j'ai maladroitement traduit par débit, je ne sais pas quel est le bon terme en français). C'est par exemple le cas sur Wikipedia, ou encore sur le papier technique Apple Digital Masters, etc.
Oui, il y a pas mal de faux-amis ou mots proches qui n'ont pas le même sens mais qui sont d'une importance capitale suivant le sens donné.
C'est le cas de digital et numérique. Je me bats tant bien que mal pour le bon emploi, d'autant plus que le sens n'est pas le même en Anglais et Français.
Resolution : tant en anglais qu'en français, je crois qu'en langage populaire pour l'audio, son augmentation est sensée faire vendre.
Les seules définitions n'apportant pas d'ambiguité à mon sens sont : bit depth et sampling frequency.

Anonyme

Jan mk2 : je t'ai déjà dit que j'aimais ta résolution ?

Jan mk2

Alan Parson a peut-être dit : "Audiophiles don't use their equipment to listen to your music. Audiophiles use your music to listen to their equipment."

Jan mk2

Citation de Gulistan :xHors sujet :Jan mk2 : je t'ai déjà dit que j'aimais ta résolution ?
Mais parce que c'est une bonne résolution !
Alan Parson a peut-être dit : "Audiophiles don't use their equipment to listen to your music. Audiophiles use your music to listen to their equipment."

Anonyme

Ben pour une fois, je ne suis pas d'accord avec Gulistan, dans le cas d'une quantification linéaire, il ne s'agit pas d'une échelle logarithmique, mais d'une progression géométrique. Une progression en L(n+1) = L x q. Elle ne devient logarithmique que lorsqu'elle s'exprime en décibel. Si L(n) = 23 bits correspond à 2,5V, L(n+1) = 24 bits = L x 2.
Oui, mea culpa, j'ai grossièrement raccourci la chose. C'est bien l'échelle en décibel qui est logarithmique (je suis trop habitué aux échelles données par les STAN). Il faut dire qu ce n'est pas donné de "simplifier" les choses pour les rendre accessibles et compréhensibles sans faire de simplification erronée.
Comme quoi.
[ Dernière édition du message le 01/09/2021 à 21:14:40 ]

Anonyme

Citation de Jan :xHors sujet :Citation de Gulistan :xHors sujet :Jan mk2 : je t'ai déjà dit que j'aimais ta résolution ?
Mais parce que c'est une bonne résolution !
et au final, seul le fixe peut être converti, pas le flottant !

Gam

Les seules définitions n'apportant pas d'ambiguité à mon sens sont : bit depth et sampling frequency.
C'est pas plutot sampling rate ?

Jean-Marc Boulier

C'est le cas de digital et numérique. Je me bats tant bien que mal pour le bon emploi, d'autant plus que le sens n'est pas le même en Anglais et Français.
Tu peux m'en dire plus ? Ca m'intéresse. Ca fait longtemps que j'ai quitté la France et en ce qui me concerne je n'utilise que le mot "digital" (en anglais, du coup) et je ne saisis pas la nuance.
Et tant qu'on y est, quelle est la bonne traduction de bit depth en français ?
Sinon pour revenir sur la question initiale, même si il n'y a pas de corrélation entre le niveau et le bit depth, il est quand même utile de préciser qu'une conséquence directe d'un enregistrement en 24 bits par rapport à 16 bits est de pouvoir baisser les niveaux d'entrée sans craindre la nuisance du bruit et donc de disposer de plus de marge par rapport au maximum digital.
Jean-Marc

Anonyme

Citation de Jan :Le schéma de dsikolg donne une idée des alignements courants.
C’est pas mon schéma, c’est celui que t’as posté précédemment dans un autre sujet, en 2014 il me semble.
Je ne le quitte plus depuis ce jour-là

Anonyme

Sinon pour revenir sur la question initiale, même si il n'y a pas de corrélation entre le niveau et le bit depth, il est quand même utile de préciser qu'une conséquence directe d'un enregistrement en 24 bits par rapport à 16 bits est de pouvoir baisser les niveaux d'entrée sans craindre la nuisance du bruit et donc de disposer de plus de marge par rapport au maximum digital.
Déjà fait, message n°9


Jan mk2

Et tant qu'on y est, quelle est la bonne traduction de bit depth en français ?
En audio, c'est résolution, à ne pas confondre avec la résolution d'une image. La définition de la résolution en audio numérique est le nombre de pas de quantification, et par extension, on peut exprimer ce nombre de pas en nombre d'octet/échantillon, donc codé en 16 ou 24bits (par exemple).
A propos de digital versus numérique, je suppose que Gulistan fait allusion au fait que le mot digital existe en français mais concerne tout autre chose, et que comme bien d'autres mots est utilisé à tord et à travers en lieu et place du mot français. Une STAN, tout le monde sait ce que c'est ici, mais pour moi une STAD (pour station de travail audio digitale) c'est un piano, ou une guitare.

Alan Parson a peut-être dit : "Audiophiles don't use their equipment to listen to your music. Audiophiles use your music to listen to their equipment."

Anonyme

A propos de digital versus numérique, je suppose que Gulistan fait allusion au fait que le mot digital existe en français mais concerne tout autre chose, et que comme bien d'autres mots est utilisé à tord et à travers en lieu et place du mot français. Une STAN, tout le monde sait ce que c'est ici, mais pour moi une STAD (pour station de travail audio digitale) c'est un piano, ou une guitare.
oui, c'est bien ça !

Deltank

Les circuits intégrés convertisseurs (A/N et N/A) utilisent une tension de référence (volts) afin de pouvoir fixer la valeur électrique maximale du signal analogique. Par exemple un convertisseur A/N 16 bits peut s'appuyer sur du 5 volts, et utiliser le 0 volt pour la valeur minimale. Il échantillonnera ainsi des valeurs de 0 à 5 volts, sur 65536 pas maximum entre ces deux extrêmes. Un convertisseur N/A 16 bits calibré aussi de 0 à 5 volts, produira un signal analogique variable de 0 à 5 volts sur 65536 pas maximum (avec donc un pas de 0,0000762939453125 volts).
C'est lors de la conception électronique que la tension de référence est fixée pour les convertisseurs, et généralement les concepteurs s'appuient sur les référentiels de tensions du domaine professionnel ou grand public, afin de respecter un standard pour l'entrée ou la sortie analogique. Dans le tableau présenté plus haut, le zéro d'une échelle en dB du domaine analogique correspond à la tension de référence utilisée pour définir cette échelle (ex: 0 dBu = 0,775 Volts). Pour les échelles en dB du domaine numérique (FS), vu qu'il y a un plafond numérique infranchissable (valeur max, tous les bits à 1), la tension de référence est fixée à une valeur négative, par exemple -18 dBFS pour la norme EBU.
Si on reviens au domaine analogique, il y a un aspect important qui est l'optimisation du signal analogique avant son envoi au convertisseur. En effet, il faut veiller à ce que le niveau électrique maximum du signal analogique soit au plus près de la tension de référence du convertisseur, afin de pouvoir utiliser toutes les valeurs de pas possibles du convertisseur, et donc toute sa résolution.
Par exemple pour un convertisseur avec une tension de référence de 0 dBu, il faut s'arranger pour que le signal analogique varie entre 0 et 0,775 volts. Si le signal ne varie que de zéro à la moitié de la tension de référence, la résolution sera mécaniquement divisée par deux.
À l'inverse, si le niveau électrique maximum du signal dépasse la tension de référence numérique, le convertisseur n'a plus de valeur à donner au signal (valeur max, tous les bits à 1), et il y a saturation (écrêtage).
Tout se joue donc à l'enregistrement et à la numérisation du signal audio, et pour que cette étape soit optimale, il faut connaître ces contraintes.
"Le monde se divise en deux catégories : ceux qui passent par la porte, et ceux qui passent par la fenêtre." (Tuco)
[ Dernière édition du message le 02/09/2021 à 15:11:00 ]

fa44

Merci à tous pour ces efforts de vulgarisation d'un sujet finalement pas si facile que çà à appréhender pour l'amateur lambda.
Je crois avoir enfin saisi pas mal de choses grâce aux échelles et vos explications de texte (j'avais l'essentiel des pièces du puzzles, mais je n'arrivais pas à les assembler correctement)
Je vais essayer un de ces quatre de faire une petite synthèse ( pour m'en assurer

Néanmoins j'ai encore besoin de 2 confirmations concernant 16 bits vs 24 bits:
J'ai compris que le passage de 16 à 24 bits ajoute 8 bits de poids faible en élargissant la plage dynamique.
Cela permet de quantifier et donc potentiellement d'entendre des niveaux d'entrée faibles qui ne pourraient l'être en 16 bits et d'éloigner le bruit de fond ("noise floor")
Pouvez-vous confirmer que:
1)Ramené au codage "octets", le passage de 16 à 24 bits revient à multiplier le mot 16 bits par 256 (soit un décalage de 8 bits à gauche).
Ainsi, en notation hexa, un échantillon codé "01AF" en 16 bits deviendrait "01AF00" en 24 bits.
Ce n'est peut-être pas si direct que çà, car il doit il avoir une histoire de bit de signe et peut-être 1 ou 2 bits de réserve "en haut" de l'échelle pour se préserver de la saturation numérique, mais est-ce bien l'esprit?
2)Pour le codage d'un échantillon donné entre -96dbFS et 0dbFS, le 24 bits n'est pas plus précis (mieux défini) que le 16 bits. L'erreur de quantification sur cet échantillon ne sera pas différente.
Bien cordialement,

Deltank

J'ai compris que le passage de 16 à 24 bits ajoute 8 bits de poids faible en élargissant la plage dynamique. Cela permet de quantifier et donc potentiellement d'entendre des niveaux d'entrée faibles qui ne pourraient l'être en 16 bits et d'éloigner le bruit de fond ("noise floor")
Attention, il s'agit du bruit de fond numérique, ou bruit de quantification. S'il y a du bruit de fond analogique dans le signal source, ce bruit de fond sera numérisé aussi, et pourra masquer les niveaux d'entrée faibles avant même la numérisation.
1)Ramené au codage "octets", le passage de 16 à 24 bits revient à multiplier le mot 16 bits par 256 (soit un décalage de 8 bits à gauche).
Ainsi, en notation hexa, un échantillon codé "01AF" en 16 bits deviendrait "01AF00" en 24 bits.
Ce n'est peut-être pas si direct que çà, car il doit il avoir une histoire de bit de signe et peut-être 1 ou 2 bits de réserve "en haut" de l'échelle pour se préserver de la saturation numérique, mais est-ce bien l'esprit?
Passer de 16 à 24 bits peut se faire mathématiquement en ajoutant des 0 de poids faible, mais dans ce cas cela n'apporte rien au signal numérisé. Il faut que la quantification soit faite en 24 bits au moment de la conversion pour que les bits de poids faibles aient une valeur liée au signal numérisé, et ainsi apporter la précision supplémentaire du 24 bits par rapport au 16 bits.
Par défaut sur les ADC et DAC, il n'y a pas de bit de signe, ni de bit de réserve. Cela est traité au niveau analogique (filtre DC, limiteur).
2)Pour le codage d'un échantillon donné entre -96dbFS et 0dbFS, le 24 bits n'est pas plus précis (mieux défini) que le 16 bits. L'erreur de quantification sur cet échantillon ne sera pas différente.
Le 24 bits est plus précis quel que soit le niveau du signal, car chaque échantillon est codé avec 8 bits supplémentaires.
"Le monde se divise en deux catégories : ceux qui passent par la porte, et ceux qui passent par la fenêtre." (Tuco)
[ Dernière édition du message le 02/09/2021 à 22:42:03 ]
- < Liste des sujets
- Charte
- 1
- 2