réactions au dossier [DOSSIER] Les bases de l’encodage audio
- 146 réponses
- 32 participants
- 73 763 vues
- 31 followers
Mark Kleback
1
Nouvel·le AFfilié·e
Membre depuis 15 ans
Sujet de la discussion Posté le 06/01/2010 à 15:49:52[DOSSIER] Les bases de l’encodage audio
Si les termes "fréquence d'échantillonnage, "profondeur de bit" ou encore "modulation 1-bit" sont du chinois pour vous, voici quelques notions qui devraient vous éclairer...
Lire l'article
Ce thread a été créé automatiquement suite à la publication d'un article. N'hésitez pas à poster vos commentaires ici !
Lire l'article
Ce thread a été créé automatiquement suite à la publication d'un article. N'hésitez pas à poster vos commentaires ici !
Anonyme
22808
141 Posté le 09/01/2010 à 02:01:50
Je précise un truc pour être tout à fait exact : la partie visible d'une image PAL fait en fait 576 lignes et le total codé sur la bande fait 625 ligne, les lignes non visibles étant utilisées pour transmettre des données de synchro ou autre. En NTSC c'est 486 lignes visibles sur un total de 525. Pourquoi les adaptateurs PCM n'utilisaient pas la totalité des lignes dispo, je ne sais pas (on peut penser que comme en vidéo les lignes restantes étaient utilisées pour coder d'autre données comme du code de correction d'erreur par exemple).
Los Teignos
9719
Administrateur·trice du site
Membre depuis 22 ans
142 Posté le 09/01/2010 à 13:11:48
Pour cause de bébé à babysiter, je ne ferai les ultimes corrections que lundi, en incluant les remarques de duch notamment, et celle sur la quantification.
Merci à vous.
Merci à vous.
__________________________________________________________________________________
Le GIEC chiffre à 3,3 milliards le nombre de victimes du réchauffement climatique. On en parle ?
Art60
113
Posteur·euse AFfiné·e
Membre depuis 17 ans
143 Posté le 09/01/2010 à 14:06:26
Citation de : guitoo
Bonjour à tous,
Je suis tout neuf dans les forums et je n'avais pas lu ce thread avant d'envoyer ma prose à Los Teignos en MP.
J'ai eu beaucoup de chance que cela ne fasse pas double emploi.
Je la recopie ici, vous me direz si je dis des co...ries
Entre temps, il me semble que Los Teignos a supprimé la phrase de l'article
citation :
J'ai été assez choqué quand j'ai lu
"une plage dynamique théorique de 144 dB, soit un niveau relativement inutile puisque se situant bien au-delà du seuil de douleur pour l’oreille humaine"
Je crains en effet qu'il y ait amalgame entre plage dynamique et niveau sonore :
La plage dynamique est le rapport entre les valeurs extrêmes représentables, généralement des tensions, soit 20 log (Umax / U min) cas dans lequel on s'attachera non pas à savoir quel maximum on obtient avec 24 bits mais inversement puisqu'on ne peut pas quantifier plus précisément que le bit de poids faible, quelle est l'erreur induite, encore dénommée "bruit de quantification" lorsque ce bit de poids faible passe de 0 à 1 ou l'inverse.
C'est ce rapport Signal_Maxi/Bruit_de_quantification qui, avec 24bits, atteint effectivement 144dB.
Concrètement, si le circuit de conversion numérique/analogique final peut délivrer 1V comme tension maximale, l'erreur maximale de quantification sur le bit de poids faible est ramenée à 0,00000006V soit 0,06µV en 24bits alors qu'elle est 256 fois plus importante, avec une variation du bit de poids faible représentant 0,000015V soit 15µV en 16bits.
En résumé : on cherche à obtenir le signal le moins erroné possible, donc à minimiser l'influence de ce bit de poids faible, la référence étant le signal maximal : Plus on a de dynamique, plus petite sera l'erreur de quantification, il n'y a pas de limite basse, il suffit de rajouter des bits. On peut très bien imaginer quantifier sur 64bits et obtenir 385dB de dynamique théorique. Dans la pratique, le bruit électronique lors de l'encodage, le décodage, l'amplification etc. produisent à eux mêmes bien plus de défauts.
D'un autre côté, le niveau sonore les dB "acoustiques" ou encore dB SPL (sound pressure level)
Il s'agit bien sûr toujours d'un rapport, ici il s'agit de 20 log (P / P0) où P0 est le niveau conventionnel du seuil minimal de perception de l'oreille humaine d'un signal sinusoidal de 1kHz.
Une ambiance sonore de 130dB (seuil de la douleur) est dans ce cas 3 millions de fois plus puissante que le seuil de perception.
Dans ce cas, la référence est le seuil bas de perception. Plus les dB augmentent, plus le son est fort. Il y a par contre un maximum qui, à 194dB, représente une pression de 1 atmosphère.
Mon avis personnel serait de dire que la définition du dBSPL est erronée et qu'on aurait du prendre comme référence cette pression de 1 atmosphère, stable et physiquement mesurable et ensuite décliner le seuil de la douleur à -64dB puis celui de la perception à -194dB, ce dernier pouvant varier avec l'individu et l'age. Mais ceci est un autre débat.
En conclusion, ce n'est pas parce qu'on peut obtenir un rapport de signal/bruit de 144dB que l'on aura mal aux oreilles avec 14dB de plus que le seuil de la douleur fixé à 130 dB, c'est l'amalgame que je reproche à votre phrase.
Par contre, en écoutant une musique à la limite de la douleur, lors des passages de silence, avec 24bits le bruit de quantification sera 14dB plus faible que notre seuil de perception, donc imperceptible.
Alors qu'en 16bits, toujours en écoutant la même musique à donf', le bruit de quantification était 34dB au dessus de notre seuil de perception, le bruit ambiant dans une forêt, donc tout à fait perceptible.
Wiki : https://fr.wikipedia.org/wiki/D%C3%A9cibel
Si on considère que l'étendu dynamique de l'oreille va de 0 dB SPL jusqu'au seuil de douleur alors il n'ya pas besoin de pouvoir représenter une dynamique plus grande.
L'auditeur va ajuster le volume de manière a ce que les moment les plus sonores reste sous le seuil de douleur. Cela garanti que le bruit de quantif sera toujours en dessous de 0dB SPL (seuil d'audibilité).
Bonjour à tous,
Je suis tout neuf dans les forums et je n'avais pas lu ce thread avant d'envoyer ma prose à Los Teignos en MP.
J'ai eu beaucoup de chance que cela ne fasse pas double emploi.
Je la recopie ici, vous me direz si je dis des co...ries
Entre temps, il me semble que Los Teignos a supprimé la phrase de l'article
citation :
J'ai été assez choqué quand j'ai lu
"une plage dynamique théorique de 144 dB, soit un niveau relativement inutile puisque se situant bien au-delà du seuil de douleur pour l’oreille humaine"
Je crains en effet qu'il y ait amalgame entre plage dynamique et niveau sonore :
La plage dynamique est le rapport entre les valeurs extrêmes représentables, généralement des tensions, soit 20 log (Umax / U min) cas dans lequel on s'attachera non pas à savoir quel maximum on obtient avec 24 bits mais inversement puisqu'on ne peut pas quantifier plus précisément que le bit de poids faible, quelle est l'erreur induite, encore dénommée "bruit de quantification" lorsque ce bit de poids faible passe de 0 à 1 ou l'inverse.
C'est ce rapport Signal_Maxi/Bruit_de_quantification qui, avec 24bits, atteint effectivement 144dB.
Concrètement, si le circuit de conversion numérique/analogique final peut délivrer 1V comme tension maximale, l'erreur maximale de quantification sur le bit de poids faible est ramenée à 0,00000006V soit 0,06µV en 24bits alors qu'elle est 256 fois plus importante, avec une variation du bit de poids faible représentant 0,000015V soit 15µV en 16bits.
En résumé : on cherche à obtenir le signal le moins erroné possible, donc à minimiser l'influence de ce bit de poids faible, la référence étant le signal maximal : Plus on a de dynamique, plus petite sera l'erreur de quantification, il n'y a pas de limite basse, il suffit de rajouter des bits. On peut très bien imaginer quantifier sur 64bits et obtenir 385dB de dynamique théorique. Dans la pratique, le bruit électronique lors de l'encodage, le décodage, l'amplification etc. produisent à eux mêmes bien plus de défauts.
D'un autre côté, le niveau sonore les dB "acoustiques" ou encore dB SPL (sound pressure level)
Il s'agit bien sûr toujours d'un rapport, ici il s'agit de 20 log (P / P0) où P0 est le niveau conventionnel du seuil minimal de perception de l'oreille humaine d'un signal sinusoidal de 1kHz.
Une ambiance sonore de 130dB (seuil de la douleur) est dans ce cas 3 millions de fois plus puissante que le seuil de perception.
Dans ce cas, la référence est le seuil bas de perception. Plus les dB augmentent, plus le son est fort. Il y a par contre un maximum qui, à 194dB, représente une pression de 1 atmosphère.
Mon avis personnel serait de dire que la définition du dBSPL est erronée et qu'on aurait du prendre comme référence cette pression de 1 atmosphère, stable et physiquement mesurable et ensuite décliner le seuil de la douleur à -64dB puis celui de la perception à -194dB, ce dernier pouvant varier avec l'individu et l'age. Mais ceci est un autre débat.
En conclusion, ce n'est pas parce qu'on peut obtenir un rapport de signal/bruit de 144dB que l'on aura mal aux oreilles avec 14dB de plus que le seuil de la douleur fixé à 130 dB, c'est l'amalgame que je reproche à votre phrase.
Par contre, en écoutant une musique à la limite de la douleur, lors des passages de silence, avec 24bits le bruit de quantification sera 14dB plus faible que notre seuil de perception, donc imperceptible.
Alors qu'en 16bits, toujours en écoutant la même musique à donf', le bruit de quantification était 34dB au dessus de notre seuil de perception, le bruit ambiant dans une forêt, donc tout à fait perceptible.
Wiki : https://fr.wikipedia.org/wiki/D%C3%A9cibel
Conversion HQ Midi Wav/Ogg/Mp3 + Kok http://artagap.free.fr/karpbo/index.htm#dl
guitoo
759
Posteur·euse AFfolé·e
Membre depuis 21 ans
144 Posté le 09/01/2010 à 14:48:50
j'ai modifié le paragraphe pour éviter toutes ambiguïtés.
Par convention un niveau acoustique de 0dBSPL est à la limite du seuil de perception. Dans cette échelle le seuil de douleur est fixé a 130 dBSPL. On peut alors considérer que l'étendu dynamique de l'oreille est de 130 dB. Dans ces conditions, il n'est pas nécessaire de pouvoir représenter des signaux disposant d'une dynamique supérieure à 130 dB.
Si l'auditeur règle le volume de façon à faire correspondre le 0dBFs avec un niveau acoustique de 130 dBSPL alors le bruit de quantification à -144dBFs correspond a un niveau acoustique de -14dBSPL, soit un niveau bien en dessous du seuil de perception.
En revanche les phénomènes de masquages psycho-acoustiques et les bruits environnants font qu'une étendue dynamique de 144dB n'est en pratique pas nécessaire pour de la simple écoute en conditions normale.
Par convention un niveau acoustique de 0dBSPL est à la limite du seuil de perception. Dans cette échelle le seuil de douleur est fixé a 130 dBSPL. On peut alors considérer que l'étendu dynamique de l'oreille est de 130 dB. Dans ces conditions, il n'est pas nécessaire de pouvoir représenter des signaux disposant d'une dynamique supérieure à 130 dB.
Si l'auditeur règle le volume de façon à faire correspondre le 0dBFs avec un niveau acoustique de 130 dBSPL alors le bruit de quantification à -144dBFs correspond a un niveau acoustique de -14dBSPL, soit un niveau bien en dessous du seuil de perception.
En revanche les phénomènes de masquages psycho-acoustiques et les bruits environnants font qu'une étendue dynamique de 144dB n'est en pratique pas nécessaire pour de la simple écoute en conditions normale.
[ Dernière édition du message le 09/01/2010 à 14:55:59 ]
Art60
113
Posteur·euse AFfiné·e
Membre depuis 17 ans
145 Posté le 09/01/2010 à 15:01:23
Citation de : guitoo
CQFD, je suis d'accord.
D'un autre côté, 130dB peuvent être représentés avec 22 bits (dynamique de 132dB)
Mais allez demander à n'importe quel programmeur de faire des économies de place en n'utilisant que 22bits sur les 3 octets (24 bits) qu'l sera obligé d'utiliser, il va vous rire au nez
Bon, je ne dis pas, sur un support sériel comme le CD où les bits sont lus les uns après les autres, entre 22 bits et 24 bits, il y a bien 10% de gain de place, mais on chipote, là
j'ai modifié le paragraphe pour éviter toutes ambiguïté.
Par convention un niveau acoustique de 0dBSPL est à la limite du seuil de perception. Dans cette échelle le seuil de douleur est fixé a 130 dBSPL. On peut alors considérer que l'étendu dynamique de l'oreille est de 130 dB. Dans ces conditions, il n'est pas nécessaire de pouvoir représenter des signaux disposant d'une dynamique supérieure à 130 dB.
Si l'auditeur règle le volume de façon à faire correspondre le 0dBFs avec un niveau acoustique de 130 dBSPL alors le bruit de quantification à -144dBFs correspond a un niveau acoustique de -14dBSPL, soit un niveau bien en dessous du seuil de perception.
En revanche les phénomènes de masquages psycho-acoustiques et les bruits environnants font qu'une étendue dynamique de 144dB n'est en pratique pas nécessaire pour de la simple écoute en conditions normale.
CQFD, je suis d'accord.
D'un autre côté, 130dB peuvent être représentés avec 22 bits (dynamique de 132dB)
Mais allez demander à n'importe quel programmeur de faire des économies de place en n'utilisant que 22bits sur les 3 octets (24 bits) qu'l sera obligé d'utiliser, il va vous rire au nez
Bon, je ne dis pas, sur un support sériel comme le CD où les bits sont lus les uns après les autres, entre 22 bits et 24 bits, il y a bien 10% de gain de place, mais on chipote, là
Conversion HQ Midi Wav/Ogg/Mp3 + Kok http://artagap.free.fr/karpbo/index.htm#dl
Anonyme
5666
146 Posté le 09/01/2010 à 16:15:57
Citation :
Si l'auditeur règle le volume de façon à faire correspondre le 0dBFs avec un niveau acoustique de 130 dBSPL alors le bruit de quantification à -144dBFs correspond a un niveau acoustique de -14dBSPL, soit un niveau bien en dessous du seuil de perception.
mais quid de la réponse de l'ampli et de la sensibilité et compression des enceintes ?
Dr Pouet
52037
Membre d’honneur
Membre depuis 20 ans
147 Posté le 09/01/2010 à 18:28:53
Avec les musiques et mastering actuels, on a rarement une dynamique supérieure à 20dB, ça laisse 76dB de rapport signal / (bruit de quantification), c'est pas mal !
Je pense que le coup du seuil de la douleur est pour donner au néophyte une idée de la plage de dynamique utile. Ensuite il me semble qu'il faut plutôt raisonner en se disant : 96dB, c'est 40dB de dynamique (déjà énorme pour la plupart des disques) et 50dB de rapport signal / bruit sur les signaux les plus faibles.
Je pense que le coup du seuil de la douleur est pour donner au néophyte une idée de la plage de dynamique utile. Ensuite il me semble qu'il faut plutôt raisonner en se disant : 96dB, c'est 40dB de dynamique (déjà énorme pour la plupart des disques) et 50dB de rapport signal / bruit sur les signaux les plus faibles.
- < Liste des sujets
- Charte