Se connecter
Se connecter

ou
Créer un compte

ou
FR
EN
Techniques du Son

réactions au dossier [DOSSIER] Les bases de l’encodage audio

  • 146 réponses
  • 32 participants
  • 74 381 vues
  • 31 followers
Sujet de la discussion [DOSSIER] Les bases de l’encodage audio
Si les termes "fréquence d'échantillonnage, "profondeur de bit" ou encore "modulation 1-bit" sont du chinois pour vous, voici quelques notions qui devraient vous éclairer...

Lire l'article
 


Ce thread a été créé automatiquement suite à la publication d'un article. N'hésitez pas à poster vos commentaires ici !
Afficher le sujet de la discussion
126
ok lol mrgreen

donc théoriquement le meilleur support  serait une bande qui tourne à    infini cm/secondes?

#ALAPLAJ L'été n'est pas fini partout!

127
le num fait mieux... mais le fameux effet de limite compression de la bande ... c'est quand même bon :o)
128
Ca va devenir un n-ième sujet sur analogique ou numérique ou hardware ou software ou sommateur ou mixage itb ou mac ou pc ? Ca serait cool que non.
129
Effectivement... il serait temps de retirer ce dossier non?
130
En fait l'enregistrement en analo sur bande c'est très très bien mais pas pour sa fidélité !!!!

vu que la réponse fréquentielle et dynamique de ce genre de jouet est tout sauf linéaire ou "transparente", ça devient des trucs interessants pour peu que l'on sache s'en servir

==> zieutez donc le topic sur "le son de steve Albini" ... ça c'est un gars qui utilise ce genre de jouet avec du talent...

d'ailleurs au final, un truc qui sonne la mort ça tient avant tout au talent du gars qui utilise intelligement le matos adapté à sa situation
(et sans parler de la compo, des arrangements ou de l'interprétation)

131
d'ailleurs je met toujours mon matos numérique au four avant de m'en servir pour que ça sonne plus chaud et mon matos analo au frigo pour qu'il sonne plus précis ...

ok je
132
133
Citation de duch :
Ca va devenir un n-ième sujet sur analogique ou numérique ou hardware ou software ou sommateur ou mixage itb ou mac ou pc ? Ca serait cool que non.

ok  ok j'arrête^^

#ALAPLAJ L'été n'est pas fini partout!

134
Dossier corrigé. Largement réécrit sur l'intro et divers passages, ajout d'un encadré, morceaux de Dr Pouet Inside, et élagage de la conclu. Si je trouve 5 minutes la semaine prochaine, le referai les visuels qui manquent.

N'hésitez pas à me faire vos remarques.

Merci aux critiques constructifs (Dr Pouet surtout) et encore désolé pour la première mouture.

__________________________________________________________________________________
Le GIEC chiffre à 3,3 milliards le nombre de victimes du réchauffement climatique. On en parle ?

 

135
Content d'avoir pu aider !


Citation :
Fourier et Nyquist sont dans un bateau…

Ha.

Citation :
24 bits, c’est bien certes, mais 1 bit c’est mieux vous diront certains.

Hôô.


Citation :
ce n’est que dans les années 80, quand la micro-électronique s'est développée et démocratisée grâce aux banques et aux jeux vidéos entre autres, qu’on a pu commencer à traiter des nombres à une vitesse suffisante pour faire quelque chose de beau avec : du son

Kilékon ce markkleback. 



Citation :
1000 mercis au Dr Pouet pour sa relecture critique

Et merci à toi !


(note à la rédaction : si Wolfen voit encore des erreurs, c'est lui qui a raison)
136
y'a pas à dire c'est quand même aut' chose.

En passant, j'ai tout de même relevé ca:
Citation :
 tandis que le nombre de valeurs qu’on est susceptible de faire correspondre à chaque échantillon est défini par ce qu’on appelle la ‘quantification’ (en bits).

pour moi c'est la résolution qui s'exprime en bits, la quantification étant l'opération consistant à attribuer cette valeur.

Citation :
Toujours en quête d’une meilleure définition audio, de nombreux convertisseurs travaillent toutefois aujourd’hui à des fréquences bien supérieures : 48, 88, 96 ou même 192 kHz... Mais ce seul paramètre ne garantit pas à lui seul la qualité de restitution. Dans ce contexte, il faut aussi considérer l’impact de la résolution audio, soit le nombre de bits grâce auxquels on pourra quantifier l’amplitude de chaque échantillon.

là, un petit article de Dan en source pourrait expliquer la chose plus en détail.

Et pour le bruit de quantification, je trouve qu'il manque un petit expliquatif sur le pourquoi du comment d'ou qu'sa vient, on en parle tout de suite sans vraiment savoir ce que c'est, d'ou ca vient et pourquoi on ne peu pas l'éliminer.

Un dernier truc, je vois pas bien la relation entre la dynamique dispo et le niveau de seuil de la douleur.

[ Dernière édition du message le 08/01/2010 à 21:29:30 ]

137
Si on considère que l'étendu dynamique de l'oreille va de 0 dB SPL jusqu'au seuil de douleur alors il n'ya pas besoin de pouvoir représenter une dynamique plus grande.

L'auditeur va ajuster le volume de manière a ce que les moment les plus sonores reste sous le seuil de douleur. Cela garanti que le bruit de quantif sera toujours en dessous de 0dB SPL (seuil d'audibilité).

[ Dernière édition du message le 09/01/2010 à 00:50:19 ]

138
Citation :
Merci aux critiques constructifs

Je dirais surtout merci aux critiques qui ne sont pas encore découragés par la publication d'articles techniques à la limite de l'acceptable (ou bien au delà de cette limite pour la version originale de celui-ci). Je ne parle pas pour moi, perso je suis découragé. Y'a pas de critiques personnelles, je connais la situation. Ca me blase juste qu'AF devienne "ça" ...

Juste quelques petites corrections et precision historiques :

Citation :
Quant à la décision de fixer la fréquence d’échantillonnage par défaut à 44 100 Hz, elle s’explique par le fonctionnement des premiers enregistreurs vidéo monochromes. Bien qu’un disque compact ne comporte aucun circuit vidéo, les premières techniques d’enregistrement utilisaient le même équipement. Et comme il existait deux standards différents d’enregistrement vidéo dans les années 70 (PAL et NTSC) fonctionnant à des fréquences différentes, la valeur 44,1 kHz résulte d’un compromis trouvé alors entre Sony et Philips, afin d’assurer une compatibilité mondiale des enregistrements audio [1].

Le système de transfert d'audio PCM en signal vidéo analogique sur bandes U-Matic auquel il est fait référence date de fin 70 - début 80, la vidéo est alors en couleur depuis un petit moment (et les standard PAL et NTSC ont été spécifiés pour et à cause de la vidéo couleur).

La valeur de 44,1 kHz ne résulte d'aucun compromis, c'est la fréquence exacte permise par ces systèmes en PAL : ce système permettait "d'inscrire" six samples par ligne vidéo (trois samples par canal pour de la stereo donc). Le PAL code la video sur 50 trames de 294 lignes par secondes (une image complète de 588 lignes étant composée de deux trames), il n'y a qu'à faire le calcul : 3 x 50 x 294 = 44 100 Hz. Le même système en NTSC fonctionne à 3 x 59,94 x 245 = 44 056 Hz. Les systèmes en question étaient majoritairement fabriqués par Sony, qui ont convaincu Philips lors de la mise en point du CD Audio d'utiliser leur standard au lieu des 44 000 Hz proposé par ces derniers. Le 16 bit était aussi la norme de Sony, les convertisseurs Philips travaillant en 14 bits (ils ont été ramené à la "qualité" 16 bit en utilisant un oversampling 4x).

Ces systèmes étaient utilisés pour le transfert et le mastering, pas pour l'enregistrement (ils étaient limités à la stéréo, pas de multipiste). Ils sont devenus obsolètes à l'apparition de la bande DAT.

Citation :
Dans les années 90 est en effet apparu une méthode alternative d’encodage audio, utilisée notamment par le format SACD. En vis-à-vis de la PCM, se dresse en effet l’alternative de l’encodage 1-bit Delta-Sigma.

L'invention de la modulation delta sigma date des années 60. Détail "comique", un des système de transfert d'audio numérique sur bande vidéo dont il était question juste avant, commercialisé par DBX, utilisait la modulation delta sigma au lieu du PCM (et offrait du coup une qualité sonore plus élevée : plus besoin de filtre anti aliasing et 16 dB de dynamique supplémentaire).

Ha oui aussi merci de virer le nom de l'auteur et de mettre "Dr Pouet" à la place.
139
Citation :
Ha oui aussi merci de virer le nom de l'auteur et de mettre "Dr Pouet" à la place.

+1

Sinon, merci Guitoo, j'avais pas capté ca comme ca.
140
Citation :
Ha oui aussi merci de virer le nom de l'auteur et de mettre "Dr Pouet" à la place.

Heu c'est sympa, mais non ! D'ailleurs je trouve que Los Teignos s'en est bien tiré, et ça a du lui prendre un petit paquet d'heures. En faisant l'exercice je me suis bien aperçu que c'était pas facile de remodeler l'article.

Et puis s'il est possible d'ajouter les dernières précisions de duch, docks, guitoo...

[ Dernière édition du message le 09/01/2010 à 01:50:48 ]

141
Je précise un truc pour être tout à fait exact : la partie visible d'une image PAL fait en fait 576 lignes et le total codé sur la bande fait 625 ligne, les lignes non visibles étant utilisées pour transmettre des données de synchro ou autre. En NTSC c'est 486 lignes visibles sur un total de 525. Pourquoi les adaptateurs PCM n'utilisaient pas la totalité des lignes dispo, je ne sais pas (on peut penser que comme en vidéo les lignes restantes étaient utilisées pour coder d'autre données comme du code de correction d'erreur par exemple).
142
Pour cause de bébé à babysiter, je ne ferai les ultimes corrections que lundi, en incluant les remarques de duch notamment, et celle sur la quantification.

Merci à vous.

__________________________________________________________________________________
Le GIEC chiffre à 3,3 milliards le nombre de victimes du réchauffement climatique. On en parle ?

 

143
Citation de : guitoo
Si on considère que l'étendu dynamique de l'oreille va de 0 dB SPL jusqu'au seuil de douleur alors il n'ya pas besoin de pouvoir représenter une dynamique plus grande.

L'auditeur va ajuster le volume de manière a ce que les moment les plus sonores reste sous le seuil de douleur. Cela garanti que le bruit de quantif sera toujours en dessous de 0dB SPL (seuil d'audibilité).

Bonjour à tous,
Je suis tout neuf dans les forums et je n'avais pas lu ce thread avant d'envoyer ma prose à Los Teignos en MP.
J'ai eu beaucoup de chance que cela ne fasse pas double emploi.
Je la recopie ici, vous me direz si je dis des co...ries  
Entre temps, il me semble que Los Teignos a supprimé la phrase de l'article

citation :
J'ai été assez choqué quand j'ai lu
"une plage dynamique théorique de 144 dB, soit un niveau relativement inutile puisque se situant bien au-delà du seuil de douleur pour l’oreille humaine"

Je crains en effet qu'il y ait amalgame entre plage dynamique et niveau sonore :

La plage dynamique est le rapport entre les valeurs extrêmes représentables, généralement des tensions, soit 20 log (Umax / U min) cas dans lequel on s'attachera non pas à savoir quel maximum on obtient avec 24 bits mais inversement puisqu'on ne peut pas quantifier plus précisément que le bit de poids faible, quelle est l'erreur induite, encore dénommée "bruit de quantification" lorsque ce bit de poids faible passe de 0 à 1 ou l'inverse.
C'est ce rapport Signal_Maxi/Bruit_de_quantification qui, avec 24bits, atteint effectivement 144dB.

Concrètement, si le circuit de conversion numérique/analogique final peut délivrer 1V comme tension maximale, l'erreur maximale de quantification sur le bit de poids faible est ramenée à 0,00000006V soit 0,06µV en 24bits alors qu'elle est 256 fois plus importante, avec une variation du bit de poids faible représentant 0,000015V soit 15µV en 16bits.

En résumé : on cherche à obtenir le signal le moins erroné possible, donc à minimiser l'influence de ce bit de poids faible, la référence étant le signal maximal : Plus on a de dynamique, plus petite sera l'erreur de quantification, il n'y a pas de limite basse, il suffit de rajouter des bits. On peut très bien imaginer quantifier sur 64bits et obtenir 385dB de dynamique théorique. Dans la pratique, le bruit électronique lors de l'encodage, le décodage, l'amplification etc. produisent à eux mêmes bien plus de défauts.

D'un autre côté, le niveau sonore les dB "acoustiques" ou encore dB SPL (sound pressure level)
Il s'agit bien sûr toujours d'un rapport, ici il s'agit de 20 log (P / P0) où P0 est le niveau conventionnel du seuil minimal de perception de l'oreille humaine d'un signal sinusoidal de 1kHz.
Une ambiance sonore de 130dB (seuil de la douleur) est dans ce cas 3 millions de fois plus puissante que le seuil de perception.
Dans ce cas, la référence est le seuil bas de perception. Plus les dB augmentent, plus le son est fort. Il y a par contre un maximum qui, à 194dB, représente une pression de 1 atmosphère.
Mon avis personnel serait de dire que la définition du dBSPL est erronée et qu'on aurait du prendre comme référence cette pression de 1 atmosphère, stable et physiquement mesurable et ensuite décliner le seuil de la douleur à -64dB puis celui de la perception à -194dB, ce dernier pouvant varier avec l'individu et l'age. Mais ceci est un autre débat.

En conclusion, ce n'est pas parce qu'on peut obtenir un rapport de signal/bruit de 144dB que l'on aura mal aux oreilles avec 14dB de plus que le seuil de la douleur fixé à 130 dB, c'est l'amalgame que je reproche à votre phrase.

Par contre, en écoutant une musique à la limite de la douleur, lors des passages de silence, avec 24bits le bruit de quantification sera 14dB plus faible que notre seuil de perception, donc imperceptible.
Alors qu'en 16bits, toujours en écoutant la même musique à donf', le bruit de quantification était 34dB au dessus de notre seuil de perception, le bruit ambiant dans une forêt, donc tout à fait perceptible.

Wiki : https://fr.wikipedia.org/wiki/D%C3%A9cibel

Conversion HQ Midi Wav/Ogg/Mp3 + Kok http://artagap.free.fr/karpbo/index.htm#dl

144
j'ai modifié le paragraphe pour éviter toutes ambiguïtés.

Par convention un niveau acoustique de 0dBSPL est à la limite du seuil de perception. Dans cette échelle le seuil de douleur est fixé a 130 dBSPL. On peut alors considérer que l'étendu dynamique de l'oreille est de 130 dB. Dans ces conditions, il n'est pas nécessaire de pouvoir représenter des signaux disposant d'une dynamique supérieure à 130 dB.


Si l'auditeur règle le volume de façon à faire correspondre le 0dBFs avec un niveau acoustique de 130 dBSPL alors le bruit de quantification à -144dBFs correspond a un niveau acoustique de -14dBSPL, soit un niveau bien en dessous du seuil de perception.
En revanche les phénomènes de masquages psycho-acoustiques et les bruits environnants font qu'une étendue dynamique de 144dB n'est en pratique pas nécessaire pour de la simple écoute en conditions normale.



[ Dernière édition du message le 09/01/2010 à 14:55:59 ]

145
Citation de : guitoo
j'ai modifié le paragraphe pour éviter toutes ambiguïté.

Par convention un niveau acoustique de 0dBSPL est à la limite du seuil de perception. Dans cette échelle le seuil de douleur est fixé a 130 dBSPL. On peut alors considérer que l'étendu dynamique de l'oreille est de 130 dB. Dans ces conditions, il n'est pas nécessaire de pouvoir représenter des signaux disposant d'une dynamique supérieure à 130 dB.


Si l'auditeur règle le volume de façon à faire correspondre le 0dBFs avec un niveau acoustique de 130 dBSPL alors le bruit de quantification à -144dBFs correspond a un niveau acoustique de -14dBSPL, soit un niveau bien en dessous du seuil de perception.
En revanche les phénomènes de masquages psycho-acoustiques et les bruits environnants font qu'une étendue dynamique de 144dB n'est en pratique pas nécessaire pour de la simple écoute en conditions normale.




CQFD, je suis d'accord.
D'un autre côté, 130dB peuvent être représentés avec 22 bits (dynamique de 132dB)
Mais allez demander à n'importe quel programmeur de faire des économies de place en n'utilisant que 22bits sur les 3 octets (24 bits) qu'l sera obligé d'utiliser, il va vous rire au nez mrgreen
Bon, je ne dis pas, sur un support sériel comme le CD où les bits sont lus les uns après les autres, entre 22 bits et 24 bits, il y a bien 10% de gain de place, mais on chipote, là bave

Conversion HQ Midi Wav/Ogg/Mp3 + Kok http://artagap.free.fr/karpbo/index.htm#dl

146
Citation :
Si l'auditeur règle le volume de façon à faire correspondre le 0dBFs avec un niveau acoustique de 130 dBSPL alors le bruit de quantification à -144dBFs correspond a un niveau acoustique de -14dBSPL, soit un niveau bien en dessous du seuil de perception.

mais quid de la réponse de l'ampli et de la sensibilité et compression des enceintes ?
147
Avec les musiques et mastering actuels, on a rarement une dynamique supérieure à 20dB, ça laisse 76dB de rapport signal / (bruit de quantification), c'est pas mal !

Je pense que le coup du seuil de la douleur est pour donner au néophyte une idée de la plage de dynamique utile. Ensuite il me semble qu'il faut plutôt raisonner en se disant : 96dB, c'est 40dB de dynamique (déjà énorme pour la plupart des disques) et 50dB de rapport signal / bruit sur les signaux les plus faibles.