Le pub de Nyquist Shannon et leurs copains
- 173 réponses
- 21 participants
- 16 226 vues
- 45 followers
Dr Pouet
Donc questions et tests divers autours des convertisseurs anologique / numérique et dans l'autre sens, fréquences d'échantillonnage, repliement, technologies de fabrication, etc...
[ Dernière édition du message le 24/11/2010 à 23:06:31 ]
scare
Pour moi soit la phase ne bouge pas du tout, soit elle bouge de façon linéaire, sinon le son sera dénaturé.
Construction du nouveau studio
Visitez le site THD STUDIO / page FB THD Studio
Dossier : Conversion analogique-numérique (pour les courageux)
Danguit
scare
C'est une bonne nouvelle (je me suis pas trop mangé
). Arrives-tu a estimer une valeur pour le temps de groupe ?
Construction du nouveau studio
Visitez le site THD STUDIO / page FB THD Studio
Dossier : Conversion analogique-numérique (pour les courageux)
Danguit
Dr Pouet
Je souhaite rajouter ceci pour donner une explication concrète à OtherSeb et a ceux qui le souhaite
l'intérêt REEL de bosser en 24bits et minimum 96khz, voir 192khz à la prise et au mix.
les bits représente la dynamique possible. A savoir qu'en 16bits, nous avons une plage dynamique de 96db.
Demonstration rapide : en 16bits on a 2^16 (ou 65536)...on cherche les dbV, FS ou dbPa, donc pour le faire de tête c 2^16 donc 6*16, soit environ 96db.(on fait sinon 20Log(65536) )
De la même manière on a 24bits qui nous donnera environ 145db de dynamique possible.(rapport 1/16Millions!)
C'est tout simplement énorme. Le seuil de douleur de l'oreille étant situé autour de 120db, soit un rapport de 1(le seuil audible pour un million : les 120db), c'est environ 20bits.
Autant dire que le 32bits sont utiles si vous souhaitez faire des benchmarks, mais la musique s'en fout.
Les Hz sont basé sur une idée simple, on peut aller jusqu'a la moitié de cette fameuse fréquence. Soit 22k5 pour 44.1kHz. Donc à priori, pourquoi aller plus haut? Simplement parcequ'on peut aller jusqu'à 22k5, et non pas retranscrire fidèlement jusque cette fréquence. L'échantillonage agit comme un métronome, tous les 1/44.1millieme de seconde. Le probleme principal, c'est qu'autour de 22.5kHz, à la prise de son, la fréquence ne sera correctement capté et codé que lorsque le + de la sinusoide arrivera au premier coup de métronome, le - au deuxieme coup...d'ou une imprécision relativement forte aux extrêmes (disons 15-20khz) et une sensation d'un naturel qui fout le camp. L'AES préconise* des conditions de boulots autour de 192khz minimum...Mais bon trouvons un compromis avec notre matériel et nos conditions d'écoutes souvent trop médiocres!
Ce qu'il faut retenir de tout ça, c'est le codage à 24/96khz ou plus élevé permet d'obtenir un onde avec peu de crénelages, proche d'une onde analogique, le son paraitra donc plus naturel...C'est entre autre pour cette raison que le son analogique possède ce côté très plaisant!
Malgré tout ça ne fait pas tout...il ya les micros, les préamps, les convertisseurs, bref c'est une chaine dans laquelle on peut inclure cette solution qui ne coute rien, sinon quelques ressources et Go en plus sur la machine.
icon_exclaim.gif Et surtout, puisque le but est de revenir sur un CD 44.1/16bits, en fin de chaîne apres tous le traitements et faders, ne jamais oublier le dither icon_exclaim.gif (voir sur d'otres topics à ce sujet)
Derniere chose...on va me coincer parcequ'au final je dit qu'on revient à ce point de départ avec un CD en 44.1/16, mais c'est tout à fait différent de respecter la chaine du traitement jusqu'au bout pour réduire le mix final!(qui plus est avec des outils qui permettent de limiter la casse)
De la même manière en video on monte un projet en HD meme si le résultat sera un divx mégaupload... icon_crying1.gif
* On parle de phénomène d'"interleave", c'est à dire qu'une fréquence suraigu intéragissant avec une autre, peut donner une sensation audible, de plus au delà de ces fréquences audibles, des études montrent que les personnes ressentent un confort supérieur si la réponse en fréquence va au délà du spectre audible.(bon je sais ça ne parait pas clair pourtant...)
"Houlà, non, absolument aucun intérêt, sauf dans le cas où on est une chauve souris, un chat ou un toutou"
Et bien le premier intérêt c'est que tout traitement ultérieur sera à la nouvelle fréquence d'échantillonage et 24bits...donc une destruction de moins.
Par ailleurs, pourquoi les ingés en jazz enregistrent sur des consoles neves à 200 000euros et protools HD...en 192khz/24bits...(pour la frime??)
Bien entendu tu n'es pas obligé de me croire
[ Dernière édition du message le 07/02/2011 à 14:15:25 ]
Dr Pouet
De la même manière on a 24bits qui nous donnera environ 145db de dynamique possible. C'est tout simplement énorme.
Jusque là on est d'accord. (il s'agit de l'échantillonnage par l'interface audio, donc de "24 bits à virgule fixe" ).
Autant dire que le 32bits sont utiles si vous souhaitez faire des benchmarks, mais la musique s'en fout.
Premier bémol : généralement quand on parle de 32 bits, c'est "32 bits à virgule flottante". Ce qui veut dire 24bits pour la "partie utile du nombre" (= la mantisse = la partie où il n'y a pas que des zéros), et 8 bits pour l'exposant (ça permet de bouger la virgule = gérer la partie du nombre où il n'y a que des zéros).
Donc le 32bits flottant permet :
- de ne perdre aucun info par rapport au 24 bits fixe
- d'avoir un overhead énorme.
Ça permet normalement (sauf avec certains plug-ins mal faits) d'éviter ce qui serait une saturation sur un bus interne. Donc c'est bien en fait !
De toute manière tous les séquenceurs travaillent comme ça (ou alors en prévoyant un overhead spécifique côté Protools qui est en virgule fixe), donc il n'y a pas de question à se poser.
Ce qu'il faut retenir de tout ça, c'est le codage à 24/96khz ou plus élevé permet d'obtenir un onde avec peu de crénelages, proche d'une onde analogique, le son paraitra donc plus naturel...C'est entre autre pour cette raison que le son analogique possède ce côté très plaisant!
Ça c'est vraiment faux. Les crénelages correspondent à des fréquences supérieures à la fréquence de Nyquitst, le convertisseur NA doit donc les virer, ce qui se fait avec un filtre.
Par ailleurs, pourquoi les ingés en jazz enregistrent sur des consoles neves à 200 000euros et protools HD...en 192khz/24bits...(pour la frime??)
Les enregistrements de jazz ne sont certainement pas tous faits en 192kHz. Et parmi ceux en 88 ou 44, il y en a certainement de magnifiques.
De fait, Dan Lavry, qui est un spécialiste reconnu dans le monde des convertisseurs, et qui n'hésite pas à donner beaucoup d'explications (pas seulement son avis), estime que sans contrainte de compatibilité de format la fréquence d'échantillonnage idéale serait vers 70kHz.
Il faut rappeler un point important : une fréquence plus élevée n'est pas forcément meilleure. La comparaison courante avec le nombre de pixels dans une image est trompeuse. En fait si on augmente la fréquence d'échantillonnage, on réduit le temps disponible pour faire une mesure de qualité. Donc à 192kHz on aura plus d'échantillons, mais ils seront de moins bonne qualité qu'à 96kHz.
Et si c'est pour faire un CD (pas de la vidéo) il est préférable de travailler à un multiple de 44kHz : 44, 88, 176kHz... On court moins le risque de passer à un moment par une conversion foireuse.
Anonyme
+1 avec Dr pouet, ces histoires de crénelage qui serait meilleur c'est justement l'idée (répandue) que combat entre autre Dan Lavry.
Pour l'histoire d'avoir de meilleurs traitements si on enregistre en 24 bit, en soit c'est faux, puisque quelque soit la résolution du fichier utilisée lors de la quantification à la conversion, les traitements eux seront réalisés en 32 bit flottant ou plus (cas particuliers pour les cartes DSP comme le TDM, la powercore.....) où les calculs sont faits sur des entiers (souvent 48 bit) idem pour certaines tables de mix numériques.
Il faut aussi faire le distingo entre la dynamique réelle du converto (qui n'est pas de 24 bit, on peu aller de 17 à 21 bits réels selon la qualité du converto) et la dynamqiue du support qui elle est bien de 24 bit.
Et par curiosité, j'aimerais bien l'extrait des papiers de l'AES qui encourage à travailler à 192kHz en prétextant que c'est mieux et pourquoi.
[ Dernière édition du message le 07/02/2011 à 16:21:41 ]
scare
Aucun intérêt.
Le 44,1 que des avantages.
Construction du nouveau studio
Visitez le site THD STUDIO / page FB THD Studio
Dossier : Conversion analogique-numérique (pour les courageux)
clems_
Voila les citations tiré d'une convention AES de 2001
http://tech.juaneda.com/en/articles/dsd.pdf
page1 intro : "Arguments are given that the minimal frequency span needed to comply with the human auditory system is roughly 0-300 kHz"
Page 7/8, chapitre conclusion :
"Moreover, it is argued that the DSD format complies with the minimal
requirements set by the human hearing system in order to avoid audible
artifacts caused by digitizing the analog signal. For example, the
minimal sampling rate needed is about 350 kHz, which is not covered
by a 192 kHz PCM recording."
Je ne sais pas si il est autorisé de citer en anglais, néanmoins il s'agit de ma source.
Bien entendu je ne me suis pas penché en détail sur le sujet (la façon dont était converti le signal A>D), néanmoins partant du principe qu'ils dictent un paquet de normes et semblent faire autorité, je me suis permis de leur faire confiance.
Entierement d'accord pour les plugs pas tous compatibles 192KHz...
Néanmoins pourquoi propose t'il d'aller aussi loin dans la finesse de conversion, si en vérité il s'agit d'une vaste arnaque??
Perso je ne souhaite prendre plus parti, ça me semblait vrai puisque un ingé mastering me l'avait simplifié ainsi (euh non je ne le citerai pas!
), donc à priori, meme s'il s'agit du syndrome "blouse blanche"=il a raison, son boulot m'avait l'air méchament sérieux en terme de résultat.
Donc avec toute la curiosité qui s'impose je me ferais un plaisir de vous lire!
----emission braindance/acid---- http://www.radio-radio.net/emissions/acide.htm
Acid Adventures
[ Dernière édition du message le 07/02/2011 à 17:43:34 ]
Danguit
Les crénelages correspondent à des fréquences supérieures à la fréquence de Nyquitst
Si je ne m'abuse ce n'est pas le crénelage mais l'échantillonnage qui génère ces fréquences (théoriquement jusqu'à l'infini).
Le crénelage a un effet passe-bas qui permet d'éliminer une partie de ces fréquences.
Dr Pouet
Ça ne veut pas pour autant dire que tout ce qui est publié par l'AES devient une norme ou l'état des connaissances scientifiques ; ça doit être plus compliqué que ça.
On avait un sujet :
SONDAGE : y a-t-il quelqu'un qui puisse distinguer 44.1 vs 48 khz en test "à l'aveugle" ?
Faudrait le relire pour voir s'il y a des infos établies, en rapport avec notre discussion.
Pour le sujet d'aujourd'hui, il faudrait plutôt un enregistrement + mix en 88 kHz, puis tests à l'aveugle entre 44kHz et 88kHz.
Quand bien même quelques uns pourraient entendre une différence, elle serait pouillèmesque, en comparaison avec la différence entre les hifi de 80% des gens et un bon système de monitoring.
[ Dernière édition du message le 07/02/2011 à 17:55:03 ]
Dr Pouet
Il n'y a pas de différence audible entre 44.1 et 48 kHz en fréq. d'échantillonnage.
Le 44.1 était au départ destiné à l'audio et le 48 à la vidéo.
La fréquence n'est qu'un des aspects qualitatifs, et ce n'est pas le plus audible. Même de 96 à 44.1 il n'est pas certain que tu entendes la différence.
Il y a des convertisseurs qui rendent une meilleure qualité en 44.1 que d'autre en 96 kHz. Mais les fabricants affichent souvent une haute fréquence pour impressionner le client. Si tu compares un converto bas de gamme en 96 ou même 192 kHz et un haut de gamme en 44.1, tu entendras la différence (en faveur du haut de gamme).
Anonyme
faudrait lire le papier plus en détail, mais là, je vois pas le rapport avec le schmilblick, puisqu'il est question de comparer les fréquences d'échantillonnage du DSD et du PCM, et tout ce que je lit sur la citation c'est que le DSD travail à de plus hautes fréquences que le PCM, mais ça c’est pas un scoop, en fait je vois pas dans cette citation une quelconque phrase qui vante les bénéfices de l'échantillonnage en 192kHz en PCM. 
Pour l'expérience du mix en 88.2/44.1 je l'avais faite, et j'avais rien entendu de significatif, ça veut pas dire qu'il n'y a aucun intérêt, mais aujourd'hui la plupart des traitements pour lesquels il y a un potentiel intérêt (ce qui génère de la distorsion, les équa etc....) travaillent en sur-échantillonnage interne, plus vraiment de raisons donc de s'embêter avec des fichiers lourds et de monopoliser des ressources importantes à chaque étape alors qu'en utilisant des outils qui sur-échantillonnent là où ça nous semble apporter un plus et de manière ciblée, on arrive à la même chose.
Après, pour des cas particuliers, genre time stretching, là oui ça peut être un plus.
Citation :
Quand bien même quelques uns pourraient entendre une différence, elle serait pouillèmesque, en comparaison avec la différence entre les hifi de 80% des gens et un bon système de monitoring.
je pense aussi.
[ Dernière édition du message le 07/02/2011 à 19:20:17 ]
Anonyme
Farpaitement Docks, d'autant que parler de fréquence d'échantillonnage en DSD est une hérésie, il n'y a pas d'échantillonnage en DSD.
Je dois avouer que je n'ai rien compris à sa démonstration. Ca doit venir de moi, petite forme en ce moment ![]()
Zerosquare
D'ailleurs, en parlant du DSD, j'avais lu un papier qui disait que la façon dont le DSD était implémenté sur les SACD était fondamentalement foireux, avec démonstrations mathématiques à l'appui. Le type montrait qu'en gros, dans certains cas, la qualité était nettement moins bonne comparé à un stockage PCM classique. Je n'ai pas un niveau en maths suffisant pour vérifier, cependant.
Pour ma part, je considère que stocker de l'audio en DSD était un non-sens. C'est très difficile d'effectuer des traitements sur un flux DSD, alors qu'en PCM c'est beaucoup plus simple. Et on sait convertir facilement du PCM au DSD en temps réel, alors que l'inverse est plus complexe. Je me suis toujours demandé si le choix du DSD n'était pas un simple croc-en-jambes pour embêter ceux qui rippent les disques, plutôt qu'un réel argument technique.
La comparaison courante avec le nombre de pixels dans une image est trompeuse.
La différence, c'est qu'en imagerie on essaie encore de se rapprocher des limites de la perception humaine, alors qu'en audio on les a grosso modo atteintes.
Si je ne m'abuse ce n'est pas le crénelage mais l'échantillonnage qui génère ces fréquences (théoriquement jusqu'à l'infini).
Le crénelage a un effet passe-bas qui permet d'éliminer une partie de ces fréquences.
D'ailleurs je me demande si je ne vais pas brancher ma carte son sur mon oscillo, générer un signal proche de Fe/2 et prendre une photo de l'écran, pour tordre le cou une bonne fois pour toutes à l'idée qu'on obtient des marches d'escaliers au lieu d'un sinusoïde.
[ Dernière édition du message le 07/02/2011 à 23:48:51 ]
scare
Citation :
Farpaitement Docks, d'autant que parler de fréquence d'échantillonnage en DSD est une hérésie, il n'y a pas d'échantillonnage en DSD.
Le DSD est une modulation numérique delta sigma à la fréquence de (sur)échantillonnage de 2.8224 MHz (64 * 44,1 Khz)
Tous les signaux passant au travers de nos convertos actuels subissent une modulation delta sigma dans la boiboite, pour ensuite être convertis au format PCM par décimation.
Construction du nouveau studio
Visitez le site THD STUDIO / page FB THD Studio
Dossier : Conversion analogique-numérique (pour les courageux)
[ Dernière édition du message le 08/02/2011 à 02:04:08 ]
blackbollocks
wouhou le thread des psychopates est relancé!!!
#ALAPLAJ L'été n'est pas fini partout!
Danguit
pour tordre le cou une bonne fois pour toutes à l'idée qu'on obtient des marches d'escaliers au lieu d'un sinusoïde
Je l'ai déjà fait (SONDAGE : y a-t-il quelqu'un qui puisse distinguer 44.1 vs 48 khz en test "à l'aveugle" ?), et l'on trouve deux sinusoïdes et non une seule.
Dr Pouet
wouhou le thread des psychopates est relancé!!!
Pas tant que ça ; un fan de photo te dira qu'un appareil avec une grosse résolution, ça n'a aucun intérêt si le capteur et les optiques ne suivent pas
Oui ma comparaison était foireuse. En l'écrivant je me suis dit que ça serait bien d'en chercher une meilleure, et puis j'ai eu la flemme !
Même au niveau du capteur seul, on doit retrouver un problème similaire à l'audio: sur une surface donnée il doit y avoir un moment où augmenter le nombre de pixel réduit leur qualité de mesure.
Dans les 2 cas c'est une légende urbaine "plus ya de points, mieux c'est". C'est clair qu'un compact à 10Mpixels avec un objectif pourri ne vaudra pas un réflex un peu ancien à 7Mpixels et avec de bons objectifs.
D'ailleurs je me demande si je ne vais pas brancher ma carte son sur mon oscillo, générer un signal proche de Fe/2 et prendre une photo de l'écran,
Ce serait bien !
Farpaitement Docks, d'autant que parler de fréquence d'échantillonnage en DSD est une hérésie, il n'y a pas d'échantillonnage en DSD.
Ça me surprend un peu comme formulation. J'aimerais voir comment c'est présenté dans les cours de théorie du signal. Mais j'aurais dit qu'il s'agit bien d'un échantillonnage 1 bit à une fréquence élevée. Après ce qui nous intéresse c'est du 16 ou 24 bits PCM à une fréquence plus basse, et il y a un lien entre les deux.
C'est vrai que c'est pas vraiment un échantillon, plutôt une comparaison : si ça monte plus vite, on met un 1, si ça monte moins vite ou descend plus vite on met un 0... Mais ça revient bien à estimer à fréquence fixe une valeur numérique qui servira à représenter un signal analogique.
[ Dernière édition du message le 08/02/2011 à 10:39:25 ]
Danguit
1. La Fe 44.1k n’est spécifié que jusqu’à 20 kHz, valeur également donnée les fabricants d’interface audio. Au-delà, silence complet, mais quand on fait quelques mesures on constate que ce n’est pas le calme plat !
2. En entrée analogique, le filtrage anti-repliement est moins efficace que ce que l’on pourrait espérer. On trouve donc du repliement à un niveau non négligeable pour des signaux de fort niveau un peu au-dessus de Fe/2.
3. En sortie analogique, le filtrage est insuffisant pour éliminer les fréquences images proches de Fe/2, et que l’on retrouve avec une faible atténuation. Une sinusoïde représenté par des marches d’escalier dans le fichier numérique se transforme sur la sortie analogique en sinusoïde « propre » jusqu’à # 20 kHz, et en battement entre deux sinusoïdes (F et son image) entre # 20k et Fe/2-epsilon.
4. Dans un signal, les informations à fort niveau à plus de 20 kHz amèneront donc des distorsions importantes, pouvant même avoir un impact en dessous de 20 kHz puisque l’on retrouvera :
a. Entre # 20k et Fe/2, le signal initial mélangé au repliement des fréquences supérieures à Fe/2,
b. Au-delà de Fe/2, le symétrique du mélange précédent (par rapport à Fe/2).
c. Exemple simple, sur un somme de sinus en entrée (21k et 23k) on trouvera en sortie 21k, 21.1k (repliement du 23k), 23k (image du 23.1k), 23.1k (image du 21k) alors que théoriquement on aurait dû ne retrouver que 21k.
5. En ce qui concerne les non-linéarités (dans le traitement informatique ou la chaîne analogique), après réflexion la création de battements et autres artefacts existerait aussi avec un système de numérisation parfait (mais pas avec des résultats sonores identiques), par conséquent l’impact ne me paraît plus essentiel, sauf cas particulier.
6. L’utilisation d’une Fe supérieure, à contenu spectral identique, ne peut qu’améliorer les choses, puisque les problèmes évoqués précédemment seront rejetés plus haut, donc dans des zones où il y a moins d’énergie (normalement). Dans l’exemple du 4-c, une Fe de 48k ou plus permettrait de ne récupérer que les deux fréquences initiales (21k et 23k).
7.Rien ne prouve que ces observations soient valables pour d’autres interfaces et surtout celles haut de gamme (si quelqu’un a des infos…), mais cela semble cohérent avec les propos du sieur Lavry (même si je trouve son argumentation peu convaincante).
Je ne prétends pas détenir la vérité et je reconnais que c’est un peu long, mais si cela peut en éclairer certains…
scare
Construction du nouveau studio
Visitez le site THD STUDIO / page FB THD Studio
Dossier : Conversion analogique-numérique (pour les courageux)
Dr Pouet
Dr Pouet
6. L’utilisation d’une Fe supérieure, à contenu spectral identique, ne peut qu’améliorer les choses, puisque les problèmes évoqués précédemment seront rejetés plus haut, donc dans des zones où il y a moins d’énergie (normalement). Dans l’exemple du 4-c, une Fe de 48k ou plus permettrait de ne récupérer que les deux fréquences initiales (21k et 23k).
Ça vaudrait peut-être le coup d'essayer non ?
C'est pas Jan qui disait que les interfaces audio travaillent toutes en DSD à la même fréquence, et qu'ensuite elles font une conversion vers la profondeur et la fréquence choisies. Dans ce cas, le résultat ne serait-il pas toujours le même quelle que soit la Fe sélectionnée (44, 48, 88kHz) ?
scare
Citation :
Dans ce cas, le résultat ne serait-il pas toujours le même quelle que soit la Fe sélectionnée (44, 48, 88kHz) ?
Non le résultat serait différent car le Filtre passe bas numérique dans l'étage de décimation aura une Fc différente , et en fin de chaine, après décimation, Fe/2 sera différent selon la Fe finale voulue.
Le Delta sigma permet de s'affanchir des contraintes de design d'un filtre antirepliement analogique, et de basculer tout cela en numérique, avec une pente plus raide, plus éfficace et une bande passante plate. Cependant les contraintes évoquée par Danguit restent les mêmes, d'ailleurs les cartes son de danguit sont en delta sigma.
Construction du nouveau studio
Visitez le site THD STUDIO / page FB THD Studio
Dossier : Conversion analogique-numérique (pour les courageux)
Zerosquare
[ Dernière édition du message le 10/02/2011 à 01:40:59 ]
- < Liste des sujets
- Charte

