Comment masteriser pour bandcamp et son stream tout ****** en mp3 128k ???!!!
- 62 réponses
- 8 participants
- 2 731 vues
- 11 followers

Des Baies

Pratiquant bandcamp depuis 3 ans (la qualité du stream proposé en 2020 ayant fait partie des critères), je m'aperçois depuis quelques semaines que les sons que j'upload (FLAC 24 bits à -14 LUFS) sont complètement dénaturés

Ayant depuis quelques mois un compte sur bridge.audio, j'ai fait le test de poster EXACTEMENT le même fichier sur les 2 plateformes, et cela ne fait aucun doute : le son sur bandcamp n'est plus à la hauteur, à moins de savoir préparer le fichier en amont. Ce qui n'est pas mon cas, car je n'utilise plus le mp3 depuis longtemps que pour les dépôts SACEM lol
Après recherches sur la toile il semblerait que leurs standards aient changé depuis leur rachat par Epic Games (Fortnite !


Bref, si quelqu'un pouvait m'indiquer comment procéder pour faire "avaler" mes super-fichiers-qui-sonnent-vachement-bien par du mp3 128k

Je serais volontiers preneur de quelques conseils !

Danbei

C'est un peu contre intuitif, mais envoyer la plus grande résolution possible à la plateforme c'est risquer de réduire la qualité d'écoute. Un risque plutôt faible cela dit, mais comme ça mange pas de pain, pour être sur que l'utilisateur reçoit un truc propre, j'envoie du 16 bit avec dithering aux plateformes, comme ça pas de surprise.
[ Dernière édition du message le 11/06/2023 à 19:03:02 ]

Cowbell Studio

Attention à ne pas confondre la résolution à laquelle tu règles ton projet, et la résolution de calcul, qui a de fortes chances d'être du 64 bit flottant (double précision selon l'IEEE754https://fr.m.wikipedia.org/wiki/IEEE_754) voir même 80 bit flottant ( double précision étendue).
Mais quelque soient les résolutions de calcul, ce qui sera envoyé aux convertos pour la lecture du titre sera dans le meilleur des cas du 24 bit entier.
En toute rigueur il faudrait donc un dithering malgré tout car on passe d'une résolution à virgule flottante à une résolution en nombre entier.
Même si sur de la musique contemporaine, avec les niveaux généralement pratiqués, l'utilisation d'un dithering me semble assez anecdotique pour pas dire inutile d'un point de vue pratique, et encore plus en 96kHz, parce que vu là où sera le "bruit", on est pas prêt de l'entendre.
Merci de préciser la partie technique, c'est intéressant. Je n'ai pas le niveau pour en discuter sereinement, mais de ma compréhension j'exporte mes WAV en 32bits FP et mon DAW travaille en interne également avec cette taille (Reaper).
C'est au niveau de la conversion lors du monitoring que les convertisseurs D/A de l'interface travaillent en 24bits. Mais le fichier que j'exporte sur SC (et autres) est bien en 96Khz/32bits FP.
Si je me suis permis de rentrer dans les détails c'était pour exposer ma logique (potentiellement naïve) : je laisse la plateforme de destination se débrouiller en fournissant un fichier le plus brut possible plutôt que d'essayer d'anticiper les traitements qu'ils font.
Intéressant ta remarque concernant le dithering

Mon dernier album : Beware Of The Thinking Machine
www.cowbellstudio.com
[ Dernière édition du message le 11/06/2023 à 19:03:42 ]

DocK'S

Citation :Dock's, c'est toi qui était sur AF il y a quelques années (avec un avatar de Southpark) et qui avait construit ton home studio insonorisé ?
Je suis démasqué
C'est un peu contre intuitif, mais envoyer la plus grande résolution possible à la plateforme c'est risquer de réduire la qualité d'écoute. Un risque plutôt faible cela dit, mais comme ça mange pas de pain, pour être sur que l'utilisateur reçoit un truc propre, j'envoie du 16 bit avec dithering aux plateformes, comme ça pas de surprise.
Je serais aussi de cet avis.
Attention toutefois, avec des fréquences d'échantillonnage > 44.1 le noise shaping/dithering sera hors de l'audible, et donc inutile.
Je vais essayer de retrouver les comparatifs de dithering que j'avais fait à l'époque et qui mettaient en évidence que le dithering/noise shaping est généré dans les hautes fréquences de la bande passante relative à la fe du fichier.
Il y a également une vidéo qui circulait à l'époque dans laquelle Ethan Winners présidait une convention de l'AES qui traitait du dithering et de la différence prétenduement audible entre des algorithmes de dithering/noise shaping différents.( je vous laisse deviner la conclusion

de ma compréhension j'exporte mes WAV en 32bits FP et mon DAW travaille en interne également avec cette taille (Reaper).
Je connais très mal Reaper donc je n'ai aucune certitude mais ça fait déjà un bon bout de temps que les Stan traitent en 64 bit float en interne, je serais surpris que Reaper fasse exception.
[ Dernière édition du message le 11/06/2023 à 19:29:42 ]

Jean-Marc Boulier

Je bosse en 32 FP, donc normal que je les exporte comme cela, sans diminution du bitdepth
Si tu es sous Reaper, tu bosses en réalité en 64bit FP. A l'heure actuelle tous les DAW sont en floating point en interne. C'est uniquement lors de l'export que tu peux choisir une résolution différente, et tu as toute liberté d'exporter en FP, PCM ou autre, et avec la profondeur de bit de ton choix.
(pas de dithering comme ça)
En fait, si : les plateformes appliquent la plupart du temps un dithering lorsqu'elles réduisent la profondeur. SoundCloud convertit systématiquement tout ce que tu uploades en mp3 128kbps pour le streaming (même s'il reste possible de télécharger le fichier dans son format original lorsque l'option est activée), or les mp3 sont limités à une résolution de 16bit. On ne sait pas quelle est la qualité du dithering qu'ils appliquent mais étant donné leurs standards faibles, on peut supposer qu'il n'y a pas un grand effort apporté là-dessus. Donc il est plutôt conseillé de se charger soi-même du dithering et de livrer un fichier en 16bit sur SounCloud, si l'on veut avoir une plus grande maîtrise du process.
Et pour l'histoire du limiting, et bien je ne sais pas ce que font les plateformes
Ben c'est simple : elles ne font rien

- l'audio a une gamme dynamique importante et une sonie faible (ce qui devient rare ces dernières décennies)
- l'utilisateur possède un abonnement premium ET a manuellement changé les réglages par défaut pour activer le mode de normalisation "loud" (-11 LUFS)
En fait, la grande majorité des plateformes de streaming ne normalisent qu'à la baisse, précisément parceque c'est le seul moyen de s'assurer qu'on n'endommage pas l'audio. Spotify (et Apple Music, et peut-être quelques autres mais pas la majorité) normalise à la hausse également, mais de façon relativement intelligente : à l'exception du mode "loud", ils ne remontent le niveau que si la marge le permet, et gardent toujours 1dB TP de marge additionnelle. Mais une certaine plateforme (Pandora pour ne pas la nommer) applique la normalisation à la baisse comme à la hausse, et ce sans utiliser de limiteur (donc bonjour les dégâts sur du contenu dynamique et pas très fort...). Heureusement c'est une exception.
SoundCloud est une autre exception, mais dans un genre différent : c'est la seule plateforme qui ne pratique pas la normalisation. Cela fait des années que le sujet est "d'actualité" en interne et qu'ils prévoient de le faire mais clairement ça ne doit pas être dans leurs priorités. Pourtant des représentants officiels de SoundCloud étaient présents lors des réunions avec le comité de rédaction de l'AES lorsqu'il travaillait sur la publication technique TD1008, et tous les membres s'étaient prononcés en faveur de l'adoption des recommendations de ce document.
Et ce que je voulais dire c'est que je préfère rentrer un peu plus fort dans mon clipper/limiter pour ajouter de la distorsion qui apporte quelque chose au titre, plutôt que de ne pas le faire
Je suppose que tu fais de la musique dans un genre plutôt "agressif" (metal, dubstep, rap?...) En ce qui me concerne je recommande plutôt l'inverse, quel que soit le genre d'ailleurs, car je n'ai encore jamais entendu un limiteur qui apporte une distorsion bénéfique. Le pompage causé par la compression/limiting, ou la saturation harmonique causés par différents processeurs peuvent être des effets désirables, mais la distorsion apportée par un limiteur, c'est selon moi toujours atroce. Mais bon je suppose que cela peut être classé dans les questions de goût et reste subjectif...
Jean-Marc
[ Dernière édition du message le 11/06/2023 à 19:58:59 ]

DocK'S

je suis toujours surpris du rapport à la musique du "grand public".
Je connais des tas de gens qui cherchent systématiquement les films à télécharger en full HD et qui n'ont aucun problème avec le "poids" des fichiers mais pour ce qui est de la musique, le premier mp3 mal encodé qui traîne les satisfait pleinement.
Je trouve assez paradoxal et même "inquiétant" qu'on ai des capacités techniques (résolution/fe) qui soient incroyables et que dans le même temps beaucoup de gens utilisent des fichiers de qualité médiocre et qu'on subisse encore la loudness war, drôle de monde quand même

Cowbell Studio

Concernant le limiteur, oui je suis dans des genres musicaux assez agressif mais pas que. Cela dit quand je dis pousser fort dans le limiteur, je parle de 2-3dB de GR, pas bien plus. L'idée étant d'avoir un mix assez dense à la base, ce qui aide à atteindre des niveaux de loudness assez élevé si besoin.
Et je compare toujours avec et sans le limiteur (à loudness "matchée" bien sûr) : pour ma part j'aime assez souvent la distorsion qu'apporte le limiteur, Pro L-2 en l'occurence, dont la différence de son entre les différents modes est assez marquée et bien souvent intéressante. Dsl pour le HS.
Mon dernier album : Beware Of The Thinking Machine
www.cowbellstudio.com
[ Dernière édition du message le 11/06/2023 à 22:52:39 ]

DocK'S

Citation :Je vais faire l'expérience par curiosité d'envoyer deux fois le même morceau sur SC, l'un en 32 bits (sans dithering donc) et l'autre en 16 bits avec dithering.
Attention, pour que l'essai soit "valide", il faudra commencer par descendre la fréquence d'échantillonnage à 44.1kHz
parce qu'à 96kHz le gros du "bruit" du dithering va être au dessus des 40kHz, donc loin de l'audible.
Citation :je pense aussiQuelque chose me dit que la différence risque de plus tenir de l'effet placebo qu'autre chose. A voir.

Jean-Marc Boulier

Je vais faire l'expérience par curiosité d'envoyer deux fois le même morceau sur SC, l'un en 32 bits (sans dithering donc) et l'autre en 16 bits avec dithering. Quelque chose me dit que la différence risque de plus tenir de l'effet placebo qu'autre chose. A voir.
Le mieux dans ce cas est d'enregistrer la sortie audio de SoundCloud en train de streamer les deux versions, comme ça après tu peux faire un null test et avoir une idée plus précise de la différence.
L'idée étant d'avoir un mix assez dense à la base, ce qui aide à atteindre des niveaux de loudness assez élevé si besoin.
C'est la bonne démarche dans ce cas

Jean-Marc

Spacionot (ex Cola Verde)

[ Dernière édition du message le 12/06/2023 à 01:11:46 ]

Danbei

Attention toutefois, avec des fréquences d'échantillonnage > 44.1 le noise shaping/dithering sera hors de l'audible, et donc inutile.
Maintenant, j'upload en 44.1/16bits (donc dithérisé)
- Soit uniquement tronquer
- Soit appliquer un dithering, puis tronquer (c'est la bonne manière de faire)
Le potentiel problème qu'on peut avoir avec les plateformes de streaming c'est que le fichier de sortie pour l'utilisateur soit tronqué en 16bit sans dithering (après décodage du mp3/opus/aac). C'est pour cela que certains, dont moi, préfèrent appliquer un dithering avant de l'envoyer.
Je monte le curseur jusqu'au point où ça ajoute du détail au son
or les mp3 sont limités à une résolution de 16bit
J'ai produis quelques fichiers d'illustrations ici : https://fromsmash.com/F7lAjSYX7R-ct
Pour mettre en évidence les phénomènes il faut forcer un peu le trait en appliquand un gain négatif, faire l'encodage puis appliquer un gain positif :
- Je pars d'un extrait audio qui est une caisse clair avec beaucoup de reverbe
- Application d'un gain de -60 dB (pour aller chercher les problèmes de quantification) en PCM FP32
- Encodage dans différents formats (PCM 16bit avec/sans dither, avec/sans noise shaping, MP3).
- Décodage en PCM FP32 de chacun des fichiers produit et application d'un gain de +60dB (pour revenir à un niveau utilisable)
Avec ça on met en évidence les phénomènes du à la troncature, au dither, au noise shaping et au MP3. On entends donc les caractéristiques de chacun des défauts.
Je vous encourage à reproduire les test de votre coté. Il faut faire attention à ce que les outils utilisés n'appliquent pas du dithering ou d'autres choses automatiquement !
Mes conclusion sur les fichiers joins :
- Comme dit plus haut, le mp3 permet plus de dynamique que le PCM 16bit. Ce qui contredit l'idée selon laquelle le MP3 a du mal avec les niveaux faibles (ce que j'ai cru comprendre de certains messages plus haut). Le mp3 sait mieux faire ça que le PCM à virgule fixe en fait (le PCM flottant sait bien faire lui), c'est le fichier le plus proche de l'original, parmi les tests fait ici.
- Les artefacts de la troncature (16bit sans dithering) sont très moches. Même si souvent, c'est en fait inaudible.
- Le dithering permet efficacement de changer le son de la troncature par un bruit de fond à priori moins gênant, même si un peu fort.
- Le noise shaping permet de nettement réduire l'audibilité du dithering. C'est le deuxième fichier le plus proche de l'original, après le mp3.
Etant donné que le dithering avec noise shaping n'est pas difficile à faire (la plupart des outils permettent de le faire) autant le faire. Par contre faut pas que ça empêche de dormir la nuit : ce sera très certainement inaudible la plus part du temps.
Dernière petite remarque : faire cette petite expérience est très intéressant parce que ça permet de savoir comment ça sonne la troncature, le dithering, le noise shaping etc.. Ceci permet d'être critique fasse aux affirmations comme "Moi, j'entends la différence entre 16 bit et 24 bit, c'est plus dynamique !" : quand la description de ce qui est entendu ne correspond pas à ce comment ça sonne, on sait qu'il y a très certainement un problème dans le protocole de test ou qu'il y a de l'autosuggestion.
[ Dernière édition du message le 12/06/2023 à 19:46:22 ]

DocK'S

J'ai peut être mal compris ta phrase, mais c'est quand le dithering est le moins audible qu'il est justement le plus utile (ou plutôt le plus efficace) : sans le dithering on entends la troncature (enfin ... potentiellement), avec dithering on l'entends moins, avec noise shaping encore moins.
Je pense qu'on dit la même chose.
J'ai retrouvé le sujet où j'avais posté des screens d'un analyseur montrant le dithering seul ( plugin inséré sur une piste audio vierge) avec des comparatifs en fonction de la fe, malheureusement les screens sont des liens morts, je pense avoir les images sur un dd mais il faut que je fouille un peu. On y voit la répartition fréquentielle du dithering/noise shaping et les niveaux ( peak et rms) à différentes fe et avec différents algos de dithering/noise shaping ( de mémoire l'uv22hr, le pow-r1 et celui d'un limiteur waves genre L2 ou L3 je sais plus)

Spacionot (ex Cola Verde)

Pour le niveau de détails, c'est parce que ça adoucit la troncature, les artefacts, et donc ça permet d'entendre mieux les détails du mix.
On parle beaucoup de Mp3 pour le streaming mais il me semble que ça n'est pas forcément le format employer par les plateformes de streaming. Des infos ?
[ Dernière édition du message le 12/06/2023 à 20:08:49 ]

DocK'S


Danbei

Oui, je sais bien qu'on peut exporter en 16bits sans ditheriser, c'est bien pour ça que j'utilise un plugin de dithering...
On parle beaucoup de Mp3 pour le streaming mais il me semble que ça n'est pas forcément le format employer par les plateformes de streaming. Des infos ?
Opus (ou aac si le client ne supporte pas opus) pour YouTube
Aac pour Spotify et Apple Music
Mp3 pour Deezer
[ Dernière édition du message le 12/06/2023 à 20:34:02 ]

Jean-Marc Boulier

Non, les données compressé dans les mp3/opus/aac sont stocké en format flottant. Avec la dynamique qui va avec. Fun fact : un fichier mp3 à plus de dynamique qu'un fichier PCM 16 bit !
Merci pour l'info, c'est vrai qu'on qualifie la qualité d'un format lossy en bit rate alors qu'on peut mesurer les sample rate et bit depth en lossless. Après, je suppose que le mp3 n'a une plus grande gamme dynamique que si il a été généré à partir d'un fichier d'une profondeur supérieure à 16bit.
De ce que je sais :
Opus (ou aac si le client ne supporte pas opus) pour YouTube
Aac pour Spotify et Apple Music
Mp3 pour Deezer
Quelques précisions :
Spotify
Ogg/Vorbis pour les débits 96, 160 et 320 kbps
AAC pour 128 et 256 kbps
HE-AACv2 pour 24kbps

Apple
ALAC en lossless (jusqu'à 24-bit/192 kHz)
AAC pour le reste
Deezer
HiFi : 16-Bit/44.1 kHz FLAC
mp3 pour 64, 128 et 320kbps que ce soit sur mobile ou PC
SoundCloud
AAC 256kbps en HQ
mp3 128kbps pour le reste
Tidal
FLAC 16bit/44.1kHz en lossless
AAC 160kbps en lossy
Amazon Music
Opus 16bit/48kHz pour 48, 192 et 320 kbps
FLAC en HD et UHD (jusqu'à 24bit/192kHz)
Jean-Marc

Danbei


Après, je suppose que le mp3 n'a une plus grande gamme dynamique que si il a été généré à partir d'un fichier d'une profondeur supérieure à 16bit.

DocK'S

ça me manquait ce genre de discussion, bien content d'être revenu

DocK'S

Je vais essayer d'être le plus clair possible pour que tout le monde comprenne bien ce que ça montre.
1: dithering UV22HR réglé sur 16 bit et mis sur une piste audio vide dans un projet en 44.1 / 24 bit

2: dithering UV22HR réglé sur 16 bit et mis sur une piste audio vide dans un projet en 88.2 / 24 bit

3: dans une nouvelle session, lecture de l'export 44.1 / 16 bit issu du 1er cas:

4: lecture de l'export 44.1 / 16 bit issu du 2ème cas:

5: zoom sur la forme d'onde avec en haut (piste1) le cas n°3 et en bas (piste 2) le cas n°4:

La conclusion que je tire de ces observations et dont je parlais précédemment, c'est que:
si on regarde les niveaux de l'image N°4, qui correspond donc à l'export 44.1 / 16 bit réalisé avec dithering à partir d'une session 88.2 / 24 bit et l'image N°5 qui zoom sur les 2 formes d'ondes obtenues à partir de sessions à des FE différentes, on voit que le dithering devrait être, selon moi, appliqué après la conversion de fréquence d'échantillonnage et bien entendu avant la réduction de la résolution.
J'espère avoir été clair.

Edit: les images sont dans mon profil si vous voulez zoomer
[ Dernière édition du message le 15/06/2023 à 16:29:19 ]

Jean-Marc Boulier


Le dithering n'a d'intérêt que lorsqu'on réduit la résolution (longueur de mot, ou word length). Le downsampling est une manipulation indépendante qui a ses propres inconvénients, mais qui n'interagit pas directement avec le dithering. On peut aussi préciser au passage, même si cela semble évident, que d'appliquer du dithering sur un fichier audio vide n'a pas de sens puisqu'il n'y a pas de bruit de quantification dans ce cas... mais j'ai bien compris que tu l'as fait pour l'intérêt du test, purement théorique.
Ce qui me gêne un peu c'est ton interprétation du résultat. En regardant les mêmes graphiques, j'ai une interprétation personnelle différente : je note d'abord que dans les deux cas il n'y a rien d'audible et donc zéro différence en pratique (ça mérite tout de même d'être signalé). Ensuite, la distribution du bruit qui est ramenée des fréquences hautes vers les mediums est typique du downsampling. Je pense que tous les programmes de conversion commencent par appliquer un filtre anti-aliasing qui va atténuer les fréquences situées au-dessus de la nouvelle fréquence de Nyquist (22,05kHz dans ton exemple car le nouveau SR est 44,1kHz). Pour moi ce qu'on voit sur tes spectrogrammes n'est que la manifestation de cette conversion avec filtre anti-aliasing. Mais je ne vois pas en quoi cela te mène à conclure qu'il vaut mieux appliquer le dithering avant le ré-échantillonage.
En d'autres termes, je pense que le ré-échantillonage entraînera toujours cette distorsion, indépendamment du dithering. Et le dithering est toujours nécessaire lorsqu'on réduit la résolution, indépendamment du ré-échantillonage.
Disclaimer : je ne suis pas un expert de ces sujets, il est possible qu'il y ait des choses qui m'échappent.

Jean-Marc

DocK'S

Le dithering n'a d'intérêt que lorsqu'on réduit la résolution (longueur de mot, ou word length). Le downsampling est une manipulation indépendante qui a ses propres inconvénients, mais qui n'interagit pas directement avec le dithering.
On est parfaitement d'accord la dessus.
Le postulat de départ est que le dithering n'est pas fait pour être entendu en tant que tel mais pour masquer la troncature en introduisant un léger bruit mis en forme selon une loi de répartition (noise shaping).
Mais malgré tout, pour qu'il fasse ce qu'il est sensé faire, il faut que ça soit dans la bande passante qui nous intéresse.
Hors ce que montre les mesures, ce ne sont pas des distorsions mais la montée progressive du bruit du dithering, sauf que si on regarde les niveaux on est en dessous des -100dBFS à 20kHz.
C'est ce que montre également le zoom sur les formes d onde, on voit que pour le fichier qui n'a pas subit la SRC avant d'appliquer le dithering, il n'y a pratiquement rien, quasi aucun signal, donc le dithering étant quasi absent, il ne masquera pas les effets de la troncature.
Remplace le dithering par un filtre, tu comprends bien que si je met +3dB à 300kHz avec un facteur de qualité à 600, ça n'aura aucun impact dans la bande passante 20Hz/20kHz (je caricature volontairement).
Ben là pour moi c'est pareil, si le dithering est appliqué avant SRC, le bruit généré sera quasi inexistant dans la bande 20Hz/20kHz puisque le plus gros de son énergie est autour de FE/2 donc vers 40kHz pour un fichier en 88,2.
Et donc dans l'exemple du format évoqué au début de cette discussion, à savoir une FE de 96KHz, à mon avis il ne reste plus rien du dithering dans la bande 20/20, donc ça reviens à ne pas en mettre.
C'est plus clair?
Après tout ça c'est uniquement de la théorie pour satisfaire la curiosité de comprendre comment ça marche.
En pratique, sur de la musique actuelle avec des niveaux "normaux" je reste persuadé qu'avec ou sans dithering ne change rien, mais ça ne coûte rien de le mettre par principe, donc autant le faire.
[ Dernière édition du message le 15/06/2023 à 22:52:37 ]

DocK'S

Partir d'une session en 96kHz et faire différents exports à niveau très bas, d'abord sans dither, puis avec dither mais avant SRC à 44.1, et enfin avec dither mais après SRC. Puis compenser l'atténuation de niveau qui a été faite au départ et comparer les exports.
[ Dernière édition du message le 15/06/2023 à 23:55:38 ]

Jean-Marc Boulier

Hors ce que montre les mesures, ce ne sont pas des distorsions mais la montée progressive du bruit du dithering
Pour les figures 1, 2 et 3 oui, mais pas pour la figure 4... Ce qu'on voit sur la figure 4 c'est la distorsion introduite par la conversion de 88.1k à 44.1k : c'est typique du filtre anti-aliasing.
Remplace le dithering par un filtre, tu comprends bien que si je met +3dB à 300kHz avec un facteur de qualité à 600, ça n'aura aucun impact dans la bande passante 20Hz/20kHz (je caricature volontairement).
Certes, mais l'objectif du noise shaping c'est justement de rendre le bruit de dither le moins audible possible donc si c'était possible de l'introduire à 300kHz ce serait plutôt une bonne chose !
si le dithering est appliqué avant SRC, le bruit généré sera quasi inexistant dans la bande 20Hz/20kHz puisque le plus gros de son énergie est autour de FE/2 donc vers 40kHz pour un fichier en 88,2.
Ben non... Le gros de son énergie n'est pas spécialement à la fréquence de Nyquist. Dans ton exemple ça peut effectivement laisser penser ça car le UV22HR a cette particularité de déplacer l'essentiel de l'énergie au delà de 18kHz, mais ce n'est pas le cas de la majorité des autres "formes" de dither.
Il faut bien garder à l'esprit aussi que le but du dither n'est pas de "recouvrir" le bruit de quantification pour le masquer, mais d'introduire du bruit en amont pour éviter l'apparition des erreurs de quantification lors de la troncature. Le dither ne masque pas la distorsion, il la remplace par du bruit (qui se veut inaudible). D'ailleurs sur un enregistrement qui aurait du bruit de fond naturellement présent, il serait inutile d'appliquer du dithering.
En pratique, sur de la musique actuelle avec des niveaux "normaux" je reste persuadé qu'avec ou sans dithering ne change rien
Oui c'est clair, si il n'y a aucun moment calme ou silencieux dans la musique, ça ne changera rien. Mais le bruit de quantification s'entend typiquement sur les queues de sustain/reverb, et ça c'est rare qu'il n'y en ait vraiment pas du tout, ne serait-ce que sur la fin d'une chanson.
Après, le dither a d'autant plus d'intérêt que la résolution est basse. En 16bit on peut entendre des bruits de quantification désagréables, en 24bit ça devient nettement plus difficile...
Au final, pour savoir si le dither est plus fort que le bruit de quantification, on peut aussi faire ce test assez simplement : il suffit d'exporter 2 fois une piste 24bit en la réduisant à 16bit (une avec dithering et une sans) puis importer les deux résultats dans une nouvelle session et faire un null test on peut même mesurer le résultat du null test pour en tirer des conclusions plus précises.
Jean-Marc
[ Dernière édition du message le 16/06/2023 à 00:49:12 ]

DocK'S

Pour les figures 1, 2 et 3 oui, mais pas pour la figure 4... Ce qu'on voit sur la figure 4 c'est la distorsion introduite par la conversion de 88.1k à 44.1k
La figure 4 montre exactement la même chose que la figure 2, mais dans la partie de la bande 20Hz/20kHz alors que la figure 2 est sur une bande 20Hz/40kHz. (Compare les niveaux à chaque fréquence, tu verras que c'est la même "courbe", mais il faut aller dans mon profil pour zoomer sur les images, là dans le poste on ne voit pas très bien, je te l'accorde)
Il faut bien garder à l'esprit aussi que le but du dither n'est pas de "recouvrir" le bruit de quantification pour le masquer, mais d'introduire du bruit en amont pour éviter l'apparition des erreurs de quantification lors de la troncature.
Tu as obligatoirement de l'erreur de quantification, comprise entre 0 et 1/2 pas de quantification.
Le "problème" de la troncature c'est que du coup les 3 ou 4 derniers bit du signal à la nouvelle résolution réduite ont à peu près toujours la même valeur, du coup on introduit un bruit haute fréquence qui permet de faire varier rapidement la valeur des derniers LSB, ce qui rend le résultat plus "naturel".
D'ailleurs le dither est un bruit numérique, donc il a lui même du BDQ, compris entre 0 et 1/2 pas de quantification.
si c'était possible de l'introduire à 300kHz ce serait plutôt une bonne chose !
Je ne voit pas ce qui techniquement rend ça impossible, et pourtant ce n'est pas ce qu'on fait, on introduit ce bruit un poil en dessous de la fréquence de Nyquist, qui dépend de FE du projet.
Ce que montre les screens 2,4 et 5, c'est qu'introduire du dithering sur un fichier 96kHz revient à ne pas en mettre sur le même fichier à 44.1kHz, parce qu'il sera dégagé à la SRC, car au dessus de la bande passante finale.
En tout cas c'est que je constate.

https://fr.m.wikipedia.org/wiki/Dither_(audio)
Mais j'ai peut être loupé un truc.

[ Dernière édition du message le 16/06/2023 à 07:47:54 ]

DocK'S

Je parle du cas où on part d'une session 96kHz/32bit (point de départ de la discussion) et où le format de destination est 44.1/16 bit.
Et je dit que dans ce cas, il y a un ordre à respecter et qu'il faut d'abord faire la SRC en restant en 32bit (ou 24) et ensuite abaisser la résolution en appliquant un dithering.
[ Dernière édition du message le 16/06/2023 à 10:41:44 ]

Jean-Marc Boulier

La figure 4 montre exactement la même chose que la figure 2, mais dans la partie de la bande 20Hz/20kHz alors que la figure 2 est sur une bande 20Hz/40kHz. (Compare les niveaux à chaque fréquence, tu verras que c'est la même "courbe", mais il faut aller dans mon profil pour zoomer sur les images, là dans le poste on ne voit pas très bien, je te l'accorde)
Ben justement c'est ce que j'ai fait, et je ne vois pas du tout les mêmes valeurs. Par exemple à 500Hz il n'y aucun signal sur la fig. 2 alors qu'on est à peu près à -113dB sur la fig. 4.
Tu as obligatoirement de l'erreur de quantification, comprise entre 0 et 1/2 pas de quantification.
Oui j'aurais du dire "minimiser" au lieu de "éviter", mais le truc important c'est que le dither n'a pas pour but de masquer l'erreur de quantification en superposant un bruit "contraire" comme certains au moyen-âge se parfumaient pour masquer les odeurs corporelles vu qu'ils ne se lavaient pas (désolé pour la comparaison hasardeuse, c'est tout ce que j'ai trouvé

Je ne voit pas ce qui techniquement rend ça impossible
Ben le théorème de Nyquist, qui dit qu'on ne peut pas avoir un signal de fréquence supérieure à la moitié de la fréquence d'échantillonge... non ? Dans ton fichier à 88.1kHz il est impossible d'avoir du signal à 300kHz.
Ce que montre les screens 2,4 et 5, c'est qu'introduire du dithering sur un fichier 96kHz revient à ne pas en mettre sur le même fichier à 44.1kHz, parce qu'il sera dégagé à la SRC, car au dessus de la bande passante finale.
Je crois que je commence à comprendre ou tu veux en venir. Oui c'est vrai que la portion du bruit de dither qui a été introduite au-delà de la fréquence de Nyquist du nouveau SR va être filtrée durant le process de conversion et donc elle sera inutile au final, dans le cadre d'une réduction de la résolution + du downsampling. Mais justement c'est pour cela qu'on dispose d'une grande variété de noise shapes, pour pouvoir s'adapter à toutes les situations y compris celle-là, me semble-t-il.
Jean-Marc
- < Liste des sujets
- Charte