Comment masteriser pour bandcamp et son stream tout ****** en mp3 128k ???!!!
- 62 réponses
- 8 participants
- 2 155 vues
- 11 followers
Des Baies
302
Posteur·euse AFfamé·e
Membre depuis 19 ans
Sujet de la discussion Posté le 07/06/2023 à 19:19:47Comment masteriser pour bandcamp et son stream tout ****** en mp3 128k ???!!!
Bonjour les gens...
Pratiquant bandcamp depuis 3 ans (la qualité du stream proposé en 2020 ayant fait partie des critères), je m'aperçois depuis quelques semaines que les sons que j'upload (FLAC 24 bits à -14 LUFS) sont complètement dénaturés
Ayant depuis quelques mois un compte sur bridge.audio, j'ai fait le test de poster EXACTEMENT le même fichier sur les 2 plateformes, et cela ne fait aucun doute : le son sur bandcamp n'est plus à la hauteur, à moins de savoir préparer le fichier en amont. Ce qui n'est pas mon cas, car je n'utilise plus le mp3 depuis longtemps que pour les dépôts SACEM lol
Après recherches sur la toile il semblerait que leurs standards aient changé depuis leur rachat par Epic Games (Fortnite ! ), lui-même étant en partie financé par le géant chinois Tencent
Bref, si quelqu'un pouvait m'indiquer comment procéder pour faire "avaler" mes super-fichiers-qui-sonnent-vachement-bien par du mp3 128k
Je serais volontiers preneur de quelques conseils !
Pratiquant bandcamp depuis 3 ans (la qualité du stream proposé en 2020 ayant fait partie des critères), je m'aperçois depuis quelques semaines que les sons que j'upload (FLAC 24 bits à -14 LUFS) sont complètement dénaturés
Ayant depuis quelques mois un compte sur bridge.audio, j'ai fait le test de poster EXACTEMENT le même fichier sur les 2 plateformes, et cela ne fait aucun doute : le son sur bandcamp n'est plus à la hauteur, à moins de savoir préparer le fichier en amont. Ce qui n'est pas mon cas, car je n'utilise plus le mp3 depuis longtemps que pour les dépôts SACEM lol
Après recherches sur la toile il semblerait que leurs standards aient changé depuis leur rachat par Epic Games (Fortnite ! ), lui-même étant en partie financé par le géant chinois Tencent
Bref, si quelqu'un pouvait m'indiquer comment procéder pour faire "avaler" mes super-fichiers-qui-sonnent-vachement-bien par du mp3 128k
Je serais volontiers preneur de quelques conseils !
Danbei
1891
AFicionado·a
Membre depuis 13 ans
41 Posté le 12/06/2023 à 22:45:57
Super les détails, merci
Citation :
Effectivement Après, je suppose que le mp3 n'a une plus grande gamme dynamique que si il a été généré à partir d'un fichier d'une profondeur supérieure à 16bit.
DocK'S
1584
AFicionado·a
Membre depuis 1 an
42 Posté le 12/06/2023 à 22:48:03
x
Hors sujet :ça me manquait ce genre de discussion, bien content d'être revenu
DocK'S
1584
AFicionado·a
Membre depuis 1 an
43 Posté le 15/06/2023 à 16:19:45
me revoilà, j'ai retrouvé quelques images des comparatifs de dithering dont je parlais plus haut.
Je vais essayer d'être le plus clair possible pour que tout le monde comprenne bien ce que ça montre.
1: dithering UV22HR réglé sur 16 bit et mis sur une piste audio vide dans un projet en 44.1 / 24 bit
2: dithering UV22HR réglé sur 16 bit et mis sur une piste audio vide dans un projet en 88.2 / 24 bit
3: dans une nouvelle session, lecture de l'export 44.1 / 16 bit issu du 1er cas:
4: lecture de l'export 44.1 / 16 bit issu du 2ème cas:
5: zoom sur la forme d'onde avec en haut (piste1) le cas n°3 et en bas (piste 2) le cas n°4:
La conclusion que je tire de ces observations et dont je parlais précédemment, c'est que:
si on regarde les niveaux de l'image N°4, qui correspond donc à l'export 44.1 / 16 bit réalisé avec dithering à partir d'une session 88.2 / 24 bit et l'image N°5 qui zoom sur les 2 formes d'ondes obtenues à partir de sessions à des FE différentes, on voit que le dithering devrait être, selon moi, appliqué après la conversion de fréquence d'échantillonnage et bien entendu avant la réduction de la résolution.
J'espère avoir été clair.
Edit: les images sont dans mon profil si vous voulez zoomer
Je vais essayer d'être le plus clair possible pour que tout le monde comprenne bien ce que ça montre.
1: dithering UV22HR réglé sur 16 bit et mis sur une piste audio vide dans un projet en 44.1 / 24 bit
2: dithering UV22HR réglé sur 16 bit et mis sur une piste audio vide dans un projet en 88.2 / 24 bit
3: dans une nouvelle session, lecture de l'export 44.1 / 16 bit issu du 1er cas:
4: lecture de l'export 44.1 / 16 bit issu du 2ème cas:
5: zoom sur la forme d'onde avec en haut (piste1) le cas n°3 et en bas (piste 2) le cas n°4:
La conclusion que je tire de ces observations et dont je parlais précédemment, c'est que:
si on regarde les niveaux de l'image N°4, qui correspond donc à l'export 44.1 / 16 bit réalisé avec dithering à partir d'une session 88.2 / 24 bit et l'image N°5 qui zoom sur les 2 formes d'ondes obtenues à partir de sessions à des FE différentes, on voit que le dithering devrait être, selon moi, appliqué après la conversion de fréquence d'échantillonnage et bien entendu avant la réduction de la résolution.
J'espère avoir été clair.
Edit: les images sont dans mon profil si vous voulez zoomer
[ Dernière édition du message le 15/06/2023 à 16:29:19 ]
Jean-Marc Boulier
458
Posteur·euse AFfamé·e
Membre depuis 5 ans
44 Posté le 15/06/2023 à 22:24:51
C'est très intéressant mais je ne suis pas convaincu
Le dithering n'a d'intérêt que lorsqu'on réduit la résolution (longueur de mot, ou word length). Le downsampling est une manipulation indépendante qui a ses propres inconvénients, mais qui n'interagit pas directement avec le dithering. On peut aussi préciser au passage, même si cela semble évident, que d'appliquer du dithering sur un fichier audio vide n'a pas de sens puisqu'il n'y a pas de bruit de quantification dans ce cas... mais j'ai bien compris que tu l'as fait pour l'intérêt du test, purement théorique.
Ce qui me gêne un peu c'est ton interprétation du résultat. En regardant les mêmes graphiques, j'ai une interprétation personnelle différente : je note d'abord que dans les deux cas il n'y a rien d'audible et donc zéro différence en pratique (ça mérite tout de même d'être signalé). Ensuite, la distribution du bruit qui est ramenée des fréquences hautes vers les mediums est typique du downsampling. Je pense que tous les programmes de conversion commencent par appliquer un filtre anti-aliasing qui va atténuer les fréquences situées au-dessus de la nouvelle fréquence de Nyquist (22,05kHz dans ton exemple car le nouveau SR est 44,1kHz). Pour moi ce qu'on voit sur tes spectrogrammes n'est que la manifestation de cette conversion avec filtre anti-aliasing. Mais je ne vois pas en quoi cela te mène à conclure qu'il vaut mieux appliquer le dithering avant le ré-échantillonage.
En d'autres termes, je pense que le ré-échantillonage entraînera toujours cette distorsion, indépendamment du dithering. Et le dithering est toujours nécessaire lorsqu'on réduit la résolution, indépendamment du ré-échantillonage.
Disclaimer : je ne suis pas un expert de ces sujets, il est possible qu'il y ait des choses qui m'échappent.
Le dithering n'a d'intérêt que lorsqu'on réduit la résolution (longueur de mot, ou word length). Le downsampling est une manipulation indépendante qui a ses propres inconvénients, mais qui n'interagit pas directement avec le dithering. On peut aussi préciser au passage, même si cela semble évident, que d'appliquer du dithering sur un fichier audio vide n'a pas de sens puisqu'il n'y a pas de bruit de quantification dans ce cas... mais j'ai bien compris que tu l'as fait pour l'intérêt du test, purement théorique.
Ce qui me gêne un peu c'est ton interprétation du résultat. En regardant les mêmes graphiques, j'ai une interprétation personnelle différente : je note d'abord que dans les deux cas il n'y a rien d'audible et donc zéro différence en pratique (ça mérite tout de même d'être signalé). Ensuite, la distribution du bruit qui est ramenée des fréquences hautes vers les mediums est typique du downsampling. Je pense que tous les programmes de conversion commencent par appliquer un filtre anti-aliasing qui va atténuer les fréquences situées au-dessus de la nouvelle fréquence de Nyquist (22,05kHz dans ton exemple car le nouveau SR est 44,1kHz). Pour moi ce qu'on voit sur tes spectrogrammes n'est que la manifestation de cette conversion avec filtre anti-aliasing. Mais je ne vois pas en quoi cela te mène à conclure qu'il vaut mieux appliquer le dithering avant le ré-échantillonage.
En d'autres termes, je pense que le ré-échantillonage entraînera toujours cette distorsion, indépendamment du dithering. Et le dithering est toujours nécessaire lorsqu'on réduit la résolution, indépendamment du ré-échantillonage.
Disclaimer : je ne suis pas un expert de ces sujets, il est possible qu'il y ait des choses qui m'échappent.
Jean-Marc
DocK'S
1584
AFicionado·a
Membre depuis 1 an
45 Posté le 15/06/2023 à 22:39:24
Citation :
Le dithering n'a d'intérêt que lorsqu'on réduit la résolution (longueur de mot, ou word length). Le downsampling est une manipulation indépendante qui a ses propres inconvénients, mais qui n'interagit pas directement avec le dithering.
On est parfaitement d'accord la dessus.
Le postulat de départ est que le dithering n'est pas fait pour être entendu en tant que tel mais pour masquer la troncature en introduisant un léger bruit mis en forme selon une loi de répartition (noise shaping).
Mais malgré tout, pour qu'il fasse ce qu'il est sensé faire, il faut que ça soit dans la bande passante qui nous intéresse.
Hors ce que montre les mesures, ce ne sont pas des distorsions mais la montée progressive du bruit du dithering, sauf que si on regarde les niveaux on est en dessous des -100dBFS à 20kHz.
C'est ce que montre également le zoom sur les formes d onde, on voit que pour le fichier qui n'a pas subit la SRC avant d'appliquer le dithering, il n'y a pratiquement rien, quasi aucun signal, donc le dithering étant quasi absent, il ne masquera pas les effets de la troncature.
Remplace le dithering par un filtre, tu comprends bien que si je met +3dB à 300kHz avec un facteur de qualité à 600, ça n'aura aucun impact dans la bande passante 20Hz/20kHz (je caricature volontairement).
Ben là pour moi c'est pareil, si le dithering est appliqué avant SRC, le bruit généré sera quasi inexistant dans la bande 20Hz/20kHz puisque le plus gros de son énergie est autour de FE/2 donc vers 40kHz pour un fichier en 88,2.
Et donc dans l'exemple du format évoqué au début de cette discussion, à savoir une FE de 96KHz, à mon avis il ne reste plus rien du dithering dans la bande 20/20, donc ça reviens à ne pas en mettre.
C'est plus clair?
Après tout ça c'est uniquement de la théorie pour satisfaire la curiosité de comprendre comment ça marche.
En pratique, sur de la musique actuelle avec des niveaux "normaux" je reste persuadé qu'avec ou sans dithering ne change rien, mais ça ne coûte rien de le mettre par principe, donc autant le faire.
[ Dernière édition du message le 15/06/2023 à 22:52:37 ]
DocK'S
1584
AFicionado·a
Membre depuis 1 an
46 Posté le 15/06/2023 à 23:54:22
Je ne peux pas le faire parce que mon studio est HS, mais ce que je conclu doit être facilement vérifiable avec un protocole similaire à celui décrit par Danbei post 35.
Partir d'une session en 96kHz et faire différents exports à niveau très bas, d'abord sans dither, puis avec dither mais avant SRC à 44.1, et enfin avec dither mais après SRC. Puis compenser l'atténuation de niveau qui a été faite au départ et comparer les exports.
Partir d'une session en 96kHz et faire différents exports à niveau très bas, d'abord sans dither, puis avec dither mais avant SRC à 44.1, et enfin avec dither mais après SRC. Puis compenser l'atténuation de niveau qui a été faite au départ et comparer les exports.
[ Dernière édition du message le 15/06/2023 à 23:55:38 ]
Jean-Marc Boulier
458
Posteur·euse AFfamé·e
Membre depuis 5 ans
47 Posté le 16/06/2023 à 00:46:12
Citation de DocK'S :
Hors ce que montre les mesures, ce ne sont pas des distorsions mais la montée progressive du bruit du dithering
Pour les figures 1, 2 et 3 oui, mais pas pour la figure 4... Ce qu'on voit sur la figure 4 c'est la distorsion introduite par la conversion de 88.1k à 44.1k : c'est typique du filtre anti-aliasing.
Citation :
Remplace le dithering par un filtre, tu comprends bien que si je met +3dB à 300kHz avec un facteur de qualité à 600, ça n'aura aucun impact dans la bande passante 20Hz/20kHz (je caricature volontairement).
Certes, mais l'objectif du noise shaping c'est justement de rendre le bruit de dither le moins audible possible donc si c'était possible de l'introduire à 300kHz ce serait plutôt une bonne chose !
Citation :
si le dithering est appliqué avant SRC, le bruit généré sera quasi inexistant dans la bande 20Hz/20kHz puisque le plus gros de son énergie est autour de FE/2 donc vers 40kHz pour un fichier en 88,2.
Ben non... Le gros de son énergie n'est pas spécialement à la fréquence de Nyquist. Dans ton exemple ça peut effectivement laisser penser ça car le UV22HR a cette particularité de déplacer l'essentiel de l'énergie au delà de 18kHz, mais ce n'est pas le cas de la majorité des autres "formes" de dither.
Il faut bien garder à l'esprit aussi que le but du dither n'est pas de "recouvrir" le bruit de quantification pour le masquer, mais d'introduire du bruit en amont pour éviter l'apparition des erreurs de quantification lors de la troncature. Le dither ne masque pas la distorsion, il la remplace par du bruit (qui se veut inaudible). D'ailleurs sur un enregistrement qui aurait du bruit de fond naturellement présent, il serait inutile d'appliquer du dithering.
Citation :
En pratique, sur de la musique actuelle avec des niveaux "normaux" je reste persuadé qu'avec ou sans dithering ne change rien
Oui c'est clair, si il n'y a aucun moment calme ou silencieux dans la musique, ça ne changera rien. Mais le bruit de quantification s'entend typiquement sur les queues de sustain/reverb, et ça c'est rare qu'il n'y en ait vraiment pas du tout, ne serait-ce que sur la fin d'une chanson.
Après, le dither a d'autant plus d'intérêt que la résolution est basse. En 16bit on peut entendre des bruits de quantification désagréables, en 24bit ça devient nettement plus difficile...
Au final, pour savoir si le dither est plus fort que le bruit de quantification, on peut aussi faire ce test assez simplement : il suffit d'exporter 2 fois une piste 24bit en la réduisant à 16bit (une avec dithering et une sans) puis importer les deux résultats dans une nouvelle session et faire un null test on peut même mesurer le résultat du null test pour en tirer des conclusions plus précises.
Jean-Marc
[ Dernière édition du message le 16/06/2023 à 00:49:12 ]
DocK'S
1584
AFicionado·a
Membre depuis 1 an
48 Posté le 16/06/2023 à 07:28:21
Citation :
Pour les figures 1, 2 et 3 oui, mais pas pour la figure 4... Ce qu'on voit sur la figure 4 c'est la distorsion introduite par la conversion de 88.1k à 44.1k
La figure 4 montre exactement la même chose que la figure 2, mais dans la partie de la bande 20Hz/20kHz alors que la figure 2 est sur une bande 20Hz/40kHz. (Compare les niveaux à chaque fréquence, tu verras que c'est la même "courbe", mais il faut aller dans mon profil pour zoomer sur les images, là dans le poste on ne voit pas très bien, je te l'accorde)
Citation :
Il faut bien garder à l'esprit aussi que le but du dither n'est pas de "recouvrir" le bruit de quantification pour le masquer, mais d'introduire du bruit en amont pour éviter l'apparition des erreurs de quantification lors de la troncature.
Tu as obligatoirement de l'erreur de quantification, comprise entre 0 et 1/2 pas de quantification.
Le "problème" de la troncature c'est que du coup les 3 ou 4 derniers bit du signal à la nouvelle résolution réduite ont à peu près toujours la même valeur, du coup on introduit un bruit haute fréquence qui permet de faire varier rapidement la valeur des derniers LSB, ce qui rend le résultat plus "naturel".
D'ailleurs le dither est un bruit numérique, donc il a lui même du BDQ, compris entre 0 et 1/2 pas de quantification.
Citation :
si c'était possible de l'introduire à 300kHz ce serait plutôt une bonne chose !
Je ne voit pas ce qui techniquement rend ça impossible, et pourtant ce n'est pas ce qu'on fait, on introduit ce bruit un poil en dessous de la fréquence de Nyquist, qui dépend de FE du projet.
Ce que montre les screens 2,4 et 5, c'est qu'introduire du dithering sur un fichier 96kHz revient à ne pas en mettre sur le même fichier à 44.1kHz, parce qu'il sera dégagé à la SRC, car au dessus de la bande passante finale.
En tout cas c'est que je constate.
https://fr.m.wikipedia.org/wiki/Dither_(audio)
Mais j'ai peut être loupé un truc.
[ Dernière édition du message le 16/06/2023 à 07:47:54 ]
DocK'S
1584
AFicionado·a
Membre depuis 1 an
49 Posté le 16/06/2023 à 10:41:16
J'ai relu un peu et j'ai peut-être capté où ça coince.
Je parle du cas où on part d'une session 96kHz/32bit (point de départ de la discussion) et où le format de destination est 44.1/16 bit.
Et je dit que dans ce cas, il y a un ordre à respecter et qu'il faut d'abord faire la SRC en restant en 32bit (ou 24) et ensuite abaisser la résolution en appliquant un dithering.
Je parle du cas où on part d'une session 96kHz/32bit (point de départ de la discussion) et où le format de destination est 44.1/16 bit.
Et je dit que dans ce cas, il y a un ordre à respecter et qu'il faut d'abord faire la SRC en restant en 32bit (ou 24) et ensuite abaisser la résolution en appliquant un dithering.
[ Dernière édition du message le 16/06/2023 à 10:41:44 ]
Jean-Marc Boulier
458
Posteur·euse AFfamé·e
Membre depuis 5 ans
50 Posté le 16/06/2023 à 12:25:08
Citation de DocK'S :
La figure 4 montre exactement la même chose que la figure 2, mais dans la partie de la bande 20Hz/20kHz alors que la figure 2 est sur une bande 20Hz/40kHz. (Compare les niveaux à chaque fréquence, tu verras que c'est la même "courbe", mais il faut aller dans mon profil pour zoomer sur les images, là dans le poste on ne voit pas très bien, je te l'accorde)
Ben justement c'est ce que j'ai fait, et je ne vois pas du tout les mêmes valeurs. Par exemple à 500Hz il n'y aucun signal sur la fig. 2 alors qu'on est à peu près à -113dB sur la fig. 4.
Citation :
Tu as obligatoirement de l'erreur de quantification, comprise entre 0 et 1/2 pas de quantification.
Oui j'aurais du dire "minimiser" au lieu de "éviter", mais le truc important c'est que le dither n'a pas pour but de masquer l'erreur de quantification en superposant un bruit "contraire" comme certains au moyen-âge se parfumaient pour masquer les odeurs corporelles vu qu'ils ne se lavaient pas (désolé pour la comparaison hasardeuse, c'est tout ce que j'ai trouvé ), mais d'introduire un signal en amont qui va réduire cette erreur à la source.
Citation :
Je ne voit pas ce qui techniquement rend ça impossible
Ben le théorème de Nyquist, qui dit qu'on ne peut pas avoir un signal de fréquence supérieure à la moitié de la fréquence d'échantillonge... non ? Dans ton fichier à 88.1kHz il est impossible d'avoir du signal à 300kHz.
Citation :
Ce que montre les screens 2,4 et 5, c'est qu'introduire du dithering sur un fichier 96kHz revient à ne pas en mettre sur le même fichier à 44.1kHz, parce qu'il sera dégagé à la SRC, car au dessus de la bande passante finale.
Je crois que je commence à comprendre ou tu veux en venir. Oui c'est vrai que la portion du bruit de dither qui a été introduite au-delà de la fréquence de Nyquist du nouveau SR va être filtrée durant le process de conversion et donc elle sera inutile au final, dans le cadre d'une réduction de la résolution + du downsampling. Mais justement c'est pour cela qu'on dispose d'une grande variété de noise shapes, pour pouvoir s'adapter à toutes les situations y compris celle-là, me semble-t-il.
Jean-Marc
- < Liste des sujets
- Charte