44,1Khz, 48Khz, 88Khz ou 96Khz en 2020 ?
- 384 réponses
- 50 participants
- 30 652 vues
- 60 followers
Shankar
Je me suis énormément pris la tête pour savoir quelle serait la meilleur fréquence pour travailler lorsque je créer, lorsque je mixe ou masterise mes morceaux.
Cette question, vous l’avez tous entendu un paquet de fois, cependant, nous sommes en 2020.
Les ordinateurs ont évolués, les plugins aussi.
Aujourd’hui la plus part des plugins prennent en compte l’oversampling, l’anti-aliasing…
La vérité d’hier est elle la même qu’aujourd’hui ?
Perso, Je boss all in the box.
J’ai un mac puissant, et je peux donc me permettre d’avoir des sessions bien chargé avec de belles emulations de Synthés, Reverbes, EQ, Compresseurs, Saturations, Tapes… pour traiter, Cleaner, ajuster ou même juste colorer le son.
Tous ces traitement génèrent aussi des artefacts qui viennent polluer mes mixes et je suis très soucieux de la qualité de mes mixes.
Je suis passé depuis peu au 96Khz, et j’ai vraiment le sentiment d’avoir gagné en définition et en largeur.
Malheureusement mon processeur à pris un un bon coup dans la gueule et mes disques dure se remplissent bien plus vite qu’avant
Je ne suis toujours pas sur de mon choix quand je met tout cela sur la balance.
Et vous aujourd’hui, vous bossez toujours comme avant ?
[ Dernière édition du message le 27/01/2020 à 00:43:10 ]
r0ck&roll
Citation de r0ck&roll :Je voudrais revenir un peu si vous êtes d'accord sur la fréquence d’échantillonnage. Je ne me sers que du 44.1 pour mes enregistrements, quels seraient selon vous les avantages/inconvénients à enregistrer à une fréquence d'échantillonnage plus élevée?
Fais-tu du time-streching ? du pitch-shifting ? du down-sampling ?
Non ?
Alors ne change rien.
La fausse idée de la latence plus basse en 96 ne justifie pas mieux l'intérêt. Le CPU aura plus de choses à traiter, ce qui va éventuellement créer des clics et il va falloir augmenter les buffers.
Merci Gulistan
SWAT 987
Je ne me sers que du 44.1 pour mes enregistrements, quels seraient selon vous les avantages/inconvénients à enregistrer à une fréquence d'échantillonnage plus élevée?
Si tu veux faire un clip vidéo de ta chanson : audio en 48 kHz.
Si tu veux mettre ta chanson sur YouTube : audio en 48 kHz (si je ne m'abuse).
Conclusion : prendre la fréquence d’échantillonnage la plus haute en fonction des contraintes techniques de diffusion. Mieux vaut convertir de 48 à 44,1 kHz que l'inverse car on ne peut pas créer de l'information absente.
SWAT - Sound Workshop & Audio Tactics
Accompagnement de projets, prises de son et mixage pour artistes non professionnels.
Le SWAT sur le web : Facebook - SoundCloud
Sarakyel
Citation de Sarakyel :
Si tu bosses avec une fréquence d'échantillonnage inférieure à celle des tes sources, le DAW créé temporairement des versions downsamplées de tes fichiers qu'il utilise tant que tu bosses à cette fréquence inférieure (donc dans mon cas tout est en 24/48). Mais quand t'as fini et que tu exportes ton mix stéréo, il n'utilise pas les fichiers temporaires resamplés, il fait un nouveau rendu à partir des sources elles-mêmes.
Non, ça se passe autrement.
Tu choisis les options re-sampling pour la lecture temps réel, et d'autres pour le rendu final.
Mais dans les 2 cas, il effectue le re-sampling AVANT toute chose.
Effectivement, my bad, il aurait été plus juste de dire "quand on fait un rendu de son mix, le DAW n'utilise pas les fichiers temporaires resamplés à la fréquence de fonctionnement des drivers, il fait un nouveau rendu à partir des sources resamplées et processées au taux d'échantillonnage sélectionné pour le projet (et donc sans resampling s'il s'agit du même taux que celui de la source)."
[ Dernière édition du message le 31/01/2020 à 13:47:38 ]
Danbei
Citation de gulistan :Ben si tu ne mets pas de dithering entre 32 et 24 bit (en considérant que les 32bit sont réellement utilisés, ce qui n'est pas le cas sur un fichier brut - sauf cas extrèmement rare d'un converto 32bit) et si tu appliques un gain de 100dB, tu va mettre en évidence la troncation. Si tu mets du dithering, ça sera plus "joli". Mais tu auras dans tous les cas un bon gros son de merde.
Si on convertie de 32 à 24 bit sans dithering et avec un signal qui ne contient pas naturellement de bruit, le résultat de la troncature n'est pas "un bruit à -144dBFS", mais c'est de la distorsion harmonique (et plus) et un gain de 0dB peut suffire pour entendre les artefacts.
A mon avis, le fait de monter ou pas le niveau après la troncature ne change pas vraiment le problème.
Je pense qu'il y a une confusion à propos du résultat de la quantification, on parle d'un coté de distorsion et d'un autre coté de bruit à -96 dBFS (16bit) ou -144 dBFS (24bit). Les deux sont possible :
- S'il n'y a pas de bruit dans le signal (vraiment rien), la quantification amène de la distorsion éventuellement audible, même en 24 bit. Dans ce cas là, la quantification n'est pas équivalente à un bruit de fond.
- S'il y a assez de bruit dans le signal (ce qui arrive le plus souvent sans rien faire), la quantification peut être vue comme un bruit à -96 dBFS (16bit) ou -144 dBFS (24bit). Dans ce cas la il n'y a pas de distorsion harmonique.
Il faut du bruit pour que la quantification ce passe bien, s'il y en a déjà c'est OK, sinon il faut en ajouter, et ce quelque soit la résolution.
Maintenant, si la réduction de résolution est faite correctement, on ne devrais pas avoir autre chose qu'un bruit de fond plus haut.
Plus de détails :
- https://www.ece.rutgers.edu/~orfanidi/intro2sp/orfanidis-i2sp.pdf, page 83, partie 2.5,
- https://www.researchgate.net/profile/Rob_Wannamaker/publication/236340550_Quantization_and_Dither_A_Theoretical_Survey/links/5964605aaca2728c11274f6f/Quantization-and-Dither-A-Theoretical-Survey.pdf, partie 2.
Anonyme
Nous en dirions c'qu'on en pense.
[ Dernière édition du message le 31/01/2020 à 20:33:28 ]
Anonyme
xHors sujet :Citation de gulistan :Ben si tu ne mets pas de dithering entre 32 et 24 bit (en considérant que les 32bit sont réellement utilisés, ce qui n'est pas le cas sur un fichier brut - sauf cas extrèmement rare d'un converto 32bit) et si tu appliques un gain de 100dB, tu va mettre en évidence la troncation. Si tu mets du dithering, ça sera plus "joli". Mais tu auras dans tous les cas un bon gros son de merde.
Si on convertie de 32 à 24 bit sans dithering et avec un signal qui ne contient pas naturellement de bruit, le résultat de la troncature n'est pas "un bruit à -144dBFS", mais c'est de la distorsion harmonique (et plus) et un gain de 0dB peut suffire pour entendre les artefacts.
A mon avis, le fait de monter ou pas le niveau après la troncature ne change pas vraiment le problème.
Je serais curieux d'entendre un exemple humainement audible.
Danbei
[ Dernière édition du message le 01/02/2020 à 09:04:44 ]
Anonyme
Sinon tu ne pourras probablement pas entendre la différence entre deux fichiers un en 16 un en 24. D’autant qu’il faudra deux sessions. Pas plus que la grande majorité des gens ne distinguent un mp3 bien encodé d’un fichier .wav. Par contre enregistrer et mixer tout un projet en 24 bits permet de voir tout l’intérêt de la chose.
[ Dernière édition du message le 01/02/2020 à 07:10:03 ]
Danbei
[ Dernière édition du message le 01/02/2020 à 09:15:20 ]
Anonyme
Gulistan si les chiffres disent le contraire de ce que tu affirmes. Non seulement tu gagnes beaucoup en rapport signal bruit mais également en crosstalk (12 db dans cet exemple). De plus le rapport signal bruit est plus qu’essentiel pour la qualité du rendu final. Je vais donc dans le sens de Fmarine.
Sinon tu ne pourras probablement pas entendre la différence entre deux fichiers un en 16 un en 24. D’autant qu’il faudra deux sessions. Pas plus que la grande majorité des gens ne distinguent un mp3 bien encodé d’un fichier .wav. Par contre enregistrer et mixer tout un projet en 24 bits permet de voir tout l’intérêt de la chose.
Sauf que ton exemple compare 2 choses différentes. L'augmentation de la quantification ET de la fréquence d'échantillonnage.
Comme je l'ai dit, le rapport signal bruit augmente avec l'augmentation de la quantification. Le test ne dit pas le contraire.
Le crosstalk est lié à l'augmentation de la fe.
Ensuite, je te laisse mettre les choses dans leur contexte et pondérer les 12dB avec les niveaux en jeu.
Anonyme
[ Dernière édition du message le 01/02/2020 à 10:01:00 ]
Jimbass
La conversion 24 bits à la prise a démontré son intérêt (headroom avant saturation, bruit de quantification inaudible, le tout même avec un signal très dynamique), y'a pas de raison de faire autrement. Quant aux récents convertisseurs 32 bits d'AKM (qui n'ont probablement que 28 ou 30 bits utiles), je doute que ca apporte grand-chose à moins peut-être de pouvoir convertir directement le signal d'un micro, sans préamplification.
Après, à la restitution du mix donc sur un signal qui a beaucoup moins de dynamique, il n'y aura certainement pas de différence audible entre 24 et 16 bits. Surtout si ca a été masterisé façon "loudness war".
Concernant les fréquences d'échantillonnage, c'est un sujet qu'on a déjà essoré à maintes reprises sur AF, et y'a rien de neuf en 2020 non plus. Le seul intérêt d'un échantillonnage supérieur à 48kHz est de relâcher les contraintes sur le filtre anti-repliement, qui peut donc être moins cher à performances équivalentes.
Musikmesser 2013 - Bullshit Gourous - Tocxic Instruments - festivals Foud'Rock, Metal Sphère et la Tour met les Watts
Anonyme
Plus sérieusement, pour contenter tout le monde, puisque ce sujet mainte fois rabâché est pourtant toujours d'actualité, il suffirait de faire des tests avec le logiciel RMAA sur une même interface à différentes fréquences et taux d'échantillonnage. Tout le monde peut mettre en œuvre ce test soit-dit en passant. Et on peut rapprocher les différences de chiffres avec les différences décelées à l'oreille. On pourra quantifier l'importance du changement de quantification et/ou de résolution, et faire le rapport entre le gain entendu ou ressenti, placebo ou pas, les contraintes, et le gain qualitatif réellement mesuré.
Enfin bon moi je reste en 24/44 ou 24/48 ceci-dit, ça me convient très bien.
[ Dernière édition du message le 01/02/2020 à 11:17:09 ]
alex.d.
Gulistan si les chiffres disent le contraire de ce que tu affirmes. Non seulement tu gagnes beaucoup en rapport signal bruit mais également en crosstalk (12 db dans cet exemple).
Je ne voudrais pas m'immiscer dans votre débat, mais le crosstalk n'est pas plus mauvais. Il y a en effet 12dB de différence sur les chiffres bruts, mais en 16 bits, qui a une dynamique de 96dB, un crosstalk à -98.2dB est simplement au maximum physique. Dit autrement : sur tes 16 bits, la perturbation du signal due au crosstalk se fait sur moins d'un demi bit, en dessous du bruit introduit par le dithering.
Anonyme
Je ne voudrais pas m'immiscer dans votre débat, mais le crosstalk n'est pas plus mauvais. Il y a en effet 12dB de différence sur les chiffres bruts, mais en 16 bits, qui a une dynamique de 96dB, un crosstalk à -98.2dB est simplement au maximum physique. Dit autrement : sur tes 16 bits, la perturbation du signal due au crosstalk se fait sur moins d'un demi bit, en dessous du bruit introduit par le dithering.
Ne te gêne pas surtout, c'est avec plaisir, c'est un forum et aucun avis n'est plus important qu'un autre. La E-Mu 1212m est mesurée à -99.1 db en 16/44 mais je veux bien te croire, vu que ça reste serré. Cependant en ce qui concerne les chiffres bruts qui sont représentatifs d'une réalité physique, le crosstalk est bien plus mauvais.
Cependant j'avais cru comprendre que cette différence au niveau du crosstalk était liée à la fréquence d'échantillonnage, non à la quantification qui n'est censée rapporter qu'un gain en S/N?
La vraie question pour moi reste au fond y'a-t-il des différences mesurées, est-ce que tout cela s'entend et est-ce que le gain justifie de travailler dans une résolution et/ou quantification supérieure. Au delà de ça quel serait le meilleur choix pour l'initiateur du Thread qui a bien dû le lâcher depuis 12 pages?
[ Dernière édition du message le 01/02/2020 à 12:18:47 ]
Alex Plosion
rroland
Est-ce que des vrais tests à l'aveugle ne peuvent pas mettre tout le monde d'accord?
Cela dépend aussi des moniteurs sur lesquels on écoute.
Deux exemples vécus :
1) Il y a quelques années, j’avais effectué une mise à jour du logiciel audio du studio, la veille d’un enregistrement.
La session débute, par l’enregistrement des batteries. En fin de journée, les clients partis je vais manger et repasse au studio et réécoute ce qui s’est fait la journée. Cela sonnait un peu petit, ce dont je ne m’étais pas vraiment rendu compte dans le feu de l’action. En fait, suite à la mise à jour, le logiciel était repassé en 16 bit.
2) Très régulièrement, quand je reçois des titres à masteriser je les écoute au studio de mixage (sur des écoutes sérieuses). Au studio de mastering (sur des écoutes encore plus sérieuses : PMC IBS2, amplification Bryston), contrôleur de monitoring Crane Song Avocet, il m’arrive de percevoir de petites choses que je n’avais pas entendues. Genre un bruit parasite, une reverb imparfaite. Comme si les défauts étaient plus apparents. C’est simplement que les moniteurs sont plus performants.
Mais je conçois très bien que sur des écoutes Home Studio des tas de défauts (et de qualités) passent inaperçus.
[ Dernière édition du message le 01/02/2020 à 14:23:56 ]
Shankar
Effectivement, ca fait un petit moment que j'ai laché l'affaire.
Les commentaires on déviés de ma question posée à l'origine du post et en plus cela devient très pointu.
Je te cache pas que parfois j'ai du mal à suivre, je trouve cela super intéressant, et même si je participe peu pour alimenter le débat (parfois, vaut mieux ce taire plutôt que de dire des conneries), je vous suit et je vous lis très attentivement, et en plus j'apprend pleins de choses.
Pour cela, un grand merci encore à vous tous.
Me concernant, la question du choix de bosser en 16 ou 24bit (aujourd'hui en 2020) est clair, je suis en 24Bit et je compte bien y rester.
Je crois que la plupart seront d'accord avec moi.
Là ou je coince encore, c'est plutôt pour savoir si le plus judicieux pour moi serait de bosser en 88 ou 96khz.
Comme précisé dans mes précédents posts, je boss All in the Box.
Beaucoup de synths virtuels, de traitements plugins qui engendre de l'artefact tels que des satus, distos, comps, eqs, revs, tape...
Du sound design, time stretch, pitch....
Et pour finir, j'applique des conversions pour revenir sur des formats CD 16/44 ou pour l'image en 24/48.
alex.d.
Ne te gêne pas surtout, c'est avec plaisir, c'est un forum et aucun avis n'est plus important qu'un autre. La E-Mu 1212m est mesurée à -99.1 db en 16/44 mais je veux bien te croire, vu que ça reste serré. Cependant en ce qui concerne les chiffres bruts qui sont représentatifs d'une réalité physique, le crosstalk est bien plus mauvais.
Ce que je voulais dire, c'est que la limite physique pour du 16 bits, c'est -96dB. Tout ce qui est en dessous est en dessous du bruit de fond, donc un crosstalk à moins de -96dB, ça veut dire qu'il n'y en a pas. Faire la différence entre un crosstalk à -98dB et un à -110dB, c'est comme faire la différence entre un à -110dB et un à -250dB : dans l'absolu, le second est meilleur que le premier ; mais en pratique, on est au-delà de la perception de l'oreille humaine.
Anonyme
Citation :Est-ce que des vrais tests à l'aveugle ne peuvent pas mettre tout le monde d'accord?
Cela dépend aussi des moniteurs sur lesquels on écoute.
Deux exemples vécus :
1) Il y a quelques années, j’avais effectué une mise à jour du logiciel audio du studio, la veille d’un enregistrement.
La session débute, par l’enregistrement des batteries. En fin de journée, les clients partis je vais manger et repasse au studio et réécoute ce qui s’est fait la journée. Cela sonnait un peu petit, ce dont je ne m’étais pas vraiment rendu compte dans le feu de l’action. En fait, suite à la mise à jour, le logiciel était repassé en 16 bit.
Donc les 96dB de dynamique ne suffisaient pas ?
Et combien de fois as-tu eu cette impression alors que la session était en 24bit ?
Attentions aux biais de confirmation, genre le téléphone sonne et c'est Roger, et je pensais justement à lui. Et combien de fois je pense à lui dans une année sans que le tél sonne ?
[ Dernière édition du message le 01/02/2020 à 14:58:09 ]
oboreal
Rroland : Il est évident qu'on entend plus facilement des différences, sur des moniteurs très haut de gamme dans une acoustique parfaitement contrôlée (qui inclue aussi un bruit de fond très faible), et je pense que personne ne nie cela. C'est d'ailleurs la raison pour laquelle, si on veut faire un test ABX, on se place dans les meilleures conditions d'écoute qu'on peut avoir à disposition pour se donner toutes les chances de bien percevoir les différences si elles existent.
Du coup si Gulistan fait un blind test, ce serait cool que tu participe, ça pourra permettre de fiabiliser le test.
Par contre, ton second exemple me semble illustrer un problème de raisonnement qui peut conduire à des interprétation erronées.
En effet, ton exemple avec la batterie montre une corrélation entre deux phénomènes.
- Mon Daw était passé en 16 bits sans que je m'en rende compte et dans le même temps, j'ai eu l'impression que mes prises batterie sonnaient un peu petites.
Et si je comprend bien ton raisonnement (parce que tu ne le formule pas aussi clairement, donc je ne voudrais pas déformer tes propos), tu semble en tirer une causalité :
- Mes prises de batterie sonnaient "petit" parce que mon Daw était passé en 16 bits sans que je m'en rende compte.
Cette conclusion est peut être vraie, sauf que cette expérience ne permet pas de conclure ça. Ta batterie pouvait en effet te sembler sonner un peu petit pour plein d'autres raisons n'ayant rien à voir avec le changement de fréquence d’échantillonnage.
Au mieux, ce que permet une telle expérience c'est de faire une hypothèse qui qui sera à vérifier dans des conditions contrôlées type ABX.
[ Dernière édition du message le 01/02/2020 à 15:54:41 ]
rroland
Cette conclusion est peut être vraie, sauf que cette expérience ne permet pas de conclure ça. Ta batterie pouvait en effet te sembler sonner un peu petit pour plein d'autres raisons n'ayant rien à voir avec le changement de fréquence d’échantillonnage.
Sauf que le lendemain, on a refait les prises en 24 bit, et que cela sonnait mieux. Peut-être que le batteur était plus en forme le deuxième jour, ou que sa batterie avait bonifié durant la nuit?
Non, en fait, c'était assez audible (je précise que c'était du jazz, avec pas mal de nuances), et je m'en voulais surtout de ne pas l'avoir entendu de suite.
J'ajoute que l'oreille (comme le reste), cela s'éduque, et que pratiquer sur de bonnes enceintes permet d'éduquer plus rapidement et plus aisément l'ouïe. Malgré l'âge, et un organe auditif objectivement moins performant que quand j'avais 20 ans, j'entends plus de choses aujourd'hui, parce que l'expérience (l'usage) et l'entrainement font que l'écoute s'est améliorée. j'insiste : l'écoute, pas l'ouïe.
Donc les 96dB de dynamique ne suffisaient pas ?
C'est très théorique, les 96 dB (comme le sont les 144 dB du 24 bit). Aujourd'hui, les meilleurs convertos font environ 123 dB en conversion A/N (on perd donc +/- 20 dB par rapport à la théorie). Et on peut comparer en direct un DAD ou un Cranesong avec un converto plus entrée de gamme dont les données techniques seront quasi identiques, et entendre aisément la différence, spécialement quand on masterise, où le convertisseur travaille à la limite du maximum.
Par contre, ce qui n'a pas été évoqué ici, ce sont les formats comme le DSD ou DXD qui semblent moins "vendeurs" que la fréquence d'échantillonnage, et ont pourtant un impact réel et mesurée sur la qualité.
[ Dernière édition du message le 01/02/2020 à 21:34:09 ]
oboreal
Sauf que le lendemain, on a refait les prises en 24 bit, et que cela sonnait mieux. Peut-être que le batteur était plus en forme le deuxième jour, ou que sa batterie avait bonifié durant la nuit?
La première hypothèse est fort possible... Qu'est ce qui fait que tu l'écarte ? Ce n'est pas à toi que je vais apprendre que le son d'une batterie est au moins à 50 % dans les mains et les pieds du batteur. Donc clairement, une différence de forme du batteur, une plus grande attention à son toucher peut largement expliquer à elle seule la différence sonore perçue.
Un changement d'hygrométrie et de température peut aussi faire bouger les fûts et les peaux... Bref, il y a bien trop de variables pour conclure à une causalité dans tous les cas.
Mais avant toute autre chose, le point central, c'est que le changement de résolution ne permet pas d'expliquer le changement sonore que tu décris, qui semble plutôt de l'ordre du fréquentiel et temporel, et qui est codé par la fréquence d’échantillonnage, pas par le bit depth.
Une conséquence possible du changement de bit depth aurait pu être du cliping sur un bus au sein d'un template conçu en 24 bits par exemple, ou un bruit de fond audible suite à un gain staging de plusieurs dizaines de dB. Là, oui, l'observation était raccord avec la théorie, cohérente avec la raison pour laquelle la plupart des studios bossent en 24 bits et il n'aurait pas forcément été nécessaire d'aller voir plus loin.
Dans le cas que tu décris en revanche, la causalité que tu dis identifier, va à contresens de tout ce qu'on peut lire dans les ouvrages sérieux.
Pour ceux que ça intéresse, voilà des éléments de synthèse que j'ai relu / écouté pour rafraichir mes connaissances et nous permettront peut être d'échanger sur des bases plus solides :
- https://sonicscoop.com/2013/08/29/why-almost-everything-you-thought-you-knew-about-bit-depth-is-probably-wrong/
-
[ Dernière édition du message le 02/02/2020 à 03:27:17 ]
Elka21
Il commente même en plusieurs résolutions pour le fun
[ Dernière édition du message le 02/02/2020 à 12:16:13 ]
oboreal
J'aurai encore préféré fournir des articles publiés dans des revues à comité de lecture, mais hélas, je n'ai rien trouvé de gratuit sur google scholar. Il va falloir que je finisse pas me résoudre à prendre ma cotisation à l'AES.
Nabucho avait déjà parlé de Christopher Montgomery, mais clairement, outre le fait qu'il démontre ce qu'il dit dans sa vidéo, le fait qu'il soit l'un des principaux contributeurs du format OGG Vorbis et qu'il soit donc rentré dans la théorie du signal et les mathématiques qui la sous tendent en fait une source qui me parait plus solide que la moyenne.
Sinon j'ai trouvé un A/B sur les samples rate qui me parait bien fait, donc je partage pour que chacun puisse se faire son opinion. (évidemment il faut télécharger les fichiers wav, car les codecs de youtube détruisent les différences subtiles qui existent).
[ Dernière édition du message le 02/02/2020 à 14:11:26 ]
- < Liste des sujets
- Charte

