discussion Pourquoi l’idée d’enregistrer le son d’enceintes en binaural n’est pas terrible.
- 106 réponses
- 13 participants
- 2 702 vues
- 19 followers

Jan mk2
1583

AFicionado·a
Membre depuis 5 ans
Sujet de la discussion Posté le 21/04/2025 à 16:25:51Pourquoi l’idée d’enregistrer le son d’enceintes en binaural n’est pas terrible.
Cette discussion fait suite à une polémique née dans une autre discussion sur AF : est-il utile d’enregistrer des enceintes Hifi dans un salon pour en montrer les capacités, et si oui, le faire en binaural est-il pertinent.
Nous pouvons croiser ici et là des vidéos d’audiophiles qui prétendent faire entendre le son de leurs enceintes dans une vidéo, notamment sur Youtube. Cette idée est (pour moi) complètement farfelue pour une bonne (et simple) raison, c’est que lorsque nous écoutons une musique reproduite sur des enceintes, ce que nous entendons c’est :
1 le son des enceintes
2 la réaction du local
3 éventuellement la sugnature sonores des éléments précédents dans la chaîne.
La proportion entre les trois est variable, mais souvent beaucoup plus importante qu’on peut l’imaginer en faveur du local.
Dans la vraie vie domestique, lorsque nous écoutons de la musique reproduite par des enceintes acoustiques placées dans notre salon, à moins d’avoir affaire à un local très pourri, ou d’être placé assez loin, nous avons l’impression d’entendre essentiellement l’empreinte du système, et notamment des enceintes. Mais ce n’est pas vrai.
Il faut introduire une première notion d’acoustique qui est celle de la distance critique. C’est la distance à la source pour laquelle le son direct et le son réverbéré par le local sont du même niveau. En bref, à cette distance, ce que vous entendez provient à 50% des enceintes, et à 50% du salon.
Dans un salon moderne avec des portes en bois ou en panneau alvéolaire, un ou deux canapés, une bibliothèque, une ou deux fenêtre ou baie vitrée avec rideaux, un tapis sur carrelage, plancher bois ou stratifié, voire une moquette, et le tout de forme plus ou moins rectangulaire et d’une surface de 15 à 30 mètres carrés, la distance critique a des chances de se trouver aux alentours de deux à cinq mètres, et souvent plus près de deux.
Alors, pourquoi n’avons-nous pas l’impression que l’acoustique du local envahit l’écoute ?
Si vous avez la possibilité de placer deux micros à l’endroit ou vous écoutez vos enceintes de salon, et si possible des omnidirectionnels, vous risquez d’être surpris par le résultat, et vous avez peu de chance de reconnaitre le son de vos enceintes tel que vous le percevez en direct.
La raison est simple : nous ne somme pas des micros. Nos oreilles se comportent à peu près comme des micros omni, mais notre cerveau joue au DSP (Digital Signal Processing), ou ici on devrait dire HSP (pour Human Signal Processing). Il utilise les lobes de nos oreilles pour déterminer la provenance des sons, et la temporalité de l’arrivée des sons pour aider à les isoler de leur contexte sonore. Ce qui produit un effet de zoom acoustique totalement réflexe et inconscient qui abaisse l’impact de l’acoustique du local dans la sensation sonore. En très bref, notre cerveau sait que lorsque nos oreilles perçoivent un son plus vite à gauche qu’à droite, c’est qu’il vient de la gauche. Et il sait aussi que s’il perçoit des répliques de ce son plus ou moins déformé, ce n’est pas la source mais une réplique acoustique. Et il sait l’atténuer, en fonction de la logueur du retard, et des proportions finies.
Une autre manifestation de cette capacité est l’effet cocktail party
On en vient donc à cette idée bizarre de faire entendre des enceintes acoustiques via un enregistrement effectué dans le salon de l’auditeur/youtubeur. L’audiophile est un amateur qui n’a souvent pas d’expérience en prise de son, peu de connaissance en acoustique, et qui trop souvent prends les connaissances en psychoacoustique pour des fake news. Du coup, le réflexe est de placer des micros au point d’écoute, ce qui risque de ne pas être très éloigné de la distance critique, pas de bol. Je vous laisse imaginer le résultat.
Un des systèmes de captation qui pourrait être le plus proche de l’oreille humaine de la vraie vie est le binaural, ceux qui ne connaissent pas pourront mettre ce mot dans un moteur de recherche. L’avantage de ce système est qu’il se fait avec des capsules omni, et une simulation de tête humaine.
Genre ça :
)
Ecouté au casque, cela permet de restituer une grande partie des informations de localisation, en trois dimensions, et de permettre au cerveau de l’auditeur de faire son travail d’escroc, au moins en partie.
Mais la prise de son binaurale d’une paire d’enceintes dans un salon comprends l’empreinte acoustique du dit salon ? me direz-vous. Et vous aurez raison, ô combien ! Encore plus car on parle ici de capsules omnidirectionnelles obligatoires en binaural. Donc, c’est pas une idée terrible terrible. Et je ne parle pas de l’impact des capsules elles-même, ni du préampli.
Voilà voilà…
Nous pouvons croiser ici et là des vidéos d’audiophiles qui prétendent faire entendre le son de leurs enceintes dans une vidéo, notamment sur Youtube. Cette idée est (pour moi) complètement farfelue pour une bonne (et simple) raison, c’est que lorsque nous écoutons une musique reproduite sur des enceintes, ce que nous entendons c’est :
1 le son des enceintes
2 la réaction du local
3 éventuellement la sugnature sonores des éléments précédents dans la chaîne.
La proportion entre les trois est variable, mais souvent beaucoup plus importante qu’on peut l’imaginer en faveur du local.
Dans la vraie vie domestique, lorsque nous écoutons de la musique reproduite par des enceintes acoustiques placées dans notre salon, à moins d’avoir affaire à un local très pourri, ou d’être placé assez loin, nous avons l’impression d’entendre essentiellement l’empreinte du système, et notamment des enceintes. Mais ce n’est pas vrai.
Il faut introduire une première notion d’acoustique qui est celle de la distance critique. C’est la distance à la source pour laquelle le son direct et le son réverbéré par le local sont du même niveau. En bref, à cette distance, ce que vous entendez provient à 50% des enceintes, et à 50% du salon.
Dans un salon moderne avec des portes en bois ou en panneau alvéolaire, un ou deux canapés, une bibliothèque, une ou deux fenêtre ou baie vitrée avec rideaux, un tapis sur carrelage, plancher bois ou stratifié, voire une moquette, et le tout de forme plus ou moins rectangulaire et d’une surface de 15 à 30 mètres carrés, la distance critique a des chances de se trouver aux alentours de deux à cinq mètres, et souvent plus près de deux.
Alors, pourquoi n’avons-nous pas l’impression que l’acoustique du local envahit l’écoute ?
Si vous avez la possibilité de placer deux micros à l’endroit ou vous écoutez vos enceintes de salon, et si possible des omnidirectionnels, vous risquez d’être surpris par le résultat, et vous avez peu de chance de reconnaitre le son de vos enceintes tel que vous le percevez en direct.
La raison est simple : nous ne somme pas des micros. Nos oreilles se comportent à peu près comme des micros omni, mais notre cerveau joue au DSP (Digital Signal Processing), ou ici on devrait dire HSP (pour Human Signal Processing). Il utilise les lobes de nos oreilles pour déterminer la provenance des sons, et la temporalité de l’arrivée des sons pour aider à les isoler de leur contexte sonore. Ce qui produit un effet de zoom acoustique totalement réflexe et inconscient qui abaisse l’impact de l’acoustique du local dans la sensation sonore. En très bref, notre cerveau sait que lorsque nos oreilles perçoivent un son plus vite à gauche qu’à droite, c’est qu’il vient de la gauche. Et il sait aussi que s’il perçoit des répliques de ce son plus ou moins déformé, ce n’est pas la source mais une réplique acoustique. Et il sait l’atténuer, en fonction de la logueur du retard, et des proportions finies.
Une autre manifestation de cette capacité est l’effet cocktail party
On en vient donc à cette idée bizarre de faire entendre des enceintes acoustiques via un enregistrement effectué dans le salon de l’auditeur/youtubeur. L’audiophile est un amateur qui n’a souvent pas d’expérience en prise de son, peu de connaissance en acoustique, et qui trop souvent prends les connaissances en psychoacoustique pour des fake news. Du coup, le réflexe est de placer des micros au point d’écoute, ce qui risque de ne pas être très éloigné de la distance critique, pas de bol. Je vous laisse imaginer le résultat.
Un des systèmes de captation qui pourrait être le plus proche de l’oreille humaine de la vraie vie est le binaural, ceux qui ne connaissent pas pourront mettre ce mot dans un moteur de recherche. L’avantage de ce système est qu’il se fait avec des capsules omni, et une simulation de tête humaine.
Genre ça :
)
Ecouté au casque, cela permet de restituer une grande partie des informations de localisation, en trois dimensions, et de permettre au cerveau de l’auditeur de faire son travail d’escroc, au moins en partie.
Mais la prise de son binaurale d’une paire d’enceintes dans un salon comprends l’empreinte acoustique du dit salon ? me direz-vous. Et vous aurez raison, ô combien ! Encore plus car on parle ici de capsules omnidirectionnelles obligatoires en binaural. Donc, c’est pas une idée terrible terrible. Et je ne parle pas de l’impact des capsules elles-même, ni du préampli.
Voilà voilà…
Alan Parson a peut-être dit : "Audiophiles don't use their equipment to listen to your music. Audiophiles use your music to listen to their equipment."

kYZmar
5448

Je poste, donc je suis
Membre depuis 21 ans
11 Posté le 21/04/2025 à 17:49:40
Jan > C'est techniquement tres juste.
C'est juste dommage de ne pas pouvoir extrapoler ces connaissances pour les adapter au monde reel.
Le contexte pourrait se resumer a : "Faire une prise de son pour juger de la qualite d'une enceinte est une demarche stupide".
Sauf que dans le monde reel, excepte en magasin, on ne peut juger qu'avec :
- les avis : ce ne sont que des mots, et vous pouvez connaitre tout le champ lexical, aucun mot ne saura decrire votre perception.
- les graphs : tres majoritairement faux ou incomplets. C'est la demarche louable d'ASR qui essaie d'etre le plus objectif possible. Vous comprendrez en vous abreuvant de ces donnees techniques les limites de la demarche.
Et meme pour ceux qui peuvent ecouter en magasin : le bruit, la position, le contexte,... Et la reverberation de la salle, toujours.
A ce titre, je sais que ca peut paraitre incongru pour certain, mais l'idee de faire une captation sonore d'un element audio pour en juger la qualite me semble coherente, du moins dans mon referentiel.
Maintenant, pour reprendre ce que tu dis.
Je te rejoins en tout point sur le manque de coherence d'une prise de son traditionnelle pour cet usage.
Dans l'exemple en question, on entend presque uniquement le son de la piece (desequilibre en plus). Ca ne donne aucune info.
On pourrait ameliorer en ajoutant plusieurs references, en traitant la piece (RT60 < 0.4 par ex.).
Mais je pense que la solution vient du binaural.
C'est le systeme captation-transmission le plus efficace qui soit, si on pense en terme de neutralite.
Mais comme tu dis, on en revient toujours au meme probleme : l'empreinte de la piece.
Disons qu'une enceinte va presenter des irregularites de +/- 4 dB (a peu pres) la ou une piece va plutot te mettre 20-30 dB dans la gueule.
Mais il est possible, coherent, voire souhaitable que quelqu'un propose une salle traite acoustiquement, une salle 'reference' ou seraient place chaque enceinte lors du test.
Et qui respecte les recommandation de l'AES, ca donne un aspect serieux je crois.
Alors oui, les puristes en carton me parleront de la qualite des preamplis, convertisseurs et surtout compression YT.
Tout ca ne joue que moins d'un dB, c'est pas le plus important, et je propose un test ABX a ceux qui pretendent le contraire.
La solution que je propose n'est pas parfaite loin de la.
On perd beaucoup en information (la dynamique surtout).
On pourrait peut-etre comparer ce concept a de la simulation auto ou au casque VR.
C'est pas parfait, mais en addition avec des donnees techniques et de des avis d'utilisateurs, ca permet je crois d'augmenter le niveau de perception.
C'est juste dommage de ne pas pouvoir extrapoler ces connaissances pour les adapter au monde reel.
Le contexte pourrait se resumer a : "Faire une prise de son pour juger de la qualite d'une enceinte est une demarche stupide".
Sauf que dans le monde reel, excepte en magasin, on ne peut juger qu'avec :
- les avis : ce ne sont que des mots, et vous pouvez connaitre tout le champ lexical, aucun mot ne saura decrire votre perception.
- les graphs : tres majoritairement faux ou incomplets. C'est la demarche louable d'ASR qui essaie d'etre le plus objectif possible. Vous comprendrez en vous abreuvant de ces donnees techniques les limites de la demarche.
Et meme pour ceux qui peuvent ecouter en magasin : le bruit, la position, le contexte,... Et la reverberation de la salle, toujours.
A ce titre, je sais que ca peut paraitre incongru pour certain, mais l'idee de faire une captation sonore d'un element audio pour en juger la qualite me semble coherente, du moins dans mon referentiel.
Maintenant, pour reprendre ce que tu dis.
Je te rejoins en tout point sur le manque de coherence d'une prise de son traditionnelle pour cet usage.
Dans l'exemple en question, on entend presque uniquement le son de la piece (desequilibre en plus). Ca ne donne aucune info.
On pourrait ameliorer en ajoutant plusieurs references, en traitant la piece (RT60 < 0.4 par ex.).
Mais je pense que la solution vient du binaural.
C'est le systeme captation-transmission le plus efficace qui soit, si on pense en terme de neutralite.
Mais comme tu dis, on en revient toujours au meme probleme : l'empreinte de la piece.
Disons qu'une enceinte va presenter des irregularites de +/- 4 dB (a peu pres) la ou une piece va plutot te mettre 20-30 dB dans la gueule.
Mais il est possible, coherent, voire souhaitable que quelqu'un propose une salle traite acoustiquement, une salle 'reference' ou seraient place chaque enceinte lors du test.
Et qui respecte les recommandation de l'AES, ca donne un aspect serieux je crois.
Alors oui, les puristes en carton me parleront de la qualite des preamplis, convertisseurs et surtout compression YT.
Tout ca ne joue que moins d'un dB, c'est pas le plus important, et je propose un test ABX a ceux qui pretendent le contraire.
La solution que je propose n'est pas parfaite loin de la.
On perd beaucoup en information (la dynamique surtout).
On pourrait peut-etre comparer ce concept a de la simulation auto ou au casque VR.
C'est pas parfait, mais en addition avec des donnees techniques et de des avis d'utilisateurs, ca permet je crois d'augmenter le niveau de perception.
0

kYZmar
5448

Je poste, donc je suis
Membre depuis 21 ans
12 Posté le 21/04/2025 à 18:16:52
Citation :
Je ne pense pas que tu trompes, j'imagine qu'il faudrait une pièce parfaitement symétrique, dans sa géométrie mais aussi sa nature (matériaux) pour être réellement mono.
(et les enceintes / point d'écoute sur l'axe de symétrie évidemment).
Non, justement.
Ce dont tu parles est un modele purement theorique, absolument impossible a mettre en pratique, chaque element ayant une influence sur le son percu.
Mais je comprends ce que tu veux dire, alors imaginons le cadre de ce modele theorique.
Dans une prise de son binaurale, l'onde de gauche va d'abord percuter l'oreille gauche, puis faire le tour de la tete, puis taper l'oreille droite.
Entre le canal L et R, tu as difference de phase, une difference d'intensite et du filtrage en prime.
Tu pourrais seulement obtenir le phenomene que tu decris avec une prise de son mono ou stereo coincidente (XY par ex.)
Aussi car le filtrage en peigne plus ou moins prononce de ta salle depend de la position.
0

DocK'S
2275

AFicionado·a
Membre depuis 2 ans
13 Posté le 21/04/2025 à 18:23:16
Je suis de ceux qui pensent que les enceintes, c'est l'élément le plus délicat à comparer.
Parce que physiquement, on ne peut pas les avoir en même temps placées de la même façon.
Donc soit on les a en même temps mais placées différemment, soit on compare l'instant T à un souvenir.
Et puis en terme de psycho-acoustique, la vue joue un rôle très important et nous conditionne déjà avant d'avoir entendu quoi que ce soit (plus tout un tas d'autres biais).
Donc en prenant ça en compte, effectivement ça serait intéressant de pouvoir coucher ça sur enregistrement, mais il faut forcément, à minima, une référence, ou à défaut une multitude d'échantillons pour que ça devienne pertinent.
Et si on veut être pragmatique, et coller "au réel" comme tu le dis kYZmar, on sera d'accord je pense que ça demande des moyens considérables, et que dans le réel justement, c'est pratiquement impossible à mettre en oeuvre correctement.
Pour les pré-amplis / convertos / câbles et tutti quanti, je te rejoins à 200 %, ça serait du pignolage intellectuel.
C'est précisément ce que j'ai écrit, je pensais être clair.
Donc complètement d'accord avec ce que tu as écris.
Parce que physiquement, on ne peut pas les avoir en même temps placées de la même façon.
Donc soit on les a en même temps mais placées différemment, soit on compare l'instant T à un souvenir.
Et puis en terme de psycho-acoustique, la vue joue un rôle très important et nous conditionne déjà avant d'avoir entendu quoi que ce soit (plus tout un tas d'autres biais).
Donc en prenant ça en compte, effectivement ça serait intéressant de pouvoir coucher ça sur enregistrement, mais il faut forcément, à minima, une référence, ou à défaut une multitude d'échantillons pour que ça devienne pertinent.
Et si on veut être pragmatique, et coller "au réel" comme tu le dis kYZmar, on sera d'accord je pense que ça demande des moyens considérables, et que dans le réel justement, c'est pratiquement impossible à mettre en oeuvre correctement.
Pour les pré-amplis / convertos / câbles et tutti quanti, je te rejoins à 200 %, ça serait du pignolage intellectuel.
Citation de kYZmar :
Non, justement.
Ce dont tu parles est un modele purement theorique, absolument impossible a mettre en pratique, chaque element ayant une influence sur le son percu.
C'est précisément ce que j'ai écrit, je pensais être clair.

Donc complètement d'accord avec ce que tu as écris.
1

iktomi
16321

Drogué·e à l’AFéine
Membre depuis 6 ans
14 Posté le 21/04/2025 à 18:28:06
Citation de kosmix :
Je suis entièrement d'accord avec Jean-Marc, le traitement acoustique et le matériel "haut-de-gamme" c'est un plus mais en toute objectivité il faut bien reconnaître qu'il est tout à fait possible de produire de la qualité avec du matériel et un traitement acoustique médiocres. Je ne fais pas partie des personnes qui en sont capablesmais je pense que le résultat dépend pour une très grande partie de l'expérience et des compétences de la personne qui effectue le travail.
J'en reviens à ma citation de Witcher 3 : "Ya pas de mauvais drakkar ni de mauvais temps. Ya que des marins de merde."

2
[ Dernière édition du message le 21/04/2025 à 18:29:07 ]

kYZmar
5448

Je poste, donc je suis
Membre depuis 21 ans
15 Posté le 21/04/2025 à 18:29:10
Citation :
C'est notamment pour ça que j'ai du mal avec l'emploi du qualificatif "binaural" pour tout ce qui n'est pas de la captation de son
Quand tu parles de binaural, tu parles autant de la captation que de la transmission, car l'un ne va pas sans l'autre.
Une prise de son binaurale sur un systeme de diffusion stereo, c'est "faux".
Je mets entre guillemets car les plus creatifs sauront utiliser le binaural comme une effet de phase atypique et musical, mais c'est un autre sujet.
Citation :
- s'il s'agit de générer un son binaural, tous les synthés stéréo avec un minimum de contrôle D/G peuvent faire quelque-chose de cet ordre
Un synthe numerique pourrait produire des sons binauraux.
Mais c'est pas simplement jouer avec droite/gauche, il faut coder les fonctions HRTF propres au binaural.
Ca existe en VST, ca pourrait techniquement exister en synthe. A ma connaissance, ca n'existe pas mais peut-etre.
Il y a en piano numerique, parfois la possibilite d'ecouter le son en binaural a la position du pianiste, beaucoup disent que c'est le top pour l'immersion.
Citation :
- et pour l'écoute, même un son mono sera entendu de manière binaurale à moins d'être sourd d'une oreille.
C'est quasi philosohique, mais oui.
Ainsi, tu pourrais dire, a l'instar de M. Jourdain :
"Par ma foi ! il y a plus de quarante ans que j'ecoute en binaural sans que j’en susse rien."
0

iktomi
16321

Drogué·e à l’AFéine
Membre depuis 6 ans
16 Posté le 21/04/2025 à 18:37:41
Citation de kYZmar :
Ca existe en VST, ca pourrait techniquement exister en synthe. A ma connaissance, ca n'existe pas mais peut-etre.
2022 : Le Super 6 de UDO Audio
Mais ce qualificatif employé de cette manière me semble plus relever de l'argument de vente que d'évoquer un réel apport concret.
Pourquoi dire que l'écoute d'un son quel qu'il soit est forcément binaural (avec 2 oreilles fonctionnelles) serait "quasi philosophique" ?
0
[ Dernière édition du message le 21/04/2025 à 18:38:15 ]

kYZmar
5448

Je poste, donc je suis
Membre depuis 21 ans
17 Posté le 21/04/2025 à 18:41:31
Citation :
Et puis en terme de psycho-acoustique, la vue joue un rôle très important
Ce n'est pas du domaine de la psycho-acoustique, c'est de la psychologie.
Je vous prie sincerement de m'excuser si vous me pensez taquin.
Citation :
C'est précisément ce que j'ai écrit, je pensais être clair.
Excuse mon incomprehension, je croyais que tu disais que si ta salle etait parfaitement symetrique, tu pourrais obtenir un son mono avec une prise de son binaurale.
Mais si on est d'accord, alors je vais pas te contredire lol.
Citation :
Donc en prenant ça en compte, effectivement ça serait intéressant de pouvoir coucher ça sur enregistrement, mais il faut forcément, à minima, une référence, ou à défaut une multitude d'échantillons pour que ça devienne pertinent.
Si t'as pas budget, je pense qu'avec un petit Roland CS-10EM a 100 balles et une absorption bourrine et inesthetique (matelas, rideau,...), tu n'es pas en mesure d'assoir une posture d'autorite 'State of the art' mais que tu peux faire avancer la discipline.
Ca pourrait etre une sorte d'equivalent audio des tests cote-a-cote de les numeriques.com mais en audio.
C'est pas parfait mais c'est mieux que rien (l'etat actuel des choses).
0

kYZmar
5448

Je poste, donc je suis
Membre depuis 21 ans
18 Posté le 21/04/2025 à 18:48:24
Citation :
Pourquoi dire que l'écoute d'un son quel qu'il soit est forcément binaural (avec 2 oreilles fonctionnelles) serait "quasi philosophique" ?
Tu entends effectivement tout en binaural, dès lors qu’on a deux oreilles fonctionnelles.
Ta remarque m’a simplement fait penser à une scène célèbre du Bourgeois gentilhomme, où le personnage découvre avec émerveillement qu’il parle en prose depuis toujours, sans le savoir.
C’est un peu le même genre de situation ici : le terme "binaural" donne une connotation technique à quelque chose qui, en réalité, est tout à fait naturel.
Je trouve ça amusant.
1

iktomi
16321

Drogué·e à l’AFéine
Membre depuis 6 ans
19 Posté le 21/04/2025 à 18:50:27
Ha ok dans ce sens. Oui certes, comme énormément de choses d'ailleurs.
0

kosmix
50519

AF, je suis ton père
Membre depuis 19 ans
20 Posté le 21/04/2025 à 18:55:13
Citation de iktomi :
Le Super 6 de UDO Audio
Mais ce qualificatif employé de cette manière me semble plus relever de l'argument de vente que d'évoquer un réel apport concret.
Je ne sais pas dans quelle mesure cette qualification de "binaural" est techniquement correcte mais en tous cas les personnes qui ont testé les synthés UDO ont généralement trouvé le son remarquable et la stéréo très belle.
0
Putain Walter mais qu'est-ce que le Vietnam vient foutre là-dedans ?
- < Liste des sujets
- Charte