discussion Pourquoi l’idée d’enregistrer le son d’enceintes en binaural n’est pas terrible.
- 106 réponses
- 13 participants
- 2 704 vues
- 19 followers

Jan mk2
1583

AFicionado·a
Membre depuis 5 ans
Sujet de la discussion Posté le 21/04/2025 à 16:25:51Pourquoi l’idée d’enregistrer le son d’enceintes en binaural n’est pas terrible.
Cette discussion fait suite à une polémique née dans une autre discussion sur AF : est-il utile d’enregistrer des enceintes Hifi dans un salon pour en montrer les capacités, et si oui, le faire en binaural est-il pertinent.
Nous pouvons croiser ici et là des vidéos d’audiophiles qui prétendent faire entendre le son de leurs enceintes dans une vidéo, notamment sur Youtube. Cette idée est (pour moi) complètement farfelue pour une bonne (et simple) raison, c’est que lorsque nous écoutons une musique reproduite sur des enceintes, ce que nous entendons c’est :
1 le son des enceintes
2 la réaction du local
3 éventuellement la sugnature sonores des éléments précédents dans la chaîne.
La proportion entre les trois est variable, mais souvent beaucoup plus importante qu’on peut l’imaginer en faveur du local.
Dans la vraie vie domestique, lorsque nous écoutons de la musique reproduite par des enceintes acoustiques placées dans notre salon, à moins d’avoir affaire à un local très pourri, ou d’être placé assez loin, nous avons l’impression d’entendre essentiellement l’empreinte du système, et notamment des enceintes. Mais ce n’est pas vrai.
Il faut introduire une première notion d’acoustique qui est celle de la distance critique. C’est la distance à la source pour laquelle le son direct et le son réverbéré par le local sont du même niveau. En bref, à cette distance, ce que vous entendez provient à 50% des enceintes, et à 50% du salon.
Dans un salon moderne avec des portes en bois ou en panneau alvéolaire, un ou deux canapés, une bibliothèque, une ou deux fenêtre ou baie vitrée avec rideaux, un tapis sur carrelage, plancher bois ou stratifié, voire une moquette, et le tout de forme plus ou moins rectangulaire et d’une surface de 15 à 30 mètres carrés, la distance critique a des chances de se trouver aux alentours de deux à cinq mètres, et souvent plus près de deux.
Alors, pourquoi n’avons-nous pas l’impression que l’acoustique du local envahit l’écoute ?
Si vous avez la possibilité de placer deux micros à l’endroit ou vous écoutez vos enceintes de salon, et si possible des omnidirectionnels, vous risquez d’être surpris par le résultat, et vous avez peu de chance de reconnaitre le son de vos enceintes tel que vous le percevez en direct.
La raison est simple : nous ne somme pas des micros. Nos oreilles se comportent à peu près comme des micros omni, mais notre cerveau joue au DSP (Digital Signal Processing), ou ici on devrait dire HSP (pour Human Signal Processing). Il utilise les lobes de nos oreilles pour déterminer la provenance des sons, et la temporalité de l’arrivée des sons pour aider à les isoler de leur contexte sonore. Ce qui produit un effet de zoom acoustique totalement réflexe et inconscient qui abaisse l’impact de l’acoustique du local dans la sensation sonore. En très bref, notre cerveau sait que lorsque nos oreilles perçoivent un son plus vite à gauche qu’à droite, c’est qu’il vient de la gauche. Et il sait aussi que s’il perçoit des répliques de ce son plus ou moins déformé, ce n’est pas la source mais une réplique acoustique. Et il sait l’atténuer, en fonction de la logueur du retard, et des proportions finies.
Une autre manifestation de cette capacité est l’effet cocktail party
On en vient donc à cette idée bizarre de faire entendre des enceintes acoustiques via un enregistrement effectué dans le salon de l’auditeur/youtubeur. L’audiophile est un amateur qui n’a souvent pas d’expérience en prise de son, peu de connaissance en acoustique, et qui trop souvent prends les connaissances en psychoacoustique pour des fake news. Du coup, le réflexe est de placer des micros au point d’écoute, ce qui risque de ne pas être très éloigné de la distance critique, pas de bol. Je vous laisse imaginer le résultat.
Un des systèmes de captation qui pourrait être le plus proche de l’oreille humaine de la vraie vie est le binaural, ceux qui ne connaissent pas pourront mettre ce mot dans un moteur de recherche. L’avantage de ce système est qu’il se fait avec des capsules omni, et une simulation de tête humaine.
Genre ça :
)
Ecouté au casque, cela permet de restituer une grande partie des informations de localisation, en trois dimensions, et de permettre au cerveau de l’auditeur de faire son travail d’escroc, au moins en partie.
Mais la prise de son binaurale d’une paire d’enceintes dans un salon comprends l’empreinte acoustique du dit salon ? me direz-vous. Et vous aurez raison, ô combien ! Encore plus car on parle ici de capsules omnidirectionnelles obligatoires en binaural. Donc, c’est pas une idée terrible terrible. Et je ne parle pas de l’impact des capsules elles-même, ni du préampli.
Voilà voilà…
Nous pouvons croiser ici et là des vidéos d’audiophiles qui prétendent faire entendre le son de leurs enceintes dans une vidéo, notamment sur Youtube. Cette idée est (pour moi) complètement farfelue pour une bonne (et simple) raison, c’est que lorsque nous écoutons une musique reproduite sur des enceintes, ce que nous entendons c’est :
1 le son des enceintes
2 la réaction du local
3 éventuellement la sugnature sonores des éléments précédents dans la chaîne.
La proportion entre les trois est variable, mais souvent beaucoup plus importante qu’on peut l’imaginer en faveur du local.
Dans la vraie vie domestique, lorsque nous écoutons de la musique reproduite par des enceintes acoustiques placées dans notre salon, à moins d’avoir affaire à un local très pourri, ou d’être placé assez loin, nous avons l’impression d’entendre essentiellement l’empreinte du système, et notamment des enceintes. Mais ce n’est pas vrai.
Il faut introduire une première notion d’acoustique qui est celle de la distance critique. C’est la distance à la source pour laquelle le son direct et le son réverbéré par le local sont du même niveau. En bref, à cette distance, ce que vous entendez provient à 50% des enceintes, et à 50% du salon.
Dans un salon moderne avec des portes en bois ou en panneau alvéolaire, un ou deux canapés, une bibliothèque, une ou deux fenêtre ou baie vitrée avec rideaux, un tapis sur carrelage, plancher bois ou stratifié, voire une moquette, et le tout de forme plus ou moins rectangulaire et d’une surface de 15 à 30 mètres carrés, la distance critique a des chances de se trouver aux alentours de deux à cinq mètres, et souvent plus près de deux.
Alors, pourquoi n’avons-nous pas l’impression que l’acoustique du local envahit l’écoute ?
Si vous avez la possibilité de placer deux micros à l’endroit ou vous écoutez vos enceintes de salon, et si possible des omnidirectionnels, vous risquez d’être surpris par le résultat, et vous avez peu de chance de reconnaitre le son de vos enceintes tel que vous le percevez en direct.
La raison est simple : nous ne somme pas des micros. Nos oreilles se comportent à peu près comme des micros omni, mais notre cerveau joue au DSP (Digital Signal Processing), ou ici on devrait dire HSP (pour Human Signal Processing). Il utilise les lobes de nos oreilles pour déterminer la provenance des sons, et la temporalité de l’arrivée des sons pour aider à les isoler de leur contexte sonore. Ce qui produit un effet de zoom acoustique totalement réflexe et inconscient qui abaisse l’impact de l’acoustique du local dans la sensation sonore. En très bref, notre cerveau sait que lorsque nos oreilles perçoivent un son plus vite à gauche qu’à droite, c’est qu’il vient de la gauche. Et il sait aussi que s’il perçoit des répliques de ce son plus ou moins déformé, ce n’est pas la source mais une réplique acoustique. Et il sait l’atténuer, en fonction de la logueur du retard, et des proportions finies.
Une autre manifestation de cette capacité est l’effet cocktail party
On en vient donc à cette idée bizarre de faire entendre des enceintes acoustiques via un enregistrement effectué dans le salon de l’auditeur/youtubeur. L’audiophile est un amateur qui n’a souvent pas d’expérience en prise de son, peu de connaissance en acoustique, et qui trop souvent prends les connaissances en psychoacoustique pour des fake news. Du coup, le réflexe est de placer des micros au point d’écoute, ce qui risque de ne pas être très éloigné de la distance critique, pas de bol. Je vous laisse imaginer le résultat.
Un des systèmes de captation qui pourrait être le plus proche de l’oreille humaine de la vraie vie est le binaural, ceux qui ne connaissent pas pourront mettre ce mot dans un moteur de recherche. L’avantage de ce système est qu’il se fait avec des capsules omni, et une simulation de tête humaine.
Genre ça :
)
Ecouté au casque, cela permet de restituer une grande partie des informations de localisation, en trois dimensions, et de permettre au cerveau de l’auditeur de faire son travail d’escroc, au moins en partie.
Mais la prise de son binaurale d’une paire d’enceintes dans un salon comprends l’empreinte acoustique du dit salon ? me direz-vous. Et vous aurez raison, ô combien ! Encore plus car on parle ici de capsules omnidirectionnelles obligatoires en binaural. Donc, c’est pas une idée terrible terrible. Et je ne parle pas de l’impact des capsules elles-même, ni du préampli.
Voilà voilà…
Alan Parson a peut-être dit : "Audiophiles don't use their equipment to listen to your music. Audiophiles use your music to listen to their equipment."

kosmix
50519

AF, je suis ton père
Membre depuis 19 ans
91 Posté le 24/04/2025 à 15:08:35
C'était il y a quelques jours et j'ai oublié d'y répondre :
Entièrement d'accord, j'avais juste oublié de préciser que dans mon cas il n'y a strictement aucun enjeu et peu d'ambition si ce n'est de me faire plaisir. Je suis un simple amateur avec certes un peu d'expérience mais plus dans l'optique de me faire plaisir que de répondre à un cahier des charges technique pour une diffusion pro, vu que la diffusion de mes prods reste hyper confidentielle (anecdotique même). Même si évidemment je m'efforce toujours de livrer un produit "propre" et équilibré, avec plus ou moins de succès, avec mon matos (très) moyen, mon studio pourri qui n'a aucun traitement acoustique et mon système d'écoute complètement bancal
Citation de Jan mk2 :
Citation de kosmix :(...) je pense que le résultat dépend pour une très grande partie de l'expérience et des compétences de la personne qui effectue le travail.
En tant qu'amateur peu éclairé et peu compétent je me repose surtout sur la connaissance de mon propre matériel, du son de ma pièce, et surtout j'effectue des écoutes ailleurs pour faire des corrections.
Je peux être d'accord, mais il faut pondérer. Cela dépends du type de produit qu'on réalise, et à quel niveau de la production on se situe. Après le risuqe d'erreur est plus acceptable quand on travaille sur un truc potentiellement vendu à quelques centaines d'exemplaires, ou à quelques dizaines de milliers d'exemplaires. C'est trivial, mais ça compte.
Entièrement d'accord, j'avais juste oublié de préciser que dans mon cas il n'y a strictement aucun enjeu et peu d'ambition si ce n'est de me faire plaisir. Je suis un simple amateur avec certes un peu d'expérience mais plus dans l'optique de me faire plaisir que de répondre à un cahier des charges technique pour une diffusion pro, vu que la diffusion de mes prods reste hyper confidentielle (anecdotique même). Même si évidemment je m'efforce toujours de livrer un produit "propre" et équilibré, avec plus ou moins de succès, avec mon matos (très) moyen, mon studio pourri qui n'a aucun traitement acoustique et mon système d'écoute complètement bancal

0
Putain Walter mais qu'est-ce que le Vietnam vient foutre là-dedans ?
[ Dernière édition du message le 24/04/2025 à 15:10:28 ]

iktomi
16321

Drogué·e à l’AFéine
Membre depuis 6 ans
92 Posté le 24/04/2025 à 15:16:52
Ha ok je pensais vraiment qu'il s'agissait d'une tentative de compenser d'éventuels problèmes liés à l'acoustique, et ça me semblait bizarre sans analyse préalable de la pièce. (Je me souviens très bien de Jean-Pierre disant qu'on ne traite jamais avant de savoir quoi traiter.)
Je crois que c'est cette phrase de l'article qui m'a fait pensé à l'acoustique.
"La « linéarité », c’est une sorte d’utopie dans le son, un idéal dans lequel les matières et les espaces ne perturberaient ou n’amplifieraient pas les fréquences dans leur chemin jusqu’à nos tympans."
Merci Jean-Marc.
Je crois que c'est cette phrase de l'article qui m'a fait pensé à l'acoustique.
"La « linéarité », c’est une sorte d’utopie dans le son, un idéal dans lequel les matières et les espaces ne perturberaient ou n’amplifieraient pas les fréquences dans leur chemin jusqu’à nos tympans."
Merci Jean-Marc.
1
[ Dernière édition du message le 24/04/2025 à 15:19:26 ]

Anonyme

93 Posté le 24/04/2025 à 15:24:02
Citation de Jean-Marc Boulier :
Le principe est d'effectuer un alignement temporel avec un filtre FIR en appliquant un délai compensatoire aux fréquences qui se propagent plus rapidement. Cela permet que tout arrive en même temps aux oreilles et améliore la réponse transitoire, entre autres. En revanche cela introduit évidemment une certaine latence, ce qui n'est pas du tout un problème pour mon utilisation.
En réalité le son se déplace quasiment à la même vitesse pour toutes les fréquences dans la plupart des fluides. En général, la distorsion de phase vient surtout du fait que le trajet acoustique est différent en sortie d'enceintes.
Un exemple typique c'est les sub Maestro de la marque Amadeus : il y a une sorte d'escargot acoustique dans l'enceinte qui fait qu'elle sont assez significativement en retard sur les têtes si on ne les aligne pas (même si les têtes sont collées dessus).
Une des qualités des PSI, comme l'expliquait Jan, c'est d'avoir fait un gros travail sur la correction de phase pour aligner les voies entre elles.
0
[ Dernière édition du message le 24/04/2025 à 15:25:29 ]

Jean-Marc Boulier
474

Posteur·euse AFfamé·e
Membre depuis 6 ans
94 Posté le 24/04/2025 à 15:43:37
J'en suis tout à fait conscient : je me suis mal exprimé en parlant de rapidité, merci de le souligner.
Comment fait PSI pour résoudre ce problème sans DSP ? Il y a quand même un paquet de paramètres mécaniques à prendre en compte... Masse et inertie des membranes, résonances mécaniques, caractéristiques acoustiques du boitier lui-même etc...
Comment fait PSI pour résoudre ce problème sans DSP ? Il y a quand même un paquet de paramètres mécaniques à prendre en compte... Masse et inertie des membranes, résonances mécaniques, caractéristiques acoustiques du boitier lui-même etc...
0
Jean-Marc

slave1802
5069

Je poste, donc je suis
Membre depuis 15 ans
95 Posté le 24/04/2025 à 15:49:45
A un moment j'avais penché vers l'arrière mes enceintes colonnes histoire que les graves sortant du boomer situé en bas atteignent mes oreilles un peu avant les aiguës suite à un gros mélange entre la vitesse du son et sa fréquence...extrait d'un forum de spécialiste (!!!)
J'ai bien entendu perçu une nette différence entre avant et après la modification...
Jusqu'à ce que je passe dans le bureau et m’aperçoive que les supports d'enceinte des mes moniteurs étaient à l'exact opposé, et pas pour une quelconque variation de vitesse mais juste pour être dans l'axe de mes oreilles.
J'ai enlevé les cales, elles étaient en bois, elles ont très bien brulées malgré un léger chuintement dans les aigües...

J'ai bien entendu perçu une nette différence entre avant et après la modification...
Jusqu'à ce que je passe dans le bureau et m’aperçoive que les supports d'enceinte des mes moniteurs étaient à l'exact opposé, et pas pour une quelconque variation de vitesse mais juste pour être dans l'axe de mes oreilles.
J'ai enlevé les cales, elles étaient en bois, elles ont très bien brulées malgré un léger chuintement dans les aigües...

2

Anonyme

96 Posté le 24/04/2025 à 15:58:54
De ce que j'ai compris, chez PSI, ce sont des traitements électroniques (donc sans doute des lignes à retard). Mais je peux clairement me tromper, ça fait partie des trucs brevetés et protégés sur leur conception d'enceintes.
En tout cas c'est diablement efficace. La sensation d'impact dans le grave c'est ce qui m'a le plus soufflé lors de ma 1ere écoute des A14 en auditorium. Le 2nd point ça a été d'entendre plus précisément que jamais les modulations dans des effets modulés sur des voix.
En tout cas c'est diablement efficace. La sensation d'impact dans le grave c'est ce qui m'a le plus soufflé lors de ma 1ere écoute des A14 en auditorium. Le 2nd point ça a été d'entendre plus précisément que jamais les modulations dans des effets modulés sur des voix.
0

Jan mk2
1583

AFicionado·a
Membre depuis 5 ans
97 Posté le 24/04/2025 à 16:19:48
Citation de Noisey Houtan :
De ce que j'ai compris, chez PSI, ce sont des traitements électroniques (donc sans doute des lignes à retard). Mais je peux clairement me tromper, ça fait partie des trucs brevetés et protégés sur leur conception d'enceintes.
En tout cas c'est diablement efficace. La sensation d'impact dans le grave c'est ce qui m'a le plus soufflé lors de ma 1ere écoute des A14 en auditorium. Le 2nd point ça a été d'entendre plus précisément que jamais les modulations dans des effets modulés sur des voix.
Ouaip' et plus tu montes en gamme, plus c'est flagrant.
Concernant les retards, ils sont dûs dans l'ordre d'apparition : à l'amplification (souvent π/2 sur un ampli en classe B par exemple entre 20Hz et 20kHz), aux filtres répartiteurs, aux membranes, et enfin à la charge. Dans une enceinte amplifiée, le constructeur peut mesurer tout ça et se donner les moyens de corriger. Mais il y a des limites car le faire dès 20Hz entrainerait un retard beaucoup trop élevé. Et ça tombe bien, nous sommes peu sensibles à la relation phase/fréquence dans le grave. Par exemple, PSI rectifie la phase au dessus de 200Hz seulement.
Mais il ne faut jamais oublier que le dernier maillon de la chaîne, c'est la pièce. Et dans cette pièce il se produit de nombreux accidents sur la phase.
2
Alan Parson a peut-être dit : "Audiophiles don't use their equipment to listen to your music. Audiophiles use your music to listen to their equipment."

Jean-Marc Boulier
474

Posteur·euse AFfamé·e
Membre depuis 6 ans
98 Posté le 24/04/2025 à 16:51:42
Citation de Noisey Houtan :
Le 2nd point ça a été d'entendre plus précisément que jamais les modulations dans des effets modulés sur des voix.
Pas compris cette phrase...
0
Jean-Marc

Anonyme

99 Posté le 24/04/2025 à 17:09:43
Lorsque tu as des effets (typiquement délais et plus encore reverbe) avec de la modulation sur les répétitions ou les queues de reverbe.
Ça peut sonner juste plus gros et fourni, où on peut entendre les modulations. Là j'entendais les cycles de modulation comme jamais auparavant (sur du Bjork, album Homogenic en l'occurrence)
Ça peut sonner juste plus gros et fourni, où on peut entendre les modulations. Là j'entendais les cycles de modulation comme jamais auparavant (sur du Bjork, album Homogenic en l'occurrence)
1

Jean-Marc Boulier
474

Posteur·euse AFfamé·e
Membre depuis 6 ans
100 Posté le 24/04/2025 à 17:20:18
Ah ok, intéressant !
1
Jean-Marc
- < Liste des sujets
- Charte