Se connecter
Se connecter

ou
Créer un compte

ou

Sujet utilisation de la réponse impulsionnelle binaurale

  • 14 réponses
  • 4 participants
  • 1 788 vues
  • 8 followers
Sujet de la discussion utilisation de la réponse impulsionnelle binaurale
Bonjour à tous !

Je me permet de créer ce sujet afin d'avoir de plus amples informations et le retour d'éventuelles personnes quant à l'utilisation de la réponse impulsionnelle à base de captation binaurale au sein de réverbes à convolution.

Je ne suis pas forcément intéressé par la technique binaurale en enregistrement pur mais pour son utilisation dans le but d'avoir accès à une alternative pour la création d'espaces.

Cette idée m'est venu aujourd'hui et après avoir un peu parcouru la littérature disponible sur le net, je suis resté sur ma fin (je ne suis pas un scientifique et me place comme utilisateur simple).

Je précise que je ne projette pas de faire mes propres réponses impulsionnelles (du moins à court terme et pas avant d'avoir expérimenté la chose), ne disposant pas de matériel binaural, j'aimerai simplement savoir si certains d'entre vous ont déjà pratiqués cette technique et partager leur retour d'expérience, et, si possible, récupérer des IR pour essayer à mon tour de me faire une opinion de la viabilité du truc.

Je connais les limites du binaural liées à la morphologie humaine et conçoit bien que les résultats de cette pratique peuvent ne pas donner de résultats satisfaisants.

Merci d'avance de votre attention !
2
un p'tit up !
3
bon, dernier up au kazoo, car je crois ce sujet n'intéresse que moi ! :(((
4
Salut,


Le sujet m'intéresse et intéresse d'autres personnes.

J'ai quelques connaissances là-dessus (la partie "traitement du signal", un peu de culture de ce qui se passe en labo sur le sujet, et en tant qu'utilisateur).
A vrai dire que je ne comprends pas trop ce que tu recherches.
5
Salut EraTom et merci pour ton attention (au passage je tiens à te dire que j'apprécie beaucoup tes interventions très enrichissantes sur af).

Citation :
A vrai dire que je ne comprends pas trop ce que tu recherches


En fait, pour faire simple, je cherche dans un premier temps à savoir si des personnes utilisent des captations binaurales du sweep de base servant à "convolutionner" les espaces, plutôt que les couples stéréos habituels.

Ensuite, je serai curieux de savoir si cela à un intérêt par le retour d'expérience d'éventuels utilisateurs, en sachant que je suis plus attiré par le côté esthétique de la chose, intégrée à des mixs non-binauraux eux-mêmes.

Enfin, si cela existe donc, trouver un moyen de pouvoir récupérer des IR pour à mon tour expérimenter.

Mais je me plante peut-être complètement sur la technique employée et l'application que j'ai décrite, et dans ce cas n'hésite pas à m'apporter quelques éclaircissements.

Merci d'avance !
6

Flag.

 

Hors sujet :

Salut Undo ! 

 

7
x
Hors sujet :
coucouyoutou !
8
Citation :
Salut EraTom et merci pour ton attention (au passage je tiens à te dire que j'apprécie beaucoup tes interventions très enrichissantes sur af).
Beh de rien et merci, même si ça me gêne :oops:.

Ok !


Mathématiquement (et physiquement) l'idée est d’utiliser une HRIR (Head Related Impulse Reponse) pour modéliser la HRTF (Head Related Transfer Function) par une fonction linéaire dont le comportement en sortie peut être calculé par un produit de convolution.
De façon encore plus simple : nos oreilles (+ tête + épaules) se comporte comme des "EQ" qui changent en fonction de l'angle d'arrivée du son perçu. Les HRIR sont des réponses impulsionnelles des "filtres" de l'EQ sous tous les angles.

La première grosse limite c'est que d'un auditeur à un autre il y a des variations physiques : taille de la tête, épaules, cou, forme de l'oreille et même la longueur de cheveux (une étude à même montré que les personnes qui se font couper les cheveux après les avoir portés longs ont besoin d'un temps d'adaptation de quelques jours pour retrouver une bonne spatialisation verticale).
Tout ça pour dire que l'on ne peut pas espérer qu'une HRTF convienne à tous les auditeurs : Il faut "customiser" et choisir la plus adaptée pour créer l'illusion sonore.


Il existe de nombreuses prises de "réponse impulsionnelles" réalisées suivant diverses méthodes, dans diverses conditions. Il existe également des bases de données libres diffusées sur le net pour permettre l'avancer des travaux scientifiques dans ce domaine.
Si tu tapes "head related impulse reponse database" ou "head related transfert function database" sur google tu vas en trouver plusieurs, avec généralement une publi au format pdf qui explique comment la base de données a été constituée (méthode de prise, condition de la salle, post-traitement ou non, etc.)


La quantité de données est énorme : C'est l'équivalent de ce que l'on a pour les réponses impulsionnelles de pièce ou salle pour les reverbes... mais sous chaque angle de l'espace qui entoure l'auditeur.
Par exemple, pour la constitution de cette base https://www.ak.tu-berlin.de/fileadmin/a0135/Publikationen/2013/Brinkmann_2013_A_high_resolution_head-related_transfer_function_database_including_different_orientations_of_head_above_the_torso.pdf
il y a 124 795 IR... Et vu que le nombre est impaire c'est qu'ils ont déjà fait l'approximation que les HRIR des deux oreilles sont les-mêmes à une symétrie près (ce qui n'est pas le cas ; personne n'est symétrique).

Pour être exploitable il y a deux étapes qu'il faut régler :
- Trouver une technique d'interpolation des IR pour les positions angulaires / distances manquantes (l'espace à forcément été discrétisé, et pour des raisons pratiques la taille de maille est assez grande.
- Opérer une réduction des données pour les rendre exploitables dans demander une salle de calcul de la NASA.

En fait les deux problèmes sont liés : La technique de réduction des données conduit à construire des modélisations qui souvent entraînent la méthode d'interpolation.
Pour le dire différemment, on colle par exemple un modèle compact de quelques paramètres qui s'adapte bien aux réponses impulsionnelles enregistrées, et l'interpolation des IR s'opère en interpolant les valeurs des paramètres.


Pour ce que j'ai pu lire, et selon mon expérience en traitement du signal (je veux dire par là que ce n'est que mon avis et qu'il n'est peut être pas partagé, qu'il n'est pas étayé par des calculs, mais que ça s'appuie sur une certaine habitude de ce genre de sujet) l'approche la plus pertinente physiquement et de commencer par décomposer le "flitrage" de nos { oreilles + tête + épaules } en deux filtres :
- Un pour les oreilles.
- Un pour la tête et les épaules.

L'idée consiste à dire que le filtre { tête + épaule } est grosso-modo le même pour tout le tour (la morphologie ne bouge pas trop, et que le filtre { oreille } varie de façon importante.

Les personnes ne sont pas découpées pour la prise son ! On réalise ceci par un traitement mathématique qui s'appelle le "factorisation polynomiales".
C'est ce qui est expliqué ici http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.184.7461&rep=rep1&type=pdf et ici https://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=568734&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D568734

En gros, on dit que chaque HRIR est constituée de deux "sous-IR" appliquées l'une après l'autre par une produit de convolution ; il y a des méthodes mathématiques pour "dé-convoluer" et recomposer les 2 IR, on dit ensuite que l'une de ses sous-IR et commune à chaque HRIR : c'est le filtre { tête + épaule }.
On peut montrer ensuite que la somme des tailles de sous-IR est égale à taille de la HRIR. Si la HRIR est de N échantillons qui varient en fonction de l'angle, on peut la décomposer en P+Q = N sous-IR et que l'un des deux ne dépend pas de l'angle (disons P), alors il n'y a plus que Q échantillons variable à connaître pour tous les angles.
Ça réduit la place pour le codage de toutes les HRIR (la sous-IR de P échantillons est enregistrée une seul fois pour toutes les positions, puisque commune), et aussi le nombre de calculs au moment de l'application du filtre.

Une approche complémentaire et de passer à un filtre à réponse impulsionnelle infinie (RII) : L'enregistrement d'un IR correspond aux coefficients d'un filtre à réponse impulsionnelle finis (RIF) ; or il est possible de trouver un filtre RII avec moins de coefficients très proche spectralement du filtre RIF.
Ce filtre RII équivalent permet alors modéliser le filtre RIF avec moins de valeur à enregistrer.

La meilleur méthode d'interpolation est alors d'interpoler les "zéros" des filtres RII plutôt que leurs coefficients : ceci permet de faire varier plus continument le contenu spectrale.


Bon c'est compliqué...
... Mais il y en a qui savent faire ça et qui n'ont pas de vie sociale. Du coup il s'amuse à coder des trucs pareils le weekend.
La succession de ses 3 étapes et un bon geek/nerd permettent de rendre exploitable ses modèles en temps-réel sur nos ordinateurs actuels :
http://freemusicsoftware.org/1625
http://www.dklingler.com/projects/spatializer
etc.
http://www.gersic.com/plugins/index.php?daCat=11

Tu vois alors que pour t'amuser, il suffit que tu installes l'un de ces plugs VST, de le charger dans ton host favoris, et de jouer avec les boutons :)
9
gros gros merci pour cette réponse bien fournie ! :bravo:

Mes capacités techniques ne me permettent pas de rentrer en profondeur dans le détail de ce que tu m'as décrit ici, mais je saisi très bien les principes énoncés, la logique et les technologies employées et préfère cela à une vulgarisation imprécise, ces directions me donneront sans doute l'envie d'élargir mes connaissances sur ce thème plus tard.

Je suis ravi aussi que certains nerds aient sacrifiés leur vie sociale pour moi, je leur en suis au moins 124 795 fois reconnaissant et y penserai à chaque fois que je ferai mumuse avec un bouton !

Je vais donc tester les outils que tu m'as mis en lien et sans doute continuer à me renseigner sur d'autres applications maintenant que tu as éclairci le sujet et les termes utilisés pour moi.

C'est plus complexe que ce que j'envisageais et avoue que j'ai tout de même une petite interrogation que je me permet volontairement de remettre dans l'état d'esprit dans lequel j'étais avant l'ouverture de ce sujet.

Imaginons que je dispose d'un de ces systèmes d'enregistrement binaural :
http://www.er.uqam.ca/nobel/k24305/chapitre_3.html (explications sur le sujet très bien résumées dans ce lien également)
et que mon but est de créer une empreinte acoustique d'une pièce.

Si je place ce système de captation à la place de l'auditeur et que j'émet le sweep derrière la tête, quel résultat donnera une réverbe "convolutionnée" à partir de ce signal ? Est-ce que ce système n'a de différence avec ce que tu m'as décrit que le fait d'être figé (angle de l'espace unique) ? Si j'envoie un élément dans cette réverbe, aura-t-on la sensation d'espace arrière au casque ?

Merci encore EraTom pour toutes ces précisions et si d'autres sont intéressés par le sujet, n'hésitez pas à venir partager vos expériences, idées ou réflexions !

[ Dernière édition du message le 12/02/2014 à 02:31:40 ]

10
Citation :
Imaginons que je dispose d'un de ces systèmes d'enregistrement binaural :
http://www.er.uqam.ca/nobel/k24305/chapitre_3.html (explications sur le sujet très bien résumées dans ce lien également)
et que mon but est de créer une empreinte acoustique d'une pièce.
Ça se fait, mais l'approche usuelle est de séparer la réverbération de la pièce et le "filtre" binaural.

"L'empreinte" de l'oreille est prise dans un premier temps avec un enregistrement dans une chambre anéchoïque.
La réverbération d'une pièce est mesurée séparément et appliquée post-traitement : les produits de convolution successifs du "filtre binaural" puis de la réverbération renforce l'impression de profondeur et de spatialisation.
Il existe en plus des réverbérations numériques qui permettent de simuler une pièce réelle : En indiquant les dimensions de la pièce, la position de la source et du récepteur, etc. les "Early Reflections & Pre-Delay" sont calculées en fonction des paramètres donnés.


Citation :
Si je place ce système de captation à la place de l'auditeur et que j'émet le sweep derrière la tête, quel résultat donnera une réverbe "convolutionnée" à partir de ce signal ? Est-ce que ce système n'a de différence avec ce que tu m'as décrit que le fait d'être figé (angle de l'espace unique) ? Si j'envoie un élément dans cette réverbe, aura-t-on la sensation d'espace arrière au casque ?
Oui et non.

Oui parce que l'enregistrement sera bien "filtré" convenablement par le système de captation (la tête de mannequin avec les oreilles, les petits micros et tout le bazar https://www.neumann.com/?lang=fr&id=current_microphones&cid=ku100_description ).
En fait la simulation numérique se pose en alternative de cette technique, pour pouvoir spatialiser une scène en post-traitement à partir de captations classiques (bien moins couteuses...).

Non parce que notre système auditif et psycho-acoustique n'est pas assez performant :p
Pour un son dans une bande moyenne du spectre sonore nous sommes capables de spatialiser la droite et la gauche.
Pour l'avant, l'arrière, le haut et le bas nous sommes bien moins bon.

Ce que nous sommes capables de discerner c'est si un son passe de l'avant vers l'arrière, du haut vers le bas, un déplacement quoi, en "remarquant" les variations du contenu spectral.

Si tu envoies une sinusoïde pure, je suis presque sûr que la "filtrage du spectre" réalisé par nos oreilles ne sera même pas suffisant pour dire si le son et devant ou derrière.


En revanche, si tu enregistres un son en faisant le tour du système de captation binaural (et si la forme du mannequin correspond à ta morphologie), si tu écoutes ensuite le résultat avec des écouteurs tu auras bien la sensation qu'une truc tourne autour de toi.

[ Dernière édition du message le 13/02/2014 à 00:59:47 ]