Se connecter
Se connecter

ou
Créer un compte

ou

réactions au dossier [Bien débuter] Anatomie des ondes

  • 113 réponses
  • 26 participants
  • 15 637 vues
  • 28 followers
Sujet de la discussion [Bien débuter] Anatomie des ondes
Anatomie des ondes
Dans le précédent article, nous avons vu que le son était composé d’ondes. Comme beaucoup de choses dans la vie, celles-ci peuvent être simples ou complexes.

Lire l'article
 


Ce thread a été créé automatiquement suite à la publication d'un article. N'hésitez pas à poster vos commentaires ici !

Accepter qu'on n'sait pas, c'est déjà l'premier pas.

 

MUSICIENS ET PUBLIC, PROTEGEZ VOS OREILLES!

Afficher le sujet de la discussion
101
@Eratom : Merci beaucoup pour ta réponse EraTom, je sais que ça peut prendre facilement une heure de pondre un long post comme ça, si on essaye un peu de le structurer...

Je pense que j'ai bien compris l'analogie avec les densité de probabilité. En fait dans la transformée de Fourier, le spectre n'a pas la même signification que celui de la décomposition en série car on ne fait pas de projection sur une base (il me semblait pourtant que les exp(2i.Pi.f.t) formaient une base "continue" (et orthogonale ^^) et que l'intégrale qu'on utilise pour calculer la transformée de Fourier était un produit scalaire, donc une projection, mais bon, il doit y avoir des nuances qui m'échappent) et du coup, la valeur significative pour un tel spectre, c'est l'aire sous la courbe et non la valeur en un point, donc pour traiter ça, il faut avoir des approches propabilistes qui impliquent un certain nombres de limitations que ne remplissent pas toujours les transitoires. On ne m'avait jamais présenté la chose ainsi...


Les algo dont tu parles (Music, Esprit), si j'ai bien compris, ça trouve surtout son intérêt pour la compression utilisée pour le stockage et surtout pour le streaming (donc les codecs audio). Il me semble que le MP3 fait appel justement à des décompositions en fréquence, avec resynthèse derrière... donc c'est pour ça que les symbales sonnent si peu naturelles avec le MP3... :bravo:



Citation :
Le spectre d'un signal proche de l'impulsion sera complètement étalé dans les fréquences et pourra avoir la même tête qu'un bruit (qui lui est réellement présent partout). Ça se complique encore si le son en question est un bruit modulé rapidement en amplitude (genre une caisse claire ou un coup de charleston.

Mon avis et mon expérience (que tout le monde ne partage sans doute pas) sont que dans ces cas là il vaut mieux faire confiance à ses oreilles qu'à ce qu'on lit sur un analyseur parce qu'il ne te donnera qu'une idée grossière de ce qu'il se passe réellement.

C'est bien ce que je craignais... maintenant j'imagine que certains analyseurs sont être plus performants que d'autres quand même, on ne paye pas que la GUI et la gestion de la dynamique d'affichage du spectre quand même...


Après, le soucis, c'est si on utilise ce genre d'outil sur un bus, ou le master, parce que là, tous les types de sons sont superposés...

Du coup, je me demande, dans le cadre du mixage (équalisation etc) et non pas dans le cadre d'un codec avec resynthèse derrière, est-ce qu'il ne serait pas "tout simplement" plus intéressant de ne pas tenir compte des transitoires (c'est une question purement théorique...) ? Parce qu'au final, comment est perçu un transitoire ? Est-ce qu'il va paraître plus aigu (ou ayant plus "d'air") s'il est plus rapide ? J'ai plutôt l'impression que ça va changer la sensation de l'attaque (d'ailleurs c'est comme ça que s'appelle ce paramètre sur les synthés justement) et au final, les composantes spectrales dues aux transitoires et présentes dans le spectre (même si le calcul arrive à les déterminer précisément) ne sont finalement peut-être pas si pertinentes que ça du point de vue du ressenti grave/médium/aigu etc. non ?

[ Dernière édition du message le 23/09/2014 à 14:54:28 ]

102
Citation :
la valeur significative pour un tel spectre, c'est l'aire sous la courbe et non la valeur en un point
En tout rigueur c'est ça, dans le cas continu. Attends, quand-même, avant de jeter le bébé avec l'eau du bain :P
Dans la pratique tu utilises, de toute manière, une FFT qui donne une représentation discrète du spectre (ça devient donc un faux débat puisque l'on ne rencontre pas de mesure continue).

Citation :
il me semblait pourtant que les exp(2i.Pi.f.t) formaient une base "continue"
Voilà, c'est là qu'il y a une approximation "de physicien" qui permet de se saisir du concept mais qui est fausse (une vulgarisation "bac+5" qd-même...). Pour bien comprendre le truc il faut se farcir de la topologie, la théorie de la mesure et les tribus machins... Pour finalement avoir la satisfaction de bien maitriser un outil mathématique sur des cas tordus que l'on ne rencontre pas (ou peu) en pratique (ce qui réduit l'effort à de la branlette).

En probabilité (mathématique), il n'est pas rare de devoir repenser certains estimateurs et les matheux sont obligés de bien revenir sur le cadre théorique. En traitement du signal c'est déjà un exercice bien plus rare réservé à quelques labos.
Donc on comprend ce machin, on le met dans un coin de la tête si besoin, et puis on l'oublie (jusqu'à ce que ça merdouille si l'on s'attaque à un truc trapu).

Citation :
il faut avoir des approches propabilistes qui impliquent un certain nombres de limitations que ne remplissent pas toujours les transitoires
Dans la première partie je faisais juste un parallèle au sujet de l'estimation par une densité (parce qu'en proba c'est un truc essentielle sur lequel les matheux ne peuvent pas faire l'impasse ; difficile de trouver des sources équivalentes pour le signal).

Par contre, l'estimation probabiliste de la DSP ou DSE est un contrainte supplémentaire (à cette histoire de densité) dès lors que l'on prend en compte les signaux de bruit représentés par des processus stochastiques.
Il faut que le signal soit stationnaire (au sens large) et ergodique. S'il ne l'est pas... Et ben on bricole pour s'en approcher et l'on utilise quand même les mêmes outils parce que l'on en a pas d'autre efficace : On applique quand-même et l'on se contente d'une estimation biaisée.

Citation :
donc c'est pour ça que les symbales sonnent si peu naturelles avec le MP3...
Yep. Et le modèle de bruit (modélisation des processus stochastique) du mp3 n'est pas non plus super efficace.

Si je ne me trompe pas, MUSIC et ESPRIT font quand-même l'hypothèse que le signal est stationnaire quasi-périodique sur des trames très courtes (la variation du signal est assez lente devant la durée d'une trame).
Comme ces méthodes sont "HR", le problème de la résolution est contournée pour avoir des trames assez fines et mieux traiter un signal changeant rapidement.

Le modèle à la base du mp3 est un modèle "sinusoïdes + bruit" collé sur des trames courtes. Ceci dit, une impulsion ou un transitoire rapide risque d'être étalé sur la durée de la trame (en plus de présenté des fréquences à côté) : Pas génial pour la restitution d'une attaque et l'on prend en plus le risque de garder beaucoup de sinusoïdes qui sont des artefacts de la décomposition réalisée lors de l'analyse spectrale (ça compresse moins bien, et le machin qui décide si un partie doit être modélisée comme une somme de sinus ou par une enveloppe de bruit se plante).

Dans la littérature actuelle tu trouves des propositions de modèles "Transitoires + Sinusoïde Amorties + Bruit" qui permettent d'obtenir des modèles plus compacts (plus efficace pour la restitution et la compression).
Pour les transitoires on voit souvent la décomposition sur des ondelettes.

Les sinusoïdes amorties ajoutent une exponentielle : a*exp(tau*t)*sin(f*t+phi). Avec un paramètre "tau" en plus on peut coder avec la même qualité des trames 3 fois plus longues (c'est ce qui est généralement observé). Les techniques pour estimer les 4 paramètres sont très proches de celles utilisées dans les méthodes HR classiques : Au lieu d'avoir une base complexe exp(j*f*t) on a une base exp((tau+j*f)*t)...
Le paramètre de phase phi et l'amplitude a sont estimés conjointement dans un 2nd temps.

Pour le bruit, il y a eu des avancées significatives pour le traitement de la parole à repomper allègrement.


Citation :
Après, le soucis, c'est si on utilise ce genre d'outil sur un bus, ou le master, parce que là, tous les types de sons sont superposés...
Oui c'est un peu le problème...

Citation :
Du coup, je me demande, dans le cadre du mixage (équalisation etc) et non pas dans le cadre d'un codec avec resynthèse derrière, est-ce qu'il ne serait pas "tout simplement" plus intéressant de ne pas tenir compte des transitoires (c'est une question purement théorique...) ? Parce qu'au final, comment est perçu un transitoire ? Est-ce qu'il va paraître plus aigu (ou ayant plus "d'air") s'il est plus rapide ? J'ai plutôt l'impression que ça va changer la sensation de l'attaque (d'ailleurs c'est comme ça que s'appelle ce paramètre sur les synthés justement) et au final, les composantes spectrales dues aux transitoires et présentes dans le spectre (même si le calcul arrive à les déterminer précisément) ne sont finalement peut-être pas si pertinentes que ça du point de vue du ressenti grave/médium/aigu etc. non ?
Là faudrait demandé l'expérience d'un ingé son.
Si je trouve qu'un instrument est mal assorti avec un coup de caisse claire (par exemple) je pourrais regarder le spectre de l'instrument voir où tombent exactement ses harmoniques et creuser avec un EQ la caisse claire pour lui faire de la place (en cherchant à ne pas dénaturer la percu).

Pour régler un EQ sur une partie percussive je mets de côté les analyseurs et je préfère balader un EQ sur différentes fréquences en cherchant à l'oreille.

[ Dernière édition du message le 23/09/2014 à 19:30:14 ]

103
Citation :
Dans la pratique tu utilises, de toute manière, une FFT qui donne une représentation discrète du spectre

Oui, tu l'avais déjà précisé dans le post précédent, merci pour tes efforts de pédagogie :D


Citation :
Par contre, l'estimation probabiliste de la DSP ou DSE est un contrainte supplémentaire (à cette histoire de densité) dès lors que l'on prend en compte les signaux de bruit représentés par des processus stochastiques.
Ah d'accord, j'avais pas pigé cet aspect.


Citation :
Dans la littérature actuelle tu trouves des propositions de modèles "Transitoires + Sinusoïde Amorties + Bruit" qui permettent d'obtenir des modèles plus compacts (plus efficace pour la restitution et la compression).
J'avais jamais entendu parler de ça... Mais c'est malin, on décompose le signal en ses différentes composantes et on "code" chacune à l'aide de l'outil le plus adapté. C'est cool, ça avance :D J'imagine que la partie délicate doit être l'algo qui discrimine entre ces différentes parties...
C'est ce qui est utilisé pour le AAC ?


Citation :
Pour régler un EQ sur une partie percussive je mets de côté les analyseurs et je préfère balader un EQ sur différentes fréquences en cherchant à l'oreille.

BAh, pour l'instant, je n'ai pas d'analyseur de qualité, donc je n'en utilise pas. Mais ça me tente bien d'investir dans un EQ couplé à un analyseur, ça permet de voir ce qui se passe, comment agit l'EQ etc., voire même de laisser le soft calculer les paramètres de l'EQ en agissant directement sur le spectre.:8)
J'avais déjà essayé d'utiliser celui dont je dispose pour le réglage des basses parce que j'ai un petit home-studio dans une pièce non traitée et c'est la partie la plus délicate à gérer, mais bon, je pouvais attenuer de 12dB la zone située en-dessous de 200Hz par exemple, et ça ne changeait quasiment rien dans l'analyseur icon_facepalm.gif
En tout cas, je retiens l'idée de ne pas se fier aux analyseurs pour les sons percussif :)
104
Citation :
la partie délicate doit être l'algo qui discrimine entre ces différentes parties...
Exactement. Il y a plusieurs approches :
- Certaines tentent de classifier a priori les trames pour utiliser le modèle le plus efficace,
- D'autres tentent des schémas a posteriori et itératifs : On tente de coller des sinus amorties, on regarde ce qu'il reste et si ça ne marche pas assez bien on tente un autre truc.

C'est compliqué parce qu'en plus d'être difficile à régler le choix oriente toute l'architecture de l'ensemble.
105
Je ne veux pas faire le chipoteur mais moi j'aurais préféré que ça soit la dame à gauche qui ronfle et le monsieur à droite qui éternue...
106
Pour accompagner ce très bon article:

107

   moi, j'ai pas d'blé mais j'ai du son...

108

Merci Choc pour tes liens ! :-)

 

Et à tous les autres, notamment EraTom, pour vos très intéressantes contributions.

Accepter qu'on n'sait pas, c'est déjà l'premier pas.

 

MUSICIENS ET PUBLIC, PROTEGEZ VOS OREILLES!

109
Citation de Choc :

J'ai fais une petite appli web pour illustrer ca : http://www.sp4mass.com/signal/periodic/

Dommage, le lien est mort.. Autre lien? Merci;
110
Merci de toutes ces précisions :)

Citation de jimmyjim :
Une animation flash pour mieux comprendre la somme de 2 ondes :

http://www.sciences.univ-nantes.fr/sites/genevieve_tulloue/Ondes/general/somme.html

En vert c'est le résultat de la somme, tu mets les 2 ondes (rouge et bleue) à la même amplitude (le volume) et si tu joues avec le déphasage (décalage de l'onde à 0° et l'autre à 180° (à 6 heures)) tu observe la courbe verte qui s'annule


En version plus simple pour comprendre la fréquence, l'amplitude, la pérode et de la déphasage : http://www.sciences.univ-nantes.fr/sites/genevieve_tulloue/Ondes/general/sinus.html

Et celle la avec le son :bravo: :
http://www.sciences.univ-nantes.fr/sites/genevieve_tulloue/Ondes/general/synthese.html