réactions au dossier [Bien débuter] Anatomie des ondes
- 113 réponses
- 26 participants
- 16 183 vues
- 28 followers

newjazz

Lire l'article
Ce thread a été créé automatiquement suite à la publication d'un article. N'hésitez pas à poster vos commentaires ici !

Choc

pour moi, clairement la musique a entraîné le signal
Je crois que tout le monde est dans le même cas

Site personnel: https://www.enib.fr/~choqueuse/

sleepless

Si nous mélangeons deux sons « en phase », les parties positives des deux ondes vont s’additionner entre elles, et les parties négatives vont faire de même. Le tout aura donc pour résultat un doublement du volume général du son.
C'est moi, ou bien... ?
[ Dernière édition du message le 22/09/2014 à 17:07:48 ]

miles1981

Audio Toolkit: http://www.audio-tk.com/

sleepless

Puissance, intensité, volume perçu ?
+3 dB, + 6 dB, + 10 dB, source doublée, source quadruplée, source décuplée ?
dB, sonie ?
Je pense que la formulation de l'article est très imprécise.
[ Dernière édition du message le 22/09/2014 à 17:17:05 ]

Danguit


sleepless

Si je ne me buse :
Deux sinusoides parfaitement en phase = doublement de l'intensité, donc + 6 dB.
Quand on parle puissance, + 6 dB correspondent au quadruplement de cette dernière.
Et là-dessus, on est d'accord.
Mais doublement du volume perçu, implique une augmentation comprise entre + 8 et + 10 dB selon les fréquences et niveaux. Non ?
Donc dire que c'est un doublement du "volume" me paraît source d'incompréhension (non ?).
[ Dernière édition du message le 22/09/2014 à 17:46:27 ]

Petermaler



miles1981

Et dans ce cas, doublement du volume = +6 dB
Audio Toolkit: http://www.audio-tk.com/
[ Dernière édition du message le 22/09/2014 à 18:42:30 ]

Danguit

Mais en general, on simplifie en donnant amplitude = volume.

KaeRZed

Hors sujet :
Citation de miles1981 :
le volume, c'est un concept complique (c'est subjectif)
tout-à-fait d'accord... j'ai d'ailleurs regardé récemment une vidéo sur l'explication des LU / LUFS qui était très instructive à ce sujet...

EraTom

Si l'amplitude est doublée la puissance est quadruplée : +6dB dans les deux cas.
+3dB un doublement de la puissance ne correspond pas à un doublement de l'amplitude (les 2 sinusoïdes n'interfèrent pas, par exemple).
@Tchandra78 : Pour ne pas donner la nausée aux gens on peut demander à un modo de déplacer notre échange dans un fil spécifique, non ?

KaeRZed

Hors sujet :
Citation de EraTom :
Pour ne pas donner la nausée aux gens
Faut pas pousser.. Ça tient plus de la migraine que de la nausée...

Anonyme

Ah pardon d'avoir posé des questions d'analyse spectral sur un forum d'audio..., ça n'empêche pas les gens de lire l'article ou de zapper les discussions qui ne les intéressent pas...
Citation :Franchement, la transformée de Fourier Discrète ca marche déjà super bien...
Ben c'est ce qu'il me semble aussi, mais EraTom dit que ce n'est pas exploitable sur les transitoires...
Si tu comprends tout ce que tu expliques, je te tire mon chapeau.
En plus j'ai écouté les compos de Tchandra et je dis : bravo.
Puis il joue de la guitare tranquille sur des morceaux avec lesquels je ne réussis à sortir qu'un " Bzdoiiing "
J'aurais bien aimé ajouter un truc intelligent mais je n'ai rien en magasin.

Juste une question si c'est possible ( puisque j'ai fait mes enregistrements en home studio avec une machine "direct to disk" qui n'affiche pas les courbes oscillantes , tout se fait à l'oreille ) :
Juste en regardant des courbes de chaque piste enregistrée sur un Cubase par exemple, est ce que vous arrivez à prévoir un résultat optimal dans la synthèse du mixage , juste "à l'œil "?
[ Dernière édition du message le 22/09/2014 à 20:53:54 ]

trazom

Juste en regardant des courbes de chaque piste enregistrée sur un Cubase par exemple, est ce que vous arrivez à prévoir un résultat optimal dans la synthèse du mixage , juste "à l'œil "?
Mixer en regardant les courbes ? Je ne comprends pas trop, là ?

miles1981

Ah pardon d'avoir posé des questions d'analyse spectral sur un forum d'audio..., ça n'empêche pas les gens de lire l'article ou de zapper les discussions qui ne les intéressent pas...
Citation :Franchement, la transformée de Fourier Discrète ca marche déjà super bien...
Ben c'est ce qu'il me semble aussi, mais EraTom dit que ce n'est pas exploitable sur les transitoires...
Ca marche très bien, c'est juste que tu considère le transitoire comme étant périodique (période = durée de ton signal original).
Audio Toolkit: http://www.audio-tk.com/

Anonyme

Citation :Juste en regardant des courbes de chaque piste enregistrée sur un Cubase par exemple, est ce que vous arrivez à prévoir un résultat optimal dans la synthèse du mixage , juste "à l'œil "?
Mixer en regardant les courbes ? Je ne comprends pas trop, là ?
C'est que j'ai moi- même sans doute rien compris.
Mais je me disais que si des sinusoïdes qui représentent des sons et qui apparaissent sur les diagrammes des pistes d'un séquenceur comme cubase peuvent s'ajouteŕ , s'annuler (...)en fonction de leur phases et de leur fréquence, on peut peut- être anticiper le résultat du mixage pour l'optimiser juste en les regardant ( en modifiant l'amplitude, la fréquence ...)

trazom

Pour le reste (réglage des niveaux, EQ, pano, et autres), on n'utilise pas du tout la forme d'onde, sauf éventuellement pour admirer l'effet d'un compresseur (mais le visuel peut être très trompeur) ou pour détecter un clic indésirable. Enfin, perso, je vois rien d'autre.
[ Dernière édition du message le 22/09/2014 à 22:38:14 ]

Anonyme

Citation de KaeRZed :Tchandra, tu as le droit de poser toutes les questions que tu souhaites.... Dès l'instant qu'elles sont posées dans une discussion en rapport
Pas de soucis, mais la discussion était basée sur cette citation de l'article :
Citation :Pour information, on doit au génial mathématicien et physicien Joseph Fourier (1768-1830) la découverte suivante : toute onde complexe peut être décomposée en un certain nombre d’ondes sinusoïdales simples, à l’exception des transitoires, qui sont les périodes d’établissement et de disparition du son.
Après, la discussion a émergée d'elle-même à cause des intervenants qui avaient quelque chose à dire à ce sujet, je n'aurais pas pensé à poser cette question sinon, et ouais ça me saoule que d'avoir à se censurer dès qu'on dit des trucs un peu compliqué, quand des gens racontent n'importe quoi sur le forum, je ne vais pas leur dire d'aller ailleurs parce qu'ici c'est un forum d'audio et non le café du coin, je zappe la discussion et voilà...
Citation :En plus j'ai écouté les compos de Tchandra et je dis : bravo.
Merci, c'est sympa
Citation :Oui pourquoi pas.Pour ne pas donner la nausée aux gens on peut demander à un modo de déplacer notre échange dans un fil spécifique, non ?
Citation :Je vois l'idée, merciCa marche très bien, c'est juste que tu considère le transitoire comme étant périodique (période = durée de ton signal original).

sleepless

Oui pour le côté subjectif, d'où création du sone, loi de Stevens, de Scharf, etc.
D'accord avec EraTom, pour son post 86.
En désaccord avec Danguit et miles1981 dans leur analogie puissance=volume ou amplitude=volume :
Si l'on génère (avec Audacity, par exemple) un signal à 50 Hz et un autre à 2 kHz dotés de la même amplitude et qu'on les diffuse au même réglage d'amplification, qu'est-ce que ça donne au niveau du volume perçu ?
[ Dernière édition du message le 22/09/2014 à 23:32:52 ]

miles1981

Audio Toolkit: http://www.audio-tk.com/

sleepless

Pourtant tu dis bien amplitude = volume, non ?
Dans l'exemple que je donne, le 2 kHz sonnera bien "plus fort", alors qu'il est de même amplitude que le 50 Hz, ce qui m'empêche de faire l'égalité que tu fais.
Ou bien j'me goure-je-t'il ?

EraTom

Par contre, c'est curieux cette histoire de puissance dont tu parles. Ce que j'avais retenu, c'est que transformée de Fourier est une projection d'une fonction sur une base de type exp(2Pi.f.t) avec f réel (alors qu'il s'agit de nombres entiers pour la décomposition en série) et que ça s'appliquait à tout signal... donc pour moi le spectre, ça indique simplement l'amplitude de telle ou telle composante (haute fréquence, basse fréquence etc) pas la puissance...en général quand on calcule une puissance ou une énergie, on utilise le carré du signal à un moment donné, mais bon si tu dis que le spectre donne une idée de la puissance du signal en fonction de la bande de fréquence, je te crois mais je ne pige pas d'où ça vient...
Dans le cas de continu, on calcule une densité de puissance qui permet de retrouver la puissance dans une bande de fréquence en calculant une intégrale.
Franchement, ça va loin et les physiciens ne s'embarrassent généralement de ce genre de "détail".
Si tu veux un parallèle, c'est comme la définition de densité de probabilité continue qui permet de calculer la probabilité que la valeur prise par une variable aléatoire soit dans un intervalle donné.
https://fr.wikipedia.org/wiki/Densit%C3%A9_de_probabilit%C3%A9
Comme expliqué dans cette article, dans le cas continu la probabilité que la variable aléatoire prenne une valeur donnée est nulle : P( X = x ) = 0 ≠ f(x)
Mais la densité permet de calculer P( a < X < b ) = ∫ f(x).dx pour x sur
En toute rigueur tu te retrouves dans le même cas pour la puissance dans le domaine fréquentiel ; c'est ce que le terme "densité" signifie. Et comme l'indique la suite de l'article Wikipédia, les physiciens utilisent une définition qui n'est pas complètement rigoureuse et qui peut ne pas fonctionner pour certaines classes de signaux.
Dans le cas continu, dire que la densité de puissance en "f" correspond à la puissance d'une sinusoïde à cette fréquence est abusif.
Dans le cas discret (ce que tu obtiens avec une FFT) tu peux "confondre" la densité et la puissance à une fréquence données sans vergogne.
[quote]Mais j'imagine que tu décris une méthode d'analyse qui utilise une sorte d'effet de moyenne, on fait plusieurs fois le même calcul sur une "trame" et on détermine le spectre final en "moyennant" les différents spectres obtenus. Je comprends bien que ce n'est pas applicable avec un signal qui n'est jamais identique, mais il s'agit là d'une méthode pour améliorer la précision de la transformé de Fourier, je ne vois pas en quoi ça empêche de faire la transformée de Fourier d'un transitoire unique et en quoi le spectre obtenu serait inutilisable...[/quote]Ce n'est pas seulement pour améliorer la précision mais bien pour parvenir à l'estimation.
Dans le cas le plus général, le signal n'est pas déterministe mais aléatoire. C'est un processus stochastique (bon courage... https://fr.wikipedia.org/wiki/Processus_stochastique )
En gros, le signal est la réalisation d'un truc aléatoire (comme un jeté de dé) et pour calculer la densité de puissance il faut calculer l'espérance mathématique (la moyenne en probabilité) du carré de la transformée de Fourier du processus stochastique qui forme le signal. Dans la littérature tu pourras rencontrer la formule DSE = E[|S(f)|²].
Or obtenir les différentes réalisations du signal n'est pas possible dans la pratique ; l'idée est alors de faire une moyenne temporelle mais ce n'est possible que si le processus possède deux propriétés : stationnaire et ergodique.
https://fr.wikipedia.org/wiki/Processus_stationnaire
https://fr.wikipedia.org/wiki/Processus_ergodique
Dans le cas de signaux musicaux ceci n'est pas toujours vérifié notamment sur les sons de percussions ou les transitoires trop rapides : L'estimation du spectre est alors biaisée.
Pour caractériser un bruit (un processus stochastique)... Même avec le calcul d'un FFT (discrète), le décrire comme une somme de sinusoïdes (amplitude, fréquence, phase) n'est vraiment pas pertinent : Donner l'enveloppe de la puissance suffit sachant, qu'en plus, il n'y a pas de phase particulière à retenir (c'est quoi la phase d'un bruit sinon un artefact de calcul valable pour une seule estimation du spectre ?).
[quote]Bon, comme je disais plus haut, le fait que le signal mesuré soit de durée fini et qu'on le projette sur une base de fonctions infinies, ça donne des résultats bizarres comme les sinus cardinaux etc, mais je ne vois en quoi le problème serait pire pour un transitoire que pour un autre type de signal...

Il faut alors passer à d'autres techniques dites Haute Résolution. En général les techniques proposent d'introduire de la connaissance a priori : Par exemple, on "sait" que le signal est une somme de sinusoïdes, des sinusoïdes amorties ou des atomes de Gabor (les ondelettes) et l'on cherche à estimer les paramètres qui permettent de coller au mieux à la trame du signal dont l'on dispose.
L’intérêt pour le traitement du signal musical est bien réel mais le coût calculatoire est prohibitif. Ça fait plus d'une dizaine d'années que des labos planchent activement sur des algo pour réduire le coût calculatoire (la puissance de calcul de nos machines augmentant dans le même temps).
Les candidats pour la prochaine génération d'encodeur audio proposent ces techniques notamment pour améliorer la représentation et la reproduction des transitoires rapides.
Les méthodes MUSIC et ESPRIT du lien de Choc sont des méthodes HR.
Edit : Une thèse de Télécom ParisTech qui raconte la même chose et qui propose des algo https://tel.archives-ouvertes.fr/tel-00009321
J'avais bossé à distance avec un certain Rémi Boyer qui menait une thèse sur le sujet à Télécom ParisTech qui allait jusqu'à proposer un encodeur audio mais elle ne semble plus en ligne... Peut-être en cherchant un peu...
[quote]Par exemple, il est bien possible de filtrer un transitoire, si on lui applique un passe-bas, on va le "lisser" , c'est-à-dire réduire ses composantes hautes fréquences, j'en déduis que ces fréquences sont bien là non ? Bon certes, on va aussi ajouter des composantes qui viennent du filtre lui-même (résonance, déphasage, etc) mais c'est autre chose...[/quote]En réalité c'est une autre façon de voir la FFT et tu vas rencontrer les mêmes limitations.
[quote]Pour le principe d'incertitude d'Heisenberg, je ne savais pas qu'il s'appliquait ici, je pensais que c'était un truc réservé à la mécanique quantique...[/quote]Ben en fait ça s'applique à chaque espace dual... Et c'est bien le même problème (c'est une fonction d'onde qui régit la mécanique quantique) : Position <-> Quantité de mouvement d'une particule
Localisation temporelle d'un signal <-> Localisation fréquentielle
[quote]Merci pour tes conseils concernant le réglage des analyseurs de spectre, mais concrètement, ça ne m'aide pas beaucoup parce que si tu utilises un analyseur de spectre du commerce dans ton daw, généralement, tu ne peux pas régler le type de fenêtrage, la durée des trames oui, mais dans un signal d'un morceau de musique, il y a des transitoires partout (le début de chaque note...), donc concrètement si tu appliques un EQ sur un son percussif, et que tu regardes le spectre du signal filtré pour mieux voir ce qui passe au niveau des fréquences, est-ce que ça veut dire 80% de ce que tu vas lire dans ton spectre ne sera que du "bruit" de fenêtrage ? Est-ce que les analyseurs de spectre pour l'audio (je en sais pas, les trucs utilisés en mastering etc) ne sont pas optimisés pour afficher un résultat exploitable ? Peut-être qu'ils utilisent d'autres algo que la transformée de Fourier, ondelettes ou les "méthodes paramétriques" (connais pas...) ?[/quote]Oui les outils d'une DAW sont assez souvent limités en terme de réglages... Alors autant avoir conscience des limites.
Le spectre d'un signal proche de l'impulsion sera complètement étalé dans les fréquences et pourra avoir la même tête qu'un bruit (qui lui est réellement présent partout). Ça se complique encore si le son en question est un bruit modulé rapidement en amplitude (genre une caisse claire ou un coup de charleston).
Mon avis et mon expérience (que tout le monde ne partage sans doute pas) sont que dans ces cas là il vaut mieux faire confiance à ses oreilles qu'à ce qu'on lit sur un analyseur parce qu'il ne te donnera qu'une idée grossière de ce qu'il se passe réellement.
[quote]Ca marche très bien, c'est juste que tu considère le transitoire comme étant périodique (période = durée de ton signal original).[/quote]Ok pour la méthode, mais malheureusement ça ne marche pas toujours très bien : Tout dépend de la durée du phénomène et de la résolution fréquentielle dont on a besoin... On va dire que dans 90% des applications audios ça suffit.
[quote]Par contre, je relativiserai un peu certains discours. [/quote]Nan !

Bon ok, mais moi je suis signaleur ET batteur alors la représentation spectrale des percussions ça me chatouille. Ce qu'en fait le mp3 ça me rend même parfois malade." rel="ugc noopener" target="_blank">
En toute rigueur tu te retrouves dans le même cas pour la puissance dans le domaine fréquentiel ; c'est ce que le terme "densité" signifie. Et comme l'indique la suite de l'article Wikipédia, les physiciens utilisent une définition qui n'est pas complètement rigoureuse et qui peut ne pas fonctionner pour certaines classes de signaux.
Dans le cas continu, dire que la densité de puissance en "f" correspond à la puissance d'une sinusoïde à cette fréquence est abusif.
Dans le cas discret (ce que tu obtiens avec une FFT) tu peux "confondre" la densité et la puissance à une fréquence données sans vergogne.
[quote]Mais j'imagine que tu décris une méthode d'analyse qui utilise une sorte d'effet de moyenne, on fait plusieurs fois le même calcul sur une "trame" et on détermine le spectre final en "moyennant" les différents spectres obtenus. Je comprends bien que ce n'est pas applicable avec un signal qui n'est jamais identique, mais il s'agit là d'une méthode pour améliorer la précision de la transformé de Fourier, je ne vois pas en quoi ça empêche de faire la transformée de Fourier d'un transitoire unique et en quoi le spectre obtenu serait inutilisable...[/quote]Ce n'est pas seulement pour améliorer la précision mais bien pour parvenir à l'estimation.
Dans le cas le plus général, le signal n'est pas déterministe mais aléatoire. C'est un processus stochastique (bon courage... https://fr.wikipedia.org/wiki/Processus_stochastique )
En gros, le signal est la réalisation d'un truc aléatoire (comme un jeté de dé) et pour calculer la densité de puissance il faut calculer l'espérance mathématique (la moyenne en probabilité) du carré de la transformée de Fourier du processus stochastique qui forme le signal. Dans la littérature tu pourras rencontrer la formule DSE = E[|S(f)|²].
Or obtenir les différentes réalisations du signal n'est pas possible dans la pratique ; l'idée est alors de faire une moyenne temporelle mais ce n'est possible que si le processus possède deux propriétés : stationnaire et ergodique.
https://fr.wikipedia.org/wiki/Processus_stationnaire
https://fr.wikipedia.org/wiki/Processus_ergodique
Dans le cas de signaux musicaux ceci n'est pas toujours vérifié notamment sur les sons de percussions ou les transitoires trop rapides : L'estimation du spectre est alors biaisée.
Pour caractériser un bruit (un processus stochastique)... Même avec le calcul d'un FFT (discrète), le décrire comme une somme de sinusoïdes (amplitude, fréquence, phase) n'est vraiment pas pertinent : Donner l'enveloppe de la puissance suffit sachant, qu'en plus, il n'y a pas de phase particulière à retenir (c'est quoi la phase d'un bruit sinon un artefact de calcul valable pour une seule estimation du spectre ?).
[quote]Bon, comme je disais plus haut, le fait que le signal mesuré soit de durée fini et qu'on le projette sur une base de fonctions infinies, ça donne des résultats bizarres comme les sinus cardinaux etc, mais je ne vois en quoi le problème serait pire pour un transitoire que pour un autre type de signal...

Il faut alors passer à d'autres techniques dites Haute Résolution. En général les techniques proposent d'introduire de la connaissance a priori : Par exemple, on "sait" que le signal est une somme de sinusoïdes, des sinusoïdes amorties ou des atomes de Gabor (les ondelettes) et l'on cherche à estimer les paramètres qui permettent de coller au mieux à la trame du signal dont l'on dispose.
L’intérêt pour le traitement du signal musical est bien réel mais le coût calculatoire est prohibitif. Ça fait plus d'une dizaine d'années que des labos planchent activement sur des algo pour réduire le coût calculatoire (la puissance de calcul de nos machines augmentant dans le même temps).
Les candidats pour la prochaine génération d'encodeur audio proposent ces techniques notamment pour améliorer la représentation et la reproduction des transitoires rapides.
Les méthodes MUSIC et ESPRIT du lien de Choc sont des méthodes HR.
Edit : Une thèse de Télécom ParisTech qui raconte la même chose et qui propose des algo https://tel.archives-ouvertes.fr/tel-00009321
J'avais bossé à distance avec un certain Rémi Boyer qui menait une thèse sur le sujet à Télécom ParisTech qui allait jusqu'à proposer un encodeur audio mais elle ne semble plus en ligne... Peut-être en cherchant un peu...
[quote]Par exemple, il est bien possible de filtrer un transitoire, si on lui applique un passe-bas, on va le "lisser" , c'est-à-dire réduire ses composantes hautes fréquences, j'en déduis que ces fréquences sont bien là non ? Bon certes, on va aussi ajouter des composantes qui viennent du filtre lui-même (résonance, déphasage, etc) mais c'est autre chose...[/quote]En réalité c'est une autre façon de voir la FFT et tu vas rencontrer les mêmes limitations.
[quote]Pour le principe d'incertitude d'Heisenberg, je ne savais pas qu'il s'appliquait ici, je pensais que c'était un truc réservé à la mécanique quantique...[/quote]Ben en fait ça s'applique à chaque espace dual... Et c'est bien le même problème (c'est une fonction d'onde qui régit la mécanique quantique) : Position <-> Quantité de mouvement d'une particule
Localisation temporelle d'un signal <-> Localisation fréquentielle
[quote]Merci pour tes conseils concernant le réglage des analyseurs de spectre, mais concrètement, ça ne m'aide pas beaucoup parce que si tu utilises un analyseur de spectre du commerce dans ton daw, généralement, tu ne peux pas régler le type de fenêtrage, la durée des trames oui, mais dans un signal d'un morceau de musique, il y a des transitoires partout (le début de chaque note...), donc concrètement si tu appliques un EQ sur un son percussif, et que tu regardes le spectre du signal filtré pour mieux voir ce qui passe au niveau des fréquences, est-ce que ça veut dire 80% de ce que tu vas lire dans ton spectre ne sera que du "bruit" de fenêtrage ? Est-ce que les analyseurs de spectre pour l'audio (je en sais pas, les trucs utilisés en mastering etc) ne sont pas optimisés pour afficher un résultat exploitable ? Peut-être qu'ils utilisent d'autres algo que la transformée de Fourier, ondelettes ou les "méthodes paramétriques" (connais pas...) ?[/quote]Oui les outils d'une DAW sont assez souvent limités en terme de réglages... Alors autant avoir conscience des limites.
Le spectre d'un signal proche de l'impulsion sera complètement étalé dans les fréquences et pourra avoir la même tête qu'un bruit (qui lui est réellement présent partout). Ça se complique encore si le son en question est un bruit modulé rapidement en amplitude (genre une caisse claire ou un coup de charleston).
Mon avis et mon expérience (que tout le monde ne partage sans doute pas) sont que dans ces cas là il vaut mieux faire confiance à ses oreilles qu'à ce qu'on lit sur un analyseur parce qu'il ne te donnera qu'une idée grossière de ce qu'il se passe réellement.
[quote]Ca marche très bien, c'est juste que tu considère le transitoire comme étant périodique (période = durée de ton signal original).[/quote]Ok pour la méthode, mais malheureusement ça ne marche pas toujours très bien : Tout dépend de la durée du phénomène et de la résolution fréquentielle dont on a besoin... On va dire que dans 90% des applications audios ça suffit.
[quote]Par contre, je relativiserai un peu certains discours. [/quote]Nan !

Bon ok, mais moi je suis signaleur ET batteur alors la représentation spectrale des percussions ça me chatouille. Ce qu'en fait le mp3 ça me rend même parfois malade." rel="ugc noopener" target="_blank">
Pas contre si X est une variable discrète P( X = x ) ≠ 0 et P( a < X < b ) = ∑ P( X = x ) pour x dans https://fr.wikipedia.org/wiki/Processus_stochastique )
En gros, le signal est la réalisation d'un truc aléatoire (comme un jeté de dé) et pour calculer la densité de puissance il faut calculer l'espérance mathématique (la moyenne en probabilité) du carré de la transformée de Fourier du processus stochastique qui forme le signal. Dans la littérature tu pourras rencontrer la formule DSE = E[|S(f)|²].
Or obtenir les différentes réalisations du signal n'est pas possible dans la pratique ; l'idée est alors de faire une moyenne temporelle mais ce n'est possible que si le processus possède deux propriétés : stationnaire et ergodique.
https://fr.wikipedia.org/wiki/Processus_stationnaire
https://fr.wikipedia.org/wiki/Processus_ergodique
Dans le cas de signaux musicaux ceci n'est pas toujours vérifié notamment sur les sons de percussions ou les transitoires trop rapides : L'estimation du spectre est alors biaisée.
Pour caractériser un bruit (un processus stochastique)... Même avec le calcul d'un FFT (discrète), le décrire comme une somme de sinusoïdes (amplitude, fréquence, phase) n'est vraiment pas pertinent : Donner l'enveloppe de la puissance suffit sachant, qu'en plus, il n'y a pas de phase particulière à retenir (c'est quoi la phase d'un bruit sinon un artefact de calcul valable pour une seule estimation du spectre ?).
[quote]Bon, comme je disais plus haut, le fait que le signal mesuré soit de durée fini et qu'on le projette sur une base de fonctions infinies, ça donne des résultats bizarres comme les sinus cardinaux etc, mais je ne vois en quoi le problème serait pire pour un transitoire que pour un autre type de signal...

Il faut alors passer à d'autres techniques dites Haute Résolution. En général les techniques proposent d'introduire de la connaissance a priori : Par exemple, on "sait" que le signal est une somme de sinusoïdes, des sinusoïdes amorties ou des atomes de Gabor (les ondelettes) et l'on cherche à estimer les paramètres qui permettent de coller au mieux à la trame du signal dont l'on dispose.
L’intérêt pour le traitement du signal musical est bien réel mais le coût calculatoire est prohibitif. Ça fait plus d'une dizaine d'années que des labos planchent activement sur des algo pour réduire le coût calculatoire (la puissance de calcul de nos machines augmentant dans le même temps).
Les candidats pour la prochaine génération d'encodeur audio proposent ces techniques notamment pour améliorer la représentation et la reproduction des transitoires rapides.
Les méthodes MUSIC et ESPRIT du lien de Choc sont des méthodes HR.
Edit : Une thèse de Télécom ParisTech qui raconte la même chose et qui propose des algo https://tel.archives-ouvertes.fr/tel-00009321
J'avais bossé à distance avec un certain Rémi Boyer qui menait une thèse sur le sujet à Télécom ParisTech qui allait jusqu'à proposer un encodeur audio mais elle ne semble plus en ligne... Peut-être en cherchant un peu...
[quote]Par exemple, il est bien possible de filtrer un transitoire, si on lui applique un passe-bas, on va le "lisser" , c'est-à-dire réduire ses composantes hautes fréquences, j'en déduis que ces fréquences sont bien là non ? Bon certes, on va aussi ajouter des composantes qui viennent du filtre lui-même (résonance, déphasage, etc) mais c'est autre chose...[/quote]En réalité c'est une autre façon de voir la FFT et tu vas rencontrer les mêmes limitations.
[quote]Pour le principe d'incertitude d'Heisenberg, je ne savais pas qu'il s'appliquait ici, je pensais que c'était un truc réservé à la mécanique quantique...[/quote]Ben en fait ça s'applique à chaque espace dual... Et c'est bien le même problème (c'est une fonction d'onde qui régit la mécanique quantique) : Position <-> Quantité de mouvement d'une particule
Localisation temporelle d'un signal <-> Localisation fréquentielle
[quote]Merci pour tes conseils concernant le réglage des analyseurs de spectre, mais concrètement, ça ne m'aide pas beaucoup parce que si tu utilises un analyseur de spectre du commerce dans ton daw, généralement, tu ne peux pas régler le type de fenêtrage, la durée des trames oui, mais dans un signal d'un morceau de musique, il y a des transitoires partout (le début de chaque note...), donc concrètement si tu appliques un EQ sur un son percussif, et que tu regardes le spectre du signal filtré pour mieux voir ce qui passe au niveau des fréquences, est-ce que ça veut dire 80% de ce que tu vas lire dans ton spectre ne sera que du "bruit" de fenêtrage ? Est-ce que les analyseurs de spectre pour l'audio (je en sais pas, les trucs utilisés en mastering etc) ne sont pas optimisés pour afficher un résultat exploitable ? Peut-être qu'ils utilisent d'autres algo que la transformée de Fourier, ondelettes ou les "méthodes paramétriques" (connais pas...) ?[/quote]Oui les outils d'une DAW sont assez souvent limités en terme de réglages... Alors autant avoir conscience des limites.
Le spectre d'un signal proche de l'impulsion sera complètement étalé dans les fréquences et pourra avoir la même tête qu'un bruit (qui lui est réellement présent partout). Ça se complique encore si le son en question est un bruit modulé rapidement en amplitude (genre une caisse claire ou un coup de charleston).
Mon avis et mon expérience (que tout le monde ne partage sans doute pas) sont que dans ces cas là il vaut mieux faire confiance à ses oreilles qu'à ce qu'on lit sur un analyseur parce qu'il ne te donnera qu'une idée grossière de ce qu'il se passe réellement.
[quote]Ca marche très bien, c'est juste que tu considère le transitoire comme étant périodique (période = durée de ton signal original).[/quote]Ok pour la méthode, mais malheureusement ça ne marche pas toujours très bien : Tout dépend de la durée du phénomène et de la résolution fréquentielle dont on a besoin... On va dire que dans 90% des applications audios ça suffit.
[quote]Par contre, je relativiserai un peu certains discours. [/quote]Nan !

Bon ok, mais moi je suis signaleur ET batteur alors la représentation spectrale des percussions ça me chatouille. Ce qu'en fait le mp3 ça me rend même parfois malade." rel="ugc noopener" target="_blank">
En toute rigueur tu te retrouves dans le même cas pour la puissance dans le domaine fréquentiel ; c'est ce que le terme "densité" signifie. Et comme l'indique la suite de l'article Wikipédia, les physiciens utilisent une définition qui n'est pas complètement rigoureuse et qui peut ne pas fonctionner pour certaines classes de signaux.
Dans le cas continu, dire que la densité de puissance en "f" correspond à la puissance d'une sinusoïde à cette fréquence est abusif.
Dans le cas discret (ce que tu obtiens avec une FFT) tu peux "confondre" la densité et la puissance à une fréquence données sans vergogne.
[quote]Mais j'imagine que tu décris une méthode d'analyse qui utilise une sorte d'effet de moyenne, on fait plusieurs fois le même calcul sur une "trame" et on détermine le spectre final en "moyennant" les différents spectres obtenus. Je comprends bien que ce n'est pas applicable avec un signal qui n'est jamais identique, mais il s'agit là d'une méthode pour améliorer la précision de la transformé de Fourier, je ne vois pas en quoi ça empêche de faire la transformée de Fourier d'un transitoire unique et en quoi le spectre obtenu serait inutilisable...[/quote]Ce n'est pas seulement pour améliorer la précision mais bien pour parvenir à l'estimation.
Dans le cas le plus général, le signal n'est pas déterministe mais aléatoire. C'est un processus stochastique (bon courage... https://fr.wikipedia.org/wiki/Processus_stochastique )
En gros, le signal est la réalisation d'un truc aléatoire (comme un jeté de dé) et pour calculer la densité de puissance il faut calculer l'espérance mathématique (la moyenne en probabilité) du carré de la transformée de Fourier du processus stochastique qui forme le signal. Dans la littérature tu pourras rencontrer la formule DSE = E[|S(f)|²].
Or obtenir les différentes réalisations du signal n'est pas possible dans la pratique ; l'idée est alors de faire une moyenne temporelle mais ce n'est possible que si le processus possède deux propriétés : stationnaire et ergodique.
https://fr.wikipedia.org/wiki/Processus_stationnaire
https://fr.wikipedia.org/wiki/Processus_ergodique
Dans le cas de signaux musicaux ceci n'est pas toujours vérifié notamment sur les sons de percussions ou les transitoires trop rapides : L'estimation du spectre est alors biaisée.
Pour caractériser un bruit (un processus stochastique)... Même avec le calcul d'un FFT (discrète), le décrire comme une somme de sinusoïdes (amplitude, fréquence, phase) n'est vraiment pas pertinent : Donner l'enveloppe de la puissance suffit sachant, qu'en plus, il n'y a pas de phase particulière à retenir (c'est quoi la phase d'un bruit sinon un artefact de calcul valable pour une seule estimation du spectre ?).
[quote]Bon, comme je disais plus haut, le fait que le signal mesuré soit de durée fini et qu'on le projette sur une base de fonctions infinies, ça donne des résultats bizarres comme les sinus cardinaux etc, mais je ne vois en quoi le problème serait pire pour un transitoire que pour un autre type de signal...

Il faut alors passer à d'autres techniques dites Haute Résolution. En général les techniques proposent d'introduire de la connaissance a priori : Par exemple, on "sait" que le signal est une somme de sinusoïdes, des sinusoïdes amorties ou des atomes de Gabor (les ondelettes) et l'on cherche à estimer les paramètres qui permettent de coller au mieux à la trame du signal dont l'on dispose.
L’intérêt pour le traitement du signal musical est bien réel mais le coût calculatoire est prohibitif. Ça fait plus d'une dizaine d'années que des labos planchent activement sur des algo pour réduire le coût calculatoire (la puissance de calcul de nos machines augmentant dans le même temps).
Les candidats pour la prochaine génération d'encodeur audio proposent ces techniques notamment pour améliorer la représentation et la reproduction des transitoires rapides.
Les méthodes MUSIC et ESPRIT du lien de Choc sont des méthodes HR.
Edit : Une thèse de Télécom ParisTech qui raconte la même chose et qui propose des algo https://tel.archives-ouvertes.fr/tel-00009321
J'avais bossé à distance avec un certain Rémi Boyer qui menait une thèse sur le sujet à Télécom ParisTech qui allait jusqu'à proposer un encodeur audio mais elle ne semble plus en ligne... Peut-être en cherchant un peu...
[quote]Par exemple, il est bien possible de filtrer un transitoire, si on lui applique un passe-bas, on va le "lisser" , c'est-à-dire réduire ses composantes hautes fréquences, j'en déduis que ces fréquences sont bien là non ? Bon certes, on va aussi ajouter des composantes qui viennent du filtre lui-même (résonance, déphasage, etc) mais c'est autre chose...[/quote]En réalité c'est une autre façon de voir la FFT et tu vas rencontrer les mêmes limitations.
[quote]Pour le principe d'incertitude d'Heisenberg, je ne savais pas qu'il s'appliquait ici, je pensais que c'était un truc réservé à la mécanique quantique...[/quote]Ben en fait ça s'applique à chaque espace dual... Et c'est bien le même problème (c'est une fonction d'onde qui régit la mécanique quantique) : Position <-> Quantité de mouvement d'une particule
Localisation temporelle d'un signal <-> Localisation fréquentielle
[quote]Merci pour tes conseils concernant le réglage des analyseurs de spectre, mais concrètement, ça ne m'aide pas beaucoup parce que si tu utilises un analyseur de spectre du commerce dans ton daw, généralement, tu ne peux pas régler le type de fenêtrage, la durée des trames oui, mais dans un signal d'un morceau de musique, il y a des transitoires partout (le début de chaque note...), donc concrètement si tu appliques un EQ sur un son percussif, et que tu regardes le spectre du signal filtré pour mieux voir ce qui passe au niveau des fréquences, est-ce que ça veut dire 80% de ce que tu vas lire dans ton spectre ne sera que du "bruit" de fenêtrage ? Est-ce que les analyseurs de spectre pour l'audio (je en sais pas, les trucs utilisés en mastering etc) ne sont pas optimisés pour afficher un résultat exploitable ? Peut-être qu'ils utilisent d'autres algo que la transformée de Fourier, ondelettes ou les "méthodes paramétriques" (connais pas...) ?[/quote]Oui les outils d'une DAW sont assez souvent limités en terme de réglages... Alors autant avoir conscience des limites.
Le spectre d'un signal proche de l'impulsion sera complètement étalé dans les fréquences et pourra avoir la même tête qu'un bruit (qui lui est réellement présent partout). Ça se complique encore si le son en question est un bruit modulé rapidement en amplitude (genre une caisse claire ou un coup de charleston).
Mon avis et mon expérience (que tout le monde ne partage sans doute pas) sont que dans ces cas là il vaut mieux faire confiance à ses oreilles qu'à ce qu'on lit sur un analyseur parce qu'il ne te donnera qu'une idée grossière de ce qu'il se passe réellement.
[quote]Ca marche très bien, c'est juste que tu considère le transitoire comme étant périodique (période = durée de ton signal original).[/quote]Ok pour la méthode, mais malheureusement ça ne marche pas toujours très bien : Tout dépend de la durée du phénomène et de la résolution fréquentielle dont on a besoin... On va dire que dans 90% des applications audios ça suffit.
[quote]Par contre, je relativiserai un peu certains discours. [/quote]Nan !

Bon ok, mais moi je suis signaleur ET batteur alors la représentation spectrale des percussions ça me chatouille. Ce qu'en fait le mp3 ça me rend même parfois malade.
[ Dernière édition du message le 23/09/2014 à 00:52:36 ]

Danguit

En désaccord avec Danguit et miles1981 dans leur analogie puissance=volume ou amplitude=volume :
Si l'on génère (avec Audacity, par exemple) un signal à 50 Hz et un autre à 2 kHz dotés de la même amplitude et qu'on les diffuse au même réglage d'amplification, qu'est-ce que ça donne au niveau du volume perçu ?
Si l'on additionne 2 signaux différents, même très proches, tout ce que l'on peut dire est que la puissance moyenne (rms) est la somme des puissances (et la valeur crête inférieure ou égale à la somme des crêtes pour une durée suffisante). Donc s'ils ont la même valeur efficace (rms) la puissance est doublée (+3dB) ce qui correspond à * 1.41 pour l'amplitude, et de façon générale c'est bien la puissance (celle qui chauffe) qui nous intéresse et pas une valeur crête ou je ne sais quoi. Quant au niveau perçu...
Dans le cas des signaux identiques, c'est particulier puisque l'on peut observer de l'annulation au doublement de l'amplitude (donc puissance * 4) en fonction du décalage.
Je ne vais pas me battre là-dessus mais comme je constate souvent une confusion, certains confondant la somme de signaux différents et identiques (d'où les grandes discussions sur les +3 ou +6dB), je voulais essayer de préciser les choses.

miles1981

Hello miles1981,
Pourtant tu dis bien amplitude = volume, non ?
Dans l'exemple que je donne, le 2 kHz sonnera bien "plus fort", alors qu'il est de même amplitude que le 50 Hz, ce qui m'empêche de faire l'égalité que tu fais.
Ou bien j'me goure-je-t'il ?
J'ai dit que c'était plus compliqué mais qu'en première approximation, c'était ça (et c'est le cas, en première approximation).
Audio Toolkit: http://www.audio-tk.com/

Choc

Les courbes de Fletcher Munson te permettent d'établir un lien "approximatif" entre l'amplitude d'une composante et l'intensité perçue.
Site personnel: https://www.enib.fr/~choqueuse/
[ Dernière édition du message le 23/09/2014 à 09:31:59 ]
- < Liste des sujets
- Charte