Existe-t-il un indicateur synthétique de l'équilibre fréquentiel d'un fichier audio ?

JolX · Posté le 07/01/2010 à 18:03:24

Citation de : Danguit

Bonjour,

Il me semble difficile - et même impossible - de réduire à un scalaire pertinent l'information recherchée.
Pourquoi ne pas faire, par exemple, une analyse par bande (octave, tiers d'octave ou autre) ?
Ceci pourrait permettre par la suite de dégager des répartitions types en fonction des autres critères, ce qui est le but si j'ai bien compris la question.

Oui, c'est bien le but.
Dans une optique comparative, il me faut des données quantitatives. Dans une analyse par bande, je peux avoir comme données un volume par bande ? Le problème c'est qu'avoir plusieurs données pour indiquer 1 seule chose (la courbe de fréquence) par cas, ça facilite pas du tout la compaison systématique... Je vois pas trop comment faire

> guitoo :
Merci beaucoup, je vais regarder ça !

Danguit · Posté le 07/01/2010 à 18:39:02

Citation :

Le problème c'est qu'avoir plusieurs données pour indiquer 1 seule chose

Pour déterminer un indicateur, la manip se ferait forcément en plusieurs étapes dont l'acquisition des données - amplitude = f(bande) - serait la première. Ensuite une série de régressions (lin, log, exp, polynomiale d'ordre faible) est susceptible de mettre en évidence des différences de comportements permettant la classification.
Il ne s'agit évidemment que d'une petite idée de départ qui nécessiterait quelques essais pour valider le principe, et je n'ai pas la prétention de rivaliser avec l'auteur de l'article cité par guitoo.

Anonyme · Posté le 07/01/2010 à 18:44:52

Citation :

Ce que je cherche est un peu spécifique : j'aimerais faire une analyse de l'évolution des normes de mixage et mastering au cours du temps sur un grand nombre de d'albums avec des logiciels statistiques.

mais ça ça dépend surtout du contenu musical.
Un album solo de kora ne sonnera pas comme le dernier truc arrenbi à la mode.
Faudrait comparer ce qui est comparable.

En fait, je vois pas trop où tu veux en venir en analysant tout ça.

JolX · Posté le 07/01/2010 à 18:46:15

Citation de : guitoo

Tu peux simplement regarder du coté des moments statistiques. En particulier moyenne et skewness.

Est ce que tu peux en dire plus ?

Dans l'article que tu as envoyé, les auteurs disent :

The extracted spectral descriptors were spectral centroid,
spread, skewness and kurtosis (excess), as well as
spectral flatness.

Ca a l'air de mesures très intéressantes !
Pour développer, j'ai trouvé ça (voir des pages 13 à 16) :
http://recherche.ircam.fr/equipes/analyse-synthese/peeters/ARTICLES/Peeters_2003_cuidadoaudiofeatures.pdf
C'est des mesures qui ont l'air très intéressantes !, faut juste que j'éclaircisse ça mathématiquement.
En fait, si je comprends bien, on fait comme si le spectre était une distribution classique en stat, ça permet de calculer pas mal de trucs, très intéressant ! Merci beaucoup pour la piste guitoo !

KeBaTeK · Posté le 07/01/2010 à 19:31:00

Hors sujet :

Citation :

Dis, je trouve que tu juges un peu vite...

Oui c'est vrai, mais c'est que sur l'Af il y a toutes sorte de mondes et toutes sortes de questions. Certaines sont pertinentes d'autres non (et je peux me siter en référence !!). Désolé si je t’ai offensé, ce n’était pas mon intension.

guitoo · Posté le 07/01/2010 à 23:06:48

Est ce que tu connais la notion de moment statistique?
La moyenne la variance le kurtosis et le skewness sont des moments statistiques. Tu pourra trouver des info la dessus sur les pages wikipedia.
Le skewness en particulier va donner une indication sur la dissymétrie. Le kurtosis donne une indication de l'étalement du spectre. Le centroîde, c'est en fait le barycentre. Il va te permettre de savoir si le spectre est plutôt dans les graves ou dans les aigus.

Geoffroy Petters et Xavier Rodet sont de bonnes référence sur les descripteur spectraux.
Je vais te donner une liste de mot clefs qui peuvent t'aider:
-MIR (music information retrieval)
-features, feature vector
-spectral descriptors (descripteurs spectraux)
-classification
-moment statistique

En fait on considère plutôt le spectre comme un histogramme issus de la réalisation d'une distribution statistique. La moyenne par exemple va s'exprimer sour la forme:

Somme des f.X(f)

f étant la fréquence d'un casier et X(f) l'amplitude de ce casier. En stat f serais la valeur d'un tirage et X(f) le nombre de fois qu'elle apparaît.
Cela revient a calculer la fréquence centrale.

En mélangeant correctement les moments statistiques on peut arriver a extraire des informations qui ont du sens, mais je te conseille de te baser sur des travaux existants plutôt que de faire les choses a ta façon.

numa · Posté le 08/01/2010 à 10:36:33

Coucou,
Il me semble qu'une mesure pertinente pour évaluer le niveau sonore relatifs de plusieurs programmes audio serait la mesure du loudness sur la totalité du programme. Cette mesure est aujourd'hui (quasiment) normalisée : standard ITU-R BS.1770. Ce standard comporte notamment la définition d'un filtre appliqué au signal avant les mesures de niveau pour tenir compte de la pondération du niveau perçu en fonction de la fréquence. En deuxième couche, le mesure des niveaux crêtes maximum du programme comparés à la mesure de loudness permet d'évaluer le dynamique du programme.
Voilà, c'est peut-être une piste ...

JolX · Posté le 10/01/2010 à 21:09:15

Citation de gulistan :

mais ça ça dépend surtout du contenu musical.
Un album solo de kora ne sonnera pas comme le dernier truc arrenbi à la mode.
Faudrait comparer ce qui est comparable.

En fait, je vois pas trop où tu veux en venir en analysant tout ça.

Oui, bien sûr, je vais pas mettre Arvo Pärt et Queen of the Stone Age dans le même groupe. Je vais créer des types +/- homogènes de musiques, pour que je compare ce qui est comparable. Comparer les volumes en dB RMS de Led Zeppelin et Queen of the Stone Age, par exemple, ça me paraît sensé pour parler d'évolution de normes de mix et mastering. Non ? Après, c'est clair que la pertinence de l'analyse dépendra de comment je l'aurai opérationalisée, des variables et des cas que j'aurai choisis par exemple. Mais ça me semble pas du tout impossible de bien faire ça.

Citation de numa :

Il me semble qu'une mesure pertinente pour évaluer le niveau sonore relatifs de plusieurs programmes audio serait la mesure du loudness sur la totalité du programme. Cette mesure est aujourd'hui (quasiment) normalisée : standard ITU-R BS.1770.

Merci beaucoup !
J'ai trouvé un logiciel gratuit, de Orban, qui mesure selon ce standard :
https://www.orban.com/meter/
Le problème c'est qu'avec ce logiciel, il faut choisir une sortie audio, qu'il analyse en temps réel. Il me faudrait la même chose mais qui produise une statistique de tout le morceau. Tu sais pas si ça existe ?
Il faut que je me renseigne un peu sur comment est fabriqué cet indicateur (mathématiquement), mais ça a l'air d'être exactement ce que je cherche pour mesurer le loudness !

Citation de Danguit :

Pour déterminer un indicateur, la manip se ferait forcément en plusieurs étapes dont l'acquisition des données - amplitude = f(bande) - serait la première. Ensuite une série de régressions (lin, log, exp, polynomiale d'ordre faible) est susceptible de mettre en évidence des différences de comportements permettant la classification.

Je ne vois pas exactement comment tu imagines ça.

Citation de guitoo :

Est ce que tu connais la notion de moment statistique?
La moyenne la variance le kurtosis et le skewness sont des moments statistiques. Tu pourra trouver des info la dessus sur les pages wikipedia.

Non, un moment statistique, ça ne me dit rien. La variance, la moyenne, ça je vois. Comme coefficient d'asymétrie je connais le coefficient de Fisher, mais bon, je sais pas si ça a une quelconque rapport avec les descripteurs spectraux dont tu parles. Je vais essayer de me renseigner. Si tu as des ref, je suis preneur !

Merci à tou-te-s !

JolX · Posté le 11/01/2010 à 03:11:09

Y'a un plug de TC qui a l'air super intéressant, c'est le LM5D.
>>> https://www.tcelectronic.com/lm5d.asp
Un truc pas mal, c'est que le LM5D includes two long-term universal descriptors: center of gravity and consistency. Any sports, news, music, commercial or film program may be characterized precisely and standardized.

Le seul problème est, si j'ai bien compris, qu'il n'est disponible qu'en version TDM pour protools HD... Donc, faut les cartes avec DSP et tout, ce que je n'ai pas... Et le plug coute 1300€ !!

Un truc aussi intéressant de cet algorithme :

The main difference between the CoG and an
integrating loudness measurement (such as the Leq-type
measurement specified in BS.1770 [7]) is that the CoG
employs an adaptive gate in order to be robust against
'silence' in the program yet making no rigid assumptions
about the absolute levels of the material to be measured.
By employing a gate, the measurement essentially
ignores regions of the material which are too quiet to be
considered part of the program – regions that would
otherwise have biased the CoG measurement.

Mais bon, je crois que c'est mort, pas accessible pour moi...
J'espère que ce n'est pas le seul logiciel a pouvoir créer une statistique de ce type?
Dans ce document, aux pages 8 et 9 il y a des mesures du même types que celles que j'aimerais faire :
https://www.tcelectronic.com/media/LoudnessDescriptors_AES125.pdf

J'ai trouvé, par ailleurs, un petit texte intéressant sur le loudness :
http://www.spip.aevll.org/spip.php?article758

JolX · Posté le 11/01/2010 à 05:25:00

Alors, après qques recherches :

- Je n'ai trouvé qu'un seul logiciel qui permette l'analyse "offline" de la "loudness", c'est à dire à partir d'un fichier et pas en temps réel : c'est AudioLeak et il n'est dispo que sur MAC...

Il produit des mesures LEQ(A) (si j'ai bien compris c'est pareil que le volume RMS sauf que toutes les fréquences n'ont pas le même poids dans le calcul, puisque l'oreille entend, à amplitude égale, mieux un 1000hz qu'un 100hz ou qu'un 10.000hz) et en LEQ (RLB) (ça c'est une mesure selon le standard BS.1770, dont je sais pas trop comment il marche).
http://www.channld.com/audle.html
Voir des infos intéressantes ici :
https://www.sounddesigners.org/index.php?name=PNphpBB2&file=viewtopic&t=5083

- J'ai trouvé ça pour Matlab, mais j'y connais rien dans ce logiciel :
http://www.mathworks.com/matlabcentral/fileexchange/22512-nthocthandarmacfiltertoolbox