Existe-t-il un indicateur synthétique de l'équilibre fréquentiel d'un fichier audio ?
- 34 réponses
- 11 participants
- 2 665 vues
- 11 followers

JolX


Voilà, je me demande si il existe, à l'image du dB RMS, qui est un indicateur synthétique du volume sonore d'un fichier audio, un indicateur synthétique de l'équilibre fréquentiel.
Un indicateur qui dirait "dans ce fichier audio il y a beaucoup d'aigus comparé aux basses" par exemple, ou quelque chose du style. 'Fin un chiffre où on verrait au premier coup d'œil l'équilibre des fréquences.
Vous savez si ça existe ??
Voilà, merci !
- 1
- 2

guitoo

La moyenne la variance le kurtosis et le skewness sont des moments statistiques. Tu pourra trouver des info la dessus sur les pages wikipedia.
Le skewness en particulier va donner une indication sur la dissymétrie. Le kurtosis donne une indication de l'étalement du spectre. Le centroîde, c'est en fait le barycentre. Il va te permettre de savoir si le spectre est plutôt dans les graves ou dans les aigus.
Geoffroy Petters et Xavier Rodet sont de bonnes référence sur les descripteur spectraux.
Je vais te donner une liste de mot clefs qui peuvent t'aider:
-MIR (music information retrieval)
-features, feature vector
-spectral descriptors (descripteurs spectraux)
-classification
-moment statistique
En fait on considère plutôt le spectre comme un histogramme issus de la réalisation d'une distribution statistique. La moyenne par exemple va s'exprimer sour la forme:
Somme des f.X(f)
f étant la fréquence d'un casier et X(f) l'amplitude de ce casier. En stat f serais la valeur d'un tirage et X(f) le nombre de fois qu'elle apparaît.
Cela revient a calculer la fréquence centrale.
En mélangeant correctement les moments statistiques on peut arriver a extraire des informations qui ont du sens, mais je te conseille de te baser sur des travaux existants plutôt que de faire les choses a ta façon.
[ Dernière édition du message le 07/01/2010 à 23:09:28 ]

numa

Il me semble qu'une mesure pertinente pour évaluer le niveau sonore relatifs de plusieurs programmes audio serait la mesure du loudness sur la totalité du programme. Cette mesure est aujourd'hui (quasiment) normalisée : standard ITU-R BS.1770. Ce standard comporte notamment la définition d'un filtre appliqué au signal avant les mesures de niveau pour tenir compte de la pondération du niveau perçu en fonction de la fréquence. En deuxième couche, le mesure des niveaux crêtes maximum du programme comparés à la mesure de loudness permet d'évaluer le dynamique du programme.
Voilà, c'est peut-être une piste ...

JolX

mais ça ça dépend surtout du contenu musical.
Un album solo de kora ne sonnera pas comme le dernier truc arrenbi à la mode.
Faudrait comparer ce qui est comparable.
En fait, je vois pas trop où tu veux en venir en analysant tout ça.
Oui, bien sûr, je vais pas mettre Arvo Pärt et Queen of the Stone Age dans le même groupe. Je vais créer des types +/- homogènes de musiques, pour que je compare ce qui est comparable. Comparer les volumes en dB RMS de Led Zeppelin et Queen of the Stone Age, par exemple, ça me paraît sensé pour parler d'évolution de normes de mix et mastering. Non ? Après, c'est clair que la pertinence de l'analyse dépendra de comment je l'aurai opérationalisée, des variables et des cas que j'aurai choisis par exemple. Mais ça me semble pas du tout impossible de bien faire ça.
Il me semble qu'une mesure pertinente pour évaluer le niveau sonore relatifs de plusieurs programmes audio serait la mesure du loudness sur la totalité du programme. Cette mesure est aujourd'hui (quasiment) normalisée : standard ITU-R BS.1770.
Merci beaucoup !
J'ai trouvé un logiciel gratuit, de Orban, qui mesure selon ce standard :
https://www.orban.com/meter/
Le problème c'est qu'avec ce logiciel, il faut choisir une sortie audio, qu'il analyse en temps réel. Il me faudrait la même chose mais qui produise une statistique de tout le morceau. Tu sais pas si ça existe ?
Il faut que je me renseigne un peu sur comment est fabriqué cet indicateur (mathématiquement), mais ça a l'air d'être exactement ce que je cherche pour mesurer le loudness !
Pour déterminer un indicateur, la manip se ferait forcément en plusieurs étapes dont l'acquisition des données - amplitude = f(bande) - serait la première. Ensuite une série de régressions (lin, log, exp, polynomiale d'ordre faible) est susceptible de mettre en évidence des différences de comportements permettant la classification.
Je ne vois pas exactement comment tu imagines ça.
Est ce que tu connais la notion de moment statistique?
La moyenne la variance le kurtosis et le skewness sont des moments statistiques. Tu pourra trouver des info la dessus sur les pages wikipedia.
Non, un moment statistique, ça ne me dit rien. La variance, la moyenne, ça je vois. Comme coefficient d'asymétrie je connais le coefficient de Fisher, mais bon, je sais pas si ça a une quelconque rapport avec les descripteurs spectraux dont tu parles. Je vais essayer de me renseigner. Si tu as des ref, je suis preneur !
Merci à tou-te-s !

JolX

>>> https://www.tcelectronic.com/lm5d.asp
Un truc pas mal, c'est que le LM5D includes two long-term universal descriptors: center of gravity and consistency. Any sports, news, music, commercial or film program may be characterized precisely and standardized.
Le seul problème est, si j'ai bien compris, qu'il n'est disponible qu'en version TDM pour protools HD... Donc, faut les cartes avec DSP et tout, ce que je n'ai pas... Et le plug coute 1300€ !!
Un truc aussi intéressant de cet algorithme :
The main difference between the CoG and an
integrating loudness measurement (such as the Leq-type
measurement specified in BS.1770 [7]) is that the CoG
employs an adaptive gate in order to be robust against
'silence' in the program yet making no rigid assumptions
about the absolute levels of the material to be measured.
By employing a gate, the measurement essentially
ignores regions of the material which are too quiet to be
considered part of the program – regions that would
otherwise have biased the CoG measurement.
Mais bon, je crois que c'est mort, pas accessible pour moi...
J'espère que ce n'est pas le seul logiciel a pouvoir créer une statistique de ce type?
Dans ce document, aux pages 8 et 9 il y a des mesures du même types que celles que j'aimerais faire :
https://www.tcelectronic.com/media/LoudnessDescriptors_AES125.pdf
J'ai trouvé, par ailleurs, un petit texte intéressant sur le loudness :
http://www.spip.aevll.org/spip.php?article758

JolX

- Je n'ai trouvé qu'un seul logiciel qui permette l'analyse "offline" de la "loudness", c'est à dire à partir d'un fichier et pas en temps réel : c'est AudioLeak et il n'est dispo que sur MAC...

http://www.channld.com/audle.html
Voir des infos intéressantes ici :
https://www.sounddesigners.org/index.php?name=PNphpBB2&file=viewtopic&t=5083
- J'ai trouvé ça pour Matlab, mais j'y connais rien dans ce logiciel :
http://www.mathworks.com/matlabcentral/fileexchange/22512-nthocthandarmacfiltertoolbox

undo

salut
ce n'est pas un outil hyper évolué mais ça peut t'intéresser et c'est gratuit :
http://www.dynamicrange.de/es/es/download#menu1
permet de mettre en évidence la moyenne rms d'un fichier ou d'un groupe de fichier audio d'une manière plus réaliste que les statistiques de base de la plupart des daw (meter en temps réel et application en offline avec rapport log)
très utile pour se faire une idée de la dynamique d'un disque, etc...
tchao !

Anonyme

Comparer les volumes en dB RMS de Led Zeppelin et Queen of the Stone Age, par exemple, ça me paraît sensé pour parler d'évolution de normes de mix et mastering. Non ?pas vraiment, car justement, il n'y a pas de normes
et d'autant plus que tu ne veux pas comparer le volume RMS, mais le contenu fréquenciel, non ?

JolX

pas vraiment, car justement, il n'y a pas de normeset d'autant plus que tu ne veux pas comparer le volume RMS, mais le contenu fréquenciel, non ?
Je parle bien sûr de normes implicites, de "best practices". On peut voir des tendances dans les pratiques sans quelles soient formulées explicitement, dans des lois par exemple. Et on remarque une tendance à la compression de plus en plus forte dans les musiques "grand public". C'est ce qu'on appelle la "loudness war". Le mieux pour s'en rendre compte c'est les remasterings des grands tubes. Ici sur un morceau des Beatles, c'est assez frappant : https://en.wikipedia.org/wiki/File:Cd_loudness_trend-something.gif
En fait je m'intéresse au loudness. La réduction de la dynamique est une technique pour rendre le son plus "loud", mais l'augmentation de fréquences medium-aigues aussi. Le volume RMS est intéressant comme indicateur pour comparer la dynamique de 2 morceaux, mais pas pour voir si un morceau possède plus de medium-aigus qu'un autre. Le volume calculé avec une pondération A, par contre, peut indiquer cela. Un morceau plus paraître plus fort qu'un autre, parce qu'il possède une plus grande proportion de mediums, alors qu'au niveau amplitude, ces 2 morceaux ont les mêmes valeurs de volume RMS. Et là un indicateur du loudness est très intéressant !

Anonyme


JolX

salut
ce n'est pas un outil hyper évolué mais ça peut t'intéresser et c'est gratuit :
http://www.dynamicrange.de/es/es/download#menu1
permet de mettre en évidence la moyenne rms d'un fichier ou d'un groupe de fichier audio d'une manière plus réaliste que les statistiques de base de la plupart des daw (meter en temps réel et application en offline avec rapport log)
très utile pour se faire une idée de la dynamique d'un disque, etc...
tchao !
Merci beaucoup !
J'ai regardé, ça a l'air pas mal. En fait c'est un indicateur dérivé du volume RMS : le programme ne prend en compte que les 20% du temps du morceau où il est le plus loud (ou le volume RMS est le plus élevé je suppose), et fait dans cette partie la différence entre le volume RMS et le niveau des crêtes. Ca donne le "Dynamic Range".
For technicians, this is the average cumulative difference between peak and loudness (RMS) over a specific period of time (duration of a song or album) and is a whole number value given in decibels. Just the top 20% of the loudness are taken into consideration to ensure that songs with a long intro and and over compressed refrain doesn´t appear with a too high DR value.
http://www.dynamicrangemetering.com/node/1
tu peux aussi te pencher sur le K-metering
C'est de Bob Katz non ?
Je vais regarder, j'ai regardé vite fait mais j'ai pas trop compris

[ Dernière édition du message le 11/01/2010 à 19:45:50 ]
- < Liste des sujets
- Charte
- 1
- 2