Calculer la moyenne des fréquences d'un extrait audio
- 50 réponses
- 11 participants
- 7 309 vues
- 11 followers

Yoann13
23

Nouvel·le AFfilié·e
Membre depuis 12 ans
Sujet de la discussion Posté le 23/01/2014 à 18:58:57Calculer la moyenne des fréquences d'un extrait audio
Bonjour à tous,
Je m'adresse à vous car, en tant que débutant, je bute sur un problème qui n'a peut-être pas de solution. Je travaille actuellement sur un projet personnel qui consiste à scinder en six morceaux un extrait audio d'un cri de bébé qui dure 1 seconde. Après ce découpage, je souhaiterais obtenir une moyenne de la totalité des fréquences de chacun des 6 morceaux. Je ne sais pas si cela est possible et mes recherches sur internet n'aboutissent pas. Je sollicite alors votre aide pour m'aider à avancer dans mon projet. J'espère que j'ai été suffisamment clair. N'hésitez pas à me demander davantage d'infos si besoin.
Merci d'avance.
PS : j'utilise, comme beaucoup de débutants, le logiciel Audacity.
Je m'adresse à vous car, en tant que débutant, je bute sur un problème qui n'a peut-être pas de solution. Je travaille actuellement sur un projet personnel qui consiste à scinder en six morceaux un extrait audio d'un cri de bébé qui dure 1 seconde. Après ce découpage, je souhaiterais obtenir une moyenne de la totalité des fréquences de chacun des 6 morceaux. Je ne sais pas si cela est possible et mes recherches sur internet n'aboutissent pas. Je sollicite alors votre aide pour m'aider à avancer dans mon projet. J'espère que j'ai été suffisamment clair. N'hésitez pas à me demander davantage d'infos si besoin.
Merci d'avance.
PS : j'utilise, comme beaucoup de débutants, le logiciel Audacity.

Gros Corps Maladroit
2436

AFicionado·a
Membre depuis 15 ans
11 Posté le 23/01/2014 à 22:54:42
si tu fais une "moyenne" (je sais pas comment?) des frequences fondamentale présente sur 1/6eme de seconde du cri de bébé...... disons 1500hz, j'ai peur que cela ne dise pas grand chose de ce cri ...cela va ressembler a un autre cri , a une voix...etc
par contre...idée... une boucle (peut etre fortement detunée vers le grave??) d'une partie de ce cri, jouée en continue devrait amener à une repetition des dessins dans le temps non ?? ce ne serait plus une forme géométrique fixe, mais une evolution de forme répétée en boucle ?? non?? faudrait peut etre ajouter en permanence du sel...il doit bien en tomber continuellement de la plaque
par contre...idée... une boucle (peut etre fortement detunée vers le grave??) d'une partie de ce cri, jouée en continue devrait amener à une repetition des dessins dans le temps non ?? ce ne serait plus une forme géométrique fixe, mais une evolution de forme répétée en boucle ?? non?? faudrait peut etre ajouter en permanence du sel...il doit bien en tomber continuellement de la plaque
0

Yoann13
23

Nouvel·le AFfilié·e
Membre depuis 12 ans
12 Posté le 23/01/2014 à 23:10:21
Certes, cela s'éloigne assez du cri d'origine mais les figures de Chladni représentent très mal les sons qui ne sont pas purs. Il est possible d'obtenir des figures mouvantes et non plus fixes en jouant sur des nuances infimes mais ce n'est pas ce que je recherche à faire. Je l'ai déjà fait dans un autre projet. Mais merci du conseil tout de même.

0

Yoann13
23

Nouvel·le AFfilié·e
Membre depuis 12 ans
13 Posté le 24/01/2014 à 08:58:29
Citation de Jan :
Nuendo sait faire ça, mais je me suis toujours demandé à quoi ça pouvait bien servir.
Salut Jan, sais-tu comment faire avec Nuendo, ou encore mieux avec un logiciel libre ?
Merci d'avance
0

Yoann13
23

Nouvel·le AFfilié·e
Membre depuis 12 ans
14 Posté le 24/01/2014 à 09:22:39
Citation de Jan :
Nuendo sait faire ça, mais je me suis toujours demandé à quoi ça pouvait bien servir. La réponse est évidente : à rien ! Du coup, si tu y trouves un intérêt quelconque, ça m'intéresse de le savoir.
Salut Jan. Sais-tu comment faire avec Nuendo, ou mieux encore avec un logiciel libre ?
0

Yoann13
23

Nouvel·le AFfilié·e
Membre depuis 12 ans
15 Posté le 24/01/2014 à 10:00:45
Salut à tous,
Alors, selon Jan, la manipulation que j'essaie de faire et possible sur Nuedo. Quelqu'un connait-il la procédure à suivre sur ce logiciel, ou mieux encore sur un logiciel libre ?
Alors, selon Jan, la manipulation que j'essaie de faire et possible sur Nuedo. Quelqu'un connait-il la procédure à suivre sur ce logiciel, ou mieux encore sur un logiciel libre ?
0

obe
408

Posteur·euse AFfamé·e
Membre depuis 21 ans
16 Posté le 24/01/2014 à 10:16:32
C'est intéressant comme projet artistique.
Pour répondre à la question de Gros Corps Maladroit, une figure de de Chladni d'un signal carré est assez complexe.
Comme tu le sais peut-être déjà, un signal périodique carré peut être décomposé en somme d'onde sinusoïdales. On parle de serie de Fourier.
Toutes ces sinusoïdes ont un point en commun, leur fréquence est un multiple d'une fréquence de base que l'on appelle le fondamental.
La fréquence fondamental est celle qui donne la hauteur de la note.
Par exemple, une onde périodique avec une fréquence fondamentale à 440Hz donne une note : le La4.
Cette onde peut être décomposée en somme de sinusoïdes dont les fréquences sont les multiples du fondamentale (ici 440x2 = 880 Hz, 440x3 = 1320, 440x=1760Hz etc).
Pour un signal carré, la suite de ces harmoniques est bien connue : il n'y a que les harmoniques impaires et leur amplitude décroit comme 1/n où n est le numéro de l'hamonique.
Voici un spectre tiré de wikipédia d'une onde carré de fréquence fondamentale de 1000Hz.

On voit bien le fondamentale à 1000Hz, l'harmonique n=3 à 3*1000=3000Hz, l'harmonique 5 à n=5*1000=5000Hz etc...
Maintenant comment est-ce que cela se transpose au figure de Chladni ?
Dans la jolie vidéo, les figures de Chladni sont excitées avec une onde sinusoïdale. Il n'y a donc que la fréquence fondamentale etpas d'hamoniques. (Frequence pure).
Pour certaines fréquences pures la plaque rentre en résonance. A chaque fréquence de résonance est associée une figure de Chladni (on parle de mode propre de résonance). Au vu de la vidéo, on a pour cette plaque les fréquence de résonance suivantes : 345Hz, 1033Hz, etc. Ces fréquences dépendent de la géometrie de la surface, son épaisseur et de sa matiere (densité entre autre, vitesse du son etc).
Cela est calculable, mais relativement difficile mathématiquement parlant. L’expérience réalisée avec une corde et non une surface est beaucoup plus facile à décrire mathématiquement mais visuellement moins spectaculaire.
Avec une onde carré, chaque harmonique du signal est susceptible de former une figure de Chladni. Cela sera le cas si la fréquence de l'harmonique n tombe sur une des fréquences de résonance de la plaque (avec une certaine marge d'erreur que l'on appelle le facteur de qualité de la résonance).
La figure de Chladni totale est la somme des figures crées par chacune des harmoniques. (Plus exactement, la somme des figures crées par chacun des harmoniques pondérées par l'intensité relative de chaque harmonique)
Maintenant pour la question initiale, je comprend l’intérêt artistique, mais la réalisation risque d'être compliquée.
En effet, deux effets vont s'opposer.
D'une part pour que l'oreille humaine reconnaisse un son de cri de bébé, le son doit avoir des fréquences qui évoluent assez vite dans le temps.
Si on modélise un cri de bébé par une sirène de police (pourquoi pas ? dans une première approche), on a une rampe de fréquence qui passe de grave à aiguë disons de 500Hz à 5000Hz en environ une seconde.
Cependant, le temps de réponse des figures Chladni est beaucoup plus lent que ça. Elle ne vont pas arriver à suivre le signal.
Si un système oscillatoire est excité plus vite qu'il ne peut répondre -> il ne bouge pas.
(Digression et exemple : c'est à cause de cet effet qu'il n'y a quasiment pas de marèe en Mediterannée.
En effet, l'eau de la Mediterannée ne peut sortir que par Gibraltar, il faudrait des jours entiers pour que la marée commence à faire effet et que le niveau baisse significativement. Donc le temps de réponse du système est de plusieurs jours. Mais la période des marées est de 6 heures. Donc à peine la Mediterannée commence à se vider à marée basse que 6 heures sont passées et qu'il est temps de passer à la marée haute. Au final la Mediterannée, n'a quasiment pas de marée).
Le problème ici va être similaire. Le temps de réponse des figures de Chladni est de l'odre de la seconde et les modulations en fréquence nécessaire pour reconnaître un cri de bébé vont être de l'ordre de 50ms (je pense). Au final, les figures de Chladni, tout comme la Mediterannée ne vont pas bougés.
Néanmoins Gros Corps Maladroit a peut-être une très bonne idée en disant de ralentir le son. Certes le son sera plus grave, mais cela pourrait laisser le temps aux figures de Chladni de se mettre en place.
Un cri de bébé même très ralenti reste un cri de bébé tout à fait reconnaissable.
Dans le cadre d'un geste artistique cela me semble une approche tout à fait concevable.
Pour répondre à la question de Gros Corps Maladroit, une figure de de Chladni d'un signal carré est assez complexe.
Comme tu le sais peut-être déjà, un signal périodique carré peut être décomposé en somme d'onde sinusoïdales. On parle de serie de Fourier.
Toutes ces sinusoïdes ont un point en commun, leur fréquence est un multiple d'une fréquence de base que l'on appelle le fondamental.
La fréquence fondamental est celle qui donne la hauteur de la note.
Par exemple, une onde périodique avec une fréquence fondamentale à 440Hz donne une note : le La4.
Cette onde peut être décomposée en somme de sinusoïdes dont les fréquences sont les multiples du fondamentale (ici 440x2 = 880 Hz, 440x3 = 1320, 440x=1760Hz etc).
Pour un signal carré, la suite de ces harmoniques est bien connue : il n'y a que les harmoniques impaires et leur amplitude décroit comme 1/n où n est le numéro de l'hamonique.
Voici un spectre tiré de wikipédia d'une onde carré de fréquence fondamentale de 1000Hz.

On voit bien le fondamentale à 1000Hz, l'harmonique n=3 à 3*1000=3000Hz, l'harmonique 5 à n=5*1000=5000Hz etc...
Maintenant comment est-ce que cela se transpose au figure de Chladni ?
Dans la jolie vidéo, les figures de Chladni sont excitées avec une onde sinusoïdale. Il n'y a donc que la fréquence fondamentale etpas d'hamoniques. (Frequence pure).
Pour certaines fréquences pures la plaque rentre en résonance. A chaque fréquence de résonance est associée une figure de Chladni (on parle de mode propre de résonance). Au vu de la vidéo, on a pour cette plaque les fréquence de résonance suivantes : 345Hz, 1033Hz, etc. Ces fréquences dépendent de la géometrie de la surface, son épaisseur et de sa matiere (densité entre autre, vitesse du son etc).
Cela est calculable, mais relativement difficile mathématiquement parlant. L’expérience réalisée avec une corde et non une surface est beaucoup plus facile à décrire mathématiquement mais visuellement moins spectaculaire.
Avec une onde carré, chaque harmonique du signal est susceptible de former une figure de Chladni. Cela sera le cas si la fréquence de l'harmonique n tombe sur une des fréquences de résonance de la plaque (avec une certaine marge d'erreur que l'on appelle le facteur de qualité de la résonance).
La figure de Chladni totale est la somme des figures crées par chacune des harmoniques. (Plus exactement, la somme des figures crées par chacun des harmoniques pondérées par l'intensité relative de chaque harmonique)
Maintenant pour la question initiale, je comprend l’intérêt artistique, mais la réalisation risque d'être compliquée.
En effet, deux effets vont s'opposer.
D'une part pour que l'oreille humaine reconnaisse un son de cri de bébé, le son doit avoir des fréquences qui évoluent assez vite dans le temps.
Si on modélise un cri de bébé par une sirène de police (pourquoi pas ? dans une première approche), on a une rampe de fréquence qui passe de grave à aiguë disons de 500Hz à 5000Hz en environ une seconde.
Cependant, le temps de réponse des figures Chladni est beaucoup plus lent que ça. Elle ne vont pas arriver à suivre le signal.
Si un système oscillatoire est excité plus vite qu'il ne peut répondre -> il ne bouge pas.
(Digression et exemple : c'est à cause de cet effet qu'il n'y a quasiment pas de marèe en Mediterannée.
En effet, l'eau de la Mediterannée ne peut sortir que par Gibraltar, il faudrait des jours entiers pour que la marée commence à faire effet et que le niveau baisse significativement. Donc le temps de réponse du système est de plusieurs jours. Mais la période des marées est de 6 heures. Donc à peine la Mediterannée commence à se vider à marée basse que 6 heures sont passées et qu'il est temps de passer à la marée haute. Au final la Mediterannée, n'a quasiment pas de marée).
Le problème ici va être similaire. Le temps de réponse des figures de Chladni est de l'odre de la seconde et les modulations en fréquence nécessaire pour reconnaître un cri de bébé vont être de l'ordre de 50ms (je pense). Au final, les figures de Chladni, tout comme la Mediterannée ne vont pas bougés.
Néanmoins Gros Corps Maladroit a peut-être une très bonne idée en disant de ralentir le son. Certes le son sera plus grave, mais cela pourrait laisser le temps aux figures de Chladni de se mettre en place.
Un cri de bébé même très ralenti reste un cri de bébé tout à fait reconnaissable.
Dans le cadre d'un geste artistique cela me semble une approche tout à fait concevable.
0
[ Dernière édition du message le 24/01/2014 à 10:20:25 ]

Danguit
3348

Squatteur·euse d’AF
Membre depuis 19 ans
17 Posté le 24/01/2014 à 11:18:18
Bonjour,
Il y a peut-être des idées à prendre dans ces docs : http://mtg.upf.edu/files/publications/Sandvold-ICMC-2005.pdf
http://recherche.ircam.fr/anasyn/peeters/ARTICLES/Peeters_2003_cuidadoaudiofeatures.pdf
Il me semble qu'une question un peu similaire avait été posée ici : https://fr.audiofanzine.com/techniques-du-son/forums/t.389640,existe-t-il-un-indicateur-synthetique-de-l-equilibre-frequentiel-d-un-fichier-audio,post.5608790.html
Il y a peut-être des idées à prendre dans ces docs : http://mtg.upf.edu/files/publications/Sandvold-ICMC-2005.pdf
http://recherche.ircam.fr/anasyn/peeters/ARTICLES/Peeters_2003_cuidadoaudiofeatures.pdf
Il me semble qu'une question un peu similaire avait été posée ici : https://fr.audiofanzine.com/techniques-du-son/forums/t.389640,existe-t-il-un-indicateur-synthetique-de-l-equilibre-frequentiel-d-un-fichier-audio,post.5608790.html
0
[ Dernière édition du message le 24/01/2014 à 11:28:01 ]

Gros Corps Maladroit
2436

AFicionado·a
Membre depuis 15 ans
18 Posté le 24/01/2014 à 11:21:17
x
Hors sujet :@OBE ,merci pour tes explications: claires, fluides et compréhensibles!
0
[ Dernière édition du message le 24/01/2014 à 11:22:33 ]

Yoann13
23

Nouvel·le AFfilié·e
Membre depuis 12 ans
19 Posté le 24/01/2014 à 11:39:25
Bonjour Obe et merci beaucoup pour ces explications que je n'arrivais pas, en partie, à formuler correctement. Je suis bien conscient que les figures de Chladni ne peuvent pas répondre à un très court signal dont la vibration fluctue (comme tu le dis " une fréquence qui passe de grave à aiguë disons de 500Hz à 5000Hz en environ une seconde). Ce que j'avais donc en tête était de scinder le cri en plusieurs morceaux. Par exemple un 1er extrait qui passe de 300 hz(au début du morceau) à 500 hz (à la fin du morceau) avec une multitude d'autres fréquences entre les deux qui peuvent tantôt varier en 300 et 500 hz mais dont certaines pourraient se situer à 600 hz voire plus encore. Je souhaiterai extraire une seule fréquence unique d'un tel morceau qui durerais par exemple un dixième de seconde afin de pouvoir obtenir une fréquence pure qui me permettrait d'obtenir une figure de Chladni stable. Pourriez-vous s'il vous plait me dire si cela est possible et si oui comment réaliser l'opération ?
Merci pour tout
Merci pour tout
0

obe
408

Posteur·euse AFfamé·e
Membre depuis 21 ans
20 Posté le 24/01/2014 à 12:26:23
Je ne pense pas que tu puisses faire des figures de Chaldni si tu envoies l'onde sonore correspondant aux cris de bébé sur la plaque (à cause du temps de réponse).
Par contre, tu fais de l'art et non de la science, et tu pourrais donc bluffer.
Rien ne t’empêche de diffuser à l'auditoire le son de bébé, mais d'envoyer un son simplifié sur les plaques pour faire les figures de CHaldni
( c'est peut-être ce que tu avais prévu dès le début...)
Reste la question : comment créer ce signal simplifié.
La réponse n'est pas simple comme l'a mentionnée Eratom.
L'idée est de décomposer le cri de bébé en fenêtre temporelle avec deux conditions contradictoires.
- Une fenêtre de temps assez courte pour que le signal audio ne change pas trop.
- Une fenêtre de temps assez longue pour que l'analyse en fréquence puisse être pertinente.
J'ai un peu de temps ce matin et j'ai rapidement fait un test avec ce fichier son de sirène (c'est plus simple qu'un cri de bébé)
Avec wawosaur (plus simple qu'audacity à mon gout, mais que sur windows),
je selectionne une partie du fichier et je fais outils-> analyse de spectre (ou F)
J'obtiens le spectre de ce bout du fichier.
Dans l'exemple 1 je prends toute la montée en fréquence de la siréne :

On voit bien une fréquence qui passe de 500Hz à 1500Hz pour la fréquence fondamentale. Les harmoniques ont le même comportement. En combien de temps ? Ce graphe ne pourra pas me le dire.
Dans l'exemple 2, je ne sélectionne qu'une partie du fichier vers le début qui à mes oreilles ne correspond environ que à une seule note :

j'obtiens une fréquence principale de 1150Hz mais c'est très imprécis !
Dans l'exemple 3 je prend la derniere note :

et j'obtiens 1400Hz
D'où une décomposition en fonction du temps du contenu frequentiel. C'est très très grossier, mais cela pourrait suffire pour ce que tu comptes faire.
Autre solution réaliser un sonogramme qui est une version automatisée de ce que l'on vient de faire :
wavosaur->Outils->Sonogramme

Peut-être un peu plus dur à lire, mais toute l'information y est. On voit la fréquence du fondamental augmenter ainsi que les harmoniques qui suivent le même comportement
Avec les figures de Chaldni il faudra surement en plus arrondir les fréquences obtenues pour qu'elles tombent sur un mode propre de la plaque.
S'il s'agit de ne faire qu'un seul fichier sonore, tu peux le faire à la main. Si tu dois en faire plusieurs, il peut être intéressant de coder une procédure. En plus, tu gagneras grandement en précision.
Un dernier mot concernant les figures de Chaldni,
En tant qu'artiste tu connais surement processing, voici un exemple trouvé très rapidement de simulation de telles figures
https://www.openprocessing.org/sketch/59515
Je n'ai pas regardé le code, ni les équations physiques misent en jeu, donc je n'ai pas d'avis sur la qualité de la simulation. Néanmoins cela pourrait t'aider à voir et prévoir quelle figure tu vas obtenir.
En version plus scientifique, une simulation mathematica :
http://demonstrations.wolfram.com/ChladniFigures/
Par contre, tu fais de l'art et non de la science, et tu pourrais donc bluffer.
Rien ne t’empêche de diffuser à l'auditoire le son de bébé, mais d'envoyer un son simplifié sur les plaques pour faire les figures de CHaldni
( c'est peut-être ce que tu avais prévu dès le début...)
Reste la question : comment créer ce signal simplifié.
La réponse n'est pas simple comme l'a mentionnée Eratom.
L'idée est de décomposer le cri de bébé en fenêtre temporelle avec deux conditions contradictoires.
- Une fenêtre de temps assez courte pour que le signal audio ne change pas trop.
- Une fenêtre de temps assez longue pour que l'analyse en fréquence puisse être pertinente.
J'ai un peu de temps ce matin et j'ai rapidement fait un test avec ce fichier son de sirène (c'est plus simple qu'un cri de bébé)
Avec wawosaur (plus simple qu'audacity à mon gout, mais que sur windows),
je selectionne une partie du fichier et je fais outils-> analyse de spectre (ou F)
J'obtiens le spectre de ce bout du fichier.
Dans l'exemple 1 je prends toute la montée en fréquence de la siréne :

On voit bien une fréquence qui passe de 500Hz à 1500Hz pour la fréquence fondamentale. Les harmoniques ont le même comportement. En combien de temps ? Ce graphe ne pourra pas me le dire.
Dans l'exemple 2, je ne sélectionne qu'une partie du fichier vers le début qui à mes oreilles ne correspond environ que à une seule note :

j'obtiens une fréquence principale de 1150Hz mais c'est très imprécis !
Dans l'exemple 3 je prend la derniere note :

et j'obtiens 1400Hz
D'où une décomposition en fonction du temps du contenu frequentiel. C'est très très grossier, mais cela pourrait suffire pour ce que tu comptes faire.
Autre solution réaliser un sonogramme qui est une version automatisée de ce que l'on vient de faire :
wavosaur->Outils->Sonogramme

Peut-être un peu plus dur à lire, mais toute l'information y est. On voit la fréquence du fondamental augmenter ainsi que les harmoniques qui suivent le même comportement
Avec les figures de Chaldni il faudra surement en plus arrondir les fréquences obtenues pour qu'elles tombent sur un mode propre de la plaque.
S'il s'agit de ne faire qu'un seul fichier sonore, tu peux le faire à la main. Si tu dois en faire plusieurs, il peut être intéressant de coder une procédure. En plus, tu gagneras grandement en précision.
Un dernier mot concernant les figures de Chaldni,
En tant qu'artiste tu connais surement processing, voici un exemple trouvé très rapidement de simulation de telles figures
https://www.openprocessing.org/sketch/59515
Je n'ai pas regardé le code, ni les équations physiques misent en jeu, donc je n'ai pas d'avis sur la qualité de la simulation. Néanmoins cela pourrait t'aider à voir et prévoir quelle figure tu vas obtenir.
En version plus scientifique, une simulation mathematica :
http://demonstrations.wolfram.com/ChladniFigures/
0
[ Dernière édition du message le 24/01/2014 à 12:40:52 ]
- < Liste des sujets
- Charte