Se connecter
Se connecter

ou
Créer un compte

ou

Sujet TIPE sur le time stretching.

  • 15 réponses
  • 5 participants
  • 1 187 vues
  • 6 followers
Sujet de la discussion TIPE sur le time stretching.
Bonjour,

je suis en prépa math sup et doit faire un tipe pour les concours. Je m'oriente pas mal vers le Time Stretching et pas mal notamment sur les techniques utilisées pour modifier la durée du son sans en affecter la hauteur ni le timbre... Mon soucis : je ne trouve aucune info!

alors je me pose deux questions :

-est ce que ca serait pas un domaine tres protégé ou chaque constructeur garde son petit secrets, ses algorythmes... Mais il devrait quand meme y avoir moyen de trouver des explication du principe sans pour autant rentrer dans telle ou telle optimisation propre a chaque fabricant?

-d'autre part est ce un sujet assez conséquent au niveau physique? Il ne me faut pas quelquechose d'insurmontable mais pas non plus de la vulgarisation scientifique pour que ca vaille quelquechose quand meme lol


Voila donc surtout j'aimerais bien savoir si certains d entre vous savent si c est possible d'avoir des informations sur ce sujet la ou si c est vraiment ultra protégé...
J'ai pensé a l'Ircam mais je trouve rien sur leur site..

Merci a tous ceux qui auraient des indications concernant ce sujet..
Je pensais pas mal a toi Gabou et Choc qui avez l'air tres calés dans le domaine audio scientifique ;)
2
Salut, lorsque j'etais a france telecom R&D mon tuteur avait fait sa these sur ca

http://www.iua.upf.es/activitats/semirec/semi-pallone/

si vraiement tu galeres je peux lui demandé sa these :coucou:
3
Il me semble que y'a un chapitre dessus dans "L'Audionumérique" de Curtis Roads, mais c'est assez vulgarisé.

Sinon un moyen de faire du time-stretch c'est de faire une analyse fft et une resynthèse additive, tu peux changer l'échelle de temps sans changer le contenu fréquentiel, mais je sais pas trop comment ça va sonner et le temps que ça va mettre à calculer ça...
4
Hmm merci pour vos infos...


je suis allé voir ton lien choc : je vais m'y pencher dessus ce week end mais ca ne m a pas l air évident enfin je vais regarder ca


Merci beaucoup en tout cas...
5
En anglais, bref, mais assez complet :
https://sound.eti.pg.gda.pl/denoise/stretch.html

En angais aussi (concerne aussi le pitch shifting) :
http://www.dspdimension.com/data/PDF/TimeStretchingOverview.pdf
6
Ah merci bcp bcp a tous!


je pensais peut etre comme travail pratique a effectuer pour le tpe : faire un logiciel de time stretching : un truc simple ou on rentrerait un fichier audio et qui serait capable d'accélérer ou de ralentir le fichier sans trop affecter le timbre. Est ce que vous pensez que ca peut etre jouable sachant qu'il ne faut surtout pas que je consacre mes efforts a de la programmation informatique car mes matières de TIPE sont math et phys...

A ce propos la, hotez moi d'un doute, au niveau du time stretching il s'agit bien avant tout d'un mécanisme qui se base sur les propriétés physiques du signal audio non? Ce n'est pas purement calculatoire et algorythmique : je ne parle pas des différentes techniques pour augmenter la vitesse de calcule etc tous les algos qui permettent de rendre un soft de time stretching plus performant mais vraiment le principe meme du time stretching se basent bien sur des propriétés physiques du signal sonore?

merci encore a vous!
7
Re

bon alors j ai lu tous les documents que vous m'avez conseillé et d'autre et de ce que j'ai compris :

grosso modo il y a deux techniques majeurs pour l'analyse du fichier audio:

-celle du vocoder de phase : le super vocoder de phase. Donc qui marche comme un vocoder c'est à dire découpe le signal en bande de fréquences plus ou moins grandes.
Inconvénient : reverberation du signal car une sinusoïde se trouve sur plusieurs bandes du vocoder.
Probleme au niveau des fréquences aigus qui sont pas bien rendues dans l'analyse alors que tres présentes à l'écoute.

-celle du découpage au niveau temporel : on découpe le fichier audio en pleins de petits fichiers audio(fenêtres) de 1024 samples que l'on traite puis que l'on rassemble avec deux méthodes possibles :
recouvrement(chevauchement) des fenetres ce qui implique qu'on découpe des fenêtres qui se chevauchent.
ou collage des blocs simplement.
Inconvénient : a priori ne convient que pour des changements pas trop grands de vitesse.

Ais-je bon?

Le probleme ce que je ne comprends pas :
La il ne s'agit que de l'analyse, préparation du signal pour être traité mais comment ensuite la diminution de la vitesse s'opère t'elle? je n'ai rien trouvé qui en traitait ou peut etre sur ton lien choc mais le site est en panne en ce moment lol
J'ai lu pas mal de fois qu'il y avait apres l'analyse une étape de synthese(additive il me semble...?), resampling... c'est la que la diminution de la vitesse s'opère?

et enfin si certains d'entre vous pouvaient m'éclairer :

ils parlent de trouver la fréquence pivot si j'ai bien compris, celle que que l'on retrouve le plus (la fondamentale?) et de centrer l'analyse sur cette fréquence... je n'ai pas bien compris en quoi ca consistait. Ils disent que cela permet d'assurer au mieux la continuité de phase. Je ne comprends pas trop ici le terme de phase a priori ce n'est pas la signification usuelle ou alors faut que je revois mes cours lol
Mais selon eux on dirait que la phase contient tout, toutes les informations sur l'identité du son...je comprends pas trop ce que vient faire la phase dans le time stretching.... J'aurais plutot imaginé que cela opérait sur la période des sinusoïde ou leur amplitude mais la phase??


Merci d'avance a ceux qui pourront m'éclairer et mettre a profit leur savoir
:)
8

Citation : c'est la que la diminution de la vitesse s'opère?


Salut :coucou: je maitrise pas trop le time stretch et le pitch shift

La premiere solution, c'est de changer la vitesse de lecture d'un sample pour le time stretch ou le pitch shift. le gros probleme c'est que la frequence et la durée de ton son sont des quantités liées, tu peux pas augmenter la vitesse sans augmenter aussi la frequence

l'avantage de passer par de l'analyse resynthese additive, c'est de briser le lien entre temsp et frequence

tu vas posseder une liste de frequences ainsi que leur enveloppe d'amplitude. En modifiant la position de ces frequences par une meme valeur et en conservant la meme enveloppe, ton son va etre plus aigu mais de meme durée que le son original.
Inversement, tu peux modifier les enveloppes d'amplitude en les parcourant plus vite sans que cela change la position fréquentielle des harmoniques et donc la tonalité de ton sample.
l'analyse resynthese additive permet, en resumé, de briser le lien entre le temps et les frequences. Tu peux ensuite travailler sur ces deux quantités independamment :coucou:

L'autre technique que tu mentionnes, on pourrait apparenter ca a de la synthese granulaire (on choppe de micro grains et on les recolles differement). Il me semble que c'est ca u'utilsie le moteur de kontakt
9
Hello Choc merci pour tes précisions :

d'un point de vue chronologique est ce que c'est cela qui se passe :

-découpage en fenêtre de taille(nombre de samples) identiques
-vocodeur de phase : découpage en bande fréquentielle
On obtient alors une analyse du fichier son
-resynthèse additive? pour pouvoir travailler indépendamment la composante fréquencielle et temporelle.
-ensuite on applique une dimuntion de la vitesse
-et comment est ce qu on relie apres temps et fréquences qui ont été décomposés par la synthèse additive? c'est la resynthèse.


La ou je ne saisis pas trop le truc c'est :

est ce qu'il y aurait 2 méthodes :

-une de type synthèse granulaire qui serait basée sur la modification de petites fenetres et qui du fait de la taille réduite des fenetres donne un résultat correct par rapport a un même traitement qui aurait été fait sur le fichier global.

-et une autre de type additive qui elle se ferait a partir du vocodeur de phase?

ou bien est ce qu'elles sont toutes liées à avoir comme ce que j ai marqué plus haut :

d'abord découpage en petites fentres(donc découpage temporel) puis découpage fréquentiel par le vocodeur de phase et ensuite resynthèse additive( et donc aussi granulaire puisqu'on opère sur des petits éléments du fichier sonore qui sont ensuite recomposés).

J'espere que je ne raconte pas trop de salade, parce que j'essaye de comprendre le fonctionnement général sans trop creuser du time stretching.

et sinon d'un point de vue pratique, toi qui est a priori très calé en synthèse, la synthèse additive est une technique abordable? Je veux dire est ce que c'est compréhensible avec des outils mathématiques de prépa?

Merci encore pour tout!
10
Pour l'analyse resynthèse, c'est assez simple en fait :

On utilise l'analyse de Fourier pour obtenir un spectrogramme :



Ce qu'on obtient c'est l'amplitude en fontion du temps, A(t), de chaque fréquence (en fait un nombre limité) Fi de notre son d'origine.

Ensuite pour la resynthèse il suffit de faire un truc du genre :

A(t)* sin (2*pi * Fi)

Et de faire la somme sur toutes les fréquences.

Ensuite si tu veux ralentir ou accélerer ton son il faudra jouer sur A(t).

Et sur Fi si tu veux modifier la hauteur, mais les deux sont découplés.