Se connecter
Se connecter

ou
Créer un compte

ou

Sujet TIPE sur le time stretching.

  • 15 réponses
  • 5 participants
  • 1 188 vues
  • 6 followers
Sujet de la discussion TIPE sur le time stretching.
Bonjour,

je suis en prépa math sup et doit faire un tipe pour les concours. Je m'oriente pas mal vers le Time Stretching et pas mal notamment sur les techniques utilisées pour modifier la durée du son sans en affecter la hauteur ni le timbre... Mon soucis : je ne trouve aucune info!

alors je me pose deux questions :

-est ce que ca serait pas un domaine tres protégé ou chaque constructeur garde son petit secrets, ses algorythmes... Mais il devrait quand meme y avoir moyen de trouver des explication du principe sans pour autant rentrer dans telle ou telle optimisation propre a chaque fabricant?

-d'autre part est ce un sujet assez conséquent au niveau physique? Il ne me faut pas quelquechose d'insurmontable mais pas non plus de la vulgarisation scientifique pour que ca vaille quelquechose quand meme lol


Voila donc surtout j'aimerais bien savoir si certains d entre vous savent si c est possible d'avoir des informations sur ce sujet la ou si c est vraiment ultra protégé...
J'ai pensé a l'Ircam mais je trouve rien sur leur site..

Merci a tous ceux qui auraient des indications concernant ce sujet..
Je pensais pas mal a toi Gabou et Choc qui avez l'air tres calés dans le domaine audio scientifique ;)
Afficher le sujet de la discussion
11
Hello,

merci pour tes explications.

Mais l'utilisation de l'analyse de Fourrier n'est elle pas remplacée par le fameux vocodeur justement? Il me semble que c'est avec le vocodeur de phase qu'on analyse le signal puis seulement apres s'opère une synthèse additive..

Vocodeur de phase et TFCT(Fourrier) sont-elles deux méthodes qui effectuent la meme tache avec seulement une question de performance ou bien c est deux choses completement différentes?
12
Ben en fait ça à l'air d'être pareil :

https://en.wikipedia.org/wiki/Phase_vocoder

Cela dit c'est surement mieux d'utiliser une transformée inverse pour la resynthèse.
13
Hello Choc,

bon j'ai parlé un poil vite pour la thèse ;)

ca se complique un peu
j'en suis au niveau justement de l'explication des méthodes et notamment de la méthode temporelle et il y a une phrase que j'ai du mal a saisir :

Citation : entrainant le duplication du grain temporel gi(t) lorsque Li+1=Li

c'est page 49

Je ne vois pas comment ca duplique le grain temporel(copier coller donc) si on prend par exemple la représentation par fenêtrage : si on réitère plusieurs fois le procédé sur les deux mêmes segments, on va finir par avoir augmenter la durée de telle maniere que Li+1=Li ou plutot que Ei=Li+1 mais il me semble pas que tout le signal est alors dupliqué, mais plutot que les n duplications nécéssaires ont fait que maintenant on a n fois la durée K en question, donc on se retrouve avec l équivalent d'un grain temporel composé que du signal de durée K qui est répété n fois, mais alors niveau qualité ca doit être bof j'imagine...



mais je n'ai pas du comprendre quelquechose, parce que l'auteur parle véritablement de duplication du grain temporel en entier...

d'autre part, les représentations qu'ils expliquent apres sont elles a voir comme des modèles simplifiez pour comprendre le principe de la méthode temporelle ou a voir comme des différentes représentations non-paramétriques comme il est question quelques paragraphes avant. Auquel cas ce sont réellement les mécanismes qui s opèrent qui sont exposés... Avec le terme de représentation ici j ai du mal a voir si il s agit de modèle ou de différentes représentation utilisées pour le traitement...

je pencherais pour des modèles d'explications simplifiés de la méthode temporelle...



sinon j'avais une autre petite question : quand on parle de grain temporel : il s'agit d'un "paquet" de samples par exemple un petit paquet de 1024 samples c est ca? c'est un découpage en petit "paquets" de tailles identiques de samples ?

Et enfin, l'auteur parle de pondérage, je ne comprends pas trop ce que cela signifie ici. Et au niveau des fenêtres temporelles hi(t), c'est ca qui fait le découpage du signal?

voila beaucoup de question, j'espère que ce n est pas trop fouilli...

Merci encore,
14
Pour la granulaire, ce que j'en sais

Tu as un son.

COmme tu le precises, tu viens recuperer un grain de durée tres courtes.
Il faut lui appliquer uen enveloppe a ce grain. EN fait quand tu preleves ton grains, rien ne t'assures que son amplitude commence a zero et se termine a zero (d'ou apparition de click numerique)
En appliquant une fenetre de ponderation (une sorte d'enveloppe) qui commence a 0, monte a 1 et termine a 0, c va te permettre d'eviter les click

En granulaire aussi, faut bien voir que tu ne mets pas les grains a la suite les uns des autres, tu peux (et c'est tres important) les superposer.
15
J'ai fais un patch max/msp de pitch shifting / time stretching granulaire, et ça marche plutôt bien !

http://www.moduleft.com/forum/viewtopic.php?t=183
16

Citation :
sinon j'avais une autre petite question : quand on parle de grain temporel : il s'agit d'un "paquet" de samples par exemple un petit paquet de 1024 samples c est ca? c'est un découpage en petit "paquets" de tailles identiques de samples ?



En general, oui, il s'agit d'un grain purement temporel, pas forcement de taille identique par contre.

J'ai perso un peu bosse pour le time stretch pour un stage, et c'est un probleme interessant et complexe. Sur les methodes classiques, il y a deja eu des reponses ici: vocoder de phase, qui sous tend un model sinusoidal du signal , model purement temporelle, qui souvent est basee sur le model tete lecture / tete ecriture (SOLA et cie). Le probleme fondamental est que differentes parties du signal (spectralement et remporelement) demandent des algo / parametres differents (avoir un spectre different pour un transitoire est moins important qu'une parte de l'information temporel, alors qu'au contraire un changement de pitch d'un passage purement pitche est catastrophique)

C'est pourquoi recemment, t'as pas mal de gens qui ont bosse sur des representations de signal harmonique + transitoire, par exemple, pour l'utilisation du time stretch. Sachant que le pb de representation est un gros morceau du traitement du signal audio et en particulier musical... Par exemple, une representation a partir de noyaux harmoniques doit pouvoir etre interessante, je sais pas si qqn a bosse la dessus (ca peut etre un pur projet de TIPE, mais balaise):

http://citeseer.ist.psu.edu/gribonval01harmonic.html

L'idee du matching pursuit, en general, est d'utiliser un ensemble de noyaux que tu dilates dans le temps, translates dans le temps et en frequence. Le probleme etant de choisir les noyaux, et le fait que cet ensemble n'etant pas du tout une base (c'est pour ca qu'elles sont dites redondantes), des algos pour calculer la decomposition ne sont pas triviaux.