Sujet TIPE sur le time stretching.
- 15 réponses
- 5 participants
- 1 188 vues
- 6 followers
![Coccinelle prod' Coccinelle prod'](https://static.audiofanzine.com/img/user/avatars/generic.png?w=40&h=40&fm=pjpg&s=0d6213e9da38ef4cab8d0bdd3999c731)
Coccinelle prod'
3795
![3795 posts au compteur 3795 posts au compteur](https://static.audiofanzine.com/images/audiofanzine/forum/avatars/new/7.png)
Squatteur·euse d’AF
Membre depuis 21 ans
Sujet de la discussion Posté le 14/06/2006 à 19:37:08TIPE sur le time stretching.
Bonjour,
je suis en prépa math sup et doit faire un tipe pour les concours. Je m'oriente pas mal vers le Time Stretching et pas mal notamment sur les techniques utilisées pour modifier la durée du son sans en affecter la hauteur ni le timbre... Mon soucis : je ne trouve aucune info!
alors je me pose deux questions :
-est ce que ca serait pas un domaine tres protégé ou chaque constructeur garde son petit secrets, ses algorythmes... Mais il devrait quand meme y avoir moyen de trouver des explication du principe sans pour autant rentrer dans telle ou telle optimisation propre a chaque fabricant?
-d'autre part est ce un sujet assez conséquent au niveau physique? Il ne me faut pas quelquechose d'insurmontable mais pas non plus de la vulgarisation scientifique pour que ca vaille quelquechose quand meme lol
Voila donc surtout j'aimerais bien savoir si certains d entre vous savent si c est possible d'avoir des informations sur ce sujet la ou si c est vraiment ultra protégé...
J'ai pensé a l'Ircam mais je trouve rien sur leur site..
Merci a tous ceux qui auraient des indications concernant ce sujet..
Je pensais pas mal a toi Gabou et Choc qui avez l'air tres calés dans le domaine audio scientifique ;)
je suis en prépa math sup et doit faire un tipe pour les concours. Je m'oriente pas mal vers le Time Stretching et pas mal notamment sur les techniques utilisées pour modifier la durée du son sans en affecter la hauteur ni le timbre... Mon soucis : je ne trouve aucune info!
alors je me pose deux questions :
-est ce que ca serait pas un domaine tres protégé ou chaque constructeur garde son petit secrets, ses algorythmes... Mais il devrait quand meme y avoir moyen de trouver des explication du principe sans pour autant rentrer dans telle ou telle optimisation propre a chaque fabricant?
-d'autre part est ce un sujet assez conséquent au niveau physique? Il ne me faut pas quelquechose d'insurmontable mais pas non plus de la vulgarisation scientifique pour que ca vaille quelquechose quand meme lol
Voila donc surtout j'aimerais bien savoir si certains d entre vous savent si c est possible d'avoir des informations sur ce sujet la ou si c est vraiment ultra protégé...
J'ai pensé a l'Ircam mais je trouve rien sur leur site..
Merci a tous ceux qui auraient des indications concernant ce sujet..
Je pensais pas mal a toi Gabou et Choc qui avez l'air tres calés dans le domaine audio scientifique ;)
- 1
- 2
![Coccinelle prod' Coccinelle prod'](https://static.audiofanzine.com/img/user/avatars/generic.png?w=40&h=40&fm=pjpg&s=0d6213e9da38ef4cab8d0bdd3999c731)
Coccinelle prod'
3795
![3795 posts au compteur 3795 posts au compteur](https://static.audiofanzine.com/images/audiofanzine/forum/avatars/new/7.png)
Squatteur·euse d’AF
Membre depuis 21 ans
11 Posté le 19/06/2006 à 10:40:33
Hello,
merci pour tes explications.
Mais l'utilisation de l'analyse de Fourrier n'est elle pas remplacée par le fameux vocodeur justement? Il me semble que c'est avec le vocodeur de phase qu'on analyse le signal puis seulement apres s'opère une synthèse additive..
Vocodeur de phase et TFCT(Fourrier) sont-elles deux méthodes qui effectuent la meme tache avec seulement une question de performance ou bien c est deux choses completement différentes?
merci pour tes explications.
Mais l'utilisation de l'analyse de Fourrier n'est elle pas remplacée par le fameux vocodeur justement? Il me semble que c'est avec le vocodeur de phase qu'on analyse le signal puis seulement apres s'opère une synthèse additive..
Vocodeur de phase et TFCT(Fourrier) sont-elles deux méthodes qui effectuent la meme tache avec seulement une question de performance ou bien c est deux choses completement différentes?
![Staross Staross](https://static.audiofanzine.com/img/user/avatars/generic.png?w=40&h=40&fm=pjpg&s=0d6213e9da38ef4cab8d0bdd3999c731)
Staross
130
![130 posts au compteur 130 posts au compteur](https://static.audiofanzine.com/images/audiofanzine/forum/avatars/new/3.png)
Posteur·euse AFfiné·e
Membre depuis 21 ans
12 Posté le 19/06/2006 à 16:54:52
Ben en fait ça à l'air d'être pareil :
https://en.wikipedia.org/wiki/Phase_vocoder
Cela dit c'est surement mieux d'utiliser une transformée inverse pour la resynthèse.
https://en.wikipedia.org/wiki/Phase_vocoder
Cela dit c'est surement mieux d'utiliser une transformée inverse pour la resynthèse.
![Coccinelle prod' Coccinelle prod'](https://static.audiofanzine.com/img/user/avatars/generic.png?w=40&h=40&fm=pjpg&s=0d6213e9da38ef4cab8d0bdd3999c731)
Coccinelle prod'
3795
![3795 posts au compteur 3795 posts au compteur](https://static.audiofanzine.com/images/audiofanzine/forum/avatars/new/7.png)
Squatteur·euse d’AF
Membre depuis 21 ans
13 Posté le 24/08/2006 à 01:26:11
Hello Choc,
bon j'ai parlé un poil vite pour la thèse ;)
ca se complique un peu
j'en suis au niveau justement de l'explication des méthodes et notamment de la méthode temporelle et il y a une phrase que j'ai du mal a saisir :
Je ne vois pas comment ca duplique le grain temporel(copier coller donc) si on prend par exemple la représentation par fenêtrage : si on réitère plusieurs fois le procédé sur les deux mêmes segments, on va finir par avoir augmenter la durée de telle maniere que Li+1=Li ou plutot que Ei=Li+1 mais il me semble pas que tout le signal est alors dupliqué, mais plutot que les n duplications nécéssaires ont fait que maintenant on a n fois la durée K en question, donc on se retrouve avec l équivalent d'un grain temporel composé que du signal de durée K qui est répété n fois, mais alors niveau qualité ca doit être bof j'imagine...
mais je n'ai pas du comprendre quelquechose, parce que l'auteur parle véritablement de duplication du grain temporel en entier...
d'autre part, les représentations qu'ils expliquent apres sont elles a voir comme des modèles simplifiez pour comprendre le principe de la méthode temporelle ou a voir comme des différentes représentations non-paramétriques comme il est question quelques paragraphes avant. Auquel cas ce sont réellement les mécanismes qui s opèrent qui sont exposés... Avec le terme de représentation ici j ai du mal a voir si il s agit de modèle ou de différentes représentation utilisées pour le traitement...
je pencherais pour des modèles d'explications simplifiés de la méthode temporelle...
sinon j'avais une autre petite question : quand on parle de grain temporel : il s'agit d'un "paquet" de samples par exemple un petit paquet de 1024 samples c est ca? c'est un découpage en petit "paquets" de tailles identiques de samples ?
Et enfin, l'auteur parle de pondérage, je ne comprends pas trop ce que cela signifie ici. Et au niveau des fenêtres temporelles hi(t), c'est ca qui fait le découpage du signal?
voila beaucoup de question, j'espère que ce n est pas trop fouilli...
Merci encore,
bon j'ai parlé un poil vite pour la thèse ;)
ca se complique un peu
j'en suis au niveau justement de l'explication des méthodes et notamment de la méthode temporelle et il y a une phrase que j'ai du mal a saisir :
Citation : entrainant le duplication du grain temporel gi(t) lorsque Li+1=Li
c'est page 49Je ne vois pas comment ca duplique le grain temporel(copier coller donc) si on prend par exemple la représentation par fenêtrage : si on réitère plusieurs fois le procédé sur les deux mêmes segments, on va finir par avoir augmenter la durée de telle maniere que Li+1=Li ou plutot que Ei=Li+1 mais il me semble pas que tout le signal est alors dupliqué, mais plutot que les n duplications nécéssaires ont fait que maintenant on a n fois la durée K en question, donc on se retrouve avec l équivalent d'un grain temporel composé que du signal de durée K qui est répété n fois, mais alors niveau qualité ca doit être bof j'imagine...
mais je n'ai pas du comprendre quelquechose, parce que l'auteur parle véritablement de duplication du grain temporel en entier...
d'autre part, les représentations qu'ils expliquent apres sont elles a voir comme des modèles simplifiez pour comprendre le principe de la méthode temporelle ou a voir comme des différentes représentations non-paramétriques comme il est question quelques paragraphes avant. Auquel cas ce sont réellement les mécanismes qui s opèrent qui sont exposés... Avec le terme de représentation ici j ai du mal a voir si il s agit de modèle ou de différentes représentation utilisées pour le traitement...
je pencherais pour des modèles d'explications simplifiés de la méthode temporelle...
sinon j'avais une autre petite question : quand on parle de grain temporel : il s'agit d'un "paquet" de samples par exemple un petit paquet de 1024 samples c est ca? c'est un découpage en petit "paquets" de tailles identiques de samples ?
Et enfin, l'auteur parle de pondérage, je ne comprends pas trop ce que cela signifie ici. Et au niveau des fenêtres temporelles hi(t), c'est ca qui fait le découpage du signal?
voila beaucoup de question, j'espère que ce n est pas trop fouilli...
Merci encore,
![Choc Choc](https://static.audiofanzine.com/img/user/avatars/generic.png?w=40&h=40&fm=pjpg&s=0d6213e9da38ef4cab8d0bdd3999c731)
Choc
6968
![6968 posts au compteur 6968 posts au compteur](https://static.audiofanzine.com/images/audiofanzine/forum/avatars/new/honorific.png)
Membre d’honneur
Membre depuis 21 ans
14 Posté le 24/08/2006 à 08:45:04
Pour la granulaire, ce que j'en sais
Tu as un son.
COmme tu le precises, tu viens recuperer un grain de durée tres courtes.
Il faut lui appliquer uen enveloppe a ce grain. EN fait quand tu preleves ton grains, rien ne t'assures que son amplitude commence a zero et se termine a zero (d'ou apparition de click numerique)
En appliquant une fenetre de ponderation (une sorte d'enveloppe) qui commence a 0, monte a 1 et termine a 0, c va te permettre d'eviter les click
En granulaire aussi, faut bien voir que tu ne mets pas les grains a la suite les uns des autres, tu peux (et c'est tres important) les superposer.
Tu as un son.
COmme tu le precises, tu viens recuperer un grain de durée tres courtes.
Il faut lui appliquer uen enveloppe a ce grain. EN fait quand tu preleves ton grains, rien ne t'assures que son amplitude commence a zero et se termine a zero (d'ou apparition de click numerique)
En appliquant une fenetre de ponderation (une sorte d'enveloppe) qui commence a 0, monte a 1 et termine a 0, c va te permettre d'eviter les click
En granulaire aussi, faut bien voir que tu ne mets pas les grains a la suite les uns des autres, tu peux (et c'est tres important) les superposer.
Site personnel: https://www.enib.fr/~choqueuse/
![Staross Staross](https://static.audiofanzine.com/img/user/avatars/generic.png?w=40&h=40&fm=pjpg&s=0d6213e9da38ef4cab8d0bdd3999c731)
Staross
130
![130 posts au compteur 130 posts au compteur](https://static.audiofanzine.com/images/audiofanzine/forum/avatars/new/3.png)
Posteur·euse AFfiné·e
Membre depuis 21 ans
15 Posté le 02/10/2006 à 19:11:06
J'ai fais un patch max/msp de pitch shifting / time stretching granulaire, et ça marche plutôt bien !
http://www.moduleft.com/forum/viewtopic.php?t=183
http://www.moduleft.com/forum/viewtopic.php?t=183
![Pov Gabou Pov Gabou](https://static.audiofanzine.com/img/user/avatars/generic.png?w=40&h=40&fm=pjpg&s=0d6213e9da38ef4cab8d0bdd3999c731)
Pov Gabou
19553
![19553 posts au compteur 19553 posts au compteur](https://static.audiofanzine.com/images/audiofanzine/forum/avatars/new/9.png)
Drogué·e à l’AFéine
Membre depuis 22 ans
16 Posté le 02/10/2006 à 19:45:54
Citation :
sinon j'avais une autre petite question : quand on parle de grain temporel : il s'agit d'un "paquet" de samples par exemple un petit paquet de 1024 samples c est ca? c'est un découpage en petit "paquets" de tailles identiques de samples ?
En general, oui, il s'agit d'un grain purement temporel, pas forcement de taille identique par contre.
J'ai perso un peu bosse pour le time stretch pour un stage, et c'est un probleme interessant et complexe. Sur les methodes classiques, il y a deja eu des reponses ici: vocoder de phase, qui sous tend un model sinusoidal du signal , model purement temporelle, qui souvent est basee sur le model tete lecture / tete ecriture (SOLA et cie). Le probleme fondamental est que differentes parties du signal (spectralement et remporelement) demandent des algo / parametres differents (avoir un spectre different pour un transitoire est moins important qu'une parte de l'information temporel, alors qu'au contraire un changement de pitch d'un passage purement pitche est catastrophique)
C'est pourquoi recemment, t'as pas mal de gens qui ont bosse sur des representations de signal harmonique + transitoire, par exemple, pour l'utilisation du time stretch. Sachant que le pb de representation est un gros morceau du traitement du signal audio et en particulier musical... Par exemple, une representation a partir de noyaux harmoniques doit pouvoir etre interessante, je sais pas si qqn a bosse la dessus (ca peut etre un pur projet de TIPE, mais balaise):
http://citeseer.ist.psu.edu/gribonval01harmonic.html
L'idee du matching pursuit, en general, est d'utiliser un ensemble de noyaux que tu dilates dans le temps, translates dans le temps et en frequence. Le probleme etant de choisir les noyaux, et le fait que cet ensemble n'etant pas du tout une base (c'est pour ca qu'elles sont dites redondantes), des algos pour calculer la decomposition ne sont pas triviaux.
- < Liste des sujets
- Charte
- 1
- 2