Se connecter
Se connecter

ou
Créer un compte

ou

Sujet Extraction de voix

  • 14 réponses
  • 5 participants
  • 1 603 vues
  • 3 followers
Sujet de la discussion Extraction de voix
Bonjour,

Je souhaiterais ne garder que les voix et si possible bruitages d une bande son d un film en stereo.

J ai reussit a retirer les voix et bruitages pour ne garder que la musique via soundforge mais pas l inverse.

Quelqu un aurait il une idee?

Musicalement,
2
Salut

si tu as réussis à isoler l'instrue, tu peux tester de faire une soustraction de l'instrue avec le morceau complet, pour cela tu coupes les deux pistes sur le même échantillon (c'est très important), ensuite tu inverses la phase de l'une des 2 pistes et tu la colles sur l'autres.
3
Bonjour,

J ai essaye:
1 piste original
1 piste original + Extraction de la voix
invertion de la piste original + Extraction de la voix
mix piste original + invertion de la piste original avec Extraction de la voix

Ca marche po, ca augmente le volume de la musique.
Le seul truc que j arrive a faire, c'est de supprimer la stereo pour accentuer la voix.

Musicalement,
  

4
La méthode d"crite patr Docks (et qui est la seule pouvant marcher !) ne marchera toutefois que si le morceau s'y prête.
Concretement, ptet 1 morceau sur 20 le fait.
5
Ca me semble tendu ton affaire...

t'as reussis a isoler la musique ? Normalement c'est un problème très très difficile ... (plutot destiné a des laboratoires de recherche en traitement du signal)
6
Bonjour,

@Choc
Oui l'isolation de musique contenant des voix se fait assez simplement.

Par contre le contraire ne se fais pas.

Il parait qu'effectivement ajouter l'inverse d'un signal audio, annule le signal, mais j ai jamais reussit jusqu a maintenant.

NB: Dommage mon morceau (BO De film) fait parti des 19.
NB2: Remarque, peut etre que vous allez y arriver ou me confirmer que y a pas moyen sur ce sample ?

Musicalement,

[ Dernière édition du message le 24/03/2010 à 19:50:14 ]

7
si le morceau s'y prête, test un matricage M/S, avec un peu de chance la voix est bien au centre et le reste très peu, ce qui fait qu'en exportant le canal correspondant au centre, tu auras peut être les voix quasi seules.
8
Citation de Anonyme :
Il parait qu'effectivement ajouter l'inverse d'un signal audio, annule le signal, mais j ai jamais reussit jusqu a maintenant.


Ajouter l'inverse d'un signal, revient a tout annuler, si tu as un signal s(t) et que tu lui ajoute -s(t), bah forcement

s(t)+(-s(t))=s(t)-s(t)=0

Maintenant, ce qui est plus intéressant c'est d'inverser un des canaux stéréo et d'ajouter le résultat. Ca marche si seulement ton signal audio est parfaitement au centre.

Son gauche: x1(t)=s(t)+n1(t) (ton signal s(t) + une composante n1(t))
Son droite: x2(t)=s(t)+n2(t) (ton signal s(t) + une composante n2(t))

Si tu fais l'addition de x1(t) avec x2(t) en opposition de phase tu vas avoir:
x1(t)+(-x2(t))=n1(t)-n2(t) donc t'as plus aucune composante en s(t)

En pratique, c'est chaud, car ca m'étonnerai que  ton signal soit parfaitement au centre...Niveau signal, je pense que l'algorithme le plus connu pour la separation de sources audio a partir d'un échantillon stéréo c'est DUET [1] (http://ee.ucd.ie/~srickard/YilmazRickard2004.pdf). En gros, pour séparer les sources, l'algorithme utilise une representation dans laquelle on fait l'hypothèse qu'au plus une seule source est présente à un endroit précis (DUET passe par une représentation temps fréquence, a l'instant t et a la fréquence f, on fait l'hypothèse qu'au plus une seule source Joue). Ensuite, l'algo essaye de retrouver les endroits ou la même source est présente (recherche basée sur la phase notamment, c-a-d sur le positionnement spatial). Une fois que les endroits correspondants a une sources ont été identifiés, on les stocke puis l'on inverse la représentation.

Il y a un paquet d'articles qui ont suivi, l'article présentant DUET a été cité dans plus de 400 articles de recherche en l'espace de 5 ans...c'est énorme. Si un jours tu vois un soft qui fait de la séparation de source audio, soit sur que l'algo DUET (ou une des ses multiples variantes) se cache la dessous.


[1] Ö. Yilmaz, S. Rickard, ”Blind separation of speech mixtures via time-frequency masking”, IEEE Trans. On Signal Processing, vol 52, no7, July 2004...

+ info: https://web.media.mit.edu/~paris/ica.html














[ Dernière édition du message le 25/03/2010 à 11:17:53 ]

9
Bonjour,

En pratique c'est quoi la fonction qui permet d'ajouter un signal a un autre (Le mix) dans les programmes genre soundforge ?

Musicalement,

[ Dernière édition du message le 03/04/2010 à 12:51:03 ]

10
Tu veux faire quoi en fait ?