Se connecter
Se connecter

ou
Créer un compte

ou

Sujet Les compressions du signal numérique

  • 25 réponses
  • 9 participants
  • 2 614 vues
  • 9 followers
Sujet de la discussion Les compressions du signal numérique
:!: Il ne s'agit pas ici d'un thread sur la compression dynamique. Je parle de compression du débit numérique (mp3, aac et autres...)
Hello tout le monde,

Je vais m'attaquer sous peu à la rédaction d'un dossier le plus complêt possible sur les différentes compressions du signal numérique.

Le point de départ est que tous les domaines du son (radio, ciné, télé, musique, diffusion internet) font appel à divers procédés de réduction du débit numérique. Or, peu de techniciens n'ont ne serait-ce qu'une vague idée du fonctionnement de ces procédés ni de leur influence réelle sur leur travail une fois arrivé chez l'auditeur. Je cherche à savoir si il est possible de tenir compte d'une compression future lors du mastering.

Je suis à la recherche de plusieurs choses :
1) des études déjà menées sur les compressions destructives
2) des livres / liens expliquant précisément les procédés utilisés et les principes des différents formats.
3) de techniques utilisées par les ingénieurs du son pour tenir compte de la compression future de leur travail et minimiser son impact destructif.

Dans l'idéal, j'aimerai faire un comparatif des différents formats de compression (mp3, aac etc.) et éventuellement trouver des techniques applicables au mastering pour optimiser le signal en vue d'une compression future.

Je suis vraiment au début de ma recherche et toute contribution m'intéresse :)

A+

Mes réalisations : http://www.rallu-sound.ch

[ Dernière édition du message le 01/11/2012 à 00:06:10 ]

Afficher le sujet de la discussion
21
EraTom, tes explications sont formidables. Je suis un peu pris en ce moment et donc pas forcément le temps d'approfondir. Je vais essayer de m'y remettre dans le courant de la semaine prochaine :)

Mes réalisations : http://www.rallu-sound.ch

22
Wouah, c'est très clair et très compréhensible !
Au fait, quelqu'un connaîtrait un livre en français sur ce sujet, ou plus largement la numérisation du son etc... Avec les explications des différents théorèmes : Nyquist etc... Je voudrais vraiment comprendre exactement comment ces phénomènes sont expliqués.
23
Super si ça vous va.

Concernant les bouquins, j'en vois un qui n'est pas mal du tout : L'audionumérique : Musique et informatique de Curtis Roads.
https://www.dunod.com/loisirs-scientifiques-techniques/audio-photo-video/son-et-acoustique/laudionumerique

Je l'avais lu pour voir un peu quelques cas concrets d'applications de la théorie du signal dans le monde de l'audio.
Il montre des applications, discute et décrit certains problèmes. Par contre il ne va pas aussi loin que moi dans mes posts.

Après je connais quelques bouquins très théoriques... le problème c'est que ça demande un niveau bac+2 / bac+3 en math (et quand je dis math c'est math universitaire ou math sup / spé).


Je ne voudrais surtout pas paraître pédant, ou te donner l'impression de vouloir te décourager, mais le truc c'est que le traitement du signal demande un formalise mathématique assez conséquent. Ça rebute même pas mal d'étudiants ; on retrouve souvent des physiciens théoriciens ou des matheux qui passent aux math appliquées.
Ce qui est bien avec la physique (et le signal c'est de la physique) c'est que l'on peut faire passer les concepts de façon intuitive, mais dans le cas du théorie du signal ce n'est pas si évident parce que les prérequis en math restent tout de même assez importants. Bref ce n'est pas un exercice facile et je ne connais pas de bouquin de niveau intermédiaire :??:


Par exemple tu évoques le théorème de Nyquist-Shannon. Le résultat est assez simple à expliquer : le spectre est répliqué à chaque fréquence multiple de la fréquence d’échantillonnage.
La conséquence est aussi simple une fois que l'on admet le résultat : si des fréquences dépassent les "bords" du spectre répliqués vont se recouvrir (l'aliasing).
Ça suffit à comprendre pourquoi il faut mettre des filtres d'antialiasing.

Pour montrer d'où vient la duplication des bandes spectrales... c'est une autre paire de manches.


Perso j'essaierai de montrer ce qui se passe avec une seule sinusoïde échantillonnée :
- On prend une sinusoïde à une fréquence quelconque.
- On l'échantillonne à une autre fréquence quelconque. On obtient un ensemble de points (échantillonnés).
- On montre que l'on peut trouver une infinité de sinusoïdes qui passent parce ces points, et qu'elles sont espacées d'un multiple de la fréquence d'échantillonnage.

Ce genre de mini-démo ça ne demande que de connaitre les formules trigo (cos(a+b) = ... etc.) et ça peut aider à fournir une première explication. Je te la fournis dans un autre topic si tu veux (j'aimerais éviter dévier de la question initiale d'Étienne).


Par contre, si tu veux vraiment montrer le vrai théorème par bandes spectrales c'est tout de suite plus costaud :
- Tu prends un signal quelconque à une dimension (un processus stochastique pour être plus général https://fr.wikipedia.org/wiki/Processus_stochastique )
- Tu le multiplies temporellement avec un peigne de Dirac https://fr.wikipedia.org/wiki/Peigne_de_Dirac pour modéliser l'action de l'échantillonnage.
- Tu calcule ensuite la densité spectrale de puissance comme l'espérance mathématique de la transformée de fourrier du signal obtenu https://fr.wikipedia.org/wiki/Densit%C3%A9_spectrale#Densit.C3.A9_spectrale_de_puissance
- Tu constates qu'il y a duplication du spectre.

Je précise "à une dimension, le temps" parce que l'on a le même phénomène en traitement d'image "2 dimensions, les lignes et les colonnes", sur les IRM "3 dimensions de l'espace" ou la video "2 dimensions image + 1 dimension pour le temps"... pour 4 dimensions l'IRM fonctionnelle "3 dimensions de l'espace + 1 dimension pour le temps"... et même pour un nombre quelconques de dimensions (et là c'est des math qui ressemblent à de la science fiction, mais qui trouve des applications pour trouver le boson de Higgs, par exemple).

Tu vois que même la "démo" de Wikipedia sur les propriétés du peigne de Dirac précise "En oubliant toute rigueur" parce que normalement il faut définir :
- l'impulsion de Dirac comme une "distribution" https://fr.wikipedia.org/wiki/Distribution_de_Dirac
- dans le cadre de la théorie de la mesure https://fr.wikipedia.org/wiki/Th%C3%A9orie_de_la_mesure
- sur des espaces topologiques https://fr.wikipedia.org/wiki/Espace_topologique
- où pour le calcul de la densité spectrale de puissance on utilise l'intégration au sens de Lebesgue https://fr.wikipedia.org/wiki/Int%C3%A9grale_de_Lebesgue

Pour rendre le calcul "plus simple", tu peux utiliser le fait qu'un produit dans l'espace temporel est un produit de convolution dans l'espace des fréquences.
https://fr.wikipedia.org/wiki/Produit_de_convolution
C'est le théorème de Fubini :
https://fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_de_Fubini


Ça pique, mais si tu veux vraiment comprendre exactement comment ces phénomènes sont expliqués ça passe par là. :-p
Je vais te dire, la plupart des ingé des grandes écoles, qui sont tout de même passés par math sup/spé, regardent la démo une fois, l'oublient, et se contentent d'appliquer le résultat. (voir, ils changent leurs options pour ne plus faire de traitement du signal :D: )


En fait, plus je poste de truc ici en essayant d'expliquer certaines idées de la théorie du signal, plus je me dis qu'il faudrait que je me lance dans la rédaction d'un bouquin de niveau intermédiaire à destination des audiophiles, parce que je crois que ça n'existe pas et que l'on peut lire de vraies âneries qui tiennent parfois du mysticisme.
Je ne sais pas si j'aurais le courage et je ne pense pas y arriver seul (parce que j'aurais bien besoin d'un relecteur pour corriger des erreurs que je pourrais faire).

[ Dernière édition du message le 05/11/2012 à 01:16:39 ]

24
Ouhlà, c'est tôt, je regarderai plus tard...

Citation :
plus je me dis qu'il faudrait que je me lance dans la rédaction d'un bouquin de niveau intermédiaire à destination des audiophiles

Ouais, bonne idée.
25
Une petite question qui me vient :

Je fais des podcsts pour une webradio. Nous enregistrons en Wav et convertissons le tout après édition en MP3 169 kbps (stéréo). C'est de la radio, donc ultra compressé et tout le temps très proche du 0FS. Un des responsable techniques prétend que de normaliser à -0.3 FS au lieu de 0FS éviterait certains artefacts du MP3. As-tu une explication à ce phénomène (autre que psychologique) ?

Mes réalisations : http://www.rallu-sound.ch

26
Pendant qu'on y est, pas grand rapport avec le sujet, j'ai une ou deux questions qui trottent :

Citation :
Génère un son aléatoire, un bruit blanc (attention, un "vrai" avec très peu de corrélation)

Un bruit blanc c'est pas toutes les fréquences en même temps ? Pourquoi dans ce cas on appelle aussi ça un bruit aléatoire ? C'est en rapport avec la forme de l'onde ?
Qu'est ce que tu entends par "sans corrélation" ?

Désolé pour ces questions, j'aimerais comprendre...