Sujet rms vs peak
- 218 réponses
- 21 participants
- 19 363 vues
- 24 followers
ms82
alors voilà je suis débutant dans le mix et j'entend parlé souvent de rms et de peak.
d'après ce que j'ai pus en comprendre le niveau rms est le niveau moyen entre les niveau fort et les niveau faible, voir niveau ressenti et celà est mesurable.
et le niveau peak ce sont les niveau les plus fort.
si je fait un gain staging avant tout traitement, est-ce que je doit prendre chaque piste est régler le gain par rapport au peak ou au rms?
apparemment la norme pour un mix fini c'est -8dbrms, mais piste par piste de combien devrait-elle être en rms?
par exemple si j'ai un kick qui tape a -3db avec un rms a -25( c'est un exemple, je n'ai pas les rapport exact), est-ce qu'il vaut mieu ramener le niveau rms ou simplement s'occuper des peak?
rroland
Il semble que Zed Brookes vive en Nouvelle Zélande, mais je ne trouve pas de mail de contact, je chercherai plus tard. J'ai peut-être la possibilité de contacter une personne très compétente à la RTBF (notre chaine radio télé nationale belge)
Anonyme
Hors sujet :
de mon côté j'ai envoyé un mail à l'IEC, si j'ai la réponse avant de disparaitre, je la colle ici.
Anonyme
Citation de jfherts
il n'a jamais été dit ni prouvé que la référence numérique en dBFS est en RMS.
Jamais ce n'est écrit "RMS" (pour le numérique dBFS) explicitement dans les normes.
si, dans le lien posté par danbei post 160:
Citation de ITU
7.3.1.2 Test signals and test signal levels
All input signal levels are stated in decibels relative to 1 V, as they are electrically output from the test system into each device headset socket microphone input channel.
All output signal levels stated in this section are relative to decibels relative to full scale (dBFS), where 0 dBFS represents the root mean square (RMS) level of a full-scale sinusoidal signal.
d'ailleur je vous invites à relire ce post 160, je pense que tout y est clair et il y a tous les liens.
static volatile
Citation de ITU
7.3.1.2 Test signals and test signal levels
All input signal levels are stated in decibels relative to 1 V, as they are electrically output from the test system into each device headset socket microphone input channel.
All output signal levels stated in this section are relative to decibels relative to full scale (dBFS), where 0 dBFS represents the root mean square (RMS) level of a full-scale sinusoidal signal.
d'ailleur je vous invites à relire ce post 160, je pense que tout y est clair et il y a tous les liens.
Tu comprends mal ce qui est écrit et la problématique en question.
D'une part, le document que tu cites se rapporte aux télécommunications, plus spécifiquement au test de micro intégrés à un casque.
D'autre part, la phrase All output signal levels stated in this section are relative to decibels relative to full scale (dBFS), where 0 dBFS represents the root mean square (RMS) level of a full-scale sinusoidal signal ne dit pas que 0 dB FS représente une valeur efficace.
On peut la corréler à ce passage de AES17:
5.4 Input for full-scale amplitude
NOTE The characteristic to be specified is the analog signal voltage required to reach digital clipping
under normal device settings.
In systems where the output is accessible in the digital domain, the input for full-scale amplitude shall be the
r.m.s. voltage of a 997-Hz sine wave that shall be applied to the input to obtain a digital signal whose positive
peak value reaches the positive digital full scale.
Ce passage définit le signal analogique présenté à l'entrée du système testé:
5.4 entrée pour la modulation pleine échelle
NOTE la caractéristique spécifiée est la tension du signal analogique requise pour atteindre l'écrêtage numérique lors d'une utilisation normale.
Dans les systèmes où la sortie est disponible dans le domaine numérique, le signal d'entrée pour la modulation pleine échelle sera la tension efficace d'une sinusoide à 997 Hz qui sera présentée à l'entrée afin d'obtenir un signal numérisé dont la crête positive atteint la pleine échelle numérique.
Quel est le problème étudié?
Dans le domaine analogique, même le plus rapide des crète-mètres a une constante de temps telle qu'on ne peut jamais connaître la valeur crête réelle d'un signal (le document de l'EBU considère que la différence, hors erreur humaine, est de l'ordre de 3 dB).
Dans le domaine numérique, la valeur crête réelle est primordiale, car seule celle-ci permet de déterminer si on va clipper un convertisseur ou non.
Il faut donc définir le niveau d'un signal analogique arbitraire (qui ne peut être qu'une valeur efficace) qui correspond au niveau numérique pleine échelle (qui est défini par rapport à l'amplitude maximale qu'on peut encoder, ce qui est par définition une valeur crête).
Comment le résoudre?
On définit que le signal analogique dont la valeur efficace est égale à celle d'une sinusoide à 997 Hz dont la valeur crête positive module à la pleine échelle numérique correspond, une fois numérisé, à un signal numérique dont l'amplitude est 0dB FS.
Cela permet d'établir de manière claire la correspondance entre des niveaux dans le domaine analogique (jamais crête par construction) et les niveaux dans le domaine numérique (relatifs à l'amplitude maximale encodable, crête par définition).
Petit rappel:
La valeur efficace d'une fonction périodique est une constante représentant une quantité d'énergie égale à celle de la fonction étudiée.
La valeur efficace d'une sinusoide est par définition une droite, il ne rime à rien de chercher à numériser sa valeur efficace.
Lorsqu'on numérise un signal, on numérise par définition sa valeur de crête.
Une fois numérisé, on peut étudier sa valeur efficace, dans le contexte d'un mixage ou d'un mastering ITB, lorsqu'on applique un traitement dynamique dans le domaine numérique, et patin couffin, mais cela ne change rien au fait que l'encodage PCM représentera toujours la valeur crête du signal numérique.
Resistance is not futile... it's voltage divided by current
[ Dernière édition du message le 11/09/2018 à 15:01:39 ]
Danbei
C'est la convention adopté par les standards de l'AES, l'ITU et l'IEC.
wikipedia-fr, wikipedia-en, ITU part 7.3.1.2, p9, AES part. 6.3 p13, IEC part 3.2, p7.
Je me suis planté dans les réfs, c'est plutôt ça :
wikipedia-fr, wikipedia-en, ITU part 7.3.1.2, p9, IEC part 3.4, p7.
- Sur le doc de l'IEC c'est la partie 3.4 et pas 3.2.
- J'ai lu trop rapidement et compris de travers le doc de l'AES, qui en fait ne parle pas de niveau RMS en dB FS , mais du niveau analogique en entré ou en sortie de convertisseur comme le fait remarquer aaB.
[ Dernière édition du message le 11/09/2018 à 15:18:28 ]
Anonyme
Citation de aab
La valeur efficace d'une fonction périodique est une constante représentant une quantité d'énergie égale à celle de la fonction étudiée.
La valeur efficace d'une sinusoide est par définition une droite, il ne rime à rien de chercher à numériser sa valeur efficace.
Lorsqu'on numérise un signal, on numérise par définition sa valeur de crête.
Une fois numérisé, on peut étudier sa valeur efficace, dans le contexte d'un mixage ou d'un mastering ITB, lorsqu'on applique un traitement dynamique dans le domaine numérique, et patin couffin, mais cela ne change rien au fait que l'encodage PCM représentera toujours la valeur crête du signal numérique.
ça, il ne me semble pas avoir écrit le contraire nul part, je pense même avoir déjà écrit exactement la même chose
Pour le reste, autant pour moi, j'ai compris comme Danbei.
Par contre, je ne pige toujours pas comment on passe d'un niveau efficace 18dB en dessous du niveau max en analo à un niveau efficace 21 dB en dessous du max en numérique?
aaB?
[ Dernière édition du message le 11/09/2018 à 15:24:47 ]
fivesstringer
Citation de fivesstringer :Definition AES et IEC:
C'est LA définition du 0 dBFS.
0 dBFS est le niveau numérique equivalent à la tension RMS d'une onde sinus.
Non, relis la norme:
Citation de AES17-1998 :
3.3
full-scale amplitude
amplitude of a 997-Hz sine wave whose positive peak value reaches the positive digital full scale, leaving the
negative maximum code unused.
NOTE In 2's-complement representation, the negative peak is 1 LSB away from the negative
maximum code.
3.3.1
decibels, full scale
dB FS
amplitude expressed as a level in decibels relative to full-scale amplitude (20 times the common logarithm of
the amplitude over the full-scale amplitude)
NOTE The rules of the International System of Units (SI) require that a space appear after the
standard symbol dB.
3.3 amplitude pleine échelle
l'amplitude d'une sinusoide à 997 Hz dont la crête positive est égale à la valeur positive numérique maximale, la valeur numérique négative minimale restant inutilisée.
NOTE en complément à 2, la crête négative minimale présente un écart de 1 LSB avec la valeur négative minimale.
NdT: en d'autres termes, l'amplitude pleine échelle est définie par une sinusoide à 997 Hz dont la valeur de crête positive encodée sur N bits est égale à [code]2**(N - 1)[/code] et dont la crête négative est égale à [code]-2**(N - 1) + 1[/code]
3.3.1 décibels, pleine échelle
dB FS
amplitude exprimée en décibels relativement à l'amplitude pleine échelle (20 fois le logarithme du rapport entre l'amplitude et l'amplitude pleine échelle)
NOTE les règles du Système International d'Unités (SI) requièrent qu'un espace soit placé après le symbole standard dB.
NdT: il est clair que le dB FS est défini en termes de valeurs crête.
Donc pour une crête positive encodée sur N bits:
[code]V_dB_FS = 20 * log(V_pk / (2**(N-1)))[/code]
et pour une crête négative:
[code]V_dB_FS = 20 * log(V_pk / (-2**(N-1) + 1)))[/code]
EDIT: le document est disponible librement ici.
Tu as oublié un bout:
3.4
full-scale signal level
FS
signal amplitude relative to the full-scale amplitude expressed in decibels, full scale or percent, full scale
NOTE Because the definition of full scale is based on a sine wave, it will be possible with squarewave
test signals to read as much as + 3,01 dB FS. Square-wave signals at this level are not
recommended because tilt or overshoot introduced by any filtering operations will cause clipping of
the signal
Selon ton interprétation ceci (Nota chapitre 3.4 que tu as juste oublié de copier) serait tout bonnement impossible puisque le 0 dBFS serait basé sur les cretes et non la valeur moyenne.. Donc aucun signal même carré ne pourrait ecreter à +3 dBFS.
De fait il est vrai que ce sont les cretes du signal à 0dBFS qui correspondent à la quantification de poids le plus lourd, mais le 0 dBFs n'en reste pas moins défini selon AES17 en correspondance au niveau RMS du sinus source.
Un signal sinus possède à la fois un niveau RMS et un niveau crete. LE RMS définit le niveau 0 dBFS et les cretes de ce sinus sont utilisées pour définir la quantification maximale admissible.
Et je rajoute que c'est normal qu'il soit défini par un niveau RMS, ça ne pourrait pas être en toute rigueur différemment puisque à un moment donné on fait correspondre des dBu analogiques et des dB FS numériques.
Or le dBu est par définition un rapport logarythmique de tenssions par rapport à une tenssion de référence:
dBu = 20 log (V / 0.775) .... Bon mais le 0.775 V en question est une valeur RMS de ternsion.
Donc pour que le rapport V /0.775 ait du sens (ait UN sens) il faut aussi que V soit une tension RMS. Et donc le dBu d'alignement est une valeur RMS.
Voila (sans doute) pourquoi l'AES17 a adopté la valeur RMS du sinus 1k (ou 997 Hz pour etre exact) comme référence 0 dBFS dans le monde numérique.
En revanche ce sont bien les cretes de ce sinus qui encodent le bit le plus fort c'est logique aussi et je vois pasx là non plus comment ils auraient pu faire autrement.
Ce qui me fait dire que 24 bits bien remplis = 0 dBFS en RMS = +3 dBFS en crete pour ce sinus.
Autrement dit un sinus dont les cretes seraient à 0 dBFS (et le RMS à -3 dBFS donc) n'encoderait pas au maximum.
Voila ce que dit l' AES17.
Tu noteras enfin que l'AES parle de crete positive de valeur nuémrique maximale, mais sans préciser s'il s'agit de 0 ou + 3 dBFS ou bien s'il s'agit de la crete d'un signal de moyenne RMS à -3 ou 0 dBFs.
Aucune valeur de niveau en dB FS n'est précisée pour ces cretes maximales sur lesquelles tu fais ta démonstration.
Donc STP ajoute le chapitre 3.4 et son nota dans ton raisonnement et tu verras que selon AES17, c'est bien un sinus de niveau de 0 dBFS en RMS dont les cretes définissent la quantification maximale (3 dB plus haut)
Mais en fait l'utilisateur s'en fout des +3 dBFS, ça n'est pas apparent, c'est une cuisine interne au convertos conçus selon le standard AES17 (on a vu Cyrrus Logic etc etc..)
La seule chose à savoir c'est que si on cale son converto pour 0 dBVU RMS = - 18 dBFS en RMS et ben 18 dB au dessus on encodera au maximum et on sera au clip numérique.
Ca laisse donc 18 dB de headroom et basta.
static volatile
Par contre, je ne pige toujours pas comment on passe d'un niveau efficace 18dB en dessous du niveau max en analo à un niveau efficace 21 dB en dessous du max en numérique?
Parce qu'on définit le signal analogique qui, une fois numérisé, modulera à 0 dB FS de la manière suivante:
C'est un signal analogique dont la tension efficace est égale à la tension efficace d'une sinusoide à 997 Hz dont l'amplitude est telle que, une fois numérisée et encodée en complément à 2 sur N bits (valeur entière signée), sa crête positive est égale à la pleine échelle numérique positive (2**(N - 1)) et sa crête négative a un écart de 1 LSB avec la pleine échelle numérique négative (-2**(N - 1) + 1).
En binaire sur 24 bits, cela donne
positive peak: 0b01111111 11111111 11111111
negative peak: 0x10000000 00000000 00000001
Il reste le truc de cette convention qui donnerait, pour la sinusoide de test, la valeur efficace égale à la valeur de crête (ce qui est mathématiquement faux).
Ce que je comprends, c'est que:
- lorsqu'on représente la valeur efficace d'un signal numérisé, on le fait relativement à l'amplitude plein échelle numérique positive.
- cela crée un décalage que l'on "rattrape" en ajoutant 3dB à la valeur efficace de la sinusoide de test lors de la calibration.
Plusieurs trucs me gênent avec cette histoire de convention:
- Je n'ai pas trouvé de référence à cette convention ailleurs que sur wikipedia et des pages qui copient wikipedia
- la seule fonction dont la valeur efficace est égale à la valeur crête est un carré ou un rectangle parfait (sans composante continue et avec une bande passante infinie), fonction qu'on ne sait pas générer dans le domaine analogique et qui, quand bien même on saurait la générer dans le domaine analogique, serait impossible dans le domaine numérique sans violer les critères de Shannon-Nyquist.
- ceci dit, si la modulation pleine échelle est atteinte par une sinusoide, cela veut dire qu'on ne pourrait pas représenter une onde carrée dont la bande passante serait limitée pour respecter Shannon-Nyquist à pleine échelle sans clipper.
Il faut que je cherche encore, je n'ai pas d'avis formé sur cette question.
Resistance is not futile... it's voltage divided by current
Anonyme
Hors sujet :
je me croierai en commission de normalisation.
depuis le début chacun site un bout de norme par ci, un bout de norme par là, on a tout un tas de pièces du puzzle, mais au final tout le monde est perdu.
Et je me met dans le lot et j'incrimine personne.
pour ma part, pour le moment je vais en rester à des notions simples, et au fait que je ne voit pas pourquoi la valeur* RMS d'un signal changeraie de 3 dB sous prétexte qu'on l'a discrétisée.
* comprendre 18dB sous le niveau max si on prend pour exemple les valeurs de l'EBU présentées sur le graphe, mais vous pouvez remplacer RMS par crête et 18 par 15.
fivesstringer
Plusieurs trucs me gênent avec cette histoire de convention:
- Je n'ai pas trouvé de référence à cette convention ailleurs que sur wikipedia et des pages qui copient wikipedia
C'est faux: J'ai repris le chapitre 3.4 sur l'extrait de l'AES17 que tu avais également laissé en lien dans une de tes interventions. Et le NOTA de ce chapuitre ne laisse aucune ambiguité sur le fait que le niveau RMS du sinus sert de référence 0 dBFS tandis que ses cretes sont considérés comme le plus haut niveau encodable avant clip numérique.
la seule fonction dont la valeur efficace est égale à la valeur crête est un carré ou un rectangle parfait (sans composante continue et avec une bande passante infinie), fonction qu'on ne sait pas générer dans le domaine analogique et qui, quand bien même on saurait la générer dans le domaine analogique, serait impossible dans le domaine numérique sans violer les critères de Shannon-Nyquist.
On s'en fout du domaine numérrique. On est en train de parler d'une correspondance de niveaux analogique/numérique du convertisseur en tant que référence. C'est un calibrage dédidé par convention si tu préfères. Ce qui se passe en aval, après conversion, n'a aucun interet ici.
- ceci dit, si la modulation pleine échelle est atteinte par une sinusoide, cela veut dire qu'on ne pourrait pas représenter une onde carrée dont la bande passante serait limitée pour respecter Shannon-Nyquist à pleine échelle sans clipper.
Il faut que je cherche encore, je n'ai pas d'avis formé sur cette question.
https://github.com/endolith/waveform_analysis/issues/18
On est pas seuls à se poser cette question ou se l'être posée.
De cette petite liste il ressort que Rane utilise le même concept que toi mais que c'est pas un standard au contraire des AES, IEC etc....
EDIT: Selon Prismesound (convertos): S'appuient sur AES17
https://www.prismsound.com/define.php?term=Full-scale_amplitude
[ Dernière édition du message le 11/09/2018 à 17:28:24 ]
- < Liste des sujets
- Charte