Bon, commençons par le commencement : le son est une onde de pression dans l'air ; un signal audio analogique est une onde électrique. Dans les deux cas, on parle de niveau pour représenter l'amplitude de l'onde, l'écart entre le minimum et le maximum de la vibration. Comme quand on mesure la hauteur des vagues.
En acoustique, le niveau pourra être exprimé par la variation de pression, en pascals (Pa), autour de la pression atmosphérique moyenne (les fameux 1013 hectopascals de la météo).
En électrique, le niveau pourra être exprimé en volts par rapport à la masse (en satisfaisant à quelques critères par ailleurs, mais je ne rentre pas dans les détails).
Il y a alors deux soucis.
D'une part, le son change tout le temps : qu'est-ce qu'on prend comme mesure ? L'amplitude maximale (ou "crête") ? La moyenne ? (en général ca ne marche pas, ca fait zéro parce que l'onde "pousse" autant qu'elle "tire".) La moyenne quadratique (ou "RMS") ? Et pour quelle(s) bande(s) de fréquence ? Avec une pondération ? En pratique, un peu tout ca selon l'aspect auquel on s'intéresse.
D'autre part, il y a beaucoup de variation de niveau, et une échelle linéaire n'est pas pratique, ca fait vite des très grands nombres. Les inventeurs du téléphone ont popularisé une échelle logarithmique, nommée bel (en hommage à Alexander Graham Bell) et son sous-multiple, le décibel (dB). Ce n'est qu'une échelle, qui n'a de sens que par rapport à une valeur de référence, mais ca simplifie bien les calculs.
On a ainsi choisi la plus faible pression audible (20 µPa) comme référence de pression acoustique pour définir le dB SPL (Sound Pressure Level).
On a choisi une tension de 1V comme référence pour définir le dBV. Ou bien une tension RMS de 0.776V (équivalent à 1mW dans une charge de 600 Ohms) pour définir le dBu. En radio on utilise le dBm pour les puissances rayonnées par les antennes (référence à 1mW). Et il y en a plein d'autres.