EBU R128 pour les Podcasts et les Sagas MP3 ?

EBU R128

Loudness et norme EBU R128


Préambule

- Pour qui ?

  Ce qui suit va probablement intéresser les broadcasteurs (podcasteurs) et autres créateurs de saga MP3 et autres aventures radiophoniques

  Officiellement, la télévision de tous les grands pays l'appliquent (ou appliquent une norme équivalente)

  Les radios ne sont pas encore contraintes d'appliquer cette norme (sauf peut-être dans certains pays mais la plupart y pensent sérieusement, sachant que pour le moment les normes appliquées à la télévision ne sont probablement pas applicables pour certaines raisons techniques, la première étant que les appareils ne permettent pas au volume de sortie de s'adapter strictement à la norme R128, tout en offrant le confort d'ecoute attendu. Il faudra donc s'adapter, mais c'est faisable. Lire plus loin.


- Pourquoi ?

  Pour éviter à l'auditeur de devoir régulièrement sauter sur son bouton de volume :

    - soit entre les programmes

    - soit même au sein d'un programme puisqu'il permet de maitriser la dynamique générale de son programme


- pré-conclusion du pour qui/pourquoi :

  il est intéressant pour tout podcasteur et tout créateur de saga MP3 de connaître et de posséder les outils de mesure du Loudness

  Appliquer strictement la norme EBU R128 serait, à l'heure actuelle, probablement une erreur, mais une norme proche, basée sur la R128 pourrait etre une grande avancée pour nous tous.


Post-préambule

Cette présentation est en grande partie basée sur une conférence donnée par Florian Camerer pour TC Electronics en 2011 mais aussi des documents officiels et des documentations que j'ai pu lire sur le net. Voir la bibliographie en fin de billet.

J'ai aussi pris sur moi d'éluder certaines parties, par exemple le mixage en 5.1 car il est peu exploité à notre niveau, mais ce n'est pas nécessairement plus compliqué, jusque quelques paramètres de plus à prendre en compte.


Ancien standard de diffusion pour la télévision

L'ancien "standard" de la télévision utilisait une norme facile à mesurer et facile à appliquer mais avait des limitations

Limitation numéro 1 : Il variait d'une chaine à l'autre, en fonction de leurs propres critères, donc zapper était pénible car il fallait aussitôt ajuster le volume de la TV.

Limitation numero 2 : ça tournait généralement autour du simple principe d'une normalisation des crêtes à, généralement, -9dB Full Scale et ne tenait pas compte de la compression dynamique.


A noter que, malgré son nom, ce qu'on appelle ici crète (ou peak) n'était pas véritablement l'échantillon le plus haut du programme, comme on pourrait s'y attendre, mais une moyenne roulante de 10 millisecondes qu'on appelera QPPM (Quasi Peak Program Meter) soit la "mesure de la quasi-crète du programme".

Cela veut dire que les transitoires sont ignorées dans la mesure.

C'est la raison principale de la norme à -9 dB FS plutôt que 0 dB FS, afin de permettre ces transitoires sans distordre le signal.


Ça impliquait qu'un programme avec une très grande dynamique était parfois pénible à écouter (par exemple une partie de golf ou de tennis, entre les parties de jeu, et les applaudissements du public). Du coup, y appliquait généralement une compression afin de maitriser la dynamique. Jusque là, normal.


Mais comme cette dynamique ne faisait pas partie des normes d'acceptation des programmes, progressivement, des petits malins ont commencé à compresser et surcompresser leurs programmes, notamment les pubs, afin que l'intensité perçue soit forte, sans pour autant déroger à la règle du peak à -9dBFS


Du coup, les téléspectateurs que nous étions faisions en permanence le yoyo avec le bouton de volume, notamment au début et à la fin des plages de pubs, ce qui était pénible, et donc nous rendait moins perceptifs aux plages de publicités, et donc qui a amené les diffuseurs à réfléchir à un standard plus efficace pour nous vendre mieux de la lessive à 20h30.


Qu'est ce que le Loudness.

En Francais, on peut employer l'expression "Intensite Sonore Perçue".


"Perçue" :

- dépend d'un individu à l'autre. c'est le problème principal.

- dépendante des fréquences (un Humain perçoit mieux les médiums que les autres fréquences)

- dépendante de la compression et des crètes

- et on a toujours cette impression fugace du "Louder is better" (plus fort c'est mieux), dès 0.2dB selon Bob Katz.


Par conséquent, les professionnels de la profession se sont réunis afin d'essayer de définir un standard (et un algorithme de mesure) de l'intensité sonore perçue (Loudness) même s'ils savaient dès le départ que cette mesure serait imparfaite.

En 2006, après quelques années de boulot, ils se sont accordés sur un consensus, standard et algorithme, inscrit dans l'ITU R BS 1770 (ITU=Union Internationale des Telecommunications ; R=Radiocommunication ; BS=Broadcast Services)


Le principe :

-1 appliquer des coefficients aux différentes fréquences pour donner plus de poids aux mediums qu'aux graves (selon le principe de Fletcher Munson), qu'on appelera la ponderation K. (K Weighting)

-2 dans le cas du surround, appliquer un coefficient different pour l'arrière et l'avant, mais c'est un détail pour ce qui nous préoccupe.


Ceci nous donne une nouvelle unité qui va définir l'intensité sonore perçue : le LU (Loudness Unit, unité relative) et le LUFS (Loudness Unit Full Scape, Unité absolue) (Dans la litterature on trouvera aussi le sigle LKFS, pour préciser la pondération K, mais on s'en fiche, LKFS et LUFS, c'est pareil.)

Du point de vue de la mesure, c'est simple : 0 LU (relatif) = -23 LUFS (absolu)

Du point de vue électrique, c'est simple aussi : une sinusoïde de 1kHz à zéro dB FS = 3.01 LUFS

Pour les mathématiques ajouter un dB à un signal, c'est ajouter un LU et pareil dans l'autre sens.


Simple, non ?


-3 on abandonne le QPPM pour le True Peak. Le vrai !


En associant ces algorithmes, on détermine 3 paramètres principaux qui vont former la norme de télédistribution EBU R128 (EBU=Union Européenne de Radiodiffusion).


- Program Loudness, donc l'intensité sonore percue de tout le programme, du début à la fin ;

- Max true Peak, donc le volume maximal atteint à un quelconque moment du programme

- Loudness Range (LRA), qui donne une idée de la dynamique, donc de la compression employée. Pour le calculer on élimine les passages les plus faibles et les passages les plus forts, et on mesure la dynamique qui reste. Rien de très compliqué.


A celà s'ajoute deux éléments qui enclenchent ou non la mesure, et donc les calculs du Loudness, que l'on appellera Gating puisque cela fonctionne comme une porte de bruit :

- Le gating G10, c'est à dire les sons qui sont à moins de 10 décibels en dessous du Loudness général calculé jusqu'àlors. cela permet d'ignorer les bruits d'ambiance quand l'action principale (par exemple les dialogues d'un film) est silencieuse.

- Le gating G70, qui ignore simplement les sons qui se trouvent à -70dB, qu'on considèrera comme du bruit de fond.

Ces deux éléments sont considérés comme n'incitant pas le telespectateur à pousser le volume. Du coup, il est logique de ne pas les inclure dans la mesure de l'intensité.


La nouvelle norme est donc :

- -23 LUFS (+- 1 LU pour les programmes supérieurs à 2 minutes)

- Maximum true peak : -1 dB TP

- LRA doit être inférieur à 20 LU (donc appliquer un peu de compression est généralement recommandé), mais supérieur à 5 LU ( donc pas de surcompression )

- Il est recommandé que les dialogues fluctuent dans une plage de +/- 7 LU autour de de la valeur d'intensité moyenne du programme (soit -23 LUFS, vous suivez ?)


A noter que pour les programmes courts (inférieurs à 2 minutes), il y a des nuances supplémentaires, afin de maintenir le contrôle des créatifs de publicité qui chercheront toujours à faire mieux que leur voisin.


Résultat général :

Un bon exemple parlera de lui même. Je vous invite donc à aller visionner la conférence de Florian Camerer à partir de la 38ème minute.

Lien : https://youtu.be/iuEtQqC-Sqo?t=37m56s

Pour les moins familiers avec l'anglais, le premier extrait présente quelques bouts de programmes (des films, des retransmissions de sport, des reportages, des pubs) étalonnés selon l'ancienne norme de -9 dB de QPPM.

Il présente ensuite les même extraits, cette fois étalonnés selon l'EBU R128.


Ce que l'on constate :

- Ce n'est pas absolument parfait, mais c'est nettement mieux et plus agréable ;

- les programmes les plus surcompressés sont pénalisés, invitant les réalisateurs à nous offrir un peu plus de dynamique

- ce n'est pas non plus la porte fermée à une compression maitrisée, laquelle redevient un outil de créativité, et pas un forcep.


Les modes de lecture :  

il y a 3 modes qui mesurent des périodes différentes et qui vont pouvoir être utilisés aussi bien comme moyen de contrôle pour le sondier qui réalise le programme, que pour les chaines de télévision pour vérifier qu'on est bien "dans les clous".


- Momentary : Moyenne roulante de 400ms, sans tenir compte du gate. C'est ce qui ressemble le plus à l'ancien vu-mètre. Pratique pour avoir un oeil sur le niveau à l'instant-T

- Short term : 3s, toujours sans gate, ça donne une certaine mesure de la dynamique. Pratique pour jauger cette dernière, et vérifier son taux de compression.

- Integrate : Depuis le début du programme, jusqu'à la fin, en tenant compte des deux gates G10 et G70. C'est celui là qui doit être à -23LUFS à la fin du programme sous peine de rejet.


Application aux podcasts et aux sagas MP3

- très avantageux pour les auditeurs qui devraient ne plus trop avoir à pousser ou baisser le volume de leur lecteur

- offre une dynamique controlée, ni trop forte, ni trop faible

- bonnes conditions d'écoute dans toutes circonstances, que ce soit dans le bus que dans son lit.


Mais il semble que les appareils mobiles ne sont pas adaptés pour un niveau d'intensité de -23 LUFS, comme peuvent l'être des téléviseurs.  

Actuellement un consensus semble se dégager autour d'une valeur qui tourne entre -16 LUFS (déjà appliqué par ReplayGain) et -20 LUFS.

Le Max TP à -1 dBTP reste une bonne norme, ça permet de compresser en MP3 sans générer de saturation non voulue.


En vérifiant quelques titres, il semblerait qu'iTunes et Spotify semble appliquer une valeur de -10 LUFS (et un LRA de 4.2 LU) donc assez fort, tout de même.

Youtube semble plus mesuré et appliquerait une valeur de -14 LUFS (et un meilleur LRA de 9.4)


(Evidemment, ils ne donnent pas leurs process, c'est une estimation réalisée en mesurant des échantillons)


A noter que d'une manière générale iTunes recommande d'utiliser -16.7 LUFS même si ce n'est pas encore très visible dans les faits.

Par ailleurs, certains producteurs de CD commencent à recommander -16 LUFS


On peut donc imaginer que les podcasteurs et les réalisateurs de saga MP3 se mettent d'accord un jour pour proposer leurs programmes dans une norme proche de -16 LUFS et un LRA d'une dizaine de LU's.

Ça nécessitera certainement quelques discussions préalables, mais si tous les lecteurs de ce billets commencent à appliquer ces normes, gageons que le mouvement fera tâche d'huile pour le plus grand bonheur de nos oreilles.


Les outils :

Il existe pas mal d'outils payants, mais il en existe aussi pas mal de gratuits.

En général ce sont des plugins que l'on va installer sur le master de notre Station de Travail Audio Numerique (STAN ou DAW) et qui sont avant tout des outils de mesure.

On les active, on lance la lecture de notre mix ou de notre enregistrement de podcast et on lit les valeurs affichées, notamment l'integrated qui sera la valeur de toute l'émission, et le LRA qui donnera une idée de la dynamique de tout le programme.

Sur cette base, on peut décider de revoir le niveau général ou le taux de compression dans un compromis qui nous conviendra, selon nos critères artistiques, et qui conviendra aux auditeurs, selon leurs critères subjectifs et techniques, d'appareil employé ou de conditions d'écoute.


Je liste ici quelques plugins gratuits :


- TP Pro Audio dpMeter http://www.tb-software.com/TBProAudio/dpmeter.html win/mac testé sur Reaper, cubase, nuendo, wavelab, FL studio, PT

- ToneBoosters tb-ebuloudness http://www.toneboosters.com/tb-ebuloudness/ mac/pc. Moi je l'aime bien celui là. Il a une version payante, mais la gratuite est déjà sympa.

- Steinberg SLM128. Apparement ne fonctionne que sur Cubase/Nuendo http://www.steinberg.net/en/support/unsupported_products/slm_128.html

- Linux : ebumeter http://kokkinizita.linuxaudio.org/linuxaudio/ Semble marcher avec Audacity... Linux

- ffmpeg R128Gain http://r128gain.sourceforge.net/


A noter qu'Adobe Audition CS6 gère l'EBU R128 en interne (et permet la normalisation automatique, ce qui peut être pratique pour normaliser plusieurs podcasts ou épisodes en une passe)

pour Reaper, je n'ai pas vu d'annonce, mais il semble que ça soit au programme d'une prochaine version

Pour Audacity, je n'ai pas encore trouvé de plugin, mais j'ai pu voir que sous Linux, ebumeter fonctionnait.


D'autres solutions à tester : Orban Loudness Meter, AC-R128, HOFA 4U Meter, Fader & MS-Pan


Et tous les autres plugs et programmes payants...

 

References et bibliographie :

ITU R BS 1770-2 : https://www.itu.int/dms_pubrec/itu-r/rec/bs/R-REC-BS.1770-2-201103-S!!PDF-E.pdf

EBU R128 : https://tech.ebu.ch/docs/r/r128.pdf

Conference de Florian Camerer : https://www.youtube.com/watch?v=iuEtQqC-Sqo

Résumé en Français par l'AES. Tellement limpide que je me demande pourquoi j'ai écrit ce papier : http://aesfrance.info/index.php/broadcast/29-le-loudness

Analyse d'Itunes, Spotify et Youtube : http://www.audiohotshot.nl/ebu-r128-on-itunes-spotify-and-youtube/