Encoder un CD audio est un acte tellement simple qu’on oublie souvent comment cela fonctionne et par conséquent comment le faire correctement. Voici donc un petit guide pour comprendre un peu mieux le jargon audio-numérique et faire un encodage digne de ce nom.

1. Définitions

Un son est une onde, on peut la visualiser graphiquement comme une courbe dans le temps. Un ordinateur ne sait pas construire une courbe, il ne sait faire que des lignes droites, en largeur (x) ou en hauteur (y), jamais en biais. L’onde se transforme donc en graphique ressemblant a un escalier comme le montre ce petit graphique (en rouge le signal sonore source, en noir le signal encodé).

Signal sonore (rouge) Signal encodé (noir)

Pour obtenir une courbe, il doit donc décrire de très petites « marches » afin de coller le plus possible au signal original. La taille et la précision de ces marches dépend toujours de 3 paramètres : la fréquence d’échantillonage (sampling rate), le débit binaire ou compression (bit rate) et la quantification (bit depth). Tout cela permet d’obtenir un signal plus ou moins fidèle au son original.

La fréquence d’échantillonage détermine le nombre d’échantillons lu par secondes. À 44100Hz, une valeur de quantification sera donnée ou lue 44100 fois par secondes. Cela correspond aux lignes horizontales.

La quantification est en quelque sorte la résolution du son, exprimée en bits. Cela correspond aux lignes verticales.

Le débit binaire détermine le taux de compression du fichier. A 192kbps (kilo bits par seconde), chaque seconde comprendra 192000 bits de données ni plus, ni moins. Plus cette valeur est basse, plus la qualité sera médiocre et plus le fichier sera petit. Cela détermine la précision des valeurs à utiliser pour déterminer les coordonnées de chaque lignes. Pour encoder un fichier on peut utiliser un débit constant (CBR) ou un débit variable (VBR). En VBR le débit varie en fonction de la complexité du signal, en CBR, le débit est toujours le même.

Le type de signal correspond au nombre de voies utilisées: le mono utilise une seule voie, la stéréo deux, surround six à huit (5.1, 6.1, 7.1) etc. Il existe deux type différentes d’encodage stéréo: normale (ou dual stéréo) et stéréo jointe. Le dual utilise constamment deux voix indépendantes (gauche et droite). Au contraire, quand le son est identique entre les deux canaux, la fonction d’encodage stéréo jointe encodera les deux voies en un son mono. Il est préférable d’utiliser ce mode pour des débits inférieurs à 224 kbps

Lossy est une technique d’encodage particulière qui altère la source afin de se débarrasser des informations sonores inutiles (fréquences inaudibles, silences etc.). Les plus connus sont ogg (libre), mp3 et aac (commerciaux).

Lossless est une méthode d’encodage sans pertes, qui conserve tout la qualité du signal original. Par conséquent les fichier lossless prennent bien plus de place que les fichiers lossy. Les formats lossless les plus connus sont flac (libre), wav et alac (commerciaux).

2. Encodage

Un CD audio contient des fichiers cda encodés à 1411.2kbps, 44100Hz, 16bit dual-stéréo. Pour obtenir un fichier de la meilleure qualité possible, il faut donc coller un maximum à ces données.

Le minimum vital lors de l’encodage est de conserver l’échantillonnage et la quantification (44100Hz, 16 bits). Encoder un CD à 48000Hz est totalement absurde. Prenons un exemple: écrivez une phrase, un mot tous les 10cm, puis lisez chaque mot tous les 13cm, la phrase perd tous son sens, encoder un CD 44100Hz à 48000Hz c’est pareil. Encoder à plus de 16 bits est tout aussi inutile.

Au niveau du débit, tout dépends du codec utilisé, de la qualité, de la taille désirée et de l’utilisation prévue pour le fichier. Pour un codec « lossy », ogg vorbis est parfait à 192kbps, vous aurez beaucoup de mal à entendre la différence avec le fichier original.

Pour un codec « lossless » comme flac, peu importe: le résultat est toujours parfait. Mais il faut néanmoins respecter l’échantillonnage et la quantification.

Si vous compter éditer une piste après l’encodage, il est très conseillé d’utiliser un format lossless. En effet si vous utilisez un format lossy, le fichier sera re-compressé à chaque enregistrement, et vous perdrez ainsi énormément en terme de qualité. Ne réencodez jamais un format lossy vers un autre (ou le même) format lossy.

Si vous utilisez un format lossy, à moins de 224kbps utilisez la stéreo jointe pour gagner en place.

3. Pour résumer

Votre encodeur de CD doit respecter au minimum les paramètres suivants pour obtenir la meilleure qualité:
– Sampling rate: 44100Hz
– Bit depth: 16 bits

En options:
– Stéréo-joint (si le bitrate est inférieur a 224kbps), stéréo normale si supérieur à 224kbps, mono si la source est en mono.
– Débit binaire variable (VBR) dont les valeurs sont à ajuster en fonction des besoins.
– Lossless pour réédition future, pour archivage ou si comme moi vous êtes paranoïaques.