PDF (adobe.com)

Numérisation des données audio



Comparaison des données audio analogiques et numériques

La transmission et le stockage du son s’effectuent de manières très différentes pour les données audio analogiques et numériques.

Données audio analogiques: tension positive et négative

Un micro convertit les ondes de pression sonores en variations de tension dans un fil électrique : la haute pression devient une tension positive et la basse pression, une tension négative. Lorsque ces variations de tension se déplacent sur un fil électrique, elles peuvent être enregistrées sur bande sous la forme de variations d’intensité magnétique ou sur un disque vinyle sous la forme de variations de la taille du sillon. Un haut-parleur fonctionne de la même manière qu’un micro, mais dans le sens inverse : il capte les signaux de tension émis par un enregistrement audio et vibre pour recréer l’onde de pression.

Données audio numériques : zéro et un

Contrairement aux supports de stockage analogiques tels que les cassettes ou les disques vinyle, les ordinateurs stockent les informations audio dans un format numérique, sous la forme d’une série de 0 et de 1. Dans un enregistrement numérique, la forme d’onde d’origine est divisée en instantanés individuels appelés « échantillons ». Ce processus est généralement appelé « numérisation » ou « échantillonnage » des données audio. Il correspond à une « conversion analogique-numérique ».

Lorsque vous enregistrez à partir d’un micro dans un ordinateur, par exemple, des convertisseurs analogiques-numériques transforment le signal analogique en échantillons numériques que les ordinateurs sont capables de stocker et de traiter.

Compréhension du taux d’échantillonnage

Le taux d’échantillonnage correspond au nombre d’échantillons numériques d’un signal audio pris par seconde. Il détermine la plage de fréquences d’un fichier audio. Plus il est élevé, plus le profil de la forme d’onde numérique sera proche de celui de la forme d’onde analogique d’origine. Des taux d’échantillonnage bas limitent la plage des fréquences qui peuvent être enregistrées, de sorte que le son enregistré peut être très éloigné du son d’origine.

Deux taux d’échantillonnage

A.
Taux d’échantillonnage bas qui altère l’onde sonore d’origine

B.
Taux d’échantillonnage élevé qui reproduit parfaitement l’onde sonore d’origine

Pour reproduire une fréquence donnée, le taux d’échantillonnage doit être au moins deux fois supérieur à cette fréquence. (Voir Fréquence de Nyquist.) Par exemple, les CD utilisent un taux d’échantillonnage de 44 100 échantillons par seconde afin de pouvoir reproduire les fréquences jusqu’à 22 050 Hz, un niveau légèrement supérieur à la limite de fréquence perceptible à l’oreille humaine (20 000 Hz).

Le tableau suivant répertorie les taux d’échantillonnage les plus courants pour le son numérique :

Taux d’échantillonnage

Niveau de qualité

Plage de fréquences

11 025 Hz

Faible qualité radio AM (multimédia bas de gamme)

0-5 512 Hz

22 050 Hz

Comparable à la qualité radio FM (multimédia haut de gamme)

0-11 025 Hz

32 000 Hz

Meilleur que la qualité radio FM (taux de diffusion standard)

0-16 000 Hz

44 100 Hz

CD

0-22 050 Hz

48 000 Hz

DVD standard

0-24 000 Hz

96 000 Hz

DVD haut de gamme

0-48 000 Hz

Compréhension de la résolution

La résolution détermine la gamme dynamique. Lorsqu’une onde sonore est échantillonnée, chaque échantillon se voit attribuer la valeur d’amplitude la plus proche de l’amplitude de l’onde d’origine. Plus la résolution est élevée, plus le nombre de valeurs d’amplitude possibles est important, ce qui augmente la plage dynamique et la fidélité tout en réduisant le bruit de fond. Pour obtenir une qualité sonore optimale, utilisez une résolution de 32 bits lorsque vous transformez des données audio dans Soundbooth et convertissez-les ensuite à une résolution inférieure pour la sortie.

Résolution

Niveau de qualité

Valeurs d’amplitude

Plage dynamique

8 bits

Téléphonie

256

48 dB

16 bits

CD

65 536

96 dB

24 bits

DVD

16 777 216

144 dB

32 bits

Supérieure

4 294 967 296

192 dB

Plus la résolution en bits est élevée, plus la plage dynamique est grande.

Contenu et taille des fichiers audio

Un fichier audio sur disque dur, tel un fichier WAV, est constitué d’un petit en-tête indiquant le taux d’échantillonnage et la résolution en bits, puis d’une longue série de nombres, un pour chaque échantillon. Ces fichiers peuvent être très volumineux. Par exemple, à raison de 44 100 échantillons par seconde et de 16 bits par échantillon, un fichier mono nécessite un espace de 86 Ko par seconde, soit environ 5 Mo par minute. Ce chiffre double à 10 Mo par minute pour un fichier stéréo, qui contient deux canaux.

Méthode de numérisation des données audio utilisée par Soundbooth

Lorsque vous enregistrez des données audio dans SoundBooth, la carte son commence le processus d’enregistrement et spécifie le taux d’échantillonnage et la profondeur de bit (résolution). Via les ports d’entrée de ligne ou de microphone, la carte son reçoit des données audio analogiques qu’elle convertit en données numériques à un taux d’échantillonnage donné. SoundBooth stocke les échantillons dans l’ordre jusqu’à ce que vous interrompiez l’enregistrement.

Lorsque vous lisez un fichier dans Adobe Audition, ce processus se déroule en sens inverse. SoundBooth envoie une série d’échantillons numériques à la carte son. La carte reconstitue alors la forme d’onde d’origine pour l’envoyer vers les haut-parleurs en tant que signal analogique via les ports de sortie de ligne.

En résumé, le processus de numérisation de données audio commence par une onde de pression dans l’air. Un micro convertit cette onde en variations de tension. Ensuite, une carte son convertit ces variations de tension en échantillons numériques. SoundBooth peut alors enregistrer, modifier et traiter ces données audio numériques. Les possibilités sont illimitées. Il vous suffit de laisser libre cours à votre imagination.