Glossary Term

Octet

Back to Glossaire Index

1 category

L'octet : unité fondamentale du stockage numérique, architecture binaire, conversion des bases et impact en traitement du signal audio

Un **octet** (byte en anglais) désigne l'unité de mesure fondamentale de la quantité d'information et de la capacité de stockage au sein de l'architecture des systèmes informatiques. Par définition, un octet est une structure composite immuable constituée d'une séquence ordonnée de **8 bits** (binary digits). Le bit représentant l'élément de mémoire quantique minimal capable de prendre deux états logiques exclusifs (0 ou 1), un octet permet d'encoder mathématiquement un ensemble de $2^8$, soit **256 valeurs distinctes** (comprises entre 0 et 255 en notation décimale). Cette unité matérialise la brique de base pour l'adressage de la mémoire vive (RAM), la structuration des fichiers sur les disques de stockage et la quantification des flux de données transités sur les réseaux.

Historique et standardisation de la longueur des mots mémoire

Le choix d'un groupement standardisé de 8 bits s'est imposé de manière empirique au cours des premières décennies de l'ingénierie informatique, dicté par les contraintes matérielles de traitement des processeurs :

L'origine du terme (1956) : Le concept de byte est introduit par l'ingénieur Werner Buchholz lors des phases de conception de l'ordinateur IBM Stretch. À l'origine, un byte désignait simplement un bloc de bits traité simultanément par le processeur, et sa taille pouvait varier de 1 à 6 bits selon les machines. Le terme français « octet » a été formalisé plus tard pour lever toute ambiguïté sémantique en spécifiant explicitement le chiffre huit.
La désaturation des codages de caractères (1964) : Au début des années 1960, les ordinateurs exploitaient des tailles de mots hétérogènes (6, 7 ou 9 bits). Le codage de caractères standard ASCII d'origine se limitait à 7 bits, permettant d'encoder 128 caractères (suffisant pour l'alphabet anglais sans accent). Pour intégrer les alphabets européens et les caractères de contrôle, IBM impose en 1964 l'architecture 8 bits avec le système d'exploitation de ses ordinateurs centraux System/360. Cette transition s'est généralisée avec l'avènement des microprocesseurs 8 bits historiques (Intel 8080, Motorola 6800).
La pérennité dans les architectures modernes : Malgré le passage des processeurs vers des registres de traitement de 16, 32 puis 64 bits, l'octet est resté la plus petite unité d'information adressable de manière individuelle en mémoire vive. Une architecture 64 bits signifie simplement que le processeur peut traiter simultanément un mot de 8 octets ($8 \times 8 = 64$ bits) à chaque cycle d'horloge.

Architecture mathématique et fonctionnement binaire de l'octet

Un octet s'organise selon une grille de 8 positions binaires indexées de droite à gauche, de la position 0 (le bit de poids faible ou LSB — Least Significant Bit) à la position 7 (le bit de poids fort ou MSB — Most Significant Bit). Chaque position correspond à une puissance de 2 de manière pondérée :

Position du bit	Bit 7 (MSB)	Bit 6	Bit 5	Bit 4	Bit 3	Bit 2	Bit 1	Bit 0 (LSB)
Poids mathématique	$2^7 = 128$	$2^6 = 64$	$2^5 = 32$	$2^4 = 16$	$2^3 = 8$	$2^2 = 4$	$2^1 = 2$	$2^0 = 1$
Exemple de code binaire	1	0	1	0	1	0	1	0

Pour convertir cet exemple de code binaire (10101010) en valeur décimale, on additionne les poids des puissances de 2 dont les bits sont actifs (valeur 1) :

$$\text{Valeur décimale} = (1 \times 128) + (0 \times 64) + (1 \times 32) + (0 \times 16) + (1 \times 8) + (0 \times 4) + (1 \times 2) + (0 \times 1) = 170$$

Le système de conversion Hexadécimal

La manipulation de longues suites d'octets binaires s'avérant fastidieuse, les ingénieurs logiciels et webmasters utilisent préférentiellement la notation **hexadécimale (Base 16)**. Un octet est scindé en deux blocs de 4 bits appelés des **quartets** (nibbles). Chaque quartet, pouvant varier de 0 à 15, est représenté par un caractère unique compris entre 0 et 9, puis de A à F :

Le premier quartet 1010 correspond à 10 en décimal, soit la lettre A en hexadécimal.
Le second quartet 1010 correspond également à 10, soit la lettre A.

L'octet binaire 10101010 s'écrit donc simplement AA en notation hexadécimale (couramment préfixé 0xAA dans les éditeurs de code ou l'intégration CSS des palettes de couleurs).

Multiples de l'octet : la dualité entre normes décimales et binaires

La mesure des volumes de stockage de masse (disques SSD, disques durs externes, clés USB) génère un écart de calcul récurrent entre l'affichage des constructeurs matériels et la réalité lue par les systèmes d'exploitation. Cet écart provient de la coexistence de deux normes d'unités de mesure :

1. Le système décimal normalisé (Norme SI / CEI)

Utilisé par les fabricants de disques et par l'architecture récente de macOS d'Apple. Il applique des puissances de 10 classiques (système métrique) :

1 Kilo-octet (Ko) = $10^3 = 1\ 000$ octets.
1 Mégaoctet (Mo) = $10^6 = 1\ 000\ 000$ octets.
1 Gigaoctet (Go) = $10^9 = 1\ 000\ 000\ 000$ octets.

2. Le système binaire historique (Norme de mesure des OS)

Exploité historiquement par Windows. Il s'appuie sur des puissances de 2, car les bus d'adressage de la mémoire vive fonctionnent de manière binaire :

1 Kibioctet (Kio) = $2^{10} = 1\ 024$ octets.
1 Mébioctet (Mio) = $2^{20} = 1\ 048\ 576$ octets.
1 Gibioctet (Gio) = $2^{30} = 1\ 073\ 741\ 824$ octets.

Cette distinction explique pourquoi un disque dur vendu dans le commerce avec l'étiquette « 1 To » ($10^{12}$ octets) n'affichera que environ 931 Go lorsqu'il est connecté sur un poste Windows, car l'OS calcule le volume en Tébioctets binaires tout en affichant l'abréviation Go.

Impact technique dans le traitement du signal audio et de la MAO

Pour les techniciens du son et les producteurs travaillant au sein de stations de travail audionumériques (DAW comme Logic Pro), la structure de l'octet régit directement la **résolution d'amplitude** (Bit Depth) et le poids des flux audio PCM linéaires non compressés (format WAV ou AIFF) :

Résolution 16 bits (Format CD audio) : Chaque échantillon sonore capturé par le convertisseur analogique-numérique (CAN) est codé sur 16 bits, soit exactement 2 octets. Cette architecture autorise une plage dynamique théorique de 96 dB. Un fichier stéréo génère ainsi un flux continu de 4 octets par échantillon.
Résolution 24 bits (Standard Studio professionnel) : Chaque échantillon est codé sur 24 bits, soit strictement 3 octets. Ce bit depth pousse la plage dynamique à 144 dB, abaissant le bruit de fond numérique sous le seuil de perception acoustique humaine, indispensable pour conserver de la marge (Headroom) lors des phases de mixage audio.
Calcul du débit binaire (Bitrate) : Pour une session standard de Home Studio configurée en 24 bits / 44.1 kHz en stéréo, le processeur doit traiter et stocker un volume constant d'octets calculé ainsi : $44\ 100 \text{ échantillons/s} \times 3 \text{ octets} \times 2 \text{ canaux} = 264\ 600 \text{ octets/s}$ (soit environ 264,6 Ko de données par seconde d'enregistrement).

En bref

Un octet est un bloc de 8 bits capable d'encoder 256 valeurs distinctes, servant d'unité universelle pour l'adressage mémoire et le stockage informatique.
Sa structure binaire se convertit en notation hexadécimale pour simplifier la manipulation des lignes de code au sein des interfaces web.
La normalisation oppose les multiples décimales (Ko/Mo/Go appliqués par Apple) aux multiples binaires historiques (Kio/Mio/Gio exploités par Windows).
En production MAO, l'octet encadre la profondeur d'échantillonnage, une prise de son professionnelle en 24 bits consommant exactement 3 octets par échantillon audio individuel.