Chroma Subsampling
Le Chroma Subsampling (en français « sous-échantillonnage de la chrominance ») désigne une technique de compression vidéo et photographique qui consiste à réduire volontairement la résolution de l’information de couleur (chrominance) tout en conservant la pleine résolution de l’information de luminosité (luminance). Cette stratégie exploite une particularité fondamentale du système visuel humain : nos yeux sont beaucoup plus sensibles aux variations de luminance qu’aux variations de couleur. Il devient donc possible de jeter une partie significative des données chromatiques sans dégradation perceptible, allégeant ainsi drastiquement le poids des fichiers et la bande passante nécessaire au traitement, à l’enregistrement et à la diffusion d’un flux vidéo.
Origine et principe technique
Le sous-échantillonnage de la chrominance trouve ses racines dans la télévision couleur analogique des années 1950, lorsque les ingénieurs ont dû transmettre un signal couleur tout en restant compatibles avec les téléviseurs noir et blanc. Pour cela, ils ont décomposé l’image dans un espace colorimétrique appelé Y’CbCr (ou YUV), composé de trois canaux distincts :
- Y’ (luma) : la composante de luminosité, qui correspond à l’image en noir et blanc.
- Cb (chroma bleu) : la différence entre le bleu et la luminance.
- Cr (chroma rouge) : la différence entre le rouge et la luminance.
Cette séparation est ce qui rend le sous-échantillonnage possible : puisque la luma et la chroma sont stockées séparément, on peut compresser la chroma sans toucher au détail lumineux de l’image. Aujourd’hui encore, la quasi-totalité des codecs vidéo grand public (H.264, H.265/HEVC, AV1, ProRes, DNxHD) reposent sur ce principe.
Comprendre la notation J:a:b
Le sous-échantillonnage chroma est exprimé selon une notation à trois chiffres standardisée par l’UIT-T J.601 (anciennement CCIR 601), de la forme J:a:b. Elle décrit la façon dont les échantillons de chrominance sont distribués sur une matrice de référence de 4 pixels de large sur 2 pixels de hauteur :
- J : largeur de la matrice de référence, conventionnellement fixée à 4.
- a : nombre d’échantillons de chrominance présents sur la première ligne de la matrice.
- b : nombre d’échantillons de chrominance présents sur la seconde ligne de la matrice. Lorsque b = 0, cela ne signifie pas « pas de couleur », mais que les valeurs chroma de la seconde ligne sont identiques à celles de la première.
Les principaux schémas et leurs usages
4:4:4 – Pleine chrominance
Chaque pixel possède sa propre information de couleur complète : aucune compression chroma n’est appliquée. Ce schéma est réservé aux usages les plus exigeants : cinéma numérique, VFX, compositing, tournages sur fond vert (chroma key) de haut niveau, capture d’écran haute fidélité pour le tutoriel ou la captation logicielle. On le retrouve dans les codecs Apple ProRes 4444, DNxHR 444, RED RAW ou les sorties HDMI 2.1 « Full RGB ». Son inconvénient : un poids de fichier et une bande passante très élevés.
4:2:2 – Le standard broadcast et post-production
La chrominance est échantillonnée une fois sur deux horizontalement, mais reste pleine verticalement. Cela représente une réduction de 33 % du volume de données par rapport au 4:4:4, tout en préservant une qualité couleur suffisante pour la quasi-totalité des usages professionnels. Le 4:2:2 est le standard de fait pour le broadcast TV, le mastering, le color grading et la post-production. C’est le format des codecs Apple ProRes 422, DNxHD/HR, XAVC-I, AVC-Intra 100, et il est devenu accessible aux créateurs grâce à des appareils comme le Sony FX3, le Panasonic GH5/GH6 ou la Blackmagic Pocket Cinema Camera.
4:2:0 – Le standard grand public
La chrominance est échantillonnée une fois sur deux horizontalement ET verticalement, ce qui réduit la quantité de données chroma de 75 %. C’est le schéma adopté par la majorité des codecs de diffusion : H.264 / AVC, H.265 / HEVC, AV1, VP9. Tout le streaming (Netflix, YouTube, Disney+), tous les Blu-ray, et la quasi-totalité des fichiers issus de smartphones, de caméras hybrides (mode interne) et de drones grand public utilisent du 4:2:0. La perte de qualité chroma est invisible à l’œil nu sur une image finale, mais devient pénalisante dès qu’on entreprend une post-production lourde.
4:1:1 – Le standard historique DV/HDV
Le 4:1:1 sous-échantillonne la chroma uniquement horizontalement, à raison d’une fois sur quatre. Utilisé historiquement par les formats DV, DVCPRO et NTSC DV25, il est aujourd’hui obsolète mais reste rencontré lors de la numérisation d’archives.
Impact concret sur la production vidéo
Sur le chroma key (fond vert)
C’est l’application la plus sensible au sous-échantillonnage. Le détourage repose entièrement sur la précision de la couleur verte des contours : un fichier 4:2:0 produit des bords crénelés, baveux et difficiles à nettoyer, là où un fichier 4:2:2 (et a fortiori 4:4:4) offre un keying net, propre et exploitable même pour des cheveux ou des éléments translucides.
Sur l’étalonnage (color grading)
Pousser fortement les couleurs d’un fichier 4:2:0 fait rapidement apparaître du banding (effet d’escalier), des dérives chromatiques dans les zones de transition, et des artefacts macroblocs visibles. En 4:2:2, le matériel encaisse des courbes agressives, des virages secondaires et l’application de LUT sans craquer.
Sur le texte fin et les graphismes
Le sous-échantillonnage est particulièrement visible sur les contours rouges, bleus ou orangés. Un sous-titre rouge sur fond noir en 4:2:0 apparaît flou et frangé, alors qu’en 4:4:4 il reste parfaitement net. C’est pourquoi les captures d’écran logicielles, les tutoriels, les motion designs sur fond uni gagnent énormément à être encodés en 4:4:4.
Comment choisir son schéma ?
- Diffusion finale (web, social, télé) : 4:2:0 suffit largement, c’est le standard imposé par les plateformes.
- Tournage destiné à du grading ou du compositing : viser au minimum du 4:2:2 (10 bits si possible).
- Fond vert, motion design, captation d’écran, archivage haut de gamme : 4:4:4 obligatoire, idéalement en 12 bits.
- Tournage smartphone ou drone : généralement bloqué en 4:2:0, sauf à activer les modes ProRes (iPhone 13 Pro et supérieur) ou LOG (DJI, Sony).
Le piège de la profondeur de bits
Le sous-échantillonnage chroma est indissociable de la profondeur de bits (8, 10 ou 12 bits) et du choix du codec. Un fichier H.264 8 bits 4:2:0 issu d’un smartphone n’offre aucune marge d’étalonnage, tandis qu’un fichier ProRes 422 HQ 10 bits tournée en LOG fournit une latitude proche d’un master cinéma. C’est l’association entre codec, profondeur de bits et sous-échantillonnage qui détermine la qualité réelle d’un flux vidéo, et non un seul de ces paramètres pris isolément.
En résumé
Le Chroma Subsampling est l’un des leviers de compression les plus puissants et les plus universellement adoptés de l’image numérique. Comprendre la différence entre 4:4:4, 4:2:2 et 4:2:0 permet de faire les bons choix dès le tournage : économiser de l’espace disque quand le projet ne le justifie pas, ou au contraire investir dans un codec professionnel pour préserver toutes les options de post-production. Pour un créateur ou un monteur, maîtriser cette notion, c’est s’assurer de ne jamais être pris au dépourvu face à un fond vert récalcitrant, à un grading impossible ou à un texte flou inexpliqué.