视频压缩通常被认为是数字格式特有的属性,但早在模拟年代,压缩就存在了。只不过自此之后,压缩技术变得越来越高级了。本文中,我们将一起回顾一种早期的压缩策略:4:2:2、4:1:1和4:2:0色度子采样。
策略
视觉专家长期以来都清楚,人眼对亮度分辨率的敏感度高于对色彩分辨率:
这成为了早期模拟与数字压缩形式的核心驱动力。视频信号会被分成一个明亮或“亮度”(luma)分量,以及两个色彩或“色度”(choma)分量,这类似图像被分成红绿蓝(RGB)三个分量。相对RGB,亮度和色度分量随后被称为YUV(模拟)或YCbCr(数字)。
分量被分离后,色度分辨率就会通过一个叫做“色度子采样”(chroma subsampling)的过程被减半,甚至减更多。最终结果是得到一个,在相同广播带宽上,显得有更多细节的视频信号,因为亮度分量占据了该视频信号的更大比例。
这种技巧同时执行起来也相对简单,并且不需要快速处理器来解码。出于这些原因,这种压缩策略一直以来都很成功,并延续至今。
工作原理
早期的显示设备通过逐行扫描每行像素来显示图像,通常顺序是快速连续地从上到下扫描。每一行扫描完成后,色度值的发送频率会低于亮度值。
尽管现代显示设备并不全以这种方式工作,但扫描线的概念仍然很重要,因为色度子采样类型是按垂直分布划定的。每一种类型通常被列为一个比例,这个比例是当一行像素被扫描时,所发送的亮度值和色度值的速率之间的比例。这里比例一般基于4个亮度值,书写形式是4:X:Y,其中X和Y是一个概念化的4×2的像素块里,有多少排色度值的相对数量。下方的例子展示了对于一个简单的4×2像素图像,这些比例如何影响分辨率:
4:4:4
4:2:2
4:1:1
4:2:0
使用标准命名法的话,4:2:2的意思是,每条水平扫描线的每4个亮度值有2个色度值。同理,4:1:1的意思是,每发送4个亮度值就发送1个色度值,而4:4:4的意思是,没有色度子采样。
但是,这种采样规律并不是完全一致的。4:2:0的意思是,对于每4个亮度值,第一个色度分量是2,第二个色度分量是0,但这不会生成全色彩图像。实践中,4:2:0反而意味着,每条扫描线有两种色度采样,但它们只会隔行出现。
相对色彩分辨率 | ||
---|---|---|
垂直 | 水平 | |
4:2:2 | 完整 | 1/2 |
4:1:1 | 完整 | 1/4 |
4:2:0 | 1/2 | 1/2 |
压缩伪影
由于色度子采样会切实降低色彩分辨率,压缩伪影在鲜明的色彩过渡边缘附近是最明显的。下面的例子显示了一个简单的8×8像素图像中压缩伪影看起来是什么样子:
4:2:2
4:1:1
4:2:0
这种净效应通常是微妙细节中色彩饱和度的降低。虽然这通常不会在大规模显示对象中降低饱和度,但若这些显示对象包含精细的色彩图案,那么压缩伪影还是会很显著。下方这个彩色的天花板图案尤其容易出现压缩伪影:
原图
4:2:0
4:1:1
4:2:2
然而,这种效果的强弱主要取决于细节的类型。下个例子包含了间隔紧密但颜色近似的屋顶瓦片,它呈现了一种更微妙的差异:
原图
4:2:0
4:1:1
4:2:2
对于上面的每一种设置,请特别注意看图像顶部屋顶的红色边缘、直立的红色烟囱、红色窗户边缘以及高处和低处屋顶斜的瓦片。最显著的伪影可能是这些区域变低的色彩饱和度。另外请注意看各种不同设置对垂直和水平的色彩细节产生了怎样不同的影响。
探讨
虽然色度子采样从视频问世早期开始就是一种简单而有效的压缩方式,但它也造成了明显的伪影。视频发展以来,数字技术已经变得越来越高级。子采样利用的是一种简单的对图像色彩分辨率的削减,而现代编解码器可以分析图像内容,并决定如何为细节制定优先级。比如,数字技术中,对于亮度较低的区域,更低的饱和度和更粗糙的细节会以不同方式处理。
消费者也已经变得越来越有辨识力,并且对图像质量的期待越来越高。因此,使用优于DVD和蓝光所使用的传统的4:2:0压缩已经成为了如今的趋势。从根本上看,将完整的4:4:4数据传输到一个现代数字编解码器中才能充分利用图像,才有可能实现肉眼可见的图像质量提升。
出处:RED
翻译:LorianneW | 盖雅翻译小组