下一代压缩视频标准性能及其技术特征( 二 )


对熵编码部分,对于要传输的量化变换系数,当使用基于上下文的变长编码(CAVLC)时,根据前面已编码传输的量化变换系数值的大小来选择接下来系数编码要使用的变长编码表 。由于变长编码表的设计是基于相应的统计条件,所以其性能要优于使用单一变长编码表 。对其它数据如头信息等,使用一种单一的变长编码表(EXP-Golomb Code) 。
新标准仍然使用基于块的猜测及重构方式,为了去除由此产生的影响图像主观质量的方块效应,H.264使用了去块效应滤波器 。其主要思想是当块边界上两边差较小时,就使用滤波器使差别“平滑”掉;若边界上图像特征明显,就不使用滤波 。这样既是为了减弱“块效应”的影响,又避免了滤掉图像的客观特征,同时在相同主观质量下使得比特率减少5~10% 。
对于图像数据的组织及传输,在H.264标准中的图像宏块能够以灵活的宏块组织顺序(FMO)划分为多个Slice Group;Slice之间相互独立,可以任意的顺序传输到解码端(ASO) 。在比特流中Slice可以使用重复的方式(RS)传输,在Slice数据出错的情况下可用来进行恢复,增强了图像传输的鲁棒性 。同时Slice间的相互独立性抑制了错误的空间传播,提高了比特流的容错性 。
2. Main Profile的技术特征
Main Profile包含Baseline Profile的所有算法并具有额外的技术特征,但它并不支持FMO、ASO及RS等技术,只支持对I、P、B Slice的处理操作 。
在此框架内提出了适配块划分尺寸的变换(ABT)这一概念 。此概念是针对帧间编码的,其主要思想是将对猜测参差进行变换编码的块尺寸与用来进行运动补偿的块尺寸联系起来 。这样就尽可能地利用最大的信号长度进行变换编码 。但是,由于复杂度的原因,进行变换的最大块尺寸被限制在8×8以下 。


对熵编码部分,为更高效地进行编码,这里使用了基于上下文的算术编码(CABAC),使熵编码的性能进一步提高 。与CAVLC相比较,在相同图像质量下,编码电视信号使用CABAC将会使比特率减少10~15% 。
另外,Main Profile不支持多个Slice Group的划分 。
3. 相关的编码问题
如何对已提出的猜测模式进行选择(Mode Decision)和使用运动估计策略(ME)历来都是视频编码实现的重点研究课题 。在H.263标准的实现软件中,对模式的选择是简单的基于对阀值的比较 。在新标准的测试软件中使用了拉格朗日率失真优化策略,它基于使用每种图像块尺寸和每种猜测模式而产生的参差及其传输的码率 。这样,模式选择可以取得优化的率失真性能,但这是以提高运算复杂度为代价的 。此优化操作是对下面拉格朗日函数的最小化:
J=SATD λ·R
式中,R—对应传输各部分的比特率;λ—优化参数(与量化参数有很强的相关性);SATD—经过哈德曼变换的4×4块的猜测参差绝对值总和 。
对于所有帧内、帧间宏块编码模式及多参考帧的选择都通过对拉格朗日函数的最小化来实现 。通常,视频标准只包括解码规范,而模式选择的技术研究是属于编码端的范畴,所以不列在标准之内 。
二 H.264与其它标准的性能比较
为了阐述H.264的编码效率,我们将其与其它标准如MPEG-2、H.263、MPEG-4等作比较 。使用QCIF、CIF格式的图像序列作测试,所有编码器都使用拉格朗日优化技术 。我们使用H.264的测试软件JM2.0并使用了Main Profile的主要技术特征 。对H.263和H.264采用的参考帧数为5,只编码图像序列的第一帧为I帧,每2个参考帧P之间插入2个非参考帧B 。使用全搜索方式进行32×32整数范围的运动估计,且由预先设定的量化参数来进行比特率的调整 。图为对CIF格式的图像序列Tempete在帧率为15Hz时所作的测试比较 。

推荐阅读