图像编码也称
图像压缩,是指在满足一定质量(
信噪比的要求或主观评价得分)的条件下,以较少比特数表示图像或图像中所包含信息的技术。
1948年,信息论学说的奠基人香农曾经论证:不论是语音或图像,由于其信号中包含很多的冗余信息,所以当利用数字方法传输或存储时均可以得到数据的压缩。在他的理论指导下,图像编码已经成为当代信息技术中较活跃的一个分支。经过近半个世纪的努力,图像编码技术已从实验室走入通信和电子领域。
模拟图像信号的数字化和相应的图像频带压缩技术。模拟图像信号数字化是对信号在时间上抽样、幅度上分层并转换为数码的过程。这一典型的数字化过程大大增加对传输信道容量的要求。因此,在
图像数字化的同时,往往必须进行频带压缩。只有将
图像数字化后对传输信道容量的要求降低到接近于、甚至小于图像模拟传输时的数值,图像的数字传输才有可能得到广泛应用。
收信端重建图像的质量,用相对于原始图像的失真来衡量。失真的客观量度,一般用原始图像样值与经过图像编码后在收信端重建图像样值间的
均方误差表示。失真的主观度量是人的视觉感受,它是对再生图像质量有决定意义的评价。在研究图像编码时,往往同时采用主观和客观失真度量。
活动图像可看成是由
平面坐标i,j以及时间坐标t决定的
三维空间内的亮度分布。同一平面内相邻像素(亦称
像元)间以及相邻时间的各帧像素间存在相关性,因而
数字图像信息具有冗余度。实现图像编码的基本途径是通过对图像信号样值去相关来消除信息的冗余度。这也就是利用图像信号样值间的相关性来实现图像的频带压缩。
图像编码的指标由平均每个样本的编码比特数来衡量,这一数值的降低取决于编码方案是否能充分地去掉相关性。由于实际图像是一个非
平稳过程,它的局部统计相关性随着图像各局部内容细节及活动量而变化。自适应图像编码能够根据图像局部统计相关性的变化,自动采用不同的参数甚至在不同的图像编码方案间切换,从而做到充分去除图像每一局部范围内的相关性。
频带压缩后的图像信号降低了信息冗余度,但一旦当信道产生误码,传输的信息就容易受到破坏。因此,图像编码的总性能应该用重建图像主客观失真、平均每样本编码比特数以及对信道误码灵敏度来表示。它们之间往往是相互制约的。
图像编码系统的发信端基本上由两部分组成。首先,对经过高精度模-数变换的原始
数字图像进行去相关处理,去除信息的冗余度;然后,根据一定的允许失真要求,对去相关后的信号编码即重新码化(图1)。一般用线性预测和
正交变换进行去相关处理;与之相对应,图像编码方案也分成预测编码和变换域编码两大类。
预测编码利用线性预测逐个对图像信息样本去相关。对某个像素S0来说,它用邻近一些像素亮度的
加权和(
线性组合)┈作为估值,对S0进行预测(图2a)。S0与┈之间的差值e(u)就是预测误差。由于相邻像素与S0间存在相关性,差值的统计平均
能量就变得很小。因此,只需用少量数码就可以实现
差值图像的传输。 图像预测编码(差值脉码调制)主要有三种预测方法。①
一维固定预测(一维差值脉码调制):用图2a中的S1或S2对S0预测,加权系数固定并且小于1。②二维固定预测(二维差值脉码调制):当预测估值取S1和S2的平均时,称之为二维平均预测,而当预测估值取┈=S1+S2-S3时,称之为二维平面预测。③条件传输帧间预测(帧差脉码调制):用前一帧同一平面位置的像素作为预测估值。对于只有少量活动的图像(如可视电话),画面中约有百分之七十以上的帧间差值等于零或很小,因此这些差值可舍弃不传。由于帧间差值的传输以其幅度是否大于某个阈值为条件,又称为条件传输帧间预测。
用
一维、
二维或三维
正交变换对一维n、二维n×n、三维n×n×n块中的图像样本的集合去相关,得到
能量分布比较集中的变换域;在再码化时,根据变换域中变换系数能量大小分配数码,就能压缩频带。最常用的
正交变换是
离散余弦变换(DCT),n值一般选为8或16。三维正交变换同时去除了三维方向的相关性,它可以压缩到平均每样本1比特。 图像编码可应用于基本静止图片的数字传输、数字电视电话会议以及数字彩色广播电视。相应的压缩目标,即传输数码率范围,初步定为64
千比特/秒、2兆比特/秒、8兆比特/秒和 34兆比特/秒级。虽然压缩性能较高的图像编码方案需要进行复杂的多维数字处理,但随着数字大规模集成电路的集成度和工作速度的提高,以及大容量传输信道的实现,
数字图像传输必将逐步从实验方案进入实用阶段。