影像技术 2007年第1期 图像压缩编码方法综述 孟宪伟,晏磊 (北京大学遥感与GIS, ̄-究所,空间信息集成与3SS-程应用北京市重点实验室,北京 100871) 摘要:本文对图像压缩的几种经典压缩编码方法进行了汇总和分析。介绍了他们的压缩原理和特点,然后对新 一代的编码方法,包括小波变换编码、分形编码和神经网络编码,进行了简要的介绍。指出了各自的优缺点,并对图 像压缩编码方法的发展方向进行了展望。 关键词:图像压缩.,J、波变换;分形;神经网络 中图分类号:TN919.81 文献标识码:A 文章编号:1001-0270(2007)01-0006-03 A Renew of Image Compression Coding Technology MENG Xian—wei,YAN Lei (Peking University,Beijing 10087 1) Abstract:Several typical ways of image coding.删explained in the paper.Then some new generation techniques with fractal。wavelet and artiifcil neuraal network coding are presented. Key Words:Image compression;wavelet transform;fractl;neurala network 引言 近年来,随着数字化信息时代的到来和多媒体计算机技 术的发展,使得人们所面对的各种数据量剧增,数据压缩技 度,数据压缩编码可分为无损压缩编码(或称为无失真压缩 编码)和有损压缩编码(又称为限失真压缩编码)。无损压缩 编码是指解码后的数据与原始数据完全相同,没有任何信息 损失,常用的无损编码方法有哈夫曼编码、算术编码、LZW编 码等;有损压缩编码实施解码后的数据与原始数据有一定的 偏差,恢复数据只是某种失真度下的近似,常用的方法主要 有离散余弦编码(DCT)、差分脉冲预测编码(DPCM)、量化 等;根据所用方法的原理不同,可分为预测编码、统计编码、 术的研究受到人们越来越多的重视。特别是计算机网络技术 的广泛应用,更促进了数据压缩技术和相关理论的研究和发 展。 1图像压缩的发展历程 自1948年提出的电视信号数字化设想后,即开始了图像 压缩的研究,到现在已有50多年的历史。20世纪五六十年代 的图像压缩编码主要集中在预测编码、哈夫曼编码等技术的 研究,还不成熟。1969年在美国召开的第一届“图像编码会议” 标志着图像编码作为一门独立学科的诞生。到了七八十年代, 图像压缩技术的主要成果体现在变换编码技术上,矢量量化 变换编码等。下面我们主要根据第二种分类方法对图像压缩 方法的基本原理和方法进行介绍。 3经典图像压缩方法 3.1统计编码 统计编码又称熵编码,它是对于有不同概率的事件分配 以不同长度的码字,对概率大的事件分配以短的码字,从而 使平均码字最短。统计编码实现事件出现的概率与码字长度 的最佳匹配。典型的统计编码法有哈夫曼编码(Hufifnan)、算 术编码和行程编码等。 (1)哈夫曼编码 编码技术也有较大的发展。80年代末,,J、波变换理论、分形理 论、人工神经网络理论、视觉仿真理论建立,人们开始突破传 统的信源编码理论,图像压缩编码向着更高的压缩率和更好 的压缩质量的方向发展,进入了一个崭新的发展时期。 哈夫曼编码是由哈夫曼在1952年提出的一种编码方法。 2图像压缩的分类 据统计,目前已有30-40多种图像压缩编码算法面世。在 分类上,也存在几种不同的方法。根据对编码信息的恢复程 收稿日期:2006—10—23 6 这种方法是根据信源中各种符号出现的概率进行编码,出现 概率越高的符号为其设计的码字越短,出现概率越小的符 号,则对应的码字越长,从而达到较少的平均码长。理论研究 维普资讯 http://www.cqvip.com
2007年第1期 影像技术 现。与Walsh—Hada删唰变换相比,DCT具有更强的信息集中 表明,哈夫曼编码是接近于信源熵的编码方法。因为哈夫曼 编码较为简单有效,所以得到了广泛的应用。但是产生哈夫曼 编码要对原始数据扫描两遍,数据压缩和还原速度都较慢。 另外哈夫曼编码对于位的增减都反应敏感。 (2)算术编码 能力,并且易于软硬件的实现,正是由于这些优点,DCT已经 成为当前图像压缩中应用最广泛的技术。 (3)walsh—Hadamard变换(WHT)。与DCT相比,wHT的 压缩方面的性能要逊色许多,但由于实现起来算法简单,且 算术编码完全抛弃了用特殊字符代替输入字符的思想。 在算术编码中,输入的字符信息用0到1之间的字数进行编 码,它用到两个基本的参数:符号的频率及其编码间隔。对于 具有简洁的去相关能力,以及特别有利于硬件实现,使得 wHT也成为一种比较流行的算法。 输入的字符信息,算术编码后形成一个唯一的浮点数。算术 编码的特点是,(1)算术编码在自适应模式下,不必预先统计 符号概率;(2)当信源中符号的概率比较接近时,算术编码的 效率优于哈夫曼编码;(3)算术编码的实现比哈夫曼编码复 杂一些。 (3)游程编码 游程编码是相对简单的编码技术,主要思路是将一个相 同值的连续串用一个代表值和串长。在进行图像编码时,定 义特定方向上具有相同灰度的相邻元为一轮,其延续长度称 之为延续的行程,简称为游程。游程的中点位置由前一游程 的中点位置确定,这样就可以由游程来表示图像数据。由于 游程是一个变化的数值,各种长度的游程出现的频率不同, 因此在许多场合下,对游程采用哈夫曼编码进一步压缩,以 进一步去除相关性,提高压缩比。 3.2预测编码 预测编码的理论基础是现代统计学和控制论。预测编码 是根据某一模型利用以往的样本值,对于新样本值进行预 测,然后将样本的实际值与其预测值相减得到一个误差值, 对这一误差值进行编码,如果模型足够好且样本序列在时间 上的相关性较强,那么误差信号的幅度将远小于原始信号, 从而可以用较少的数据类对其差值量化得到较大的数据压 缩结果。现在常用的方法是差分脉冲编码调制(DPCM)法。 利用预测编码的方法压缩图像数据的空间和时间冗余性,这 种方法直观、简捷、易于实现,它的不足在于压缩能力有限。 3.3变换编码 变换编码先对图像进行某种函数变换,从一种表示空间 变换到另一种表示空间,然后在变换后的域上,对变换后信 号进行编码。 目前在图像压缩中经常使用的变换有: (1)Karhunen—Loeve变换(KLT)。它是一种最优变换。 KLT可以有效地去除原始数据的相关性,从而实现高效压 缩。但是由于KLT变换的核不是固定的,是随原始数据而变 的,并且不存在快速算法,限制了它在实际上的应用,一般常 作为其他方法的参照。 (2)离散余弦变换(DCT)。 对于像素间呈现高度相关的典型图像,DCT的性能与 KLT的性能没有实质的区别。DCT的快速实现算法也已经实 4图像压缩的新方法 经典的压缩算法理论已经比较成熟,并且已经出台了基 于DCT等技术的国际压缩标准,妞IPEG、MPEG、H.261等。然 而随着人们对这些传统编码方法的深入研究和应用,也发现 了这些方法的许多缺点,如高压缩比时恢复图像出现严重的 方块效应、人眼视觉系统的特性不易被引入到压缩算法中。 为克服传统压缩方法的上述缺点,人们提出了几种新的编码 方法:基于小波变换的压缩方法、分形压缩方法和神经网络 压缩方法。 4.1小波 小波变换的理论是在20世纪80年代后期兴起的新的数 学分支,他是继Fourier变换后又一里程碑式的发展。小波图 像压缩的基本思想是:对原始图像进行小波变换,转换成小波 域上的系数,然后对小波系数进行量化编码。由于小波变换后 原始图像的能量主要集中在少部分的小波系数上,所以通过 略去某一阈值以下的系数,只保留那些能量较大的系数就可 达到图像压缩的目的。 图像经过小波变换后生成的小波图像的数据总量与原 图像的数据量相等,即小波变换本身并不具有压缩功能。之所 以将它用于图像压缩,是因为生成的小波图像具有与原图像 不同的特性,表现在图像的能量主要集中于低频部分,而水 平、垂直和对角线部分的能量则较少。小波变换的作用是对 图像进行多分辨率分解,即把原始图像分解成不同空间、不同 频率的子图像,分解级数越多,图像的分辨率等级也就越多。 低频部分可以称作亮度图像,水平、垂直和对角线部分可以称 作细节图像。对所得的4个子图,根据人类的视觉生理和心理 特点分别作不同的量化和编码处理。 与传统纯频域分析的傅里叶变换不同,同离散余弦变换 (r)cT)图像编码方法相比,小波变换能够有效地消除方块效 应的存在以及方块效应对后继图像编码的影响,并且还可以 保证在较高压缩比下恢复图像的质量。同时I,J、波变换方法还 能基本上消除蚊式噪声。由于其具有这些优点,所以小波分析 迅速成为图像压缩领域的热点,并取代DCT用于JPEG一 2000、MPEG-4、MPEG一7等新的图像编码标准。 4.2分形 分形的概念是数学家Mande ̄rot于1975年提出的称为分 形的结构一般都存在内在的几何规律性,即“比例自相似 7 维普资讯 http://www.cqvip.com
影像技术 2007年第1期 性”。在一定的标度范围内,对景物图像的局部区域进行放 大,会发现其不规则程度与景物本身是一样的或极其近似 的。分形图像压缩的思想就是利用原始图像所具有的白相似 结束语 小波变换、分形和神经网络作为第二代图像压缩编码 方法,由于具有更高的压缩比和图像恢复质量,受到了人 性,构造一个迭代函数系统(IFS)。利用IFS抽取图像的白相 似性,即用图像中的一个子块经过白仿射分形变换来逼近同 一们越来越多的重视,具有广阔的应用空间,但由于理论还 不完善,在实际应用中还存在许多问题。解决的思路一方 面继续加深理论的研究,寻找提高编码速度、增大压缩比、 图像中的另一子块,达到基于分形的图像压缩目的。 分形理论在图像压缩编码中的应用是一个非常诱人的 研究领域,其主要特点是在获得高压缩比的同时能保持较好 的解码图像质量、运算速度与提高图像分辨率的关系不大, 提高图像质量的改进算法;另一方面,应该走各种编码方 法结合的思路。目前在这方面已经做了一些尝试,取得了 选择适当的分形模型完全可以构造出清晰的边缘细节、解码 过程快捷等。但目前,分形编码还未完全实用化,其主要困难 在于传统空域的分形压缩有很多瓶颈,例如,运算复杂度太 大、收敛过程较难预测和控制、高压缩倍率时的块状效应等。 尽管自动图像压缩算法的改进工作已持续了十几年,但编码 时间、压缩比以及压缩效果仍不够理想,远没有达到分形本 身应该达到的效果,因而,在当前图像压缩编码中还不占主 导地位。为了能真正发挥分形高压缩比的潜力,必须寻求 IFS码算法的突破,找到编码实现的快速算法。 4.3神经网络 人工神经网络在图像压缩中的应用越来越引起人们的 注意,和一些传统的压缩方法相比,人工神经网络技术具有 良好的容错性、白组织性和白适应性,因此在图像压缩过程 中,不必借助于某种预先确定的数据编码算法,神经网络能 根据图像本身的信息特点,自主地完成图像编码和压缩。 目前,在图像压缩中,使用较多的是三层BP (Back2Propagadon)网络,如图所示。将图像先分成n个小块,对 应于输入的n个神经元,压缩后的数据对应于隐含层m个神 经元,m≤n。通过BPiJII练算法,调整网络权重,使重建图像尽可 能地相似于原始图像,经过训练后BP神经网络便可直接用来 进行数据压缩。BP网络用于数据压缩类似于图像的KL变换。 但是,目前人工神经网络的工作原理还不清楚,神经网络 的图像编码方法的研究目前仅处于一个初级阶段,需要解决 的问题还很多,如完善人工神经网络的理论体系,弄清楚神经 网络的工作原理,找到适合图像数据高效压缩,充分利用视觉 信息处理机制的神经网络模型和学习算法。 编码器 译码器 输入(n) 隐层(m) 输出in) 原始图像 压缩结果 解码后的图像 8 很好的效果。 参考文献 [1]黄伟,龚沛曾.图像压缩中的几种编码算法[J].计算机应 用研究,2008,(8). [2]将亚军,朱理.小波变换在图像压缩编码中的应用[J].零 陵学院学报,2004,(11). [3]赵耀,王红星,袁保宗.分形图像编码研究的进展[J].电子 学报,2000,(4). [4]王曙光.分形图像压缩编码的原理与发展趋势[J].福建电 脑,2O04,(9). [5]李振伟等.,J、波图像压缩进展[J].微机发展,2004,(6). [6]何业军,陈永秦.数据编码与压缩技术[J].电信快报, 200l,(6). [7]朱莹,林其伟.小波分形混合图像压缩编码[J].电脑开发 与应用,l6,(1). [8]刘国文等.基于神经网络的几种新的数据压缩方案[J].自 动化技术与应用,2003,(7). [9]朱翔,等.基于白组织特征映射神经的图像压缩[J].计算 机工程,2003,(11). [10]马义德等.一种基于分类的改进BP神经网络图像压缩方 法[J].兰州大学学报(自然科学版),2005,(8). [11]李明水等.分形图像压缩方法研究的新进展[J].工程图 学学报,2004。(2). [12]潘月秋等.图像数据压缩技术的原理及方法[J].齐齐哈 尔大学学报,2004,(12). [13]杨延宁等.轮数字图像压缩编码技术[J].安徽纺织职业 技术学院学报,2003,(9). [14]张连俊,彭荣群.图像压缩编码方法分析[J].中国有线电 视。2004,(18). [15]赵耀等.数据压缩讲座第五讲数据压缩的最新进展 [J].中国数据通信网络,2000,(12)..
因篇幅问题不能全部显示,请点此查看更多更全内容