精华区文章阅读

发信人: yangs (雪白明月照着大地), 信区: HITEA
标  题: 数据压缩技术
发信站: 哈工大紫丁香 (2001年04月30日18:44:55 星期一), 站内信件

   各种媒体信息(特别是图像和动态视频)数据量非常之大。例如:一幅640x480分辨率
的24位真彩色图像的数据量约力9O0kb;一个1O0Mb的硬盘只能存储约 l00幅静止图
像画面。NTSC标准的帧速率30帧/秒，视频信号的传输率约力26.4Mb/s，远近高于
计算机的数据传输速率。对于音频信号，激光唱盘(CD-DA)的采样频率为44.lkHz，
量化位数为16位，双通道立体声，1O0Mb硬盘仅能存储约10分钟录音。目前CD-ROM
数据传输率单速的约为150kb/s(倍速为300kb/s，最先进的3倍速或4倍速驱动器可
以达到45Okb/s以上)，远不能达到传输要求。显然，这样大的数据量不仅超出了计
算机的存储和处理能力，更是当前通信信道的传输速率所不及的。因此，为了存储
、处理和传输这些数据，必须进行压缩。相比之下，语音的数据量较小，且基本压
缩方法己经成熟，目前的数据压缩研究主要集中于图像和视频信号的压缩方面。

　　数据压缩方法种类繁多，可以分为无损压缩和有损压缩两大类。无损压缩利用
数据的统计冗余进行压缩，可完全恢复原始数据而不引入任何失真，但压缩率受到
数据统计冗余度的理论限制，一般为2:1到5:1。这类方法广泛用于文本数据、程序
和特殊应用场合的图像数据(如指纹图像、医学图像等)的压缩。由于压缩比的限制
，仅使用无损压缩方法不可能解决图像和数字视频的存储和传输问题。

　　有损压缩方法利用了人类视觉对图像中的某些频率成分不敏感的特性，允许压
缩过程中损失一定的信息;虽然不能完全恢复原始数据，但是所损失的部分对理解
原始图像的影响较小，却换来了大得多的压缩比。有损压缩广泛应用于语音、图像
和视频数据的压缩。

　　在多媒体应用中常用的压缩方法有;PCM(脉冲编码调制)、预测编码、变换编码
(主成分变换或K-L变换、离散余弦变换MT等)、插值和外推法(空域亚采样、时域亚
采样、自适应)、统计编码(Huffman编码、算术编码、Shannon-Fano编码、行程编
码等)、矢量量化和子带编码等;混合编码是近年来广泛采用的方法。新一代的数据
压缩方法，如基于模型的压缩方法、分形压缩和小波变换方法等也己经接近实用化
水平。

　　经常使用的元损压缩方法有Shannon-Fano编码、Huffman编码、游程
(Run-length)编码、LZW编码(Lempel－Ziv－Welch)和算术编码等。

　　数据压缩研究中应注意的问题是，首先，编码方法必须能用计算机或VLSI硬件
电路高速实现;其次，要符合当前的国际标准。

　　下面介绍三种流行的数据压缩国际标准。

　　1、JPEG－静止图像压缩标准

　　国际标准化组织(ID)和国际电报电话咨询委员会(CCITT)联合成立的专家组
JPEG(Joint Photographic Experts Group)经过五年艰苦细致地工作后，于1991年
3月提出了ISO CDIO918号建议草案:多灰度静止图像的数字压缩编码(通常简称为
JPEG标准)。这是一个适用于彩色和单色多灰度或连续色调静止数字图像的压缩标
准。它包括基于DPCM(差分脉冲编码调制、DCT(离散余弦变换)和Huffman编码的有
损压缩算法两个部分。前者不会产生失真，但压缩此很小;后一种算法进行图像压
缩是信息虽有损失但压缩比可以很大，例如压缩20倍左右时，人眼基本上看不出失
真。JPEG标准实际上有三个范畴:

　　1)基本顺序过程Baseline Sequential processes) 实现有损图像压缩，重建
图像质量达到人眼难以观察出来的要求。采用的是8x8像素自适应DCT算法、量化及
Huffman型的墒编码器。

　　2)基于DCT的扩展过程(Extended DCT Based Process) 使用累进工作方式，采
用自适应算术编码过程。

　　3)无失真过程(Losslesss Process)采用预测编码及Huffman编码(或算术编码
)，可保证重建图像数据与原始图像数据完全相同。

　　其中的基本顺序过程是JPEG最基本的压缩过程:符合JPEG标准的硬软件编码/解
码器都必须支持和实现这个过程。另两个过程是可选扩展，对一些特定的应用项目
有很大实用价值。

　　(l)JPEG算法

　　基本JPEG算法操作可分成以下三个步骤：通过离散余弦变换(DCT)去除数据冗
余;使用量化表对以DCT系数进行量化，量化表是根据人类视觉系统和压缩图像类型
的特点进行优化的量化系数矩阵;对量化后的DCT系数进行编码使其熵达到最小，熵
编码采用Huffman可变字长编码。　　　　　　

　　(2)离散余弦变换

　　JPEG采用8x8子块的二维离散余弦变换算法。在编码器的输入端，把原始图像
(对彩色图像是每个颜色成分)顺序地分割成一系列8x8的子块。在8x8图像块中，像
素值一般变化较平缓，因此具有较低的空间频率。实施三维8x8离散余弦变换可以
将图像块的能量集中在极少数儿个系数上，其它系数的值与这些系数相比，绝对值
要小得多。与Fourier变换类似，对于高度相关的图像数据进行这样变换的效果使
能量高度集中，便于后续的压缩处理。

　　(3)量　化

　　为了达到压缩数据的目的，对DCT系数需作量化处理。量化的作用是在保持一
定质量前提下，丢弃图像中对视觉效果影响不入的信息。量化是多对一映射,是造
成DCT编码信息损失的根源。JPEG标准中采用线性均匀量化器，量化过程为对64个
DCT系数除以量化步长并四舍五入取整，量化步长由量化表决定。量化表元素因
DCT系数位置和彩色分量的不同而取不同值。量化表为8x8矩阵，与DCT变换系数一
一对应。量化表一般由用户规定JPEG标准中给出了参考值)，并作为编码器的一个
输入。量化表中元素为1到255之间的任意整数，其值规定了其所对应DCT系数的量
化步长。 DCT变换系数除以量化表中对应位置的量化步长并合入小数部分后。多梦
变为零，从而达到了压缩的目的。

表3.1和表3.2分别给出了JPEG标准所推荐的亮度量化表和色度量化表。

　16　　11　　10　　16　　24　　40　　51　　61　
　12 　12 　14 　19 　26 　58 　60 　55
　14 　13 　16 　24 　40 　57 　69 　56
　14 　17 　22 　29 　51 　87 　80 　62
　18 　22 　37 　56 　68 　109 　103 　77
　24 　35 　55 　64 　81 　104 　113 　92
　49 　64 　78 　87 　103 　121 　120 　101
　72 　92 　95 　98 　112 　100 　103 　99

　　　　　　　　　　表1 亮度量化表　　　　　　　　　　　　　

　17  　18  　24　　47　  　99　  　99　  　99　　99
　18 　21 　26 　66 　99 　99 　99 　99
　24 　26 　56 　99 　99 　99 　99 　99
　47 　66 　99 　99 　99 　99 　99 　99
　99 　99 　99 　99 　99 　99 　99 　99
　99 　99 　99 　99 　99 　99 　99 　99
　99 　99 　99 　99 　99 　99 　99 　99
　99 　99 　99 　99 　99 　99 　99 　99

　　　　　　　　　　表2 色度量化表

　

　　(4)游程编码

　　64个变换数经量化后，左上角系数是直流分量(DC系数)，即空间域中64个图像
采样值的均值。相邻8x8块之间的DC系数一般有很强的相关性，JPEG标准对DC系数
采用DPCM编码(差分编码)方法，即对相邻像素块之间的L系数的差值进行编码。其
余63个交流分量(AC系数)使用游程编码，从左上角开始沿对角线方向，以Z字形
(Zig-Zag)进行扫描直至结束。

　　量化后的AC系数通常会有许多零值，以Z字形路径进行游程编码有效地增加了
连续出现的零值个数。

　　(5)熵编码

　　为了进一步压缩数据，对DC码和AC行程编码的码字再作基于统计特性的熵编码
。 JPEG标准建议使用的熵编码方法有Huffman编码和自适应二进制算术编码。

　　2、MPEG－运动图像压缩编码

　　MPEG(Moving Pictures Experts Group)是 ISO/IEC/JTC/SC2/WG11的一个小组
。它的工作兼顾了JPEG标准和CCITT专家组的H.261标准，于1990年形成了一个标准
草案。 MPEG标准分成两个阶段:第一个阶段(MPEG-I)是针对传输速率为 lMb/s到
l.5Mb/s的普通电视质量的视频信号的压缩;第二个阶段(MPEG-2)目标则是对每秒
30帧的720x572分辨率的视频信号进行压缩;在扩展模式下，MPEG-2可以对分辨率达
1440Xl152高清晰度电视(HDTV)的信号进行压缩。

　　MPEG算法除了对单幅图像进行编码外，还利用图像序列的相关特性去除帧间图
像冗余，大大提高了视频图像的压缩比，在保持较高的图像视觉效果的前提下、压
缩比可以达到60-100倍左右。 MPEG压缩算法复杂、计算量大，其实现一般要专门
的硬件支持。

　　MPEG标准有三个组成部分:MPEG视频;MPEG音频;视频与音频的同步。MPEG视频
是MPEG标准的核心。为满足高压缩比和随机访问两方面的要求，MPEG采用预测和插
补两种帧间编码技术。 MPEG视频压缩算法中包含两种基本技术:一种是基于l6x16
子块的运动补偿技术，用来减少帧序列的时域冗余;另一种是基于DCT的压缩，用于
减少帧序列的空域冗余，在帧内压缩及帧间预测中均使用了DCT变换。运动补偿算
法是当前视频图像压缩技术中使用最普遍的方法之一。

　　(1)运动补偿预测

　　帧序列的相邻画面之间的运动部分具有连续性，即当前画面上的图像可以看成
是前面某时刻画面上图像的位移，位移的幅度值和方向在画面各处可以不同。利用
运动位移信息与前面某时刻的图像对当前画面图像进行预测的方法，称为前向预测
。反之，根据某时刻的图像与位移信息预测该时刻之前的图像，称为后向预测。

　MPEG的运动补偿预测方法将画面分成若干16x16的子图像块(称为补偿单元或宏块
)，并根据一定的条件分别进行帧内预测、前向预测、后向预测及平均预测。

　　(2)运动补偿插值

　　以插补方法补偿运动信息是提高视频压缩比的最有效措施之一。在时域中插补
运动补偿是一种多分辨率压缩技术。例如以l/15秒或1/10秒时间间隔选取参考子图
,对时域较低分辨率子图进行编码，通过低分辨子图及反映运动趋势的附加校正信
息(运动矢量)进行插值，可得到满分辨率(帧率1/30秒)的视频信号。插值运动补偿
也称为双向预测，因为它既利用了前面帧的信息又利用了后面帧的信息。

　　3、 H.261－视频通信编码标准

　　电视电话/会议电视的建议标准H.261常称为Px64K标准，其中P是取值为 1到
30的可变参数;P=l或2时支持四分之一中间格式(QCIF:Quarter Cmmon
Intermedia Format)的帧率较低的视频电话传输;P>=6时支持通用中间格式(CIF:
Common Intermediate Format)的帧率较高的电视会议数据传输。Px64K视频压缩算
法也是一种混合编码方案，即基于DCT的变换编码和带有运动预测差分脉冲编码调
制(IDPCM)的预测编码方法的混合。在低传输速率时(P=l或2，即64 bit/s或
128Kbit/s)，除QCIF外还可使用亚帧(Sub-frame)技术，即每间隔一帧(或数帧)处
理一帧，压缩比可高达50:1左右。

　　图像压缩技术、视频技术与网络技术相结合的应用前景十分可观，如远程图像
传输系统、动态视频传输一可视电话、电视会议系统等己经开始商品化，MPEG标准
与视频技术相结合的产物一家用数字视盘机和VideoCD系统等都已进入市场。可以
预计，这些技术和产品的发展将对本世纪末到二十一世纪的社会进步产生重大影响
。

--
   * * * * * * * * * * * * * * * * * * *

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.229.252]

HITEA 版 (精华区)