发信人: champaign (原野), 信区: ECE
标  题: 浅谈MPEG-4国际标准
发信站: 哈工大紫丁香 (Fri Oct 22 08:41:11 1999), 转信

发信人: chuming (xixi), 信区: image
标  题: 浅谈MPEG-4国际标准
发信站: 饮水思源站 (Wed Jun 24 15:14:41 1998) , 转信

一、概述 

     MPEG(Moving Pictures Experts Group,运动图片专家组)是在ISO(国际标准化组织)和
IEC(国际电工委员会)内运作的一个工作组。自从1988年开始活动以来,MPEG已经编制了ISO /IEC
11172(通常所说的MPEG-1)和ISO/IEC 13818(通常所说的MPEG-2)国际标准,其中包括用
于服务器和网络会话的标准协议DSM-CC(Digital storage media command and control,数
字存储媒体命令与控制)。 

     这些标准已获得产业和服务供应商的广泛支持,并且引起了一场数字革命,使得更加普及
的交互式媒体得以迅速发展。目前,MPEG将研究重点转向了交互性更加高级的形式,在未来的
几年里,技术的发展将使这种高级形式成为可能。这就是MPEG-4课题的目标,该课题预计在1
998年底完成,该项目的完成可使用户达到关于音频视频内容交互性的多种形式,以及以一种
整体的方式将人工的和自然的音频和视频信息溶合在一起。 

     MPEG-4技术包含两个主要部分:视听对象的编码工具集和描述编码工具和编码对象的句
法语言(syntatic language)。从技术的观点看,与传统编码标准最显著的不同是:接收者可
以下载用于表示视听信息的语法描述,并且具有很快被VLSI(超大规模集成)技术所支持的特 点。 

     MPEG-4是一个正在制定的国际标准,它支持用于通信、访问和数字视听数据处理的新方
法(特别是基于内容的)。考虑到低损耗、高性能技术提供的机会和面临迅速扩展的多媒体数
据库的挑战,MPEG-4将提供灵活的框架和开放的工具集,这些工具将支持一些新型的和常规的
功能。由于快速发展的技术使得工具软件的下载极为便利,因此这种方式极具吸引力。 

     本文将介绍MPEG-4的特点以及由MPEG-4支持的功能、MPEG-4的结构和一些潜在的应用,
还将介绍制定该标准的工作计划。 

                                       二、特点及其功能 

     1.MPEG的特点 

     远程通信、计算机和电视/电影工业之间的传统界限极为模糊。历史上原本属于某一领
域的内容现已渗透到其他两个领域中。视频、声音和通信已进入计算机;交互性进入了电视
;视频和交互性则进入了远程通信领域。 

     看起来像一种聚集,实际上并非如此。这三种行业是从不同的技术角度来研究音像应用 的。 

     在当今世界,应对三种主要趋势予以关注: 

     ● 向无线通信发展的趋势; 

     ● 向交互式计算机应用发展的趋势; 

     ● 视听数据的综合应用不断增长的趋势。 

     对于传统意义上区分的各行业间的交叉,应综合考虑这三种趋势;目前的标准和正在制定
的标准没有充分涉及这些新的需求。而MPEG-4的重点就是解决这些需求,即综合三种行业的
通用应用,以提供便于交互的音频-视频编码、高压缩比和通用访问能力。为了采用迅速发展
的相关技术的优点,MPEG-4标准将保证高度的灵活性和扩展性。 

     基于内容的交互性包括人与音像画面中有意义的对象相互作用的能力。目前,这种交互
作用局限于计算机图形,即人工合成的内容。对于新的交互式音像应用,能够提供与自然的、
人工的及自然/人工混合的音像对象的相互作用极为重要。 

     为了有效使用存储空间和传送带宽,需要有较高的压缩比。对于低比特率的应用,改善压
缩效率非常重要。 

     通用访问能力是指对有用的音像数据的访问可以在存储和传送媒体的很大范围内进行。
鉴于移动通信的迅速崛起,通过无线网络进行这种应用的访问尤为重要。 

     高度的灵活性和可扩展性由句法描述语言来保证,这种句法描述语言称为‘MPEG-4句法
描述语言’(MSDL)。MSDL将在下面介绍。 

     目前的视听标准是为从照像机和麦克风获取的自然内容的编码重现而设计的。由于上述
三个领域的相互渗透,人工内容的应用在不断增长。因此,很显然的需求是一种既适合于自然
对象又适合于人工对象的模式,它能够用来产生单一的音像序列。 



     2.功能 

     a.新的或改进的功能 

     下述8个关键的功能是MPEG-4新的特点,可以认为现存的或其他正在制定的标准不能完全
支持MPEG-4,这些功能由编码工具和MSDL的组合来支持。当特定应用需要时,灵活的MSDL允许
使用不同的编码工具来提供这些功能的不同组合。 



     这些功能如表1所述,在表1中根据它们是否涉及基于内容的交互性、压缩比或通用访问
能力进行了分组。 

     b.其他标准的功能 

     除上述新的或改进的功能外,还有几种其他的重要功能,需要用它来支持已预见到的音像
应用。与新的或改进的功能所不同的是,下面所列的功能已由现行的或其他正在制定的标准
提供。 

     ● 同步———对所表示的音频、视频和其他内容数据进行同步的能力; 

     ● 辅助数据能力———为二进制数据比特流分配通道的能力; 

     ● 虚拟通道分配的灵活性———动态地重新分配视频、音频或数据通道的能力; 

     ● 低延迟模式(端对端或解码器)———对系统、音频和视频编码进行低延迟操作的能 力; 

     ● 用户控制———支持交互操作中用户控制的能力; 

     ● 传送媒体交互运作———在各种媒体上进行运作的能力; 

     ● 与其他音像系统的交互运作———与各种类型的终端相互作用的能力; 

     ● 多点能力———具有多源或多目的地的能力; 

     ● 安全———提供密码、鉴别和密钥管理的能力; 

     ● 内容———对各种类型的可视画面和音频内容进行编码的能力(高的和中等质量的
音频、宽带、窄带、智能和人工语言及人工音频); 

     ● 格式———对各种 

     格式的音频和视频进行编码的能力; 

     ● 质量———对解码的音频或视频质量的评估。 

                                      三、MPEG-4的结构 

     MPEG-4结构将为特定问题提供完整的解决方案,并且具有对最新的音像编码技术进行灵
活复制的能力。从过去MPEG的经验看,预计MPEG-4由4个不同的部分组成:MPEG-4句法描述语
言、工具、算法和轮廓。这些部分如下图所示: 



     1.MPEG-4句法描述语言(MSDL) 

     MPEG-4句法描述语言的目的是便于工具、算法和轮廓的选择、描述和下载,以及描述如
何分析和处理基本的数据流。MSDL将提供解决下述有关方面的途径: 

     ● 协商解码器的配置,该结果将决定轮廓; 

     ● 描述轮廓:各组成部分以及这些组成部分间的链接; 

     ● 在非特定机器语言中下载丢失部分,特别是在音像应用中; 

     ● 用与所选择的轮廓相一致的语法和语义来传送数据(音像和其他)。 

     2.工具 

     工具是一种通过MPEG-4句法描述语言或使用MSDL描述的语言来访问的技术。它可通过软
件或硬件来实现。 

     工具示例:运行补偿和形状表示。 

     3.算法 

     算法是提供一个或多个功能工具的有机组合。 

     算法示例:MPEG-1音频,MPEG-1视频和MPEG-2系统。 

     4.轮廓 

     轮廓是以特定的方式限定的一个算法或一组算法,用以解决一组特定的应用问题。 

     轮廓示例:MPEG-2 at Main Profile@ Main Level。 

     5.哪些内容需要标准化 

     以特定的方式可以将其下载到MPEG-4终端上的部分不需要标准化。按照MPEG的经验,下
一步很可能就是对MPEG-4句法描述语言、一些工具和一些轮廓的标准化。虽然不必对所有的
应用规定轮廓、算法甚至工具。但在轮廓级别范围内,下列应用是必须进行标准化的: 

     ● 某些应用需要解码器开启与声音和图像重放之间的延迟尽可能的短;标准化的轮廓
保证最快的开启。 

     ● 某些应用使用了有限的易出错的传送资源,如无线网络。 

     ● 下载花费时间较长,在临界阶段差错风险率较高。 

     ● 尽管软件和硬件技术在发展,但那些费效最好的终端的生产仍然要求专门的编码硬
件和特定软件平台。 

     通过使用下载,MPEG-4标准将支持使用不在标准中出现的工具、算法和轮廓。 

                                         四、应用示例 

     下面介绍得益于MPEG-4提供的新功能的三类应用示例,使人们对在今后的产品中如何使
用这些功能有所了解。表2列出了基本的(即要实现的)和可选择的(即用于某些特定应用的)
三种应用示例的功能。基本的/现的用‘E’表示可选择的用‘O’表示 

     1.音像数据库访问 

     这一类应用包括检索、处理、表示和音频、视频数据的存储。通过各种各样的无线和有
线传输媒体,可以对一个通用数据库进行本地(如:从固态存储器)或远程访问。 

     示例: 

     ●音像终端,如专用数字辅助设备(PDA),用于支持电子新闻、电子黄页和移动信息的低
容量网络(如:将来的蜂窝PSTN)。 

     ●固态存储器上的视频存储,用于便携机上的播放/录制 

     ●来自交互式视频目录的电视商场。 

     2.音像通信和处理 

     这一类应用包括有线或无线通信系统提供常规的人之间的服务。该类应用还包括传送和
检索音像信息的方法。基本内容的功能能进行新型的交互,如:改进用户可选择区域的质量。 

     示例: 

     ●可视电话 

     ●多点可视会议系统 

     ●可视应答器 

     ●可视e-mail 

     3.远程监视和控制 

     这一类应用包括在宽比特率的网络上使用照像机和麦克风。为了有效地传送和存储监控
的音像数据需要高的压缩比。 

     示例: 

     ●建筑物、工地的安全监控等 

     ●车辆交通监控 

                                     五、MPEG-4工作计划 

     MPEG-4将研制并证实标准中的MSDL、工具、算法和轮廓。MPEG-4标准将提供其他相关信
息,这些内容是全面地解决实际应用问题所需要的。工作计划分为设标阶段(1996.1结束)和
联合研制阶段。 

     在联合研制阶段,将吸收投标阶段的结果以制定出最佳标准,即研制灵活和可扩充的MPE
G-4句法描述语言、音像编码工具、算法的轮廓的初始集合。 

     目前,MPEG-4标准的研究已经产生了MSDL的工作组文件(WD),计划1997年7月形成WD的最
后版本,1997年11月形成委员会草案(CD),1998年3月形成国际标准草案(DIS),1998年11月形
成正式国际标准(IS)。我国已将MPEG-1标准转化为我国国家标准(等同采用),MPEG2也已列入
今后两年的国家标准制定计划,我们将密切关注MPEG-4标准的研制动态,适时地将其转化为我
国国家标准。 

--
※ 来源:·饮水思源站 bbs.sjtu.edu.cn·[FROM: www]

--
☆ 来源:.哈工大紫丁香 bbs.hit.edu.cn.[FROM: champaign.bbs@bbs.sj]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:2.545毫秒