动态图像专家组(Moving Pictures Experts Group,简称MPG或MPEG)是运动图像
压缩算法的
国际标准,现已被,由
国际标准化组织ISO(International Standards Organization)与IEC(International Electronic Committee)于1988年联合成立,专门致力于
运动图像(MPEG视频)及其伴音编码(MPEG音频)标准化工作。
发展历史
MPEG的缔造者们原先打算开发四个版本:MPEG1-
MPEG4,以适用于不同带宽和数字
影像质量的要求。后由于MPEG3被放弃,所以现存只有三个版本的MPEG:
MPEG-1,
MPEG-2,
MPEG-4。总体来说,MPEG在三方面优于其他压缩/解压缩方案。首先,由于在一开始它就是作为一个国际化的标准来研究制定,所以,MPEG具有很好的兼容性。其次,MPEG能够比其他算法提供更好的压缩比,最高可达200:1。更重要的是,MPEG在提供高压缩比的同时,对数据的损失很小。
MPEG-1
MPEG-1制定于1992年,为工业级标准而设计,可适用于不同带宽的设备,如
CD-ROM、Video-CD、CD-i。它可针对
SIF标准分辨率(对于
NTSC制为352X240;对于
PAL制为352X288)的图象进行压缩,传输速率为1.5Mbits/sec,每秒播放30帧,具有CD(指
激光唱盘)音质,质量级别基本与VHS相当。MPEG的编码速率最高可达4-5Mbits/sec,但随着速率的提高,其解码后的图象质量有所降低。
MPEG-1也被用于
数字电话网络上的
视频传输,如
非对称数字用户线路(
ADSL),视频点播(VOD),以及教育网络等。同时,MPEG-1也可被用做记录媒体或是在INTERNET上传输音频。
MPEG-2
MPEG-2制定于1994年,
设计目标是高级工业标准的图象质量以及更高的
传输率。MPEG-2所能提供的传输率在3-10Mbits/sec间,其在NTSC制式下的分辨率可达720X486,MPEG-2也可提供并能够提供
广播级的视像和CD级的音质。MPEG-2的
音频编码可提供左右中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道(DVD可有8种语言配音的原因)。由于MPEG-2在设计时的巧妙处理,使得大多数MPEG-2解码器也可播放MPEG-1格式的数据,如
VCD。
同时,由于MPEG-2的出色性能表现,已能适用于HDTV,使得原打算为HDTV设计的MPEG-3,还没出世就被抛弃了。(MPEG-3要求传输速率在20Mbits/sev-40Mbits/sec间,但这将使画面有轻度扭曲)。除了做为DVD的指定标准外,MPEG-2还可用于为广播,
有线电视网,电缆网络以及
卫星直播(DirectBroadcastSatellite)提供广播级的
数字视频。
MPEG-2的另一特点是,其可提供一个较广的范围改变压缩比,以适应不同画面质量,
存储容量,以及带宽的要求。
对于
最终用户来说,由于现存电视机分辨率限制,MPEG-2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显,倒是其音频特性(如加重低音,多伴音声道等)更引人注目。
MPEG-4
MPEG专家组的专家们正在为MPEG-4的制定努力工作。
MPEG-4标准主要应用于视像电话(
videophone),视像
电子邮件(VideoEmail)和电子新闻(Electronicnews)等,其传输速率要求较低,在4800-64000bits/sec之间,分辨率176X144。
MPEG-4利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最少的数据获得最佳的图象质量。
与MPEG-1和MPEG-2相比,MPEG-4的特点是其更适于交互AV服务以及
远程监控。MPEG-4是第一个使你由被动变为主动(不再只是观看,允许你加入其中,即有交互性)的动态图象标准;它的另一个特点是其综合性;从根源上说,MPEG-4试图将
自然物体与人造物体相溶合(视觉效果意义上的)。MPEG-4的设计目标还有更广的适应性和可扩展性。
MPEG工业
MPEG问世数年来,给计算机和家电产业带来的冲击是巨大的。各种基于
MPEG标准的产品如雨后春笋般不断涌现,VCD的出现已经使在家电市场上风光多年的录相机看到了生命之路的尽头(想想看,自从VCD出现后,电视,报刊杂志上还有录相机的广告吗?);而以生产MPEG解码芯片著称的C-CUBE,却赚得碗满钵溢。市场的竞争是惨烈的,拥有先进的技术,找准市场的方向,才是企业兴旺的出路。面对MPEG技术的不断发展,企业是否能跟得上潮流的变化,能否利用更新的技术,开拓出更广阔的市场,这都是值得认真思考的;就象原
英特尔公司总裁安德鲁.葛洛夫先生的一本书名所述:“
只有偏执狂才能生存。
标准
MPEG标准主要有以下五个,
MPEG-1、
MPEG-2、
MPEG-4、
MPEG-7及
MPEG-21等。该专家组建于1988年,专门负责为CD建立视频和音频标准,而成员都是为视频、音频及系统领域的技术专家。及后,他们成功将声音和影像的记录脱离了传统的模拟方式,建立了ISO/IEC1172压缩编码标准,并制定出MPEG-格式,令
视听传播方面进入了数码化时代。因此,大家现时泛指的MPEG-X版本,就是由ISO(International Organization for Standardization)所制定而发布的视频、音频、数据的
压缩标准。
MPEG标准的
视频压缩编码技术主要利用了具有
运动补偿的帧间压缩编码技术以减小时间
冗余度,利用DCT技术以减小图像的空间冗余度,利用
熵编码则在
信息表示方面减小了统计冗余度。这几种技术的综合运用,大大增强了压缩性能。
MPEG-1
MPEG-1标准于1992年正式出版,标准的编号为ISO/IEC11172,其标题为“
码率约为1.5Mb/s用于数字存贮媒体活动图像及其伴音的编码”。
MPEG-2标准于1994年公布,包括编号为13818-1系统部分、编号为13818-2的视频部分、编号为13818-3的音频部分及编号为13818-4的
符合性测试部分。
MPEG-2
MPEG-2编码标准希望囊括数字电视、
图像通信各领域的编码标准,MPEG-2按压缩比大小的不同分成五个档次(profile),每一个档次又按
图像清晰度的不同分成四种
图像格式,或称为级别(level)。五个档次四种级别共有20种组合,但实际应用中有些组合不太可能出现,较常用的是11种组合。这11种组合分别应用在不同的场合,如
MP@ML(主档次与主级别)用在具有
演播室质量标准清晰度电视SDTV中,美国
HDTV大联盟采用MP@HL(主档次及高级别)。
MPEG-4
MPEG-4在1995年7月开始研究,1998年11月被ISO/IEC批准为正式标准,正式
标准编号是ISO/IEC14496,它不仅针对一定
比特率下的视频、
音频编码,更加注重
多媒体系统的交互性和灵活性。这个标准主要应用于视像电话、视像
电子邮件等,对
传输速率要求较低,在4800-6400bits/s之间,分辨率为176*144。MPEG-4利用很窄的带宽,通过帧重建技术、
数据压缩,以求用最少的数据获得最佳的
图像质量。 利用MPEG-4的高
压缩率和高的图像还原质量可以把
DVD里面的MPEG-2
视频文件转换为体积更小的视频文件。经过这样处理,图像的
视频质量下降不大但体积却可缩小几倍,可以很方便地用CD-ROM来保存DVD上面的节目。另外,MPEG-4在家庭摄影录像、网络实时影像播放也大有用武之地。
MPEG-7
MPEG-7(它的由来是1+2+4=7, 因为没有
MPEG-3、MPEG-5、MPEG-6)于1996年10月开始研究。确切来讲,MPEG-7并不是一种压缩编码方法,其正规的名字叫做’多媒体内容描述接口,其目的是生成一种用来描述多媒体内容的标准,这个标准将对信息含义的解释提供一定的自由度,可以被传送给设备和电脑程序,或者被设备或电脑程序查取。MPEG-7并不针对某个具体的应用,而是针对被
MPEG-7标准化了的图象元素,这些元素将支持尽可能多的各种应用。建立MPEG-7标准的出发点是依靠众多的参数对图象与声音实现分类,并对它们的数据库实现查询,就象我们今天查询
文本数据库那样。可应用于
数字图书馆,例如图象编目、音乐词典等;多媒体查询服务,如电话号码簿等;广播
媒体选择,如广播与
电视频道选取;多媒体编辑,如个性化的电子新闻服务、媒体创作等。
MPEG-21
MPEG在1999年10月的MPEG会议上提出了“
多媒体框架”的概念,同年的12月的MPEG会议确定了MPEG-21的
正式名称是“多媒体框架”或“数字视听框架”,它以将标准集成起来支持协调的技术以管理多媒体商务为目标,目的就是理解如何将不同的技术和标准结合在一起需要什么新的标准以及完成不同标准的结合工作。
MPEG-5
预计仅在2020年,MPEG就会以VVC/H.266,MPEG-5第1部分“基本视频编码”(EVC)和MPEG-5第2部分“低复杂度增强视频编码”(LCEVC)的形式发布前所未有的3个标准。这些将与其他高级
编解码器一起使用,包括市场上用于各种应用的
HEVC,
VP9和
AV1。
近期,MPEG宣布了第一个里程碑,宣布EVC(也称为ISO/IEC 23094-1标准)完成,因此EVC已被提升为最终国际标准(FDIS)状态。
华为、
高通、
三星等企业牵头制定,并且将获得首批支持。
MPEG-5 EVC定义了两个单独的配置模式:“基线配置模式”(Layer1)和“主配置模式”(Layer2),第一个仅包含20年以上或可以免费在标准中使用的技术。第二个添加了少量其他工具,可以彻底禁用每个工具,也可以分别切换到相应的基准工具。
IT之家根据MPEG获悉,与现有的
视频编码标准相比,EVC标准提供了更高的压缩效率。MPEG-5 EVC在
主模式下拥有和
H.265相同的视频质量,但平均比特率降低26%;基线模式相较于
H.264,平均比特率降低31%,解码时间减少60%。并且基于该标准的所有贡献者声明,这些声明承诺在FDIS发布日后不迟于两年内宣布其MPEG-5 EVC标准的许可条款。
其他重要成果包括低复杂度增强视频编码(LCEVC)达到国际标准(DIS)草案的状态,这意味着技术工作已经完成,格式已被冻结。
LCEVC是与编
解码器无关的工具,可以显著提高任何
视频编解码器(包括现有AVC/h.264,HEVC,VP9和新兴AV1,EVC,VVC)的压缩效率,同时降低编码和维护的处理要求与增强编解码器的解码器生态系统的
兼容性。
因为MPG存在多个版本,所以我们用某个软件播放MPG格式的视频文件时,有时能正常放映,有时却不能。如用
会声会影进行
视频编辑时,会声会影能放映MPG视频的视频图像,但有时视频文件中的声音却放不出来,这时我们需要用
格式转换软件把
视频格式转换一下。如:
快乐影音转换器。用快乐影音转换器转换后,虽然文件仍为MPG格式,但图像会模糊一些并且长宽都会变小,文件也会变小一半以上。不过这时用会声会影可播放声音试听声音了。如果不是要进行编辑,只是放映的话,用
超级解霸播放,不要对原来的文件进行格式转换。
国际标准
MPEG(Moving Pictures Experts Group,运动图片专家组)是在ISO(
国际标准化组织)和IEC(
国际电工委员会)内运作的一个工作组。自从1988年开始活动以来,MPEG已经编制了ISO /IEC11172(通常所说的MPEG-1)和ISO/IEC 13818(通常所说的MPEG-2)国际标准,其中包括用于服务器和网络会话的标准协议DSM-CC(Digital storage media command and control,数字存储媒体命令与控制)。
这些标准已获得产业和服务供应商的广泛支持,并且引起了一场数字革命,使得更加普遍的交互式媒体得以迅速发展。MPEG将研究重点转向了交互性更加高级的形式,在未来的几年里,技术的发展将使这种高级形式成为可能。这就是MPEG-4课题的目标,该课题预计在1998年底完成,该项目的完成可使用户达到关于音频视频内容交互性的多种形式,以及以一种整体的方式将人工的和自然的音频和视频信息溶合在一起。
MPEG-4技术包含两个主要部分:视听对象的
编码工具集和描述编码工具和编码对象的句法语言(syntatic language)。从技术的观点看,与传统编码标准最显著的不同是:接收者可以下载用于表示视听信息的语法描述,并且具有很快被VLSI(超大规模集成)技术所支持的特征。
MPEG-4是一个正在制定的国际标准,它支持用于通信、访问和数字视听数据处理的新方法(特别是基于内容的)。考虑到低损耗、高性能技术提供的机会和面临迅速扩展的
多媒体数据库的挑战,MPEG-4将提供灵活的框架和开放的
工具集,这些工具将支持一些新型的和常规的功能。由于快速发展的技术使得工具软件的下载极为便利,因此这种方式极具吸引力。
本文将介绍MPEG-4的特点以及由MPEG-4支持的功能、MPEG-4的结构和一些潜在的应用,还将介绍制定该标准的工作计划。
常见谬误
不少人都以为DIVX即是MPEG-4,但其实DIVX是将影像部分以MPEG-4来压缩、音效部分以MP3压缩处理,再以AVI档格式存在的制成品,故档案较MPEG-2小,而画质表现就介乎MPEG-1与MPEG-2之间。
MP3即是MPEG-3
正如前述,MPEG-3只不过是被放弃的一种
压缩技术,至于大家熟悉的MP3其实是MPEG-1 Layer 3的音频
数据压缩技术,简称。
压缩理念
至于MPEG-4的出现是由于MPEG-1和MPEG-2的
压缩技术,不能将它放在网络上作为影音资料传递之用,所以MPEG-4不再是采用每张画面压缩的方式,而是采用了全新的压缩理念。先将画面上的静态对象统一制定规范标准,例如文字、背景、图形等,然后再以动态对象作基础的方式将画面压缩,务求以最少数据获得最佳的画质,并将之作为网络上传送之用。
此外,值得一提的是,继MPEG-4后,将会进入更先进的MPEG-7年代。这项崭新技术已非一种压缩
编码方法,而是一种多媒体内容描述接口(Multimedia Content Description Interface),能快速搜寻不同类型的多媒体材料,对于将来要面对日渐庞大的图像、声音的管理有重大帮助。
信息特点
远程通信、计算机和电视/电影工业之间的传统界限极为模糊。历史上原本属于某一领域的内容现已渗透到其他两个领域中。视频、声音和通信已进入计算机;
交互性进入了电视;视频和交互性则进入了远程通信领域。看起来像一种聚集,实际上并非如此。这三种行业是从不同的技术角度来研究音像应用的。
在当今世界,应对三种主要趋势予以关注:
3、视听数据的综合应用不断增长的趋势。
对于传统意义上区分的各行业间的交叉,应综合考虑这三种趋势;标准和正在制作的标准没有充分涉及这些新的需求。而MPEG-4的重点就是解决这些需求,即综合三种行业的通用应用,以提供便于交互的音频-
视频编码、高
压缩比和通用访问能力。为了采用迅速发展的
相关技术的优点,
MPEG-4标准将保证高度的灵活性和扩展性。
基于内容的交互性包括人与音像画面中有意义的对象相互作用的能力。这种
交互作用局限于计算机图形,即人工合成的内容。对于新的交互式音像应用,能够提供与自然的、人工的及自然/人工混合的音像对象的相互作用极为重要。
为了有效使用
存储空间和传送带宽,需要有较高的压缩比。对于低
比特率的应用,改善压缩效率非常重要。
通用访问能力是指对有用的音像数据的访问可以在存储和传送媒体的很大范围内进行的鉴于移动通信的迅速崛起,通过
无线网络进行这种应用的访问尤为重要。
高度的灵活性和
可扩展性由句法
描述语言来保证,这种句法描述语言称为‘MPEG-4句法描述语言’(MSDL)。MSDL将在下面介绍。
视听标准是为从照相机和
麦克风获取的自然内容的编码重现而设计的。由于上述三个领域的相互渗透,人工内容的应用在不断增长。因此,很显然的需求是一种既适合于自然对象又适合于人工对象的模式,它能够用来产生单一的音像序列。
功能
新的特点
下述8个关键的功能是MPEG-4新的特点,可以认为现存的或其他正在制定的标准不能完全支持MPEG-4,这些功能由编码工具和MSDL的组合来支持。当特定应用需要时,灵活的MSDL允许使用不同的编码工具来提供这些功能的不同组合。
这些功能如表1所述,在表1中根据它们是否涉及基于内容的交互性、压缩比或通用访问能力进行了分组。
其他标准
除上述新的或改进的功能外,还有几种其他的重要功能,需要用它来支持已预见到的音频应用。与新的或改进的功能所不同的是,下面所列的功能已由现行的或其他正在制定的标准提供。
1、同步———对所表示的音频、视频和其他内容数据进行同步的能力;
2、
辅助数据能力———为二进制数据
比特流分配通道的能力;
3、
虚拟通道分配的灵活性———动态地重新分配视频、音频或
数据通道的能力;
4、低延迟模式(端对端或解码器)———对系统、音频和
视频编码进行低延迟操作的能力;
5、用户控制———支持交互操作中用户控制的能力;
6、传送媒体交互运作———在各种媒体上进行运作的能力;
7、与其他音像系统的交互运作———与各种类型的终端相互作用的能力;
8、多点能力———具有多源或多目的地的能力;
10、内容———对各种类型的可视画面和音频内容进行编码的能力(高的和中等质量的音频、宽带、
窄带、智能和
人工语言及人工音频);
11、格式———对各种格式的音频和视频进行编码的能力;
12、质量———对解码的音频或视频质量的评估。
结构
MPEG-4结构将为特定问题提供完整的解决方案,并且具有对最新的音像编码技术进行灵活复制的能力。从过去MPEG的经验看,预计MPEG-4由4个不同的部分组成:MPEG-4句法描述语言、工具、算法和轮廓。
MPEG-4句法描述语言(MSDL)
MPEG-4句法描述语言的目的是便于工具、算法和轮廓的选择、描述和下载,以及描述如何分析和处理基本的
数据流。MSDL将提供解决下述有关方面的途径:
协商解码器的配置,该结果将决定轮廓;
描述轮廓:各组成部分以及这些组成部分间的链接;
在非特定
机器语言中下载丢失部分,特别是在音像应用中;
用与所选择的轮廓相一致的语法和语义来传送数据(音像和其他)。
工具
工具是一种通过MPEG-4句法描述语言或使用MSDL描述的语言来访问的技术。它可通过软件或硬件来实现。
工具示例:运行补偿和形状表示。
算法
算法是提供一个或多个功能工具的有机组合。
算法示例:MPEG-1音频,MPEG-1视频和MPEG-2系统。
轮廓
轮廓是以特定的方式限定的一个算法或一组算法,用以解决一组特定的应用问题。 轮廓示例:MPEG-2 at Main Profile@ Main Level。
标准化
以特定的方式可以将其下载到MPEG-4终端上的部分不需要标准化。按照MPEG的经验,下一步很可能就是对MPEG-4句法描述语言、一些工具和一些轮廓的标准化。虽然不必对所有的应用规定轮廓、算法甚至工具。但在轮廓级别范围内,下列应用是必须进行标准化的:
某些应用需要解码器开启与声音和图像重放之间的延迟尽可能的短;标准化的轮廓保证最快的开启。
某些应用使用了有限的易出错的传送资源,如无线网络。
尽管软件和硬件技术在发展,但那些费效最好的终端的生产仍然要求专门的编码硬件和特定软件平台。
通过使用下载,MPEG-4标准将支持使用不在标准中出现的工具、算法和轮廓。
应用示例
下面介绍得益于MPEG-4提供的新功能的三类应用示例,使人们对在今后的产品中如何使用这些功能有所了解。表2列出了基本的(即要实现的)和可选择的(即用于某些特定应用的)三种应用示例的功能。基本的/现的用‘E’表示可选择的用‘O’表示
这一类应用包括检索、处理、表示和音频、
视频数据的存储。通过各种各样的无线和有线
传输媒介,可以对一个通用数据库进行本地(如:从
固态存储器)或
远程访问。
示例:
音像终端,如专用数字辅助设备(PDA),用于支持电子新闻、电子黄页和移动信息的低容量网络(如:将来的蜂窝
PSTN)。
固态存储器上的视频存储,用于便携机上的播放/录制。
音像通信和处理
这一类应用包括有线或无线
通信系统提供常规的人之间的服务。该类应用还包括传送和检索音像信息的方法。基本内容的功能能进行新型的交互,如:改进用户可选择区域的质量。
示例:
可视e-mail。
这一类应用包括在宽
比特率的网络上使用照相机和麦克风。为了有效地传送和存储监视的音像数据需要高的压缩比。
示例:
建筑物、工地的安全监控等
车辆交通监控
工作计划
MPEG-4将研制并证实标准中的MSDL、工具、算法和轮廓。MPEG-4标准将提供其他相关信息,这些内容是全面地解决实际应用问题所需要的。
工作计划分为设标阶段(1996.1结束)和联合研制阶段。
在联合研制阶段,将吸收投标阶段的结果以制定出最佳标准,即研制灵活和可扩充的MPE G-4句法描述语言、音像
编码工具、算法的轮廓的初始集合。
MPEG-4标准的研究已经产生了MSDL的工作组文件(
WD),计划1997年7月形成WD的最后版本,1997年11月形成委员会草案(CD),1998年3月形成
国际标准草案(DIS),1998年11月形成正式国际标准(IS)。我国已将
MPEG-1标准转化为我国
国家标准(
等同采用),MPEG2也已列入今后两年的国家标准制定计划,我们将密切关注MPEG-4标准的研制动态,适时地将其转化为我国国家标准。