2013年12月18至21日,数字音视频编解码技术标准(AVS)工作组第47次会议在深圳举行。AVS2视频编码标准制定取得突破进展,编码效率比上一代标准翻了一番,AVS2无损音频编码标准已由IEEE颁布实施,面向未来媒体应用的流媒体传输和媒体内容描述标准制定全面展开,AVS2标准体系有望成为引领我国视听产业未来发展的新引擎。
AVS2视频编码标准的首要应用目标是超高清晰度视频。超高清视频的分辨率相当于高清视频的4倍(4K超高清)或16倍(8K超高清),需要压缩效率更高的视频编码标准。深圳会议期间的测试表明,AVS2的压缩效率已经比上一代AVS国家标准和AVC/H.264国际标准提高了一倍,最终版本将于2014年4月正式推出。
AVS2视频在场景类视频编码方面大幅度领先于最新国际标准。场景类视频是从在固定或有限场景下持续拍摄的视频,包括全球广泛部署的视频监控系统,也包括视频会议、网络教学、数字法庭、远程医疗等应用中拍摄的大量视频,其中监控视频目前已经占全球大数据的一半以上。AVS2通过去除这类视频中大量存在的场景冗余,典型情况下可将编码效率再翻一番,明显领先于最新国际标准,具有巨大的产业价值。
无损音频编码即无失真音频编码,近年来越来越得到青睐,因此被选作AVS2音频编码的首要突破口。经过两年多的努力,AVS2无损音频编码已经由IEEE颁布为IEEE1857.2-2013标准并正式出版发行。IEEE1857.2包括纯无损和有损兼容两套方案,后者完整包含了第一代AVS有损音频编码,亦即这种完全解码这种码流可以完全保真地还原音频,而部分解码也可以回放高质量的音频。这一新特征为各种新型应用打开了大门,例如,采用这种格式进行音频节目发行,有损部分不加密,其他部分加密,所有用户都可以欣赏,但是只有付费用户才能解码无失真的音频。目前AVS2音频的工作重点是面向高清晰度电视应用的环绕立体声编码,预计2014年6月在128kbps码率下实现5.1环绕立体声的高保真编码,而目前广泛使用的MP3实现立体声编码就需要这个码率。
目前互联网流量中视频所占比例已经超过70%,很快将增长到90%。除了对视频进行高效压缩外,设计高效的流媒体协议也是减轻网络压力的有效途径。为此,AVS2系统标准针对媒体“一对多”的传播特性,正在设计更为灵活的流媒体封装格式和创新的调度协议,并结合“以内容为中心的网络”等发展趋势,争取大幅度削减未来媒体网络的流量,防止可能出现的“网络大堵车”。
视听内容快速搜索和深度利用的重要性日益增强。为此,AVS工作组在今年6月成立了“数字媒体内容描述”专题组,开始制定《信息技术数字媒体内容描述》国家标准,目前包括三个部分:第一部分“标识、分类和核心元数据”,第二部分“视觉对象描述”和第三部分“听觉对象描述”。该标准继承AVS编码标准的特色,将针对不同应用制定专门的档(Profile),针对不同的需求将内容描述分为不同级别。第一阶段预计包括基本档(面向视听内容描述的共性通用特征)、监控档(面向视频监控应用的对象描述)和移动档(面向移动互联网的视觉搜索和增强现实等应用),而各档视听描述又将分为底层特征(例如颜色、形状、纹理)、中层特征(例如运动对象)和高层特征(例如对象分类、人脸识别和语义描述等)。
过去十年,AVS标准工作组在音视频标准制定和产业化方面已经取得丰硕成果,所指定的标准相继成为国家标准、行业标准和IEEE国际标准,国家新闻出版广电总局已经就我国卫星、地面、有线和网络等各种数字电视系统采用AVS进行播出做了全面部署。未来十年,AVS工作组将继续努力,除了压缩效率提升方面积极参与国际竞争外,还将在场景类视频编码、云媒体编码、真三维视频和全息视频编码等方面积极探索,引领视听技术国际标准潮头。