7月31日,国家质量监督检验检疫总局、国家标准化管理委员会正式发布了《中华人民共和国国家标准公告》(2017年第20号)。其中,科大讯飞主导编制的《中文语音合成互联网服务接口规范》和《中文语音识别互联网服务接口规范》两项国家标准获得批准发布。
获得批准发布的两项国家标准信息如下:
标准一:中文语音合成互联网服务接口规范
国家标准编号:GB/T 34145-2017
实施日期:2018年2月1日
标准二:中文语音识别互联网服务接口规范
国家标准编号:GB/T 34083-2017
实施日期:2018年2月1日
这两项标准的颁布是全国信息技术标准化技术委员会用户界面分技术委员会 2013 年成立以来最先发布的标准,填补了我国智能语音技术领域云集成标准的空白,充分体现了公司的行业领导者地位。
标准的发布和实施有助于进一步促进以科大讯飞人工智能开放平台为基础的产业集群和生态系统良性健康发展,也对国家智能语音及人工智能行业的发展有着积极意义。
为什么要制定这两项标准?
随着云计算和移动互联网技术的蓬勃发展,语音技术也从较早期的行业应用迅速转变为大众化的应用,基于各种智能终端设备的语音应用也如雨后春笋般涌现出来,世界各大语音巨头纷纷投入巨大财力和人力去占领语音市场。
在互联网环境下,语音技术服务提供商普遍采用云计算的方式提供高质量的语音服务。客户端应用将语音服务的请求发送到云端,利用云端海量的数据资源和优秀的运算资源得到最优的语音服务。在这样的工作模式下,客户端如何调用接口来获得云端的语音服务就成为构建语音应用的重要环节。
目前国内的语音技术服务提供商大多数通过提供客户端开发组件的方式提供服务,客户端应用软件开发商面向客户端开发组件进行二次开发,构建具体的语音应用。而目前国内各大语音技术服务提供商提供的客户端开发组件的接口、形式不一,中文语音合成/识别服务系统具备的功能集也不尽相同,使得其开发难度、维护难度和运营难度非常大。
在这样的背景下,科大讯飞主导编制的标准立足于语音技术互联网服务的现状,并着眼于其技术和业务的发展趋势,规范了中文语音合成/识别在互联网环境下提供服务的能力范围、输入数据、输出数据、开发接口等,适用于互联网环境下中文语音合成/识别服务系统的设计、开发和应用。
标准实施后,会带来怎样的影响?
标准通过制定中文语音合成/识别互联网服务接口规范,明确定义了客户端访问、调用云端的语音服务的接口形式,对规范语音合成服务提供方式,方便客户端的集成调用,从而促进语音交互应用的推广发展,促进广大用户充分享受到语音交互带来的快速便捷服务,提高国家在互联网、移动互联网时代的信息服务水平,具有十分重要的意义。