发布会上,百度副总裁、AI技术平台体系总负责人王海峰在致辞中提到“真正让输入法这种人机交互模式发生变革的,是正在到来的AI时代。”他说,“AI时代,人无需学习如何使用机器,用自然语言就能和机器顺畅交互,甚至无需主动交互就能让机器理解人的意图……当AI发展到一定阶段,输入法甚至不需要独立存在,它将融入人机交互系统,支持人和机器以各种形式进行信息交互。”
随后,百度输入法负责人蔡玉婷上台,宣布了百度输入法v8.0版本的正式上线,该版本在此前已有的AI功能上增加了“语音速记”和“AR表情”两大全新AI功能。
其中,“语音速记”采用了百度的“声纹识别”技术,该技术针对2-3人小型会议场景,可根据声纹自动去呗发言人,实现智能化的语音识别。而“AR表情”功能基于百度的人脸识别技术和AR技术,用户可以根据相机或相册进行人脸识别、制作表情包,还支持用户通过自己的表情控制虚拟人物形象。制作出来的AR表情可以直接通过输入法搜索、语音输入和键盘输入时展示出来。
百度语音技术部总监高亮,再大会上发布了百度语音技术的最新突破——Deep Peak2模型。该技术全称为“基于LSTM和CTC的上下文无关音素组合建模”,是百度语音技术的深度尖峰技术,也是语音识别工业历史上巨大技术进步。
高亮说,“今天现场的实时文字上屏,就是应用了百度最新的Deep peak2模型,现在的识别准确率比起百度世界大会时又上了一个台阶。经过测试,应用了百度Deep Peak2模型后,其识别的相对正确率较行业领先水平提升20%。”