马云演讲秒变文字背后藏着它!AI语音高手云栖论剑

2017-10-12 17:58:51 来源:浙江新闻客户端 热度:

为什么在车里说“我想看星星”,车子的天窗就会打开?
 
导航软件里出现林志玲的声音,真的是林志玲本人说的吗?
 
10月12日上午,2017年云栖大会的第二天,一场名为“智能语音交互专场”的论坛,为很多人打开了一扇窗:原来,“云计算”还有这样的神奇能力!
 
以假乱真的“林志玲”
 
去年的云栖大会,马云的演讲被飞速翻译成文字,显示在现场的大屏幕上。
 
事实上,记录这一切的是人工智能,而非速记手。在它的背后,是阿里云智能交互语音团队的努力。
 
一年后,这套系统更厉害了。“在基于阿里云系统的互联网汽车,经过不断升级,不仅语音识别率大大提高,还增加了很多功能。”阿里巴巴iDST智能交互团队总监鄢志杰说。
 
比如,现在车主可以和互联网汽车玩“成语接龙”游戏:你说一句成语,汽车接着说下一句。“很多车主告诉我,有了这个游戏,上班路上堵车都不那么枯燥了。”
 
 
如果语音识别,是让机器更懂你。那么语音合成,则会让你更懂机器。西北工业大学教授谢强,现场演示了一段用机器模拟林志玲的语音,引发了大家会心的笑声:“真的很像!” 
 
新产品背后的人工智能
 
手机、家电、汽车……很多人有这样的感觉:身边的智能语音设备越来越多,可以动口不动手了。
生活越来越方便的背后,是云计算和大数据不断深入介入,攻克了过去无法攻克的难关。
 
 
现场,正如所佐治亚理工学院教授、著名语音交互科学家李锦辉所说:云计算、人工智能,让一切都变得不同了。他举了一个形象的例子——
 
过去,识别一段语音,或者模拟一段语音,机器像学生,人类像考官。机器做得好不好,人类给个分数,分数低了,机器回去改进。
 
如今,由于云计算和大数据技术的介入,强大的分析能力让机器既是学生,又是考官。不断自我判定、自我修正,犹如机器一下子拥有了学习的能力,进步就非常快了。
 
“通过人工智能,能够把周边的噪音消除,降低不同语种、不同环境对声音的干扰,因而得到更纯净、更准确的声音,是近期技术的一大进步。” 李锦辉告诉现场听众。
 
“三城记”谁能占领行业高地
 
今年的云栖大会,北京中瑞科技有限公司商务经理于北明从北京赶来。
 
这是他第一次参加云栖大会,在论坛现场,他认真听完了每一位嘉宾的发言。
 
“我们公司是做语音交互的。”于北明告诉记者;“云栖大会比我想象得更好。这里,有行业的顶尖公司和顶尖人物,听他们的发言,可以掌握行业未来的趋势。接下来我们面对同行和客户时,也会更有底气。”
 
从嘉宾的发言来看,智能语音行业正向众多行业不断延伸。论坛中,两位嘉宾的发言,提到了如今法官们热衷于通过智能语音梳理案情,把事实的关键部分从海量的案卷中提取出来。特别明显的例子,就是在杭州成立的全国首家互联网法院。
 
 
最严谨、最准确的司法系统,也可以通过智能语音进行判断,可见它的精准度已大幅提升。那么,它在现实生活中的运用就更稳妥了。
 
于北明说,智能语音行业中,国内做得最好的城市有3个:北京、深圳、杭州,它们在互相比拼。每年举行的云栖大会,会成为“三城记”中的推手吗?我们拭目以待。

责任编辑:吴一波