兵家必争之地
在中新天津生态城里有这样一家入驻企业——艾听科技,通过扬声器的革命,他们重新定义了声音的传播方式——定向传播。即使在医院、酒吧这样的嘈杂环境里,通过扬声器的定向传播,在指定的区域里会清晰地听到播放的内容,而站在旁边的人则完全不受干扰。艾听科技的创始人有着多次创业的经历,而最终选定了声音作为变革的领域。
在漫长的时间里,“听”这个重要的人体感知上面的技术裹足不前,进展缓慢。艾听科技COO王剑解释,从技术角度看,因为声音本身的物理特性导致可测量、可计算非常难;另一方面,就是人自身的听觉有很多主观感受在里面,甚至所谓人们听到的音量大小,实际并不是一个简单的物理量,而是不同环境下,人耳对声音强度的一种感知。不过,近年来越来越多的创业队伍开始将声音作为创业的对象,与艾听科技的定向传播不同的是,他们的目光瞄准了智能语音。
自2014年亚马逊的智能音箱Echo横空出世以后,智能语音迅速成为巨头争夺的战场,各式各样的智能语音产品开始出现,以智能音箱为例,除了Echo,苹果推出了HomePod,微软有invoke,谷歌推出Google home ,国内则有京东联手科大讯飞(002230,股吧)推出叮咚,阿里推出天猫精灵X1,小米、联想等也相继推出智能音箱,用硝烟四起形容智能音箱市场并不为过。表现最为出色的Echo截止到2016年年底销量已经达到600万台,预计2017年将会突破千万台。
用比较极客的语言来描述,智能音箱产品大多是指通过定向麦克风,进行用户语音信息的收集,通过语音识别及NLP技术,对用户的语音进行反馈。“大家都知道智能音箱不赚钱,可是又都不敢不做”,一位业内人士形容当下的市场。王剑认为,巨头之所以纷纷在智能语音上投入,是因为未来智能家居可能都会以语音控制作为入口,有别于传统的智能家居需要通过专门应用程序或者平板进行控制,智能音箱在操作门槛上更低,所以必然会成为更好的一个入口,就像之前都去抢占所谓的PC端入口,移动端入口一样。
从基础层面的语音识别,到人工智能层面的深度学习,再到智能硬件,加上云计算的庞大计算能力,智能音箱为代表的智能语音是各种互联网技术的集大成者,这也是为何直到现如今人机交互才进入语音时代的重要原因,它需要一系列的技术准备。思必驰市场部高级市场经理陈辉龙对记者表示,目前语音技术实现了重要突破,识别率通常能达到百分之90%以上,在以前这是不可想象的,运算能力的提高又能够为技术厂商提供很大的空间,再加上人工智能的突飞猛进,都为智能音箱的出现做出了铺垫。
技术是软肋
尽管不论是初创公司还是巨头,都纷纷重金投入智能语音产品,但是仔细观察周围,就会发现使用智能音箱的消费者寥寥。如果去相关的论坛上看看消费者对产品的测评,就会发现槽点满满:“听不懂"人话"、“距离稍微远一点就要扯着嗓子喊”、“希望越大,失望越大”等等。智能音箱是否会像可穿戴设备一样,过了新鲜劲,就被消费者扔在储物柜里蒙尘?
核心技术上的硬伤仍然是软肋,这包括麦克风阵列技术、远场语音识别等等。“Echo之所以能够大火,是因为其采用了6+1的麦克风阵列,具备远场识别功能,如果没有麦克风阵列,单纯一两个麦克风识别率就会差很多。”陈辉龙解释说。
亚马逊强大的平台资源是Echo能够受欢迎的另一大法宝。Echo只是一个设备,而它的语音助手Alexa才是设备的大脑,ALexa所具有的强大的资源和海量的计算能力让任何一个智能语音产品都望尘莫及。通过合作更多的家居设备,亚马逊正在为Alexa构建更完善的生态链,对着电视说一声,“Alexa,打开电视”,就能打开电视的酷炫场景已经可以实现。
今年7月份BAT中的两家百度和阿里在同一天召开发布会,前者在发布会上宣布duerOS开放平台发布,后者则发布了天猫精灵X1,在智能语音领域,两家采用不同的竞争策略,擅长营销的阿里选择了卖产品,而骨子里透露着技术基因的百度则选择了建立开放平台,企图建立智能语音的大生态。
事实上,这也是当前智能语音市场的两大竞争策略。但是要想做出一款完美的智能语音产品,还是离不开开放平台的支持。毕竟,智能音箱只是一个入口,最终的梦想是智能家居。“梦想的具体实现需要每个家居设备具备智能性,而实现智能性和集中控制,又需要所有的设备遵守一个相互间进行通信的协议,有了协议,每个智能终端才能理解控制端发来的指令,才能做出正确的响应。”王剑解释说。
从早年间海尔做智能家居,到后面日本三洋强势提出自己的协议,再到后来小米不断推出各种米家智能电器。因为没有大家共同遵守的协议,就变成每个厂家都需要组建足够强大的产品线联盟,或者自己完全做独立的一套产品。不解决智能家居设备之间互联互通的问题,就会导致即便用户买了智能音箱,可能也没有想象中那么美好。
当然,任何技术的进步都需要时间,智能语音也是如此,它需要不断从各种生活化的场景中学习,不断更新迭代,这就是当前深度学习的主流方式,谁能在这个平台中建立最广泛的人脉,让其平台接触到最多的开发者和应用,谁的学习速度就更快,也就能在这场竞赛中跑在前头。