6月底的上海,世界移动大会(GSMA)上,科大讯飞消费者BG副总裁贺晓光把手下两个部门十几号人全部撒到会场里,并下了命令:“进去要给我带东西出来,看看别人在做什么,做的是不是足够好。”
他在为语音助手寻找更多可行的落地场景:弄明白咪咕灵犀能解决以及应该解决什么问题?通过什么载体、怎么介入应用之中?总之,讯飞内部的规划,是今年找到更多真正有需求的场景,而且要把东西做出来。
做苹果Siri、亚马逊Alexa这样的语音助手,是人工智能领域最光鲜热闹的一个领域。但折磨人的地方也在这里,语音助手一面烈火烹油,大家觉得分分钟就应该改变未来,成为下一个入口,但在实际应用上,却又迟迟找不到一个突破点。
商业化上也举步维艰。
邬霄云和乐视移动手机EUI高级副总裁马麟,面对面坐在乐视大厦附近一间咖啡馆里时,邬感觉到,对方打算用半杯咖啡的时间“打发”掉自己,甚至坐在这,也是出于中间人的人情。
“找我做什么语音助手的人特别多,你们有什么了不起?”马麟发问了。
邬霄云创立的奇点机智的语音助手产品刚起步,正需要搭载上一款手机,以获取进一步训练算法的用户数据。
然而大腿并不好抱。正如5年前曾风靡一时的畅销书《大数据时代》所言,比起算法,数据会变得更加稀缺和珍贵。
一番产品演示后,邬霄云最终顺利赢得了乐视的合作,但是是以免费模式提供服务——这已经是这个行业的常态。
缺乏话语权,直接导致这些语音助手公司很难向手机、电视等合作方收费。
今年3月,小米和出门问问间爆发了一场争执。出门问问控诉小米在新品电视发布前,临时抛出“霸王条款”,使用了问问的技术却不愿在发布会上给予露出。而小米则回应,是由于出门问问不想合作,以及技术PK的结果,小米电视的语音识别技术供应商已经换成了搜狗。
诸如手机、电视这类高出货量的硬件,每家制造商身后,都至少追着三五家语音助手公司,希望把自己系统送进去。
“语音助手到现在都没有商业模式。”创业的5年过去了,这是出门问问李志飞的结论。对于语音助手如何商业化,36氪采访的多位采访对象,均未给出明确的答案。
从手机、电视,到现在正开始热起来的智能音箱,语音助手最终可以靠什么硬件、应用场景落地?
这个被寄予了厚望的新人机交互模式,是否能如愿成为“入口”?
以及它们最终怎么赚钱?
这些问题,都还待解。
貌似光鲜的语音助手行业,正处在煎熬时刻。
从Siri横空出世、各路创业者开始做语音助手,转瞬间,五六年已经过去了。
成为Siri的挑战
曾经,做一个中国版的siri——这意味着改变未来、开拓巨大的市场、从技术落到实地的专业追求——是让许多全球顶尖的华人工程师热血沸腾、夜不能寐的主意。
2012年1月,李志飞还在硅谷Google Research Lab研究语音识别,听说好朋友赵勇有意离开Google回国创业,自己也坐不住了。他是个急性子,五个月后,就拿着一款手机APP开始融资了。
如今成为格灵深瞳CEO的赵勇记得,李志飞给他看了个带有基本语音交互功能的助手,纯白色界面,几乎什么设计都没有。他试了试:
“我要去长沙。”
“乘火车还是坐飞机?”
选择火车后,助手显示了几个班次,不过都是虚拟的。它是个demo,还没连接到任何服务数据库上。再问其他,助手就回复不了了。
尽管如此,同年8月,李志飞凭借这款不能再简单的demo,拿到了融资。投资人们认为,语音助手的控制功能,会让它成为一个大流量入口,以后无论接入什么应用,都能收上一笔“过路费”。这让资本感到兴奋。资本们也特别青睐“Google科学家”们。
邬霄云甚至觉得,2016年才开始做语音助手,自己有点后知后觉。他和被拉他出来创业的科学家林德康,此前分别在Google工作了8年和12年,与李志飞同在一个实验室。
在国内,Siri出现后,科大讯飞这样的公司,也为此感到兴奋。当时,讯飞的语音助手项目(包含讯飞输入法和灵犀语音助手),和其他3个方向,是讯飞探索的新业务。
还有更多创业者,前赴后继地投身进来。亚马逊Echo和语音助手Alexa的出现,又激发了一些想从智能音箱,切入语音助手生意的创业者。每隔两个月,邬霄云至少会听说一家新的语音助手公司出现,且多半曾在Google工作。
李志飞甚至觉得,如今算法创业有些过剩了。
但这些这些顶尖的、代表未来、热血沸腾的算法科学家和科技公司们,在现实面前遭遇了困难。
第一道门槛,就是商业化。
灵犀的起步并不算顺利。和出门问问在2013年底遇到的情况一样,从讯飞研究院孵化出来后,灵犀空有一身技术,却缺乏落地场景、资源和运营经验,直到接受中国移动入股,才找到用武之地。
“运营商有到达用户的能力,资源丰富。比如中国移动的咪咕现在在内容上就跟我们有大量合作。”尽管人们因“入口”而疯狂,但贺晓光觉得助手对于创业公司而言,门槛不低。“需要大量整合资源,而且工具型的东西,来钱特别慢,创业公司耗不起。”
“当时其他三条线挣钱挣嗨了,但灵犀一年不挣一分钱,公司愿意给它往里投。”贺晓光告诉36氪,灵犀之所以能常年保持战略投入型产品的地位,是因为刘庆峰和时任研究院院长的胡郁,坚信未来语音助手一定能以另外一种形态赚钱。
图灵机器人,当初遇到了同样的状况。2012年,俞志晨创业做了款虫洞语音助手,两年间迅速将种子用户扩大到3500万注册用户。这在当时算不小的规模,然而作为一家创业公司虫洞,也并未摸索出to C的商业模式。2014年11月,这家公司发布了图灵机器人,并在隔年发布人工智能机器人操作系统Turing OS,自此虫洞在产品线上退居次位。
第二道门槛,技术不完备限制了用户体验。
虽然搜狗还在做智能语音系统,但搜狗语音助手的IOS版却停摆在2014年的10月23日。此前,这款产品搜狗运营了一年,尽管口碑尚可,但留存率却差强人意。搜狗团队最终的判断是,语音助手是未来的方向,但当时不能成熟地解决用户痛点,产品本身价值不够大。
此后两年间,搜狗一直默默打磨语音技术,直至2016年看到行业准确率有普遍提升,才锁定了车载、智能电视这两大主要场景。
搜狗之所以首选把助手灌入电视,原因在于电视是高频、刚需性硬件。按照王砚峰的标准,这意味着起码每年得有几千万量级的销量。另外,在电视端,用户使用语音输入的比例达到20%。
“去年从乐视电视开始,厂商才逐渐把语音作为标配。我们也是在市场相对成熟,能带出来语音助手的价值时,才决定切入。”搜狗语音交互技术中心负责人王砚峰,认为家庭场景中的语音交互,会是比手机场景更早成熟。
“大家在手机上做的都是通用型助手,既要通过助手把咖啡定了,是不是又可以把京东上的货买了。本质上,助手是想替代手机里所有的APP而存在,甚至超越APP的体验,这意味着它面临的技术等等难题,是一条很漫长的路。”
即使强大如苹果,用户在最初经历用Siri调用APP、查询天气、安排日程、回复邮件这类小任务的兴奋期后,siri展露出功能的局限性。
归根结底,凡事要先谈用户体验。
第三道门槛,抱品牌商的大腿不容易。
要做好语音助手,并不止要好算法,更关键的是数据:训练人工智能所需的用户数据,如今都握在BAT手里,创业公司要是想往前走,至少第一步,要先拿到数据来训练算法。还有什么选择?
这正是大家纷纷抱紧硬件品牌商大腿的原因。
当初出门问问决定自己做“不讨喜”的硬件,也是经历了一番与制造商的撕扯,被逼之下的举动。“当初做个入口级的东西,但要做进去应用不仅要免费,还得求着他们。说服不了他们,又想往前走一步,那我就自己做呗。”李志飞告诉36氪。
前述奇点机智拿下乐视的单子不易,不过他们想不到,以科大讯飞的体量要搞定品牌商,同样充满挑战。
灵犀语音助手(今年5月更名咪咕灵犀)目前是国内最大的语音助手平台之一。但灵犀在产业链里的话语权尚未达到贺晓光期望的程度。“因为用户水平、整合难度还有IT上的难度,(带来了挑战)。如果我有四个亿用户,客户会排队来找我们。”
用户量和活跃度,是助手公司和硬件厂商、内容服务商谈判时的硬指标,能说明消费者是否真的对语音助手具备需求。
但目前,这些数字还不够乐观。
根据易观千帆提供的数据,咪咕灵犀的月活为709.45万人次,微软Cortana 的月活人数为47.56万人。5月初的微软Build大会提出全面AI化转型后,Cortana环比增幅上升至34.36%。但在活跃数据上,小厂普遍呈现出下滑趋势。
语音风口说虽然已经炒起来了,但由于技术不完备,资源整合艰难,大部分玩家都出于“熬”的状态。
抢在巨头身前冲刺
无论李志飞、贺晓光还是邬霄云,都意识到,语音助手并不会是一门贩卖流量的入口生意。
“引流的服务大家都愿意做,然而做这个对用户没用,时间长了用户粘性不高,因为你没法在灵犀上完成想要的服务。”2015年,更新到3.0版本时,讯飞发现和手机厂商一样,应用厂商也不愿意把所有数据流程都开放给你,这就导致用户在使用灵犀操作到一定地步,就没法在往下深入操作了。
比如查询明天机票,但查完了无法在咪咕灵犀内完成购买。以及查天气、打电话等功能,虽然让用户感到方便,但显然不是让他们愿意花钱来获取的服务。
贺晓光觉得,破解的方法,是干脆放弃做大而全的引流服务,把垂直领域做深做透。
这意味着寻找合适的落地场景,和硬件载体很重要,单纯的助手没有商业模式。
“助手就跟鬼上身一样,灌入各种各样的硬件,软硬结合的时候会产生价值。”
对外,咪咕灵犀以一款to C的语音助手APP的面目示人,但事实上,咪咕灵犀这个概念,几乎等同于讯飞超脑技术平台。
“过去我们什么都接入,但很多真正有需求的内容却做不下去。现在跟很多公司深度合作,他们会把内容给打我们,我们就相当于去到代理。当用户在我这里听了一本书、买了一张票,我能获取数据对你不断学习,知道你的喜好,慢慢就能告诉你,你需要什么,提供更多服务、产品和内容。”贺晓光告诉36氪。
邬霄云的想法一样。
刚回国时,他做过一个基于深度链接的SDK实现应用内搜索的产品。那个项目后来并未做大,但整日与应用商打交道,让他在2014年就想明白一件事——做语音助手,如果自己没有垂直的内容是不靠谱的。应用商肯定不希望你守在它跟用户之间,或者在它的APP里搞。如果想做个自己的界面,嫁接所有第三方功能,就得挨个跟对方谈BD,求对方开放API接口。对创业公司,这个任务太过于艰难。
所以奇点机智选择不通过独立的APP界面提供服务,而是通过底层技术,在用户使用各类应用时,在APP里面提供服务。邬霄云说,目前奇点机智能连接的APP有100多家,日后会试着进一步扩大到1000、甚至10000万家。
咪咕灵犀和奇点机智都在努力扩大服务,但速度还需要更快,因为危险的讯号来了——百度这类巨头开放了免费的开发者平台。尽管为开发者提供的定制化工具还不完善,但创业公司的处境会更艰难。巨头入场,意味着以后单点竞争会演变为生态战。最简单的例子,腾讯的QQ音乐,百度的爱奇艺,阿里的电商,只要有一款助手,巨头很容易在自己的生态内打造一个闭环。
摆在创业者面前的只有两条路:其一,趁巨头还没作出爆款,尽快建立自己的生态,或连接更多内容和服务商;其二,纯算法生意势必更加难做,一部分公司迫于无奈转去做to C的硬件。
至于技术服务商转型to C,最在吃螃蟹的是出门问问。
那是2014年上半年,出门问问开始做智能硬件,李志飞为此纠结了半年,但想到虽然语音技术有了,但短期内用户不看好,没有流量和收入,技术几乎没有用武之地,他还是下了决心。不过在当时,九成同行认为他在往火坑里蹦。
如今,出门问问依旧没有盈利,但可穿戴设备、车载产品、智能音箱等几款硬件产品,有的开始赚钱了。加之,有百度这样的大厂商开始做免费的开放语音平台,李志飞做硬件的路子,开始被更多做纯to B的业务的算法公司效仿。
今年,以智能音箱居首,语音助手的落地场景开始有明朗的迹象。
但这门生意仍不好做。搜狗在与to B技术服务商拼技术,邬霄云近日忙着说服更多强势的手机厂商,出门问问在打磨新硬件,咪咕灵犀也在想方设法吸引更多应用商的合作。不那么沉迷流量后,厂商越来越接地气。
而留给创业公司的时间也不多了。
语音分析创业公司VoiceLabs发布的《2017语音报告》显示,2016年12月对Amazon Echo和Google Home设备的调查中,只有11%的消费者愿意在购买Amazon Echo之后再购买Google Home。这意味着,消费者开始自行划分阵营。语音助手是个赢家同吃的市场。
这是美国的情况。在中国,尽管消费者对智能家居的接受度还不够高,但是BAT引领的生态具有更强的封闭性和绞杀能力。除了与小鱼在家和做的百度,7月5日阿里的智能音箱天猫精灵上线后,三大巨头中只欠一款腾讯的音箱。
能否在巨头的布局成熟之前,打通语音技术准确度、服务和内容的丰富度,以及销售渠道,三个环节,会直接决定一家创业公司,能否抢到“中国版”siri的入场券。
责任编辑:吴一波
相关推荐
由Siri引发的语音技术市场探讨:三大种类及诸多挑战面面观
引言:苹果iPhone4S的Siri功能推出,可谓是引起了人们对于智能语音技术的极大关注。其实,语音技术非常复杂,表象繁多,本刊通过采访国内科大讯飞、国笔等专家对目前的语音市场进行梳理和探讨。一、不仅仅是语音,还是人工智能尽管苹果“教主”乔布斯离开了我们,尽管iPhone5没有入人们期望的那样出现,但是iPhone4S的推出仍然成功吸引了苹果粉丝和业界的所有关注。根据美国电话电报公司(AT&T)透露,iPhone4S在发布12小时之内就接到了20万份订单,而其中最引入注目的一大新功能,就是被称为Siri的语音助手功能。10月4日上午,苹果全球产品副总裁PhilSchiller与负责iOS软件的