当AI落地音频行业,“音箱精”和“耳机精”就诞生了
从1956年麦卡锡等人提出人工智能的概念,到2016年进入“人工智能元年”,再到刚刚迈入的2018年。经过62年行走的AI,已经重新塑造了许多产品和行业,这一次,终于轮到了音频行业。
目前,对于AI音箱和AI耳机,还没有明确的标准和定义。但是,通过对已经推出的相关产品进行分析后,我们发现无论是“音箱精”还是“耳机精”,人机交互以及算法推荐是其最基本和最突出的特点,我们以AI耳机为例展开来说。
1.人机交互,缩小版的“电子助理”
AI耳机无论是从手持,发展到头戴、耳塞和后挂,还是从动圈,发展到动铁、圈铁,其佩戴方式和扬声器的变化对于人们的生活来说其实并没有突破性的变革,因为它仍旧是一个音频传输器。而搭载人工智能之后,它变成了一个缩小版的“电子助理”,能够实现人和耳机之间的对话,通过语音交互,来实现对于信息的获取。
2.算法推荐,专属于你的“私人FM”
大数据是AI绕不过去的一个技术,也是人工智能的根基之一。当耳机加上了大数据,则可以通过历史记录的数据叠加、LBS定位等新数据获取,让你听到你想听的歌曲。
AI耳机一方面,可以通过对于收听数据的清洗、分析,把握用户对于音乐风格的取向,真正让每一个人都听到自己喜欢听的歌曲。另一方面,又可以通过传感器对于心率、步数等信息的抓取,配合时间、地点等基础信息,从而得出对于环境的判断,使音乐适配场景。
早于“耳机精”,“音箱精”先迎来了集体爆发
无论是国外亚马逊的Echo、谷歌的Google Home,还是国内小米的小爱同学、阿里的天猫精灵、喜马拉雅FM的小雅等在近两年都已经取得了不错的销量。例如亚马逊的Echo在2016年就已经达到了650万的销量,而小米的小爱同学、阿里的天猫精灵均对外宣布销量超过100万。
根据艾媒咨询发布《2017上半年中国智能音箱市场专题研究报告》显示,2016年中国智能音箱销售规模为1.36亿元,预计到2020年,智能音箱销售规模将超过10亿元。
而反观AI耳机,市场还处在刚起步的阶段。据智能相对论(微信id:aixdlun)不完全统计,目前的AI耳机产品如下表:
不过,从Vinci到Google Pixel Buds、Mars、iBFree2,都还处在萌芽时期,推出的产品并不多,市场也还待爆发。
为什么是“音箱精”先爆发?
智能相对论认为,主要是两个方面的原因。
首先,从产品的角度出发,音箱相较于耳机有更好的现场感。虽然同样为语音的传输媒介,但耳机由于声场原因,相较音箱,更难达到现场感和立体感。因为音箱在声音传输时有直达声与反射声两种,而耳机则只有直达声,会产生“头中效应”(指由于耳机纵向声场不深,耳机单元距离耳朵过于接近产生的声场不自然的感觉)。
其次,从环境的角度来看,全球巨头的推波助澜,掀起了一场AI音箱浪潮。自亚马逊推出的Echo获得不错的效益之后,苹果、谷歌等公司纷纷入局。在国外科技浪潮的推动之下,为了减少“试错成本”,我国的科技公司纷纷跟风以期快速获利。同时加之价格促销等一系列营销手法,如天猫精灵在双11直降400,以99元的价格进行销售。在这样的内外作用之下,国内的智能音箱市场被点燃。
那么,“耳机精”还有肉可以吃不?
对于这个问题,智能相对论所给出的答案是肯定的。除了大家都能看到AI的大势所趋外,还基于以下两点。
第一.耳机的使用场景更占优势。音箱的使用场景固定,较为封闭,而耳机则具有便携的特点,可以随时随地嵌入任何场景之中,能够使人机交互的体验更为方便和快捷。
并且,随着AI耳机不再需要通过迁移主设备的信息来完成工作,能够独立运行,使其应用的场景和范围进一步扩大。在以往,AI耳机语音交互的实现,需要通过其他的硬件的支持,例如Airpods就需要手机的连接才能完成工作。而最近则出现了能够单独使用的耳机,即不需要外接设备即可完成语音的识别和控制工作。例如Vinci,可以直接实现播放歌曲、语音交互等功能。
第二,耳机的用户基础数庞大。根据智研咨询发布的《2017-2022年中国耳机市场运行态势及投资战略研究报告》显示,预计到2023年,除手机附赠之外的耳机出货量将达到4.6亿个。正如FIIL耳机的联合创始人邬宁在接受采访时提到“AI在智能音箱中是决定性作用,是雪中送炭;而AI在耳机中更多是锦上添花。”
虽然“耳机精”有肉吃,但是要想吃得好,还得从两个方面来增强“道行”。
第一是要增强续航能力,保持耳机的低消耗和长时间工作。根据《2017上半年中国耳机市场ZDC调研报告》显示,无线耳机已经成为人们的关注重点。而就目前所发布的AI耳机来看,也几乎都是采用无线的形式,因此增强续航能力就显得更为重要了。
第二则是语音的交互能力。语音的交互包含了识别和判断两个方面,在这个过程之中至少有两个方面会产生较大干扰。其一是环境的嘈杂声音,导致识别的混乱。当然,这个目前有了解决路径,vinci采用了骨传导的方式,来减轻环境的干扰。其二则是对于语义的理解。不同于拉丁语系语言,汉字的语言中存在大量的多音字、多义字和通假字,尤其是在不同的语言环境下,同一个字或同一个词组,都可能代表数种甚至数十种截然不同的含义。因此,对于中国的技术开发者来说这仍是摆在面前的一个巨大难题。
总之,虽然音箱先成“精”,但是并不妨碍“耳机精”吃到肉。当AI浪潮席卷到音频行业之时,厂商仍然要清楚,利用人们的好奇和从众心理,短期获利不是难事。但是要想得到长期的利润,探究人们的需要,将产品完整嵌入人们的生活之中才是关键。