2017年是AI彩电产品的元年——所谓AI彩电就是一种新的、能听懂大家的语言,执行语言命令,甚至可以和大家自由对话的电视机产品。统计数据表明,2017年新上市彩电机型中,近四分之一配备了语音智能功能。
2018年初,语音智能AI电视进一步升级。业内预计,2018年新发布的彩电产品配备AI语音技术的比例,将迅速上升到8成以上,即除了少数主打低价格的产品外,大部分新品都将成为智能电视。智能语音正在进入一个快速发展的“新阶段”。
消费电子产品,语音技术成为标配
1月29日,作为小米电视2018年推出的第二款新品——小米盒子4正式发布,其最大特点是直接预置人工智能语音系统。智能盒子产品是“存量老电视体验升级”的关键工具。国内彩电用户大概有半数采用智能盒子、OTT盒子、IPTV盒子等产品接入电视网络。小米盒子4标志着,这一“存量”市场,进入关键的“智能语音化”发展新阶段。
智能语音技术的另一个新消费类产品是“智能音箱”。2018年CES展会,百度系展示了3款智能音箱产品。该产品还是三星、苹果、谷歌等国际巨头的必争之地。国内市场,天猫系也在2017年中推出了智能音箱产品。目前,智能音箱产业开拓最好的是美国市场:在美国,2017年有近六分之一的人(超过5000万)拥有智能音箱,这个数字比16年翻了一倍还多。
从国内市场看,智能语音盒子、智能语音音箱和智能语音电视已经构成家庭和个人消费“智能语音”应用的三大平台。且每一个品类的潜在市场规模都是“千万台”的。但是,这三个品类与智能语音应用的王者:智能手机比较,销量真的有点“小”。手机产品应用语音输入、语音操作等技术已经很久了。其中,更有6成以上的用户,经常使用语音输入。不过作为掌上设备,语音操作在手机上的应用却不明显。
除了以上消费电子设备外,家电行业还看好“空调”的语音智能化、抽油烟机的声音感知与油烟感知的自动运行等“家电嵌入智能”技术的发展。有空调届人士表示,语音控制的空调产品和环境自动感知技术结合,能带来更好的操作体验、更好地无操作自动环境控制体验和避免空转的节能效果。
作为人类最重要的沟通方式,语音技术的发展显然已经成为消费电子产业重要的创新环。彩电产品语音化更是成为重要行业趋势,并快速迈向普及。
语音智能很神奇,如何做到真好用
很多人觉得,智能电视语音技术就是“多安装一个软件”。但是,真实的产品研发,却要比“一个软件”复杂的多。
实现语音交互,首先需要为设备配备“麦克风”,也就是“拾音”产品。与我们一般的会议讲话、KTV娱乐的麦克风不同,智能语音电视机的麦克风必须具有三个技术特征。第一是,远场效果好。即至少在5米远,能够准确识别日常对话,甚至识别压低声音但清晰的对话。这与手机、KTV、直播、会议室麦克风“对着嘴”的应用截然不同。
第二,智能语音技术麦克风必须是“全向拾音”。由于语音交流不是“嘴对着麦克风吹”,也就导致交流人员与麦克风等设备的“角度关系”千差万别。比如一个智能音箱,摆放在茶几上,那么他就需要对360度方位内的声音都能很好识别。因此,智能语音产品通常采用一个“多麦耦合”阵列,实现全方向全域拾音。
第三,智能语音技术的麦克风必须有很高的“信噪比”。即要能够对抗多种噪声的干扰。远场和全向拾音,进一步增加了对麦克风信噪比的考验。
但是,对于智能语音设备而言,其最大的技术要求显然不在“苛刻的拾音技术上”,而在于“语音到语意”的理解上。智能语音设备的目的是理解对方的具体意思。这与传统的会议、KTV、电话等场景,麦克风和语音系统只负责“原样搬运声音”的工作完全不同。
识别语音的含义,有哪些难关呢?比如,要从多人语音,尤其是居家环境下的多人对话、对正在播放的视听内容的声音中有效区分“和谁对话、谁在对话”。这就涉及一种称为声纹的身份识别和认证技术(类似于指纹识别、人脸识别等的功用)。再比如,不是每个人都是“新闻联播”式的标准普通话应用者:口音、方言、口头禅,这些的处理具有很大的“个人性”、“差异性”。这需要智能语音系统能够学习和升级自己,适应“主人”的语言特征。后者涉及到机器学习等高级智能技术。
当然,智能语音技术的电视机,不是“一个人在战斗”,这种电视机首先是一种“网络电视机”。即,语音技术可以从网络上得到更强大的“支持”。包括,智慧程序和算法的升级、个人语言特征和习惯的远程访问和使用、远程云计算提供更为强大的算法和理解计算力支撑,支持更多的“潜在应用”开发等等。
综上所述,AI语音电视的升级,不是简单增加一个软件而已。而且随着语音和人工智能技术的进一步发展,引入专门的智能协处理器、神经元处理器、改变传统产品的底层架构是大势所趋。语音技术和彩电产品的整合,将是一个系统性的产品技术体系革新。
有了AI语音,彩电能做什么
彩电和其它消费电子、家电企业在AI语音技术上的热情,足以说明这一技术进步的“战略性”和“重要意义”。
就目前而言,彩电AI语音功能更多的是扮演了“遥控器”的替代者的角色。很多时候找遥控器、遥控器摔坏、遥控器没电是“很恼人”的事情。彩电行业一直在尝试寻找“遥控器替代者”。早期,曾经发展过肢体语言和隔空触控的技术。但是,这种技术体验精度、交互广泛性并不友好,没有成为主流。
而采用语音技术的产品,不仅可以直接呼唤彩电菜单、电视台和电视网络中节目菜单的内容,也可以实现文字输入、直接查询网络上的以文字信息为索引的“非标准菜单”内容。或者说,语音技术不仅“替代了遥控器的所有功能”,而且还“创造出遥控器不擅长的(例如文字输入)和不存在的(语音对话)等功能”。
从未来发展看,语音智能技术会为彩电产品打开一些崭新的应用场景。传统彩电的作用主要是视频娱乐——即内容始终是单向传输的。但是,语音技术可以让彩电成为一个“关键节点”。作为一个语音交互和信息处理器,彩电可以成为其他智能家居产品的“中控大脑”。作为一个连接云系统的输入终端,彩电可以依赖背后更强大的计算与知识能量,与“观众对话、拉家常”,甚至实现更多的主动行为功能、大量互联网应用的入口与界面……
某种意义上,智能语音技术的彩电只是彩电真正进入“人机智能”时代的一个窗口。以此为线索,涉及的是整个家居、生活、家庭和个人“智能应用”的体系网络;以及这个网络背后所依赖的云存储、计算和知识体系。彩电企业高度看中AI电视的发展,恰是因为语音电视背后巨大的“潜在可能”。
甚至,语音语意技术的创新已经成为一项重要的国家战略。2017年12月,工业和信息化部印发了《促进新一代人工智能产业发展三年行动计划(2018-2020年)》的通知。其中就提到,“支持新一代语音识别框架、口语化语音识别、个性化语音识别、智能对话、音视频融合、语音合成等技术的创新应用”。“2020年,实现多场景下中文语音识别平均准确率达到96%,5米远场识别率超过92%,用户对话意图识别准确率超过90%”;“多语种智能互译取得明显突破,中译英、英译中场景下产品的翻译准确率超过85%”;“智能电视市场渗透率达到90%以上等重要目标和要求”。
2010年开始的智能电视革命,让电视上网成为一种流行和主要体验方式;现在智能革命进入第二阶段“人机智能”正在以语音交互为最初的钥匙,打开彩电业的未来之门。