随着无人驾驶快速的发展,用户对驾驶体验的需求越来越高,良好的人机交互有助于提升驾驶体验,并且加速无人驾驶市场化的进程。清华大学汽车工程系副教授李升波博士认为,「人机交互是无人驾驶汽车市场化的最后门槛」。
文章从以人为中心的「人」的角度出发,探讨了无人驾驶领域涉及的两类主要人群驾驶者(车内人和车外人)与汽车的人机交互方式(车内人与汽车的交互主要以语音和手势交互为主;车外人与车的交互方式目前仍处于概念性的研发阶段),梳理了语音交互与手势交互在无人驾驶领域的进展以及车与车外人的交互方式,分析了各交互现有的问题并提出了相应的建议。
1. 引言
随着新一代信息技术的发展,汽车智能化、网联化的趋势丰富了无人驾驶的范畴与深度,极大地推动了无人驾驶商业化的进程。无人驾驶在今天看来不算是一个全新的概念,部分车企巨头已经纷纷完成了无人驾驶的路测,并且各大汽车企业将无人驾驶初步商用化的时间点预估在 2025 年,不出 10 年,无人驾驶会成为现实 。从无人驾驶理念的提出到发展至今的智能网联化趋势,无人驾驶本质上都是解决人的出行需求。
随着各大汽车、互联网及科技巨头企业在 ADAS(高级辅助驾驶系统)、通信等方面的深入研究,无人驾驶作为一种出行方式,其在车辆安全驾驶的技术上有很大进展。但目前各车企关于汽车与人的交互研究还不够深入,情绪检测、自适应人机交互、眼球追踪、语境语音等提升汽车智能化、差异化的 HMI 技术还不够成熟,需要进一步优化。人机交互是无人驾驶市场化的关键,良好的人机系统有助于推动无人驾驶商用的进程,正如清华大学汽车工程系副教授、智能交通学者李升波所说「人机交互是无人驾驶汽车市场化的最后门槛」。
人机交互是以「人」为核心,无人驾驶涉及到的直接「人」有两种,车内人与车外人,车内人主要以驾驶员为核心,车外人主要以行人为核心。本文将从「人」的角度出发,探讨不同身份的人与车的交互方式:
对于车内人,目前各企业研究的热点集中在语音识别、手势控制这两种交互技术上;
对于车外人,目前与之相关的研究较少,人为驾驶模式的时候,行人通常会与司机有目光的交流以增加安全感;而无人驾驶阶段,这一互动就尤为困难,那么对行人开发新的信息反馈方式显得尤为必要,所以对车外人来说,车与人的交互方式是以信息反馈为目标进行研究。
2. 车内人与车的交互方式
2.1 语音交互
语音交互最基本的目的是辅助行车安全,在安全性保障的基础上被用于提升车内的体验乐趣。根据车载市场语音调查报告显示,40% 的车企已将语音交互技术搭载在自己的产品上、50% 的车企正在开发语音交互系统,可见语音交互将逐渐成为车联网交互方式的主流,预计其将会成为无人驾驶领域排名第一的人机交互方式。
语音交互的模式为语音系统置入智能手机或语音系统配置在车载终端上两种方式,车企中采用用智能手机为语音操作端的解决方案以宝马、福特、通用、现代等企业为代表,语音系统搭载车载终端的企业以奥迪、通用、现代、特斯拉、吉利、长安等为代表,主要的功能以拨打电话、导航、娱乐系统命令下达等为主。
图 1 Nuance 声龙驾驶(Dragon Drive)系统
汽车领域现有的代表性的语音交互系统有 Nuance 通信公司的 Dragon Drive 语音助手、奇瑞和科大讯飞联合开发的 Cloudrive2.0 系统:
Dragon Drive 语音助手可以实现拨打电话、阅读信息、智能导航、车辆保养维修预约等功能,具有自然语音识别及语言语境学习的能力,并且能够与驾驶员进行简单的对话;
Cloudrive2.0 系统的亮点在于自然语言的识别,可以识别 16 种方言,以及强大的降噪能力使得语音交互更加智能、精准。
语音交互在实际的运用过程中其实并不是很成熟,根据美国 J.D. Power 机构发布 2016 汽车新车质量调查显示,在众多交互的问题中,语音交互故障率高达 23%。语音交互主要的问题有:
交互的自然性低:现阶段语音命令主要以固定的搭配为主,可以接收的命令有限,而且受到地方口音与专有名词以及特殊语义的限制,大大降低了语音系统的识别性;
灵活性不够:系统对驾驶者发出的命令不能做出灵活性的修正,在驾驶人员口误的情况下,即使提高了识别的准确率,也无法获得正确的交互;
抗噪性:部分情况下车内不是单独只有驾驶员,还有其它乘客,语音交互系统如何正确区分驾驶员的命令、乘客之间的交流也是要解决的问题。
在无人驾驶车辆中,驾驶员对安全行驶的注意力会减弱,更多精力会投入到其它事情当中,对车内交互深度与智能度要求会更高,全自然的语音交流将成为用户真正渴望的交互方式,未来的语音交互不单单是命令式交互,更多的是场景化的应用。
2.2 手势交互
正确理解人类的手势语言,同样是汽车领域人机交互的研究热点 [2]。相比较语音控制和触摸屏,手势交互的技术门槛更高,交互形式复杂,现阶段的成熟度较低,手势控制实现起来更加困难。手势交互现阶段只能完成一些简单的交互,比如打电话、调节音量等操作。如表 1 为各巨头企业在汽车手势交互领域的研究。
表 1 各公司手势识别技术
从表可看出,各企业在交互方式与交互内容上各有差异,其中大陆基于减少驾驶员分心的理念将手势识别集中在方向盘上,不同于其它企业将识别集中在中央扶手附近。此外,从技术角度来看, ToF 技术(Time of Flight)、结构光技术、毫米波雷达技术为汽车领域手势识别的主要技术:
ToF 技术是利用光线传播的时间来识别手的位置及手的姿势 [3];
结构光技术采用点、线、面的光获得图像,并利用三角原理得到手的位置及姿势 [4];
毫米波雷达技术利用雷达波收发的时间差确定手的位置及手势 [5]。
从技术难度及计算效率来说, ToF 技术较为简单,不需要任何计算机视觉方面的计算,这也是目前大部分公司青睐 ToF 技术的原因。
对汽车行业内的手势交互应用进行研究,总结出目前手势交互存在的问题有:功能单一,缺乏统一的规划,人与车的自然交互匮乏,多数企业的手势交互系统识别准确率不高,识别速度缓慢,这些问题使得人机体验质量下降。现有的手势交互难点有:
手势识别技术的成熟度不够,难以高质量地完成手势控制;
手势可表达的内容有限:相比较语音交互来说,手势交互难以表达清楚具体的任务内容,但在表达任务的执行对象上来说比语音交互更有优势;
不同手势之间的相似性以及手势范围的模糊性造成系统的误判。
未来手势交互除了要解决上述的难点,手势的设计也符合人的习惯,因为手势的交互需要投入一定的学习成本,未来人们更希望获得学习成本低、交互自然的体验。手势的设计也应尽可能简单,接近日常生活中人们自然交流的姿势,同时也应考虑不同人群的文化、习惯对手势交互进行相应的定制。
3. 车外人与车的交互方式
行人过马路的安全感往往来自与驾驶员的眼神交流或挥手动作,人为驾驶时,很容易实现与车外行人的交流,而当路面上无人驾驶的比例上升时,驾驶员与行人的交流就显得尤为困难。无人驾驶阶段,驾驶员对路面的注意力不那么高,那么为保障行人安全感,驾驶员与行人的交互转化为车与行人的交互是一种必然趋势。关于车与行人的交互方式各研究机构也有不同的解决方案:
Semcon 研发出 The Smiling Car 概念汽车,汽车前端布置有一块显示屏,显示屏以显示微笑的图案告知行人可以通过马路;
Drive.ai 初创公司关注于无人驾驶车与路上行人、司机的交流,其解决方案是在车子顶部安装公告牌发送信息给行人,或者适当地发出声音提醒行人;
Google 公司致力于打造更安全的汽车,申请了一项「可与行人沟通」的无人驾驶技术专利,专利描述了利用电子显示屏向行人显示交通标志信号,同时发出例如「安全行驶」的声音提醒,甚至通过安装电子眼或机械手臂向行人示意。
无人驾驶汽车与行人的交互现处于概念性的研发阶段,并没有实际地应用,对此方面进行研究的公司也比较少。现阶段主要的交互以视觉交互和听觉交互为主:
视觉交互除了要考虑各情况下展示的信息内容外,还应考虑车速对行人视觉的影响;
同样地,听觉交互除了考虑发出的信息内容外,声音的大小以及不同道路环境的干扰也是要研究的方向。
未来无人驾驶或许会出现更先进的与行人交互方式,但无论是采取什么样的交互方式,汽车所发出的信息要保证能为行人所识别及理解。车与行人自然地交互是未来无人驾驶必须要解决的问题,无人驾驶不应只考虑驾驶员的需求,对道路上所有人员包括行人、交警的需求考虑在内是十分有必要的。
4. 结语
由于汽车本身生产的周期性长,目前部分无人驾驶与人交互的实现仍处于概念阶段。从交互的角度来说,人与车最自然的交互方式是没有交互,纵观目前市场的发展,现阶段的人机交互距离自然的交互还有很大的差别。目前人机交互的主要方式是人下达命令,由机器去执行,在这个过程中,人的命令是不能有失误,否则就无法实现正确的操作,这对于人的安全和体验有一定的隐患。
未来自然的人机交互应是以情景识别为主,即机器通过环境来预知人的需求,比如车辆燃料不够可以自动规划路线补充燃料、下雨时自动关闭窗户等更加智能地满足人的需求,以减少人的操作。
汽车的人机交互是无人驾驶最后的门槛,未来汽车的人机交互系统需要更安全、更稳定的技术,以实现更智能、更人性化的需求。这不是任何单方可以完成的事情,需要集合汽车、人工智能、心理学等不同领域的知识来完成这这一复杂的系统。
责任编辑:王维