语音识别成AI发展核心要素用户体验亟需提升
2017年,无疑是人工智能最火爆的一年。大大小小的人工智能论坛也在如火如荼的召开,各方都在拼命强调自己对于这个行业的深刻见解。然而,技术实现应用与落地或许不难,但实现产品真正的价值,成为众多人工智能初创企业的瓶颈。
11月15日,科技部公布的首批国家新一代人工智能开放创新平台名单中,百度、阿里云、腾讯和科大讯飞4家企业赫然在列,未来它们将分别围绕自动驾驶、城市大脑、医疗影像和智能语音等领域,开展建设创新。目前,百度、阿里巴巴、腾讯等企业已先后涉足人工智能,并取得了不俗的成绩,在相关领域正奋力追赶世界领先水平。
语音识别作为打造良好交互体验的重要前提,今年的发展可谓是持续火爆。在智能音箱市场,首先想到的就是Amazon的Echo。Echo作为将自然语音转化为在线指令的设备,其效率之高无容置疑,并且可保持在线的自然环境中的自然语言识别。
Echo的核心技术在于它集成的智能语音助手Alexa。在2015年6月25日亚马逊曾宣布,将开放智能语音硬件Echo的内置AI助手Alexa的语音技术,供第三方开发者免费使用。由此可见,亚马逊向用户呈现出来的不仅仅是技术上的领先,还有真正落地的产品,以及良好的产品体验。
如果说国外的企业在技术上具备领先优势,短时间内难以超越,这一点无可厚非。与此同时,国内语音识别领域也开始争夺大战。以科大讯飞听见系列产品为例,自2015年发布以来,总用户突破1000万,应用于30余个行业。目前,已经形成了以听见智能会议系统、讯(询)问笔录系统、听见转写网站、录音宝APP、听见智能会议服务等以智能语音转写技术为核心的产品和服务体系。
另外,科大讯飞输入法以超过97%的语音输入识别准确率,英日韩三种随声翻译,独家支持21种方言语音输入,成为锋时互动、蓦然认知等众多企业的合作对象。在科技部公布的首批国家新一代人工智能开放创新平台名单中,科大讯飞的智能语音赫然在列,这无疑是对其的最有力肯定。
经过多年持续积累,中国在人工智能领域取得重要进展,国际科技论文发表量和发明专利授权量已居世界第二,部分领域核心关键技术实现重要突破。语音识别、视觉识别技术世界领先,自适应自主学习等初步具备跨越发展的能力,中文信息处理、工业机器人和无人驾驶等技术逐步进入实际应用。与此同时,中国企业在人工智能领域表现突出,创新创业日益活跃,一批龙头骨干企业加速成长,在国际上获得广泛关注和认可。
做好产品品质与体验才是在行业内立足的关键,无非是需要回到专注技术的研发,蕴含在产品背后的科技力量才值得被关注。对于一个专注于语音技术企业而言,让机器“听的懂”不应该是最基本的么?
目前,语音识别和语义理解已经成为人工智能发展较为成熟的领域,做语音的企业如雨后春般出来抢占市场,如何才能抢占先机,站上行业制高点,拼用户和体验无疑是最有效的路径。
相关推荐
DVBCN消息2010年7月7日电--Telairity卓越的H.264编码技术是为全球近十亿人观看2010年世界杯足球赛提供支持的“秘密要素”。整个亚洲、南太平洋以及世界杯主办国南非的观众都是依靠Telairity的H.264/AVC编码器来收看高清(HD)和标清(SD)比赛转播的。有了Telairity的H.264现代技术,世界各地的网络运营商和广播、卫星及有线电视公司可以更换掉旧的MPEG-2压缩系统,为客户提供更出色的视频质量并显著降低对带宽的依赖,从而大幅减少传输成本。泰国国营电信公司CATTelecomPublicCompanyLimited安装了Telairity高清和标清编码器
意法半导体(STMicroelectronics,简称ST)宣布,其先进的高清电视系统级芯片(SoC)平台取得了巨大进步,此项成果将意法半导体推向能够运行基于Adobe®AIR®的游戏和其它应用软件的下一代互联网电视技术的最前沿。意法半导体已成功移植AdobeAIR®2.5forTV软件至第三代先进互动高清机顶盒系统芯片平台,并通过Adobe产品认证。AdobeAIR软件是AdobeFlash平台的一个重要组件,原始设备制造商(OEM)、原始设计制造商(ODM)、服务开发人员以及应用开发人员能够在这个平台开发丰富的网络应用软件和游戏,专门为机顶盒和数字电视等嵌入式设备和