微软发布第五代小冰:上线高级感官 全面进军IoT
2017-08-24 15:00:08 来源:AI Lab 热度:
8月22日消息,今天下午,微软在北京举办发布会,正式推出第五代小冰,微软这款主打EQ(情商)的聊天机器人进入完成态。
增加印度版和印尼版,可以自创回应
第五代小冰机器人扩展到了五个国家,继中国小冰、日本小冰(りんな)、美国小冰(Zo)之后,微软正式推出印度小冰(Ruuh),以及印度尼西亚小冰(Rinna)。其中,印度小冰首先在Facebook Messenger平台落地,而印度尼西亚小冰首先在LINE平台落地。
小冰首席架构师周力称,印尼版小冰是全球范围内第一个使用1:1生成模型(Generative Model)的落地版本。通俗的讲,就是说小冰可以完全不依赖人类数据,可以自创回应。
据悉,微软全球小冰产品线的执行策略是,优先选择人口数量超过1亿的国家,在当地建立完全本地化的团队,初始的训练数据也完全从当地取得,从而确保小冰根植于该国本土文化。也就是说,虽然印度小冰使用的语言种类与美国小冰一样均为英语,但印度小冰的性格、语言、文化和知识体系,与美国小冰截然不同。
据介绍,目前小冰与人类单次连接对话纪录,美国达到了23个小时,而中国的纪录是29个小时。
上线高级感官,具备全双工语音及实时流媒体视觉
据介绍,微软第五代小冰已经拥有高级感官,通过感官融合“自主”选择运用感官。高级感官是由多种初级感官有机融合之后形成的,具备全双工语音,以及实时流媒体视觉。
小冰实时流媒体视觉展示
在小冰上,全双工语音的典型应用案例就是小冰与人类互通电话,这种高级感官需要首先同时具备文本、语音(含SR和TTS)两种能力,要求两种能力均达到更高的质量标准。微软在发布会上宣布,第五代小冰将于9月6日解锁AI电话预约,小冰可以根据自己的理解主动给人类打电话,而且支持网络电话之外直接通过三大运营商来拨通电话。
根据微软小冰负责人李笛的表述,微软将人工智能交互技术产品的演进分为三个阶段。第一阶段是基本的人工智能交互,即拥有某一种或多种交互方式,如文本、语音、图像、视频等,但不同交互方式之间是割裂的。第二阶段是初级感官,即在人工智能系统中,用一种核心引擎(如小冰的EQ核心对话引擎)将上述各种交互统一起来,使不同感官可以混合运用。小冰从2015年第三代发布起,进入这一阶段。而第五代小冰则正式进入第三阶段的高级感官阶段。
全面进入IoT领域,小冰开始控制家电
微软认为,IoT(物联网)应是AI的一个载体,而不是反过来,把AI视为IoT的一个功能。小冰产品总监彭爽认为,目前物联网领域的最大问题是功能堆砌、过分重视交互,以及过多的SDK/API。“真正能普及的IoT设备,成功的可能性只有两个,一个是把IQ做到极致,让用户通过IoT设备体会到比其他现有方式更加便捷高效的益处;另一个是把EQ做到极致,让人们能强烈地认知到她在这个设备里的存在,甚至能接受她成为家庭中的成员,产生情感纽带,无法放弃她。”彭爽表示,微软小冰的IoT方案属于后者。
在发布会上,微软宣布,小冰已与小米IoT开放平台有机融合,小冰可以控制小米米家平台上的全部35种智能设备,并且支持全双工语音。该产品目前已在小米米家平台上线。此外,微软还与其他许多IoT厂商合作,将微软小冰置入设备中。微软还宣布了与Yeelight及东方明珠等合作伙伴正在进行的联合研发。另外,实时流媒体感官也已在中国、日本两个国家的部分主要城市公共区域落地。
人工智能创造全面铺开,小冰电台、智媒体平台3.0发布
发布会上,微软公开小冰目前已进入多个创造领域试水。这些领域包括诗歌创作,少儿读物、歌曲创作,新闻写作等。
今年5月,微软宣布小冰用多个化名在各诗歌论坛和刊物上发表诗歌,并出版了首部人工智能创作诗集《阳光失了玻璃窗》。其后,微软正式上线诗歌联合创作产品,任何人均可使用小冰来完成自己的诗歌创作。
有声少儿读物方面,微软称其质量超越98%的人类创造者,而经过测试,将少儿读物变成有声读物的用时,小冰仅为同水平人类的1/500,成本仅为同水平人类的1/80000。微软宣布,即日起开始大规模生产有声读物并投入市场。
歌曲方面,小冰的最新训练达到了48kHz采样率,同时大幅度扩展了音域,正在不断接近人类歌手。《我是小冰》同名歌曲已于近日在QQ小冰渠道首发。
此外,小冰还通过聆听分析歌曲旋律,结合对不同城市标志性建筑的学习,创作与该城市及歌曲心情有关的视觉作品。通过这一技术,微软与SELECTED合作推出的“天际线”服装进入SELECTED店内进行销售。
新闻写作方面,微软推出智媒体商业平台解决方案3.0,包括媒体生产力、媒体知识图谱、智能交互、全平台互动等六个新模块。此前,小冰作为《钱江晚报》的专栏记者,曾通过大数据撰写专栏文章,并成功预测了多个全球重要事件的结果。此次微软公开,部分网络新闻内容也是由小冰撰写而成的。过去一年来,小冰的智媒体写作已从微信、微博双平台,逐渐演进为接入和即将接入近11个端媒体,与《看看新闻》、《封面》、《钱江晚报》、《春城晚报》等媒体端进行了深入整合。
微软还同时发布了小冰电台,一个通用的人工智能实时内容创造和交互平台。它可以基于多重来源,面向任何主题,自动创造永不间断的电台节目。同时,它还能在交互过程中实时改变节目内容。换言之,小冰电台的质量类似于广播电台主持人的直播节目,但能实时地根据与用户的互动,甚至改变正在进行的直播节目的内容。目前,小冰已经登陆国内三家广播电台,分别是北京青年广播、湖南电台音乐之声,以及HitFM。
小冰成为微软三大AI产品线之一,与Bing开始整合
微软全球执行副总裁沈向洋也为本次发布会助阵。他说到,微软小冰已经成为微软三个人工智能产品线之一(其他两个分别是infuse AI、Bing和小娜)。
沈向洋称,每一次科技时代的变迁都会颠覆很多东西,都是在重新定义人类与世界的关系。“PC时代有PC操作系统和应用软件;互联网时代有浏览器和搜索引擎;移动互联网有社交网络和AppStore。”沈向洋认为,在AI到来的下一个时代,IQ和EQ(智商和情商)是最重要的东西。
微软小冰负责人李笛认为,真正EQ(情商)的极致是理性的,不是感性的。微软对EQ的研发,是希望小冰在聊天的过程中占据主动,真正的EQ表现出来是控制,情绪化只是表象。
沈向洋介绍到,微软Bing国际版已上线,Zo-Bing搜索引擎为用户提供EQ化搜索。此外,微软小冰与Bing搜索引擎加速整合。通过Bing搜索引擎的全球大数据能力,新的解决方案可为媒体构建出一个基于全球新闻数据源的媒体知识图谱,从而能准确挖掘全球资讯中每一篇内容背后的知识与含义,并构建出彼此的关系,从而帮助媒体更全面快速地梳理时间和内容背后的故事。
责任编辑:黄焱林