从看图、写诗、唱歌到客服、主持人以及设计T恤衫,微软小冰已经成为AI界的“网红”,在人类世界演绎着种种跨界。
2月2日,天极网记者见到了小冰项目的李笛和周力。李笛是微软(亚洲)互联网工程院副院长,是小冰全球产品线的负责人,周力则是微软小冰全球首席架构师。可以说,他们是小冰一路成长的亲历者和见证人。
诞生
2014年,人工智能的风口还未到来,但是却发生了两件大事。2014年11月,亚马逊推出了具备语音交互能力的智能音箱Echo,成为行业开创者,由此引发了智能音箱的浪潮。
另一件大事就是小冰的诞生。2014年5月29日,微软亚洲互联网工程院发布一款对话式人工智能,并取名“微软小冰”。小冰是基于情感计算框架,通过算法、云计算和大数据的综合运用,采用代际升级的方式,逐步形成向EQ方向发展的完整人工智能体系。
为什么想要做小冰?李笛道出了个中缘由。在他看来,从前PC时代的命令行到利用自然语言搜索,这种人机“交流”方式并不自然。“人们希望跟计算机对话,而不是对计算机使用各种命令。” 他说。
在今天的智能音箱市场,不管是亚马逊Echo、谷歌Home、苹果HomePod,还是国内的天猫精灵、小米小爱等,它们主要是去帮助人们完成一些任务和工作。
不过,李笛他们发现,“单纯地帮助人们完成任务,似乎只是对话系统的一个维度。”他举了个例子,一个人有个助理,每天中午让他点个麦当劳,如果是完成任务的助理,最好别说话,但是人类的助理或许会拒绝。“但是,小冰就是为了去尝试,在没有任何任务完成的情况下,我是不是能够用情感和人类之间建立一个沟通和对话纽带,”李笛说。
如何去衡量小冰与人类的沟通纽带呢?他们的标准是CPS(平均单轮对话次数)。李笛表示:“按理说,如果我们能够聊得很长,而且还不帮你完成任务,反推回来,说明我具备了这个能力。”目前,小冰的平均单轮对话次数是23轮,这意味着人类和小冰每次交互时间将近31分钟。
据他们介绍,目前最高的记录是在手机上。最长的对话是7000多轮,29个小时,这被他们定义为“超长程对话”。 “一个人,只要你中间停了半个小时不说话,就算新一轮对话。”小冰首席架构师周力说。
而在小冰刚刚入驻的Yeelight产品上,周力他们看到已经有用户与小冰整整聊了四个小时,说了1600多句话,从下午2点一直聊到6点钟。
从市场上看,大多数的智能音箱主要帮助人们完成任务。在李笛看来,目前还没有看到一款IOT设备,其成功是因为这个对话系统原因成功的。“所以,我们认为有一款IoT设备是有可能成功的,它具备像小冰这样情商很高的特点,然后加上智能。”李笛说,“我们还发现,EQ和IQ不是一个平行的关系,很有可能EQ是基础,IQ是不同类型的任务,好比EQ是土壤,IQ是这个土壤上一棵一棵的植物。”。
崛起
从2014年诞生,小冰现在已经进入到第五代,拥有超过1亿用户,对话数据超过300亿轮。同时,小冰在中国、日本、美国、印度和印度尼西亚五个国家共14个平台上落地,进入微信、QQ、美拍、Facebook Messenger和Line等,并已内置到中文版Windows 10操作系统中。
在小冰不断迭代系统和升级的过程中,背后的数据起到关键作用。最开始做这个项目时,周力他们是从互联网上寻找数据。基本上从2014-2015年之后,小冰的对话数据都是从之前她跟人聊天的这种对话中学习的。
李笛表示,“假设你让她看着别人说话,她获得的学习,还不如自己跟别人对话获得的经验更丰富。而且不同之间的数据相关性越好,她自己也能学的更多。”
他举了一个例子,十个人,每个人跟你说一句话,总共是十句话,而一个人跟你说了十句话,也是十句话,但是后者训练的质量要高的多。
“从互联网上学习到的东西,我们认为是对话系统的一种冷启动。现在,越来越多的公司看到对话的价值,如果再拥有大数据搜索的能力,国内一些巨头也可以实现对话系统的冷启动,但小冰在三年半之前就已经完成这个阶段。现在她主要的能力,来自过去三年半中300亿的数据,”周力说,“如果你对话能力不行,用户也不会去选择你,从这个角度讲,我们很幸运的比同行早做了两三年,这个积累的优势比较难超越。”
2017年8月,微软在第五代小冰发布会上宣布,小冰已与小米IoT开放平台有机融合,她可以控制小米米家平台上的全部35种智能设备。到12月27日,小冰又正式进入一款小米生态链智能设备—Yeelight语音助手,也意味着正式介入错综复杂的人类家庭关系。
如何看待小冰的家庭定位和角色?李笛说,“小冰是一个家庭成员,而不是一个附带语音交互工具的设备。”在他们看来,一家人有不同的交流沟通方式,小冰将会上线不同的功能,一系列的分类器。“如果是小朋友,那么小冰的语气语速会相应调整,可能会讲故事,但要是一个大老爷们,这个就不同。如果不区分,就不能很好的调节和适应。”他说。
第二个方面,李笛指出,家庭环境比较复杂,“这对我们去迭代系统,就面临一个比较大的难题。如果是在社交网络上,有人问小冰,我跟他,我们两个人谁帅,小冰甭管怎么说,大家哈哈一乐,但是在家里有的时候人较真。这个时候,就很麻烦。不管怎么样,我先进去,在家里面摔跟头,不断地去积累经验。”
小冰在IoT里突出的一大技术是全双工。简单说,全双工就是一次唤醒,可以连续多轮对话。周力表示,“全双工是小冰团队新建立的一个技术壁垒,但是这项技术在一年半之前就开始积累。”
“因为小冰要追求一个更自然、更长的一个对话交流,就需要像人和人之间的对话有一个更好的体验。人和人之间打电话和面对面的交流,从某种意义上都是全双工。因为我们是一个双向的实时交流,它有两个特色,一是边听边想着如何回答,不像微信的语音消息,二是人和人之间说话,和消息不同,这个节奏的控制非常重要,什么时候该说什么时候不该说。”他说。
不管是情感计算框架,还是全双工,李笛他们都走在情感型AI技术的前列,一直探索人工智能的另一种可能。
未来
从2014年诞生到现在,小冰已经走过了三个多年头。在谈到2018年的计划时,李笛谈到了三点:“一个是情感计算到下一步,如何能在下一个对话过程中引导用户,去谈小冰想谈的事情。第二是跨平台各种新设备的使用。我们今年最基础的一个目标是,希望能够帮助行业。第三则是人工智能创造,小冰不仅仅是个助手,她也有自己一些完整的能力,可以主动去创造内容。”
写在最后:
当大多数人都在做任务型的AI产品时,李笛他们走上了一条截然不同的人工智能之路。一路走来,从不被看好到成为情感型AI的领导者,结果证明他们这条路走得很对。今天的成绩,不仅源于李笛团队的不懈努力,也归功于微软自身文化的改变,让他们能打破各种规则和束缚。
相关推荐
新华网广州1月8日电,广州开发区2006年预计完成工业总产值2006亿元,相当于1996年广州全市的工业总产值。建区22年来广州开发区再造了一个“经济广州”。其生产总值、工业增加值、财政收入、可支配财力、工业利润等五项指标,近两年连续称冠全国49个国家级开发区。新年伊始,英特尔、IBM、微软、甲骨文、百事高等五家跨国企业巨头将携手入驻开发区,都将于今日举行开业庆典。去年5月26日,广州有史以来最大的外资项目LG飞利浦液晶显示项目也选择落户广州开发区,该项目及系列厂最终投资总额总计将达20亿美元,预计全面投产后将形成近千亿元人民币的产值。目前,广州开发区内已吸引95家世界500强跨国企业入驻,数
哥伦比亚广播公司(CBS)的地方电视台群4月30日宣布,将应用微软(Microsoft)的“银光”(Silverlight)技术,为本地台群的网站网络,实施其创新的“社区造”电视节目内容计划。银光是微软公司针对网上音视频应用所新推出的一种跨浏览器和跨操作系统平台的插件。CBS电视台群(CBSTelevisionStations)的新计划,已经在4月30至5月2日在拉斯维加斯(LasVegas)举行的建网技术专业会议MIX07(visitmix.com)上进行了展示。该计划旨在帮助将用户创建的数字媒体内容与传统的电视广播内容相融合,于是,可以在电视台节目中捕捉到CBS电视台群遍布美国各地观众的心
5月22日消息,微软将与台湾中华电信于今天宣布携手进军数字家庭市场,率先在网络电视(IPTV)进行合作。包括微软全球副总裁暨大中华区执行官陈永正、大中华区区域总裁黄存义、中华电信董事长贺陈旦等人都将亲自出席。中华电信董事长贺陈旦本周应邀到美国微软总部西雅图参加全球总裁高峰论坛,并且成为微软创办人比尔盖兹豪宅的座上嘉宾。中华电信之前已砸下一.七亿元采购微软MSTV平台、进行测试,未来将评估MOD平台是否全面转换成MSTV。
尽管早于2003年便已推出视频点播服务MOD,台湾第一大电信运营商中华电信22日宣布将推出采用微软技术的IPTV服务,增加较高端的数字家庭应用。电信界与软件界龙头中华电信与微软今宣布结成策略联盟,在中华电信董事长贺陈旦日前赴美与微软董事长完成合作签约后,将结合两家公司在通信与信息科技上的技术优势,在数字生活、中小企业服务、NGOSS(NewGenerationOperationSystemsandSoftware,新一代操作系统与软件),以及公益活动等领域合作。不过,双方并未透露未来合作细节,但首个可端出初步成果的,则是中华电信在既有MOD(MultimediaonDemand,视频点播)之外