最近,Facebook 在实验中让两个 AI 聊天机器人互相对话,发现机器人竟逐渐发展出人类无法理解的独特语言。
其实,Facebook这个实验的主要目的,是想让机器学会谈判。
实验中,双方选手语言通过谈判“瓜分”一堆物品(比如两本书、一个帽子和三个球),而每种物品对于不同选手的价值是不一样的,也就是谈回来的物品,对于两位选手带来的分值是不一样的。
从人类的角度理解,这个分值就意味着,你有多想要这个物品。有趣的是,研究人员设置的场景,就跟生活中一样,存在信息不对称——你知道自己多在意这个东西,但是你不知道对方有多想要,所以,你必须从对话中推断对方的想法。
游戏界面
每一句话,都经过计算
Facebook的AI团队(简称FAIR)还设置了其他的限制,让其更接近现实中的谈判场景,比如,要确保两个选手不可能同时拿到最好的结果。生活中往往无法尽如人意,我们总是要学会妥协。
其次,如果放弃谈判,或者谈了10轮还没谈好,双方都只能拿零分,也就是一拍两散。因此,想要利益最大化,你必须拥有杰出的谈判技能。
在训练过程中,AI学会减少说废话和意思模糊的话,提高谈判的效率。谈判显然不是一件如此简单的事,而是一个关于语言和推理的艺术,既包括合作也包括对抗,选手必须学会适当的理解和表达,以达到自身目的。
FAIR研发了一个对话推断模型框架,模拟未说出的对话可能性,然后根据每种对话最后可能的得分,计算自己应该说什么。
对话推测模
AI学会了伪装与欺骗
FAIR团队会让AI跟人或者另一个AI一起玩游戏,让AI逐渐学习应该怎么谈判。经过一轮学习之后,研究团队发现了以下现象:
人类比AI更难捉摸、也更任性:新入局的选手在面对人类对手时,明显谈判耗费的对话时间更长,接受交易更慢。人类与AI另一不同,人类有时候会拒绝继续,直接一拍两散,而实验中的AI会一直谈判,直到达成共识与结果。
从下面的表格中可以看出,相比起人与AI谈判,两个AI谈判达成一致的概率更高,而且结果也更接近最优解。
机机对战与人机对战的对比
AI学会耍手段:某些案例中,AI选手会先假装自己很想要某个物品,其实这个东东对他而言毫无价值。为什么要这么做?原来是为了之后假装“妥协”,因为它发现了对方很想要,如此一来就能骗得对方放出一些更有价值的物品——人类平时的惯用伎俩,没有人教AI,但它自己学会了。
下面三个对话,分别展示了坚持要最大化分数的AI、学会妥协的AI和学会假装不在意的AI。
AI会说未见过的句子:虽然神经网络倾向于训练AI重复数据库里面的话语,但结果是,AI自己学会组织和生成新的句子和说法。
AI发展出人类不能理解的新话
实验还出现了更多让实验人员意想不到的情况,比如“不说人话”。
如前所及,Facebook的文章提到,在强化学习期间,AI选手会尝试通过与另一个选手的对话来改进自己的参数,对手可能是一个人也可能是另一AI。
除了这个模型之外,FAIR还使用了一个监督训练模型来训练AI模仿人讲话,这个模型是后来加入的,同时参数不能被修改。因为研究人员发现,当两个AI一起聊天,相互改进、升级自身参数的同时,会逐渐偏离人类日常交流的语言,发展出自己的语言。
有些人可能觉得,AI居然发展出了人类理解不了的独立语言,简直细思极恐。要是以后AI在密谋什么,人类都听不懂怎么办?
细心一想,难道动物们说的话人类又能听懂吗?(当然,人类一直拥有一种自负,认为语言是人类独有的能力。)既然AI那么聪明,懂得见人说人话,见AI说AI话,未来说不定能学会跟动物沟通……
况且别忘了,只要工程师加入一个模型,就能“拨乱反正”,人类暂时还不需要那么鸡冻吧。Facebook 研究员在报告中很淡定地写:
" 未来的工作还有很多潜在可能,特别是让机器理解更多推理策略,以及在不偏离人类语言的情况下提高表达的多样性。"
相关推荐
DVBCN消息2010年7月7日电--Telairity卓越的H.264编码技术是为全球近十亿人观看2010年世界杯足球赛提供支持的“秘密要素”。整个亚洲、南太平洋以及世界杯主办国南非的观众都是依靠Telairity的H.264/AVC编码器来收看高清(HD)和标清(SD)比赛转播的。有了Telairity的H.264现代技术,世界各地的网络运营商和广播、卫星及有线电视公司可以更换掉旧的MPEG-2压缩系统,为客户提供更出色的视频质量并显著降低对带宽的依赖,从而大幅减少传输成本。泰国国营电信公司CATTelecomPublicCompanyLimited安装了Telairity高清和标清编码器
意法半导体(STMicroelectronics,简称ST)宣布,其先进的高清电视系统级芯片(SoC)平台取得了巨大进步,此项成果将意法半导体推向能够运行基于Adobe®AIR®的游戏和其它应用软件的下一代互联网电视技术的最前沿。意法半导体已成功移植AdobeAIR®2.5forTV软件至第三代先进互动高清机顶盒系统芯片平台,并通过Adobe产品认证。AdobeAIR软件是AdobeFlash平台的一个重要组件,原始设备制造商(OEM)、原始设计制造商(ODM)、服务开发人员以及应用开发人员能够在这个平台开发丰富的网络应用软件和游戏,专门为机顶盒和数字电视等嵌入式设备和
TriplePlayIntegration销售副总裁MikeNottage什么是三重播放集成?TPI公司是一家致力于提供数字家庭视频平台解决方案的专业软件服务公司。TPI公司还是官方Adobe的“ScalingPartner”,为消费电子平台提供FlashPlayer10、AIR和舞台美术技术提供优化的端口。我们有25名具有专业的项目管理和质量保障经验的高级工程师团队,平均具有24年的工作经验.你们能够提供什么样的
DVBCN数字电视中文网讯(敖瑞),2012年6月15日(周五),由ARM主办的“跨界、变革、多赢——ARM移动智能终端研讨会暨应用开发者大会”在上海举行。本次约有20名厂商代表上台演讲;参会并参与展示会的厂商超过30家,均为ARM在各个领域的合作伙伴。ARM亚太市场开发经理AlanTsai做出了“移动终端GPU之趋势与迷思”的精彩演讲。Alan表示:在用户体验上来说,分辨率已经可以高达人眼都无法辨析的地步了。公允的说,业界对GPU的评判标准存在太多的分歧:从三角形的角度来看,涉及到生成率、裁切率等指标,不同类型的GPU产品根本没法比;从填充率的角度上