德扑人工智能“冷扑大师”首胜中国龙之队,李开复认为人类没有赢的可能

德扑人工智能“冷扑大师”首胜中国龙之队,李开复认为人类没有赢的可能-DVBCN
4月6日,德州扑克人机大战结束了首日的赛程,在昨日上午的比赛中,人工智能“冷扑大师”暂时领先14145记分牌。
该场“人机大战”由创新工场CEO暨创新工场人工智能工程院院长李开复博士发起, 邀请母校美国卡内基梅隆大学(Carnegie Mellon University)知名的Libratus扑克机器人主创团队访问中国,于海南进行一场“冷扑大师 VS 中国龙之队—人工智能和顶尖牌手巅峰表演赛”。
  
这也是亚洲首度举办的人工智能与真人对打的扑克赛事。

 
冷扑大师是基于卡内基梅隆大学(CMU)Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus无限德州扑克人工智能系统。今年1月份曾在美国匹兹堡的比赛中,将四位职业选手挑落马下,赢走接近总数的筹码。
  
对战方“中国龙之队”则由2016年世界德州扑克大赛WSOP金手链冠军得主杜悦领军。战队成员中许朝军、张淮、童舟、朱亚希、王天建均为扑克玩家圈内熟知的顶级高手。其中,杜悦此前是人人网集团副总裁,曾在2016年的世界德州扑克大赛WSOP的无限注德州扑克赛事中获得冠军。
  
比赛于4月6日至10日举行,为期五天,总共要进行36000副手牌的比拼,获胜一方将获得200万元奖金。
  
首日上半场比赛结束后,有不少网友反映:冷扑大师并没有像AlphaGo对战人类棋手那样,呈现压倒性的优势。
  
对此,李开复回应道,冷扑大师几乎没有输的可能。因为冷扑大师能打败美国冠军,中国冠军虽然很强,但还是不如美国冠军强,所以理论上应该是没有机会的。目前优势不明显,和机器学习还没打开有关。
  
另外,从技术上分析,同围棋相比,扑克的游戏规则更像是在处理真实世界的问题。这是一种有关不确定性的游戏。玩家并不知道对手手中的牌,也不清楚会拿到什么牌,这个过程中同时掺杂着各式的诈和招数。
  
但Libratus背后并没有使用心理战的机制,它所依靠的仍然是大量的数学。Libratus也没有AlphaGo使用的深度学习技术,而是依赖于一种比较古典的线性规划,一种极其强调试错的方法。
  
举例来说,AlphaGo是通过分析人类玩家的3000万棋谱来学习的,Libratus却是从零开始,通过自己跟自己玩大量的游戏进行学习。Libratus还利用了博弈论,通过平衡风险与收益来决定自己的下一步。
  
Liberatus使用了美国匹兹堡的超级计算中心来完成比赛,每做出一个决策大概需要5到10秒钟。如同人类选手在每场比赛后会聚在一起商讨后续的计划,每个夜晚,Libratus 也会使用这台超级计算机优化策略。
  
关于Libratus的商业计划,卡内基梅隆大学计算机学院院长Andrew Moore表示,他自己最喜欢的商业应用是在企业交易或者是企业谈判领域,货物的供需或者货物的交易,可以用这种AI驱动的商业谈判算法来进行,人们甚至可以通过AI去摸清谈判对象的底线和谈判逻辑。
  
李开复也表示,当前BAT的AI应用,主要是以用户为主,但人工智能最大的应用,应该是在企业层面,比如帮保险公司做到更好的收益和平衡,帮银行做更好的理财或者是财产配置,帮券商做投资或者智能投顾,帮医生看片子比人看的更准等等,这些机会特别大。
相关文章
以数实融合创新未来,探访泉城看得见的数智化新进展
以数实融合创新未来,探访泉城看得见的…
工信部陶青:5G行业应用覆盖到76个行业大类,间接带动总产出约14万亿元
工信部陶青:5G行业应用覆盖到76个行业…
工信部赵志国:全国已累计建成207个千兆城市,GAI服务大模型注册用户超6亿
工信部赵志国:全国已累计建成207个千兆…
吉视传媒:争取2-3年实现“宽带整转”为核心快速增户,打造广电特色“5G+”模式
吉视传媒:争取2-3年实现“宽带整转”为核…
华数传媒发行动方案:上年度已分红4.08亿元,积极培育智慧广电等新质生产力
华数传媒发行动方案:上年度已分红4.08…
我国提出《人工智能能力建设普惠计划》
我国提出《人工智能能力建设普惠计划》
我还没有学会写个人说明!