4月6日,德州扑克人机大战结束了首日的赛程,在昨日上午的比赛中,人工智能“冷扑大师”暂时领先14145记分牌。
该场“人机大战”由创新工场CEO暨创新工场人工智能工程院院长李开复博士发起, 邀请母校美国卡内基梅隆大学(Carnegie Mellon University)知名的Libratus扑克机器人主创团队访问中国,于海南进行一场“冷扑大师 VS 中国龙之队—人工智能和顶尖牌手巅峰表演赛”。
这也是亚洲首度举办的人工智能与真人对打的扑克赛事。
冷扑大师是基于卡内基梅隆大学(CMU)Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus无限德州扑克人工智能系统。今年1月份曾在美国匹兹堡的比赛中,将四位职业选手挑落马下,赢走接近总数的筹码。
对战方“中国龙之队”则由2016年世界德州扑克大赛WSOP金手链冠军得主杜悦领军。战队成员中许朝军、张淮、童舟、朱亚希、王天建均为扑克玩家圈内熟知的顶级高手。其中,杜悦此前是人人网集团副总裁,曾在2016年的世界德州扑克大赛WSOP的无限注德州扑克赛事中获得冠军。
比赛于4月6日至10日举行,为期五天,总共要进行36000副手牌的比拼,获胜一方将获得200万元奖金。
首日上半场比赛结束后,有不少网友反映:冷扑大师并没有像AlphaGo对战人类棋手那样,呈现压倒性的优势。
对此,李开复回应道,冷扑大师几乎没有输的可能。因为冷扑大师能打败美国冠军,中国冠军虽然很强,但还是不如美国冠军强,所以理论上应该是没有机会的。目前优势不明显,和机器学习还没打开有关。
另外,从技术上分析,同围棋相比,扑克的游戏规则更像是在处理真实世界的问题。这是一种有关不确定性的游戏。玩家并不知道对手手中的牌,也不清楚会拿到什么牌,这个过程中同时掺杂着各式的诈和招数。
但Libratus背后并没有使用心理战的机制,它所依靠的仍然是大量的数学。Libratus也没有AlphaGo使用的深度学习技术,而是依赖于一种比较古典的线性规划,一种极其强调试错的方法。
举例来说,AlphaGo是通过分析人类玩家的3000万棋谱来学习的,Libratus却是从零开始,通过自己跟自己玩大量的游戏进行学习。Libratus还利用了博弈论,通过平衡风险与收益来决定自己的下一步。
Liberatus使用了美国匹兹堡的超级计算中心来完成比赛,每做出一个决策大概需要5到10秒钟。如同人类选手在每场比赛后会聚在一起商讨后续的计划,每个夜晚,Libratus 也会使用这台超级计算机优化策略。
关于Libratus的商业计划,卡内基梅隆大学计算机学院院长Andrew Moore表示,他自己最喜欢的商业应用是在企业交易或者是企业谈判领域,货物的供需或者货物的交易,可以用这种AI驱动的商业谈判算法来进行,人们甚至可以通过AI去摸清谈判对象的底线和谈判逻辑。
李开复也表示,当前BAT的AI应用,主要是以用户为主,但人工智能最大的应用,应该是在企业层面,比如帮保险公司做到更好的收益和平衡,帮银行做更好的理财或者是财产配置,帮券商做投资或者智能投顾,帮医生看片子比人看的更准等等,这些机会特别大。