德扑人工智能“冷扑大师”首胜中国龙之队，李开复认为人类没有赢的可能

4月6日，德州扑克人机大战结束了首日的赛程，在昨日上午的比赛中，人工智能“冷扑大师”暂时领先14145记分牌。

该场“人机大战”由创新工场CEO暨创新工场人工智能工程院院长李开复博士发起，邀请母校美国卡内基梅隆大学（Carnegie Mellon University）知名的Libratus扑克机器人主创团队访问中国，于海南进行一场“冷扑大师 VS 中国龙之队—人工智能和顶尖牌手巅峰表演赛”。

　　
这也是亚洲首度举办的人工智能与真人对打的扑克赛事。

冷扑大师是基于卡内基梅隆大学（CMU）Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus无限德州扑克人工智能系统。今年1月份曾在美国匹兹堡的比赛中，将四位职业选手挑落马下，赢走接近总数的筹码。

　　
对战方“中国龙之队”则由2016年世界德州扑克大赛WSOP金手链冠军得主杜悦领军。战队成员中许朝军、张淮、童舟、朱亚希、王天建均为扑克玩家圈内熟知的顶级高手。其中，杜悦此前是人人网集团副总裁，曾在2016年的世界德州扑克大赛WSOP的无限注德州扑克赛事中获得冠军。

　　
比赛于4月6日至10日举行，为期五天，总共要进行36000副手牌的比拼，获胜一方将获得200万元奖金。

　　
首日上半场比赛结束后，有不少网友反映：冷扑大师并没有像AlphaGo对战人类棋手那样，呈现压倒性的优势。

　　
对此，李开复回应道，冷扑大师几乎没有输的可能。因为冷扑大师能打败美国冠军，中国冠军虽然很强，但还是不如美国冠军强，所以理论上应该是没有机会的。目前优势不明显，和机器学习还没打开有关。

　　
另外，从技术上分析，同围棋相比，扑克的游戏规则更像是在处理真实世界的问题。这是一种有关不确定性的游戏。玩家并不知道对手手中的牌，也不清楚会拿到什么牌，这个过程中同时掺杂着各式的诈和招数。

　　
但Libratus背后并没有使用心理战的机制，它所依靠的仍然是大量的数学。Libratus也没有AlphaGo使用的深度学习技术，而是依赖于一种比较古典的线性规划，一种极其强调试错的方法。

　　
举例来说，AlphaGo是通过分析人类玩家的3000万棋谱来学习的，Libratus却是从零开始，通过自己跟自己玩大量的游戏进行学习。Libratus还利用了博弈论，通过平衡风险与收益来决定自己的下一步。

　　
Liberatus使用了美国匹兹堡的超级计算中心来完成比赛，每做出一个决策大概需要5到10秒钟。如同人类选手在每场比赛后会聚在一起商讨后续的计划，每个夜晚，Libratus 也会使用这台超级计算机优化策略。

　　
关于Libratus的商业计划，卡内基梅隆大学计算机学院院长Andrew Moore表示，他自己最喜欢的商业应用是在企业交易或者是企业谈判领域，货物的供需或者货物的交易，可以用这种AI驱动的商业谈判算法来进行，人们甚至可以通过AI去摸清谈判对象的底线和谈判逻辑。

　　
李开复也表示，当前BAT的AI应用，主要是以用户为主，但人工智能最大的应用，应该是在企业层面，比如帮保险公司做到更好的收益和平衡，帮银行做更好的理财或者是财产配置，帮券商做投资或者智能投顾，帮医生看片子比人看的更准等等，这些机会特别大。