由卡耐基梅隆大学(CMU)开发的“Libratus”人工智能(AI)系统将开始一场新的挑战:试图在一对一、无限制投注的“无限注德州扑克”(No-Limit Texas Hold’em)比赛中挑战人类顶级职业玩家,获胜者将获得20万美元的奖金。
卡耐基梅隆大学研究人员表示,希望Libratus最终能够赢得比赛,这样他们就可以首次向全世界宣布:人工智能又攻克了德州扑克,首次战胜人类冠军。但同时,卡耐基梅隆大学的竞争对手又表示不服。
加拿大阿尔伯塔大学、捷克布拉格查理大学和捷克理工大学的研究者近日联合发表论文称,其所研发的人工智能系统已经在德州扑克比赛中达到了专家级水平。因此,他们的人工智能系统才是第一个战胜人类的。
需要指出的是,该论文尚未经过“同行评议”,因此目前尚不可尽信。但基于这支团队的历史成就,他们声称的结果绝非空穴来风。
2008年,几乎由同一批研究人员组成的一个团队开发了出了一套系统,首次在有投注限制的“有限注德州扑克”(Limit Texas Hold’em)比赛中战胜人类高手。2015年,该团队又完成了对该系统的升级,并称已接近完美。
阿尔伯塔大学研究人员在论文中称,他们开发的这套系统使用了一种名为“DeepStack”的通用算法,近期在“一对一无限注德州扑克”(Heads-up No-Limit Texas Hold’em)比赛中战胜了人类。
2016年11月7日至12月12日,DeepStack共与33位人类选手在互联网上进行了44852手较量。比赛结果显示,DeepStack的平均赢率为492mbb/g。DeepStack团队称,一般人类玩家到50mbb/g就被认为拥有较大优势,而750mbb/g就是对手每局都弃牌的赢率。
但是,帮助卡耐基梅隆大学设计Libratus人工智能系统的托马斯·桑德霍姆(Tuomas Sandholm)教授称:“DeepStack并未战胜顶尖高手,因此还不能说它已经战胜了人类。”
桑德霍姆还称:“我们两年前已经达到他们的水平了,但那不是我们的目标。我们的目标从来就不是‘专家级’,而是‘超人水平’,就像‘深蓝’和‘沃森’那样。”
到目前为止,无论是在“有限注德州扑克”,还是“无限注德州扑克”比赛中,人工智能系统只能应对“一对一”的比赛。而在多人(五人或更多)同时比赛中,其复杂性仍是人工智能目前所难以应付的。但不管怎样,这些比赛结果表明,至少有两套人工智能系统又要创造新的里程碑。
DeepStack研究人员称,德州扑克是一种典型的非完整信息游戏,因为你不知道竞争对手的牌,也不知道下一手牌是什么。因此,对于人工智能而言,其复杂性要超过象棋。而DeepStack是一种可用于一个很大类别的序列非完整信息博弈的通用算法,它所取得的成绩表明,人工智能系统已经精通非完整信息游戏。
与谷歌的AlphaGo一样,Libratus和DeepStack并不试图解决整个比赛的所有问题,因为这需要考虑到太多的可能性。相反,这两套人工智能系统利用深度学习来培养一种直觉。DeepStack研究人员称:“在比赛之前,DeepStack不会计算和存储完整的战略,而是使用一种快速的‘近似估算’法,我们称之为‘直觉’。”
如果人工智能这一次能在德州扑克比赛中能战胜人类高手,则意味着研究人员可以利用这套技术来解决日常生活中的一些实际问题,尤其是涉及到非完整信息的一些问题,如商务谈判。在谈判中,双方都会隐藏一些信息。
参与Libratus研发的卡耐基梅隆大学博士生诺姆·布朗(Noam Brown)称:“在现实世界中,信息不可能像棋盘上的棋子那样整洁有序,总有一些重要信息被丢失或隐藏,而人工智能需要有能力来处理这个问题。”