新加坡联合早报中文网即时报道亚洲和国际的评论、商业、体育、生活、科技与多媒体新闻,从世界各个维度报道世界经济新闻,时政新闻,突发新闻等。

当前位置:主页 > 新闻 > 人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

来源:联合早报中文网作者:邵湖心更新时间:2020-09-09 22:40:03阅读:

本篇文章3917字,读完约10分钟

新华社北京10月17日电“终结者”、“我,机器人”和“人工智能”只是许多反映人工智能在过去40年里超越人类并导致人类毁灭的电影中的几个例子。《美国新闻与世界报道》的杰夫·内斯比特说,虽然这种情况在不久的将来不太可能发生,但许多人认为这个主题中的人工智能的第一部分将超越人脑的水平,达到人工超智能的水平,这将在未来30年的某个时候实现。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

人工智能是否会导致人类的灭亡还有待观察,但是人工智能最近在扑克方面取得了重大突破。

人工智能和扑克之间的斗争历史可以追溯到1984年,当时迈克·卡罗创建了一个名为orac的基本扑克人工智能软件,参与世界扑克系列赛(世界扑克系列赛,世界扑克大赛中最权威、最受尊敬的赛事)。Wsop、wpt和ept也被称为世界三大扑克赛事。可以说,人工智能和扑克之间的战争已经打了30多年。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

自那以后,人工智能在扑克领域发展迅速。最近的信息图以可视化的方式提供了人工智能在扑克领域的研究进展的深入介绍和统计概述,同时提供了从迄今为止的研究中提取的见解。

人工智能打败玩家比打败玩家更难

几个月前,几个在线扑克网站的编辑兼社区经理乔希·瓦尔迪尼(josh wardini)在pokersites博客上发布了一份题为《扑克和人工智能:机器对人类的崛起》的信息图表。Wardini介绍了过去30年来扑克和人工智能之间的关系。

人工智能在战略游戏中的应用是最热门的方向。在过去的二十年里,人工智能在各种游戏中击败了人类,包括国际象棋、围棋和危险边缘。在过去的十年里,大多数研究已经转向创造可以玩扑克的人工智能程序。

你可能会问一个问题:为什么是扑克?

国际象棋大师加里卡斯帕罗夫(Garry kasparov)在2010年指出了国际象棋和扑克的区别:在100%信息的国际象棋游戏中,两个玩家将同时学习相同的数据和信息。与计算机的敏感计算能力相比,玩扑克可以隐藏自己的牌,其中有许多变量和不确定性。概率、用假象迷惑对手的心理因素、风险管理等等是扑克中的关键因素。扑克似乎完全基于人类的心理活动,这使得它在面对电脑时无懈可击。一台机器可以很容易地计算出每手牌的可能性或概率,但是面对低概率和高赌注,人工智能并不占优势。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

Wardini认为大学的人工智能系研究扑克是因为它的复杂性。像许多现实生活中的情况一样,扑克必须处理大量不完美的信息,而人工智能的目标是解决扑克中反映的问题。

卡内基梅隆大学(cmu)博士生、人工智能研究员诺姆·布朗(Noam brown)说,在不限名额的德州扑克一对一比赛中,有10比163 (10后面跟着163个零)的不同游戏情况。假设启动堆栈有20,000个芯片,即使是最强大的计算机也不可能计算出所有可能的情况。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

人工智能在扑克上取得了突破。天平动队击败顶级职业选手

扑克中人工智能的研究主要来自于上述的阿尔伯塔大学、奥克兰大学和cmu。Cmu在扑克界很有名。它已经启动了两个人工智能项目claudico和天平动,最近还向一些顶级扑克玩家发起了挑战。

Cladico赢得了许多胜利,但在2015年,Cladico被由doug polk、bjorn li、dong kim和jason les组成的团队击败,但Cladico也赢得了许多胜利。

道格.波尔克曾告诉《神奇宝贝》,克劳迪科使用了一种非常复杂的策略,包括许多赌注,但人工智能技术仍有一些漏洞。

经过改进的迭代,天平动在2017年1月挑战了四名顶级职业扑克玩家。金和莱斯在《归来》中打了第二仗,吉米·周和丹尼尔·麦考利加入了他们的队伍。最后,天平动队击败了这群世界级的德州扑克职业玩家,并以每100手牌14倍大盲注的成绩击败了顶尖的人类玩家团队(译者注:缩写为14bb/100,意思是打100手牌,平均赢对手14倍大盲注)。在天平动用120,000手为人类玩家进行的无限注德州扑克挑战赛后,天平动从四名职业玩家手中赢得了1,766,250美元。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

比赛结束后,董金接受了《扑克新闻》的莎拉·赫林的采访。他说对我们来说比赛真的很难。我们将提出一个策略,这个策略在那天可能会很有效,然后在第二天就会带来新的东西。我们对此没有准备,所以总的来说,这真的非常非常困难。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

为什么会这样?天平动仪将进行自我校正。它每天晚上分析自己的剧本,纠正错误,第二天使用不同的策略,但这还不是全部。

与之前的claudico不同,天平动依赖于一种算法,这种算法使用数百万个内核小时来计算,因此有可能依赖匹兹堡超级计算中心(psc)的bridges source来实现大量计算,并且它不使用固定的内置策略。它还随机选择自己的行为,让对手很难判断它是否在虚张声势。最令人惊讶的是,天平动不仅是人工智能在扑克领域的一个应用,而且可以应用于任何不完善的信息系统,具有无数潜在的应用。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

金姆承认,他作为一个有血有肉的对手的能力令人印象深刻。人工智能玩得很好,我认为它有世界级的水平。

当被问及玩牌时可以使用哪种天平动策略时,金解释说,人工智能程序的混合策略使其难以对抗。

金说,当我自己玩牌的时候,我想融入很多好东西,但这真的很难做到。天平动有一些非常好的策略,但它也是一个混合策略,所以当你使用一个策略太多的时候,你的观点会很容易被利用,所以通常很难模仿或模拟。让我们拭目以待。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

天平动经常在他势不可挡的比赛中使用过度下注。金说,它比任何人都更喜欢过度下注。如果它是一个人类玩家,那么老实说,我们会认为这个家伙完全是一个差劲的玩家,因为他用得太多了。

事实上,当它过度下注时,实际上是在虚张声势。是的,这是在大张旗鼓地虚张声势。

cmu的研究员布朗在2016年3月向pokernews解释道:这并不奇怪(天平动虚张声势),因为计算机正在模拟数万亿手牌,而且它对虚张声势的看法与我们不同。它所做的只是反复遇到这种情况,它注意到即使没有好牌,它仍然可以通过下注赚更多的钱。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

人工智能击败人类玩家的关键因素是什么?

虽然大多数扑克玩家不会很快正面面对人工智能,但看看人工智能如何击败人类玩家使用的技能是很有价值的。是什么让天平动等人工智能程序表现如此出色?

在玩扑克时,有些情绪本身并不坏,在某些情况下甚至可能是有益的。从某种意义上说,在这个游戏中,区分成功的职业玩家和不赚钱也不赔钱的业余玩家的一个重要特征是模仿人工智能的能力。

虽然大多数职业玩家和扑克教练不会这么说,但他们告诉有抱负的职业玩家,在游戏中成功的关键是在做决定时不要考虑钱。

安德鲁·罗伯尔(Andrew robl)2016年在《神奇宝贝》(pokernews)上发表的一篇文章中说,要成为一名成功的扑克玩家,应该具备六个特征,其中五个可以说符合像天平动(天平动)这样的人工智能程序:经验、智力、学习欲望和意愿(不包括欲望)、控制情绪的能力,以及多次玩让人想吐的游戏。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

然而,第六个特征只适用于人类的社交和人际交往技能。人工智能在这方面的表现很差,至少目前是这样。

与人类相比,人工智能在情绪控制方面具有明显的优势,包括偏见和疲劳因素。当天平动连续失败时,他不会生气或沮丧,也不会在随后的对抗中击败对手或处于不利状态。经过一整天的努力工作,它不会感到筋疲力尽,更不用说犯错误了。所以它是一个更好的玩家。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

在面对天平动仪之后,金姆的评论强调了人工智能和人类之间的关键区别:我们没想到会失去这么多,这是一个非常困难的部分,不一定是因为人工智能本身。但是一直输,球队的士气非常低落。

与此同时,天平动也根据经验不断调整其策略,并始终发挥其最佳水平。

人工智能感觉不到金钱的价值,这使它们免于风险,并且总能实现正确的博弈论优化(gto)策略,即使在风险回报比非常糟糕的时候。这导致他们广泛使用虚张声势的战术。

不管有没有风险,天平动将做出最好的决定。他们没有资金管理的概念,也不需要支付账单,这有助于他们做到这一点。

击败人类玩家只是开始

Tuomas sandholm是天平动系统的联合创始人,他在卡内基梅隆大学的一份出版物中评估了人工智能胜利的影响。

他说,人工智能基于不完美信息进行战略推理的能力现在已经超过了人类。

波尔克在接受《神奇宝贝》采访时回应了这种情绪,他注意到克劳迪奥的弱点已经在天平动了。

就我而言,现在很明显,在无限制的德州扑克一对一比赛中,人类落后于不断变化的形势,我认为这种情况将以其他形式继续发生。

cmu计算机科学部主任弗兰克·普芬宁说,加入虚张声势是一个关键概念,因为没有这种能力你就赢不了。他说,开发一个能够成功做到这一点的人工智能程序是科学进步的一大进步。想象一下,有一天你的智能手机将能够为你想买的新车协商出最佳价格。这只是开始。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

通过人工智能训练运动员

似乎我们可以从这些可以玩扑克的人工智能程序中学到很多,但不要做得太多。有一些扑克技巧。我们人类比机器好。

尽管人工智能非常擅长通过模拟数万亿手牌来实现最佳的博弈论(gto)策略,但由于人工智能可以为特定对手获取的样本数量有限,它在针对单个对手的弱点采取策略方面能力很差。

布朗说,这是一个活跃的研究领域,如何利用对手的有限样本。我们不知道为什么人类玩家非常擅长这个,这可能是人工智能的一个重要薄弱环节。

虽然扑克玩家可能会担心和震惊,因为他们担心没有情感的人工智能会赚到他们所有的钱,但这些程序的开发实际上可以对他们的盈亏产生积极的影响。Wardini提到,人工智能模拟和训练软件的存在可以帮助人类,包括帮助玩家开发一种没有漏洞的平衡方法,并通过更好的决策来提高他们的游戏水平。

人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

附件:扑克和人工智能的信息地图:机器对人类的崛起

标题:人工智能与扑克大战30 年:机器为何现在开始碾压顶级牌手?

地址:http://www.6st8.com/zbxw/7266.html

免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。

返回顶部