直接金牌德州扑克克手机端多长时间应该学些什么呢

颤抖吧,人类连德州扑克都玩不过电脑了 | 科学人 | 果壳网 科技有意思
颤抖吧,人类连德州扑克都玩不过电脑了
Game AI 人工智能 深蓝 游戏破解 德州扑克规则
德州扑克技巧
博雅德州扑克 德州扑克怎么玩
德州扑克在线
本文作者:环球科技观光团
(/编译)半个多世纪以来,各类游戏一直是人工智能(Artificial Intelligence, AI)发展创新的温床,而人工智能技术也不负众望地取得了各种突破——著名的深蓝(Deep Blue)在国际象棋比赛中击败了卡斯帕罗夫,IBM开发的超级计算机沃森(Watson)也在《危险边缘》(Jeopardy!)节目中战胜了该节目的两名总冠军詹宁斯和鲁特尔。然而,能击败人类的顶尖选手并不代表能将游戏破解。而现在,来自加拿大阿尔伯塔大学理学院计算机-扑克研究小组的研究者们首次破解了双人限注德州扑克(heads-up limit Texas hold'em poker)的决胜法门。
所谓游戏的破解,是指当游戏双方都以最优策略进行博弈时,能够在任一阶段准确预测博弈结果——胜、负或平局。游戏的破解分为几个不同的层次,比如井字棋就属于已被“强解决”的游戏,在任何阶段,我们都知道玩家的最优策略。而这一次,阿尔伯塔大学的迈克尔·鲍林(Michael Bowling)教授和同事对双人德州扑克进行了“弱解决”——他们能得知在起始情况下,怎么样能保证必不败。“40年多来,扑克类游戏一直是人工智能领域的挑战课题,直到今天为止,双人德州扑克问题才得到破解。”鲍林说。以他为第一作者发表的论文今天发表在《科学》杂志上。
以正常人玩牌的速度,一个人类跟鲍林的程序单挑限注式德州扑克,就算花一辈子也无法得到统计学上显著的胜利。图片来源:Science
德州扑克(Texas Hold'em Poker)是目前扑克游戏中最受欢迎的一种。游戏使用52张牌,没有大小王。每位牌手得到2张牌面朝下的“底牌”,荷官则陆续发出5张牌面朝上的“公共牌”。在限注式德州扑克的两人局中,先手玩家可以根据场上局面选择投注或者盖牌认输,而后手可以选择跟注、加注或者盖牌。如果最后一轮喊注后仍胜负未分,游戏将进入“斗牌”阶段:每名牌手从自己的底牌加上桌面的公共牌共7张牌中,选出最大的5张牌组合决定胜负。
由于在德州扑克中,玩家们无法获取已发生事件的全部信息,诸如对手的底牌,因此这个游戏属于“不完美信息”(Imperfect Information)类游戏。虽然德州扑克的缺失信息比西洋跳棋少,但是这种不完美信息的特质使得双人德州扑克成为难度远远更高的人工智能挑战项目。研究者表示,要破解这样的游戏,势必需要更大的计算机记忆和计算能力。
然而更重要的是算法。鲍林和同事开发了一个叫CFR+的算法,这种算法是CFR算法(counterfactual regret minimization,虚拟遗憾最小化)的一个变体,从使遗憾最小化的角度学习最优的博弈策略。鲍林表示:“我们工作的主要突破是基础算法的改良。这意味着,在任意形式的大规模模型里,基于博弈论的推理将变得更加容易。”
这个算法的表现怎么样?鲍林解释说:“想象一下一个人每小时玩200局扑克,每天玩12小时,70年从未有一天间断。进一步假设他时刻考虑最差的情形,争取最大程度的胜利,采取针对性的策略,并永远不出现一次失误。”他们的程序每秒进行24万亿局,连续操作两个月,结果提示他们基本破解了这个游戏。现在,网友们可以在阿尔伯塔大学的网页上与这个叫(仙王座)的程序交手。
虽然听起来很好玩,博弈论其实一直被寄望于处理一些严肃的问题——在安全领域,博弈论的应用已掀起热潮,例如机场检查点的设置、飞机起落的次序和警卫的巡逻中都有博弈论的身影。在真实世界中,我们往往需要在信息不足或不确定时做出决定,有了更好的博弈论算法,我们才能更好地解决未来的实际问题,正如鲍林试图解决德州扑克问题一样。(编辑:Calo)
信息来源:Science
文章题图:
你可能感兴趣
引用 的话:玩扑克运气占一半!电脑计算了发牌就控制了游戏!赌场也这样!不是这样的,就算你用真牌和这个程序玩最终也是你输。这个纯粹是暴力破解,穷举了所有可能,然后按当时的局面决定下注大小,玩一两局人类可能能赢一点,一直玩下去输光筹码的绝对是人类。
果壳科技编辑
去年IEEE有篇谈围棋的文章,提到最近的某些研究方向已经开始涉及通用算法,就是只告知程序所要参与的棋类比赛的行棋规则,然后让程序根据规则自适应地去选择合适的算法来进行对弈。也就是说一旦研究成熟之后,这种程序将可以在任意构造出的棋类比赛中完胜人类,反正是越听越让人毛骨悚然。想象一下一台十分好学上进的超级计算机,不知疲倦地和各个领域的宗师切磋对抗:深蓝、疯石、沃森、ZEN、仙王座…… 7/24地学习各种人类的阴谋诡计,学成之后,它究竟会做些什么?早晚有一天这些家伙们会联合起来!
显示所有评论
全部评论(88)
果壳科技编辑
玩扑克运气占一半!电脑计算了发牌就控制了游戏!赌场也这样!
引用 的话:玩扑克运气占一半!电脑计算了发牌就控制了游戏!赌场也这样!不是这样的,就算你用真牌和这个程序玩最终也是你输。这个纯粹是暴力破解,穷举了所有可能,然后按当时的局面决定下注大小,玩一两局人类可能能赢一点,一直玩下去输光筹码的绝对是人类。
计算机有他最大的弱点。就是受限与我们的逻辑认知。比如我们无法了解无穷大。我们的大脑不能处理无穷大问题。那么计算机在处理这类数据或者说可能性非常大的情况时就无法有效计算。这就表现在复杂度高的游戏上。比如桥牌。比如围棋。计算机目前没有处理如此多数据的计算能力。就算他有了那么还是有东西他无法处理。那就是无法数学化的东西。可能有一天我们了解了自己。了解了围棋里讲究的境界是个什么东西。直觉是个什么东西。这才可能让计算机完全达到人的水准。
去年IEEE有篇谈围棋的文章,提到最近的某些研究方向已经开始涉及通用算法,就是只告知程序所要参与的棋类比赛的行棋规则,然后让程序根据规则自适应地去选择合适的算法来进行对弈。也就是说一旦研究成熟之后,这种程序将可以在任意构造出的棋类比赛中完胜人类,反正是越听越让人毛骨悚然。想象一下一台十分好学上进的超级计算机,不知疲倦地和各个领域的宗师切磋对抗:深蓝、疯石、沃森、ZEN、仙王座…… 7/24地学习各种人类的阴谋诡计,学成之后,它究竟会做些什么?早晚有一天这些家伙们会联合起来!
引用 的话:计算机有他最大的弱点。就是受限与我们的逻辑认知。比如我们无法...围棋的数学形式太简洁了,很难想象它给任何不是纯数学的东西留了空间。我更相信所谓境界、直觉等不过是打包的近似算法。当然,在计算机下围棋的主要瓶颈还是计算能力的现在,这些都是观点而已
大数本来就是和概率一体相生,算法不就是用来最大化实现可达概率的嘛,也不算稀奇咯。
好吧,如果没有时间限制的话,至少我可以做到不会输……
其实……个人觉得德州玩时间长了……特别是最后就剩两三个人的时候……就已经不是概率学游戏了啊……比如我之前打得都很谨慎,然后一手散牌,看到第三张牌的时候突然加注,别人一定会认为我手里有东西然后弃牌的……和电脑玩的话……除非你找个真正的AI,否则少了这个因素还叫什么德州啊……
此时此刻我只想贴一张图……(from POI s04e11)
再怎么强,未来的电脑总不可能连麻将都完虐人类吧。。。
本来就是博弈问题,只要在数学上有完善到一定水平的模型,那计算机基本都能完爆人类吧?问题就在于数学家能不能建好模型而更重要的问题是,什么时候AI能自己建模?
牌手只是输给一些程序员和数学家,至于计算机,依然连条狗都不如。
引用 的话:再怎么强,未来的电脑总不可能连麻将都完虐人类吧。。。大妈不服,等级差距太大了
引用 的话:one day..没懂。那是谁、
引用 的话:one day..不懂这个梗……能烦请讲解一下吗?
引用 的话:其实……个人觉得德州玩时间长了……特别是最后就剩两三个人的时候……就已经不是概率学游戏了啊……比如我之前打得都很谨慎,然后一手散牌,看到第三张牌的时候突然加注,别人一定会认为我手里有东西然后弃牌的……...你想的好天真……如果你底盘圈是跟注进来的,翻牌圈想加注基本上就是作死
德州扑克德州仪器德州扒鸡
天!作为一个打德州扑克的人,求给一套这样的程序啊!
果壳科技编辑
引用 的话:没懂。那是谁、引用 的话:不懂这个梗……能烦请讲解一下吗?《疑犯追踪》里的Harold Finch,剧里他造出了一个分析能力极强的监控程序。调试这个程序的时候他去赌场玩21点,程序通过赌场的闭路电视和他的手机给他提供最优策略。。
这篇文章的作者似乎不懂得州扑克,或者说更可能是不懂博弈论。这位阿尔伯塔大学的教授 Michael Bowling 研究出的计算机算法严格说应该是一种平衡算法,是博弈中的纳什均衡算法。举个简单点的例子说,在“石头剪子布”游戏中,最佳的“不会输”的方法就是每次以均等的1/3的概率出石头或者剪子或布。那么一台玩儿“石头剪子布”游戏的计算机,只要它能严格按照每次以均等的1/3的概率出石头或者剪子或布,就没有任何人能战胜它。但同样它也无法战胜人类。这个教授研究出的计算机程序应该也是这样,它只是一种“不会输”的算法,但同时它也是“不会赢”的算法。
引用 的话:《疑犯追踪》里的Harold Finch,剧里他造出了一个分析能力极强的监控程序。调试这个程序的时候他去赌场玩21点,程序通过赌场的闭路电视和他的手机给他提供最优策略。。谢谢解释!
引用 的话:这篇文章的作者似乎不懂得州扑克,或者说更可能是不懂博弈论。这位阿尔伯塔大学的教授 Michael Bowling 研究出的计算机算法严格说应该是一种平衡算法,是博弈中的纳什均衡算法。举个简单点的例子说...+1但是有一点你没有提到,这个是限注式的玩法,也就是说,实际上,连弱解决都算不上,实际情况是,人类很可能一波流带走,显然,机器不会
引用 的话:《疑犯追踪》里的Harold Finch,剧里他造出了一个分...预测犯罪系统
个人觉得今后更有可能发展的领域是:股票期货方面,也许已经出现了,比如去年光大的乌龙指,没准就是电脑程序搞出来的。
引用 的话:你想的好天真……如果你底盘圈是跟注进来的,翻牌圈想加注基本上就是作死能被人看出来是吓人吗……嘛……反正我第一圈要么看牌要么弃,虽然我知道这好像不太好
引用 的话:能被人看出来是吓人吗……嘛……反正我第一圈要么看牌要么弃,虽然我知道这好像不太好所以说这个游戏还是很复杂很好玩的,可惜这个网站点不开
我想说…我打不来德州扑克…QAQ
引用 的话:所以说这个游戏还是很复杂很好玩的,可惜这个网站点不开嗯……国内那些德州APP全是一轮ALL IN的家伙,不知道该说什么好了
引用 的话:玩扑克运气占一半!电脑计算了发牌就控制了游戏!赌场也这样!你还是果壳读者吗,这种傻逼话也说得出来
显示所有评论
(C)2017果壳网&&&&京ICP证100430号&&&&京网文[-239号&&&&新出发京零字东150005号&&&&
违法和不良信息举报邮箱:&&&&举报电话:德州扑克应该如何自学? - 知乎1527被浏览189682分享邀请回答t.cn/8Fmryeu)
学习过程中要问自己的几个问题
如何在学习过程中运用我所学到的知识?
学的时候觉得什么都很简单,但一旦开始打牌,就不能很好地运用这些概念。遇到这种问题,我该怎样解决?
我该如何永远消化吸收学到的概念,而不是过一段就忘了?
在学习中遇到任何问题都可以到中扑网CPF论坛:
与众多德州扑克爱好者一同探讨。
0添加评论分享收藏感谢收起}

我要回帖

更多关于 德州扑克 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信