AI专家柏林森博士:德扑人机大战为什么人类还有赢的可能

今日头条宣布,由于微信技术限制,近期无法将关联微信内容源同步到头条号平台。同样是今天下午,北京市网信办、市公安局、市文化市场行政执法总队联合约谈今日头条、火山直
今日头条宣布,由于微信技术限制,近期无法将关联微信内容源同步到头条号平台。同样是今天下午,北京市网信办、市公安局、市文化市场行政执法总队联合约谈今日头条、火山直
2016年初,在微博上一路明星网红的引领下、朋友圈一群萌妹子的分享下,Faceu就这样闯入了像我一样喜欢社交、喜欢新奇事物的年轻人视线中,在一次次的体验后,我也喜欢上了这
随着物质条件的丰富,大家逐步意识到精神上的空虚。“知识付费”无疑有很多想象空间,知识付费+社群更能发挥资源的极致。只有在产品模型和商业逻辑上寻求创新和突破,才能真
提起元生资本,知道的人并不多;提起它的创始人彭志坚,知道的人也不会太多;但提起彭志坚在创立元生资本前的职位——腾讯投资并购部总经理,恐怕很多人都会知道他的厉害。
转念一想,一个程序员在产品经理社区里提出这样的问题,不是搞事情吗?不怕被打吗?果不其然,有产品经理跳出来讲:每个产品经理都梦想着自己去主导一个产品的诞生,当然
苹果CEO库克是同性恋已经是众所周知的事情,除了坦然面对自己,他还为为LGBT人群(同性恋、双性恋、跨性别者或变性人)代言,并因此获得了自由言论奖。
为什么万字长文,经常成为爆文的常客?很多人可能会产生疑问:如今这个时代,写这么长的文章,会有人看吗?很多人会习惯性地认为,读者们是没有精力和耐心阅读长文的,必须
谷歌前高管斯蒂芬妮·提比略对 2012 年时的智能手表创意记忆犹新,当时设计人员顺应潮流想让智能手表完成健康追踪的任务,但谷歌内部对这个想法却提不起兴趣。
很多人在做了 2 年左右的运营之后便遇到了天花板,找不到突破的方法,而这一切的最佳破局工具就是——不断的复盘总结。
希望这篇文章能够对你们的短信营销有新的认识和帮助,也希望大家能尽快上手,做出最高质量的推广营销方法。
SEO,即是搜索引擎优化。对搜索引擎友好,不仅表现在网站内容上,网站结构结构上也是一个核心的部分。那么重要的问题来了,如何布局网站结构才能对搜索引擎友好完美提高用户体
版权所有 粤ICP备号-1咪哚网(www.midoo.cc),互联网资讯平台!
您的位置: >
AI专家柏林森:德扑人机大战为什么人类还有赢的可能
& 4 月 10 日上午,“冷扑大师VS中国龙之队”德州扑克人机大战表演赛结束了全部比赛,第九场龙之队依旧未能总分取胜,输了 47343 分。总战绩 36000 手牌,人类一共输了 792327 分,平均每百手损失 22 个大盲注。即使单看九个单场的比赛,人类牌手也未取一胜。& & & 赛后几位龙之队的选手坦言,后半程他们其实已经发现了冷扑大师的一些规律性失误,所以成绩也有所提升,但可惜发现得有些晚。如果在进行几场较量的话,他们有信心取得单场比赛的胜利。& & & 柏林森先生,信柏科技创始人/CEO、深海棱镜公司创始人,资深大数据和人工智能从业者,深度围棋、德州扑克爱好者,受邀作为新浪网的科学顾问和棋牌特约评论员出席了此次大赛。& & &&【柏林森简介】柏林森,中国科学技术大学物理学学士,美国伊利诺伊大学电子及计算机工程硕士、物理学硕士,美国注册金融分析师(A),美国精算协会准精算师(ASA),在海内外知名企业从业二十多年。柏林森先生专长于海量数据处理、数学建模、时间序列预测、人工智能及其系统实现,自美归国后先后创建百分点科技、信柏科技、深海棱镜科技等大数据/人工智能公司,先后被评为中关村高端领军人才(高聚工程)、海淀区创业领军人才、中关村核心区文化创意产业十大最具网络影响力人物、中关村十大海归新星,北京大学零售业研究中心大数据专家讲师、中商联商业养老产业分会大数据分析专家,是国内大数据和人工智能实践领航者。&&& & 现场,针对此次德扑人机大战,柏林森先生在接受记者采访时进行了个人观点的阐述与解析:& &&&记者问:李开复说德州扑克人机大战人类胜率有10%,而围棋是零,你怎么看?& & &柏林森答:我们假设真的有围棋之神和德扑之神。围棋之神能够所谓穷尽变?? 6 化,那么你跟他下棋确实不可能赢。德扑之神判断、计算能力无可匹敌,他能从你的行为中读出你的手牌是对3,而他拿着对A。那么这手牌,德扑之神肯定是“All IN”的。但河牌是有可能发出一张 3 的,最后输的是德扑之神。& & & 围棋和德扑有本质上的区别,围棋是完全信息博弈,理论上有最优解。德扑是非完全信息,总是有概率的。德扑水平的较量要看长线收益,打得手牌越多,小概率事件所能造成的影响就越少。这次一共只打 36000 手,其实人取胜的概率比想象的大。& & & 可能要跟柯洁下人机大战的AlphaGo当然还不是围棋之神,但他距离围棋之神的距离肯定比人类棋手近很多,人类棋手跟他下的胜率会很低很低。不过,在数学上0%并不代表着不能发生,只是在有限的时间里你可能观察不到而已。所以一般这种事发生的时候,我们都称之为奇迹。& & &&记者问:听说冷扑大师没有用最近比较热的深度学习的技术?& & &&柏林森答:冷扑大师用到的是一种叫做CFR(Counterfactual Regret Minimization)的框架。在双人零和游戏(你赢的是我输的)里,理论上是都存在纳什均衡点的。这次人机大战的德州扑克单挑赛制就是这样,人类和机器的输赢相加和为零,双方的目的都是为了赢其对手手里尽可能多的筹码。& & & 我们用最简单的剪刀石头布游戏举例。我们可以很容易的想到,如果我很均匀的按三种各1/ 3 的概率出,那么无论对方怎么出,最后的结果肯定是胜平负各占1/3,而我不可能获得更差的结果。& & & 如果对手只出石头和剪子,在我1/ 3 策略不变的前提下,我的胜率还是1/3。但一旦我读到了对手的策略,做出相应的改变,那么对手的胜率将会大幅下降。所以对手的最优策略也应该各出1/3,这样能够保证自己的胜率不会低于1/3。& & & 各出1/ 3 就是剪刀石头布这个双人游戏里的纳什均衡点。我们可以把德州扑克理解为一个复杂了无数倍的石头剪刀布,而且是根据不同的牌面情况还是不同方式的剪刀石头布,冷扑大师就是要找出各个状态下不会输的策略。& & & 具体到某个牌手,机器会通过数据分析牌手的策略,寻找其中的可利用性,加以打击。这也是为什么上一次冷扑大师与外国牌手人机大战,前面差距不大,后面人类越输越多的原因。& & & 所以目前看来冷扑大师和深度学习暂时没什么太大关系。& & &&记者问:我如果有足够的高手牌谱,是不是能用深度学习训练出德扑AlphaGo来?& & &&柏林森答:不能。两者游戏的基本算法逻辑是有很大区别的。举个例子,两个高手打牌的各种操作,反馈到扑克游戏里,最后的结果可能并不一样,因为胜负是有概率的。而两位棋手按照固定的走法在棋盘上落子,最后的结果是肯定的,不是黑胜就是白胜。从这种意义上讲,AlphaGo使用的那种棋谱学习的模式,是无法复制到德州扑克里的。.........&& & &&记者问:听说人工智能会诈唬,它们学会骗人了?!& & &&柏林森答:所谓诈唬就是在德州扑克比赛里,假装自己有大牌,把对方吓跑。我们忘掉诈唬这个词的表面意思,它其实就是德州扑克里的一个技术手段。除了诈唬,还有假装诈唬,假装假装诈唬,甚至一直无限的假装下去。
编辑:未知
精选图文RECOMMEND
为您推荐RECOMMEND
李小璐带甜馨去机场显温情 网友却因这两个细节气炸了 甜馨凭借高情商走红后给李小璐和贾乃亮夫妇带来了越来越多的关注度,同时也
白百何被卓伟曝出轨后,娱乐圈没有一个人愿意趟这趟浑水,也是,人家两口子都没有发话,别人也不好多说什么。4月13日,受白百何
陈羽凡左拥右抱美女照流出被摸不可描述地方 尺度不输白百何 白百何被卓伟曝光泰国约会小鲜肉的视频,其中还出现不雅动作,让吃瓜
夫妻间最佳年龄差距 身材有黄金比例,婚姻也一样,身高、年龄,甚至月薪之间的差异,都可能成为影响两人相处的因素。以下一些研
金无足赤,人无完人。人的身体多少都存在一些“缺陷”,让你看上去不太符合大众审美。近日,英国和美国的媒体发表多项研究称,身
如果说哪种植物是个营养宝库,那一定非坚果莫属,而开心果是坚果中的佼佼者。1粒小小的开心果,至少包含以下8种有益物质。 油酸
原标题:女子诈骗600多万后消失 新乡落户结婚生子变身企业家 随着落网,或许她已对那段灰色的过往感到懊悔 记者 王春胜/摄 “我
视频加载中,请稍候... 自动播放 play 大二女生陷校园贷宾馆自杀 借款57万被发裸照 向前 向后 原标题:厦门大二女生陷校园贷宾馆
原本以为,再见面时,会是母子重逢的温暖场景;原本以为,隔了那么久,一岁半的宝宝会叫一声妈妈……这些美好的愿望,都随着孩子 |  |  |
 |  |  |
未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。
[京公网安备:-1] [] 总机:86-10-
Copyright &1999-. All Rights Reserved手机版偷拍自拍_偷拍自拍熟妇人妻图片_大陆偷拍自拍
当前位置:
  特别声明:新华网“焦点网谈”栏目的文章均为独家专访,任何网站、报刊、电台、电视台未经新华网许可,不得部分或全部转载。
&联系电话:010- 传真:010-
not available啥现实版霍格沃茨?1980年代英国校园生活
新华网浙江频道 记者 方列 文/摄&编辑:何玲玲
&&&&东芝发布Haswell新品一体机 U型外观像电视机高科技高性能 HP 16A(Q7516A)硒鼓促销not available啥看到这一画面后 他们认定是失踪15年的女儿,八一男排主帅呼吁球迷看球 仲为君:赢得有点难
英女王与大象"握手" 展慈祥笑容似邻家奶奶not available啥马刺主抓两点掀翻牛仔 诺天王浪投难比高效邓肯
&&&&举重教练猝死引发反思 运动队为何不能放假过年not available啥中国海军武力营救外籍货船 老外举旗致谢
&&&&,绿军主帅不满球队防守罚球 赞扬76人队进攻出色
&&&&,简单实用滑盖机 索尼爱立信U10降至1900元航拍浙江浦江水库泄洪 场面壮观如瀑布力帆否认转让称不知此事 球员教练怒斥扰乱军心not available啥上海开启仙境模式 航拍魔都平流雾,残疾卖唱女自称非山东寻亲者之女 警方已采集其DNA,下单送加湿器 华帝烟灶套装售3399元。澳大利亚蛇界"瘾君子" 沉溺毒品被送戒毒所,交通整治行动 组织4000名渣土车司机轮训。
&&&&&&&&not available啥
近千“新北京人”排长队登记公租房、牟翠翠家属质疑贵阳警方通报 欲去贵阳做DNA检测,长沙一五旬保安骑电动车上班 被公交撞亡中国海军护航编队武力营救外籍货船 现场曝光北京至崇礼拟建新高速 纳入一小时交通圈,小伙钓到12.5公斤鱼 20分钟才弄上岸not available啥南京南站被挤压致死男子家属状告铁路局 索赔80万,马建堂:统计局将从四方面加大改革创新力度扒一扒世界上十大现役155毫米自行榴弹炮,美国一名男子裸体洗车被起诉 法院判处缓刑一年陕西榆林现"黑砂厂" 一车砂子卖120元2020年底大型企业建成专职消防队。&&&&
金属套管直插男子眼部 深入颅内10多厘米、感知需求 成都车展奇瑞将推"魔力版"车型,三种方式助你抢票成功(图)超刺激!美国一42层高楼现悬空玻璃泳池菜地堆放"僵尸车"
无人认领难倒菜农,浙大学子深入桃北新村,开展暑期社会实践not available啥UW College of Engineering announces Direct to College admiss,热带气旋"库克"袭击新西兰 街道变河道中国隐身战机上舰?网友绘舰载版歼20草图,山东环保企业用石头做塑料袋 烧起来“不滴油”告别“汇率操纵” 加速经贸对话离家77年 97岁台湾老兵找回四川家人。&&&
&&&&老郑说汇:风险事件仍多 美元暂难摆脱颓势not available啥多特蒙德球队大巴遭爆炸物袭击 1名球员受伤
&&&&海淘税改今起实施:电商将洗牌 个人代购或回暖、内蒙古边检站查获野生黄羊角584支,市场投资机遇在亚洲市场美航母奔赴韩国途中先在南海进行紧张训练新西兰后防主力签约深圳 维切里奇享免试训特权,朝鲜召开大会庆祝金正恩当选第一书记5周年not available啥瑞士球王晋级四强将战小德:期待下场对决,过去一年最有话题性的几款本白狐闯入杭州一高中被赶跑 专家:或来自北极,儿童安全乘车家长要避开九误区南海舰队某登陆舰支队实战训练检验战法研究成果“黑校车”横行 谁来拯救孩子的生命安全。。
&&&&6.5万页高效输出 HP M701a 激打热销中not available啥世界航天日 盘点宇宙不一样的“烟火”
记者采访女庄家not available啥。
&&&&not available啥
&&&&老照片中的迪士尼乐园:它创造了梦幻的童年、宁波市2014下半年教师资格考试公告,日常办公必备 理光 MP6002 北京特惠《冰雪11天》将公映 柳岩出演警嫂感触深(图)家长禁忌 不要给孩子吃这东西,芝加哥民众机场外抗议美联航暴力逐客not available啥商用高效 HP M552dn彩打 北京现货热销,Why treating animals may be important in fighting resurgentLumia也要有安卓 微软或推更高端安卓机,1906年的俄罗斯帝国总理斯托雷平遇刺案实惠经济打印 HP 12A(Q2612A) 硒鼓热卖无线双面智能 惠普M452dw彩色激打促销。
发表评论:
?遵守中华人民共和国有关法律、法规,尊重网上道德,承担一切因您的行为而直接或间接引起的法律责任。
?新华网拥有管理笔名和留言的一切权利。
?您在新华网留言板发表的言论,新华网有权在网站内转载或引用。
新华网版权与免责声明:
凡本网注明&稿件来源:新华网&的所有文字、图片和音视频稿件,版权均属新华社和新华网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明&稿件来源:新华网&,违者本网将依法追究责任。
本网未注明&稿件来源:新华网&的文/图等稿件均为转载稿,本网转载出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的&稿件来源&,并自负版权等法律责任。如擅自篡改为&稿件来源:新华网&,本网将依法追究责任。如对稿件内容有疑议,请及时与我们联系。
如本网转载稿涉及版权等问题,请作者在两周内速来电或来函与新华网联系。
推荐给朋友:
版权所有:新华网 未经协议授权,禁止下载使用。
制作单位:新华社网络中心AI专家柏林森:德扑人机大战为什么人类还有赢的可能
& 4 月 10 日上午,“冷扑大师VS中国龙之队”德州扑克人机大战表演赛结束了全部比赛,第九场龙之队依旧未能总分取胜,输了 47343 分。总战绩 36000 手牌,人类一共输了 792327 分,平均每百手损失 22 个大盲注。即使单看九个单场的比赛,人类牌手也未取一胜。& & & 赛后几位龙之队的选手坦言,后半程他们其实已经发现了冷扑大师的一些规律性失误,所以成绩也有所提升,但可惜发现得有些晚。如果在进行几场较量的话,他们有信心取得单场比赛的胜利。& & & 柏林森先生,信柏科技创始人/CEO、深海棱镜公司创始人,资深大数据和人工智能从业者,深度围棋、德州扑克爱好者,受邀作为新浪网的科学顾问和棋牌特约评论员出席了此次大赛。& & &&【柏林森简介】柏林森,中国科学技术大学物理学学士,美国伊利诺伊大学电子及计算机工程硕士、物理学硕士,美国注册金融分析师(A),美国精算协会准精算师(ASA),在海内外知名企业从业二十多年。柏林森先生专长于海量数据处理、数学建模、时间序列预测、人工智能及其系统实现,自美归国后先后创建百分点科技、信柏科技、深海棱镜科技等大数据/人工智能公司,先后被评为中关村高端领军人才(高聚工程)、海淀区创业领军人才、中关村核心区文化创意产业十大最具网络影响力人物、中关村十大海归新星,北京大学零售业研究中心大数据专家讲师、中商联商业养老产业分会大数据分析专家,是国内大数据和人工智能实践领航者。&&& & 现场,针对此次德扑人机大战,柏林森先生在接受记者采访时进行了个人观点的阐述与解析:& &&&记者问:李开复说德州扑克人机大战人类胜率有10%,而围棋是零,你怎么看?& & &柏林森答:我们假设真的有围棋之神和德扑之神。围棋之神能够所谓穷尽变·· 6 化,那么你跟他下棋确实不可能赢。德扑之神判断、计算能力无可匹敌,他能从你的行为中读出你的手牌是对3,而他拿着对A。那么这手牌,德扑之神肯定是“All IN”的。但河牌是有可能发出一张 3 的,最后输的是德扑之神。& & & 围棋和德扑有本质上的区别,围棋是完全信息博弈,理论上有最优解。德扑是非完全信息,总是有概率的。德扑水平的较量要看长线收益,打得手牌越多,小概率事件所能造成的影响就越少。这次一共只打 36000 手,其实人取胜的概率比想象的大。& & & 可能要跟柯洁下人机大战的AlphaGo当然还不是围棋之神,但他距离围棋之神的距离肯定比人类棋手近很多,人类棋手跟他下的胜率会很低很低。不过,在数学上0%并不代表着不能发生,只是在有限的时间里你可能观察不到而已。所以一般这种事发生的时候,我们都称之为奇迹。& & &&记者问:听说冷扑大师没有用最近比较热的深度学习的技术?& & &&柏林森答:冷扑大师用到的是一种叫做CFR(Counterfactual Regret Minimization)的框架。在双人零和游戏(你赢的是我输的)里,理论上是都存在纳什均衡点的。这次人机大战的德州扑克单挑赛制就是这样,人类和机器的输赢相加和为零,双方的目的都是为了赢其对手手里尽可能多的筹码。& & & 我们用最简单的剪刀石头布游戏举例。我们可以很容易的想到,如果我很均匀的按三种各1/ 3 的概率出,那么无论对方怎么出,最后的结果肯定是胜平负各占1/3,而我不可能获得更差的结果。& & & 如果对手只出石头和剪子,在我1/ 3 策略不变的前提下,我的胜率还是1/3。但一旦我读到了对手的策略,做出相应的改变,那么对手的胜率将会大幅下降。所以对手的最优策略也应该各出1/3,这样能够保证自己的胜率不会低于1/3。& & & 各出1/ 3 就是剪刀石头布这个双人游戏里的纳什均衡点。我们可以把德州扑克理解为一个复杂了无数倍的石头剪刀布,而且是根据不同的牌面情况还是不同方式的剪刀石头布,冷扑大师就是要找出各个状态下不会输的策略。& & & 具体到某个牌手,机器会通过数据分析牌手的策略,寻找其中的可利用性,加以打击。这也是为什么上一次冷扑大师与外国牌手人机大战,前面差距不大,后面人类越输越多的原因。& & & 所以目前看来冷扑大师和深度学习暂时没什么太大关系。& & &&记者问:我如果有足够的高手牌谱,是不是能用深度学习训练出德扑AlphaGo来?& & &&柏林森答:不能。两者游戏的基本算法逻辑是有很大区别的。举个例子,两个高手打牌的各种操作,反馈到扑克游戏里,最后的结果可能并不一样,因为胜负是有概率的。而两位棋手按照固定的走法在棋盘上落子,最后的结果是肯定的,不是黑胜就是白胜。从这种意义上讲,AlphaGo使用的那种棋谱学习的模式,是无法复制到德州扑克里的。.........&& & &&记者问:听说人工智能会诈唬,它们学会骗人了?!& & &&柏林森答:所谓诈唬就是在德州扑克比赛里,假装自己有大牌,把对方吓跑。我们忘掉诈唬这个词的表面意思,它其实就是德州扑克里的一个技术手段。除了诈唬,还有假装诈唬,假装假装诈唬,甚至一直无限的假装下去。& & & 从数学的角度上讲,诈唬是在德州扑克游戏里获得更大收益的一种基础手段,只是在表现形式上看似是在“骗人”而已。对AI来说,诈唬和说实话没有本质的区别,只是在当前牌型和底池情况下,选择哪种策略会让它的长期收益更高而已。& & & 冷扑大师会用诈唬的策略不是人为教给它的,而是告诉它德州扑克规则之后,它在演算过程当中自然而然形成的打牌策略,是这个游戏规则本身决定的。对人工智能来说,德州扑克是个数学问题,诈唬这种行为和加减乘除的之类数学符号没什么区别。& &&& 此外,作为新浪特约评论员,柏林森先生在现场也对冷扑大师的缔造者TuomasSandholm托马斯教授进行了专访。& & & 观看专访视频:&/sports/other//detail-ifyeceza1691250.d.html?from=groupmessage&isappinstalled=0
看过本文的人还看过
最新图文推荐
最新专栏文章
大家感兴趣的内容
网友热评的文章}

我要回帖

更多关于 沂水柏林森 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信