正在阅读:田渊栋:AlphaGo之后 研究智能围棋还有什么意义?

田渊栋:AlphaGo之后 研究智能围棋还有什么意义?

2017-03-29 11:57:30来源:雷锋网 编辑:沐子飞 关键词:人工智能机器人智能制造装备阅读量:35037

导读:近日,田渊栋受地平线曾经在Facebook的同事邀请,赴中国做了一期大牛讲堂,分享了关于游戏和增强学习等的话题。
  【中国智能制造网 名家论谈】近日,田渊栋受地平线曾经在Facebook的同事邀请,赴中国做了一期大牛讲堂,分享了关于游戏和增强学习等的话题。

田渊栋
 
  1. AlphaGo目前是世界的围棋选手,在此之后,研究智能围棋还有什么意义?
 
  我觉得围棋是很有意思的游戏,AlphaGo虽然把它做出来了。但很多东西的做法和人是不一样的。人在学围棋的时候有很多概念,按照概念做判断,但是机器解决他还是比较暴力的。
 
  一方面,你可以说人用概念来做推理局限了他的计算能力,体现出人本身有一个高度抽象的能力,就是用非常非常局限的计算能力,能达到那么强的棋力。而AlphaGo就是用非常多的计算能力去弥补这些不足,所以恰恰是互补的,我相信还是有意义的。
 
  另一方面,联系到后面那个问题(目前你的研究团队,对围棋AI的研究进展到何种地步?相比AlphaGo如何。),我们这边在开源之后就先放在那儿了,可能等到以后我们有新想法再拿过来试一试。我们这边是七八十人的研究机构,要让我们花二十人做围棋,这个是不可能的。我们这边都是很有名的研究员,这些研究员每个人都有自己的方向,像计算机视觉和自然语言处理等等,不可能把自己的方向放弃掉来专门(搞围棋)。
 
  后,从本质上来说,我们的风格跟其它公司不一样。我们研究员的一个目标是说在大家不做这个东西的时候,在比较冷门或者大家不相信它能做得更好的时候去做它,证明这条路能走通。比如说我们在做DarkForest的时候,围棋还是很冷门的方向,大家都不认为围棋可以做出来。我们的文章比AlphaGo早了三个月出来,证明这个东西确实有效果,而且能提高挺多的,这就是我们的贡献。我之前在采访里面说过,好的研究就是“于无声处听惊雷”。
 
  像星际这样的游戏,大家都不知道怎么做,研究员们的任务就是要想办法找到一些突破口,这个突破口可能没有人想到,或者是没有人觉得能做成,我们的目标是在这儿。我回到个问题,就是说智能围棋之后还有什么意义,就是我刚才说的,如果有人愿意想要做下去的话, 就看能不能自动从里面学出一些概念来,学出一些有意思的东西,比如说人有大局观或者是大势,或者是各种下棋时候的概念,概念是不是能从这里面自动学出来。像这些,目前大家都没什么办法。
 
  (你说大局观吗?)
 
  对,像这样的东西其实对于我们如何理解人的思维方式是更重要的。职业棋手是很厉害的,人脑的神经传导是毫秒级的,这点时间机器可以干很多事情,但人就是用这么慢的处理速度达到了这么强的水平。
 
  2. 绝艺和AlphaGo有差距么,差距是多少,是什么造成了这种差距?
 
  这个我稍微看了一下,我觉得绝艺肯定是比Zen要强挺多,200手不到就让Zen认输了。我之前看新闻是它对职业棋手可以战胜80%甚至更高,所以我相信它已经是做得非常好了,我相信它肯定是超过了或者是相当于AlphaGo之前Paper(AI科技评论注:2016 年 1 月 28 日,Deepmind 公司在 Nature 杂志发表论文 Mastering the game of Go with deep neural networks and tree search,介绍了 AlphaGo 程序的细节。)的水平,但是它跟现在的Master相比,可能还是有差距。
 
  3. 跟AlphaGo 3月份比赛的水平比如何?
 
  跟3月份(对战李世石)的时候这个我不好说,我只能说和Nature那篇论文相比做得好, 当然了跟Master比是有差距的,现在Master所有对战是全部都是赢的,没有输的,胜率是100%,而且都是赢的莫名其妙。Master赢了你,你都不知道什么地方出错了,好像下得挺好的,然后就输掉了。所以就是已经到了不知道错哪儿的程度了。我相信他们应该用别的方法做训练的,而不是单纯拓展之前的文章。像我是听说他们近把训练好的值网络单独拿出来,根据它再从头训练一个策略网络。我觉得这样做的好处是会发现一些看起来很怪但其实是好棋的招法,毕竟人类千百年下棋的师承形成了思维定式,有些棋在任何时候都不会走,所以按照人类棋谱训练出来的策略网络终究会有局限性;而用值网络作为指导,从头训练一个策略网络的话,确实会发现很多新招。
 
  (AlphaGo用其他的方法迭代的?)
 
  我相信他们也用了别的办法,但是细节我也不知道,因为我近也没有做,所以我也不知道他们用什么样的办法,我觉得这方面需要创新。
 
  4. 绝艺这次是跟电脑围棋比赛,跟下一次的真人比赛区别在哪?
 
  电脑围棋我们之前也参加过,就是大家坐着,连上之后让计算机自己下,下到什么地方就说我输了你输了,然后就结束了,有可能说我们看看剩下好像不行了,但是机器误判,就让人去认输。 基本上是这样的过程。
 
  (那我可以这样理解吗?跟电脑围棋比赛的是两个既定程序的对战,比如说电脑围棋绝艺跟真人,比如柯洁对战的时候,是变动性更大一点,是吗?)
 
  我相信是的,因为电脑围棋至少在之前都是有些明显的风格,比如说有些喜欢在角上和你拼,不愿意去外面抢大场。人可能能看出来这个风格,就会击败它,特别是水平不是很高的两个AI下的话,很明显能看出问题,比如我们DarkForest就有死活的问题,我们自己会说,你看这里下得不对,肯定是这里下错了,这个地方他可能判断有问题,以为这块棋是活的,其实是死的,所以会有各种各样的问题。当然了,如果是达到绝艺或者是AlphaGo这样的水平的话,我肯定是看不出来,我需要计算机辅助帮我下到后面才能看到,但是我相信职业棋手还是能看出来,但Master我不知道,我不是特别清楚。
 
  5. 以DarkForest为例,除了围棋,这种完全信息博弈的游戏智慧要应用在其他领域需要解决哪些问题?
 
  我觉得现在这个系统是针对于某个问题做特别优化,我之前在 talk里也说了,那么多方法,要依照不同的游戏用不同的方法,没有那么通用的。比如说你在象棋上用蒙特卡洛树搜索肯定是不行的,你可能漏搜了某一条特别重要的分支,然后导致一个杀王的走棋序列没有看到,这是非常有可能的。所以整个AlphaGo是一个大的系统工程和框架结构,它需要有几个人每天花时间在上面,还得每天不停地调啊调。所以说,现在所谓的 “人工智能” 还是比较弱的,还是需要人去监督,然后把它做出来。
 
  (如果是要针对某一个特定领域呢?)
 
  就是我刚才说的,你先要对这个领域有了解,然后去设计。比如说围棋和象棋就不一样,象棋每步的可能性比较少,对局面的判断相对容易,因为这个原因,你要换一个方法做,而不是用原来的方法做。所以对于方法的选择,其实是完全依赖于这个问题本身的,所以这个是需要大量的人工智能相关知识才能做出来的。
 

我要评论
  • 制造业与AI“双向奔赴”成大势,共促中国“智造”升级

    在人工智能浪潮席卷之下,中国制造业正迎来智能化升级的关键机遇期。制造业企业拥抱AI的意愿高涨,实践从试点应用迈向系统布局,例如宝钢利用高炉大模型优化能效、美的集团巨额投入AI研发。
    制造业人工智能智能体
    2025-10-23 17:02:07
  • 德国Neura机器人中国总部落地萧山

    姜永柱代表区委区政府对Neura机器人中国总部的正式启动及远道而来的领导嘉宾表示诚挚祝贺和热烈欢迎。他说,此次Neura机器人中国总部的落户,不仅为萧山具身智能产业注入了强劲动能和智能基因,更将带动上下游产业链集聚发展,助力萧山打造具有国际影响力的智能机器人产业高地。
    人形机器人人工智能
    2025-10-23 09:57:32
  • 未来将由“光”书写:光纤成为人工智能经济的核心支柱

    研究显示,到2030年,全球人工智能应用可能需要超过1亿英里的长途光纤和数千万英里的城域光纤。随着数据量的快速增长——预计从2020年的约64ZB增长到2030年的200ZB以上——超大规模企业正在进行创纪录的资本投入,以满足日益增长的计算和网络需求。
    光纤人工智能
    2025-10-23 09:01:55
  • 两部门关于开展2025年度智能制造系统解决方案“揭榜挂帅”项目申报和已揭榜项目验收工作的通知

    工业和信息化部、市场监管总局联合开展2025年度智能制造系统解决方案“揭榜挂帅”项目申报和已揭榜项目验收工作。
    智能制造系统解决方案智能制造装备
    2025-10-22 11:50:49
  • 早报|微软下一代AI芯片或由英特尔代工;乐聚机器人完成15亿元融资

    微软已向英特尔下达其下一代AI芯片Maia 2的晶圆代工订单,计划采用18A或18A-P制程;2025年10月22日,乐聚机器人宣布完成15亿元Pre-IPO轮融资......
    AI芯片晶圆代工机器人
    2025-10-22 09:47:51
  • 人工智能在制造业的新浪潮

    调查数据显示,95%的制造企业已经在AI/ML领域投入或计划在未来五年内进行投资。这一比例表明,人工智能应用在制造业中已趋于普及,并正由“试点探索”向“系统化整合”转变。
    人工智能AI赋能智能制造
    2025-10-21 09:25:54
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了