xml地图|网站地图|网站标签 [设为首页] [加入收藏]

AlphaGo超多棋步我也不懂,AlphaGo项目正式甘休

谷歌电脑演绎人工智慧系统AlphaGo幕后推手黄士杰表示,即使有数据,AlphaGo很多棋步他还是不懂,但他觉得AlphaGo很多棋步很像有“昭和棋圣”之称的职业棋士吴清源提倡的下法。

姓名:颜皓 学号:16020140084 电子工程学院

世界冠军柯洁尝试新招法 三番棋首局惜败 AlphaGo 来源:|作者:|时间:2017-05-23

AlphaGo的开发商昨天说,AlphaGo完胜世界排名第一的中国大陆职业围棋棋士柯洁九段后将急流勇退,不再与人类对弈。

转载自:http://www.yidianzixun.com/article/0HucD5qV?s=

2017年5月23日,为期 5 天的围棋峰会在水乡乌镇拉开帷幕。来自 DeepMind的围棋人工智能 AlphaGo 在与世界排名第一的柯洁九段的三番棋较量首局中,执白以1/4子的优势取得胜利。在本次围棋峰会中,将总共进行5场不同形式的对弈,其中就包括了柯洁与AlphaGo的三番棋较量。

出身台湾的黄士杰日前接受中国大陆围棋媒体访问表示,AlphaGo不会说话,很多棋步“我还是不懂”,即使有数据,还是不懂。看胜率、看数据,还是不知为什么下在那里,可能知道这步好、这步不好,但不知好在哪?职业棋士的专业解说还是很重要。

【嵌牛导读】刚刚,DeepMind黄士杰博士发表消息,表示AlphaGo项目正式结束。如果一定要有一个人为AlphaGo的研究划上句点,黄士杰当之无愧。从AlphaGo第一次出现在公众视野时,黄世杰便是AlphaGo的最佳代言人。他抬手、落子,行机器之智能,走出一代大师风范。他冷静、他沉着,他是AlphaGo的“人肉臂”。而他的离开和谢幕,代表了一个时代的终结,也是更加激动人心的开始。

现年19岁的柯洁是目前世界排名第一的职业围棋选手,5岁开始学棋,10岁的时候成为职业选手,曾先后四次获得国际大赛冠军。

不过,他说,他觉得AlphaGo很多棋步很像吴清源提倡的下法,只是实战上的实践棋手不多,但由科学力量证明这是好下法,这就是藉AlphaGo自我学习、慢慢进步的力量,探索围棋真理。

【嵌牛鼻子】AlphaGo、黄世杰

本局比赛中,柯洁使用了传奇围棋大师吴清源和木谷实在上世纪30年代创立的三·3开局。此开局曾经流行数十年,此后在现代围棋中渐渐淡出。然而,AlphaGo在今年1月的一系列比赛中再次启用此开局,此后柯洁和其他棋手一起在最近的棋赛中令其活力再现。在今天的对局中,AlphaGo 还使用了它擅长的二间守角,而柯洁则在左上角祭出了三·3点角。

黄士杰表示,希望AlphaGo做到帮人类探索围棋的工具与手段,而不是对手。

【嵌牛提问】黄世杰的AlphaGo围棋项目落下了帷幕,而其未来有什么更长远的发展方面?

由 Demis Hassabis, Shane Legg 以及 Mustafa Suleyman 于2010年共同创立的DeepMind 今日透露,目前的AlphaGo是在云端由单TPU运行,这与Goolge上周在I/O 大会上刚公布的芯片版本一致。TPU是专门为机器学习而设计的处理器。与去年3月与李世石的比赛时相比,当前的版本在处理计算时所消耗的能量仅为过去的十分之一。

至于曾代AlphaGo落子对战韩国职业围棋棋士李世石九段与柯洁,有业余实力的黄士杰棋力是否进步?他笑说,有进步,但实际上可能是自我感觉良好。

【嵌牛正文】

赛后柯洁表示 “我对布局有过备战和研究,所以一开局下了三·3占角,三·3点角,这都是对手特别喜欢下的,所以我想看看它怎么应对,但它应对得非常好。那手断让我很震惊,这手棋在人类对局中几乎是不可能的,因为是后手。后来冷静下来分析确实是好棋,制造了很多劫材,同时让角部实地化,一石二鸟。AlphaGo实在下得太出色,我输得没什么脾气,很厉害。”

图片 1

Demis Hassabis 在赛后新闻发布会上表示:“我要向柯洁表示祝贺,这是一场精彩绝伦的比赛,双方势均力敌,难分高下,对在座的每一个人来说,都是一次令人激动的体验。我还要感谢柯洁将AlphaGo推向了极限。围棋拥有着无限的可能性,我认为AlphaGo对围棋选手和整个围棋界来讲是一个有效的工具,可以用来探索这项游戏的真谛。我希望在过去的这一年里,棋手们可以通过AlphaGo所带来的全新视角,对这项运动产生更深刻的理解。“

12月寒冬的最冷一天,这条深夜的临别感言引爆了朋友圈,热闹喧嚣的讨论更映衬出一个时代终结的孤寂悲凉,黄士杰,一位精通围棋的AI工程师,他一手造就的AlphaGo,已经登峰造极,而他离去的身影,也或许窥见了人类的未来。大时代的一批传奇人物谢幕,他是寂寞的,自己培养的AI取代了他,如果一定要有一个人为AlphaGo的研究划上句点,黄士杰当之无愧。从AlphaGo第一次出现在公众视野时,黄士杰便是AlphaGo的最佳代言人。他抬手、落子,行机器之智能,走出一代大师风范。他冷静、他沉着,他是AlphaGo的“人肉臂”。时代的前进脚步从不停歇,人工智能的盛世爆发正在来临,“人肉臂”黄士杰转岗,对AlphaGo深情的告别,都是在 AI围棋的里程碑上落下绚烂的一笔。

作为围棋的发源地,这项古老的游戏在中国有着近三千年的历史。职业女子棋手和评论员徐莹,在今天比赛的评述中说到:“自从 AlphaGo 出现之后,突然围棋变得五彩斑澜了,我们感觉思路一下子打开了,AlphaGo 这种自由自在的行棋风格,恰恰是我们一直所追求的围棋本质。”

针对未来发展方面,黄士杰表示,DeepMind 有兴趣的领域除了围棋之外,还有‘医疗’跟‘机器人’,希望能够让世界变得更美好,至于他自己个人的下一步,当然就是选一个有兴趣的领域去投入。现场有媒体再次询问下一个目标是不是挑战《星海争霸》、《英雄联盟》这个模拟策略游戏领域,黄士杰并没有把话说死,表示:“内部还在讨论”。

本局柯洁落下第一手之后,进行得非常迅速。Michael Redmond 九段,在本场的英文解说中谈到:“和往常的巅峰对弈一样,一开局就快速地出现了一个极为罕见的布局。其中一个原因是柯洁选择了比较独特的下法,当然AlphaGo也是一个非比寻常而且十分强大的对手。”

11月27日,黄士杰在Facebook转发了一则关于DeepMind将与一些顶尖的研究机构共同投入诊断乳腺癌的AI研究消息。DeepMind将利用最新的机器学习技术,希望能够快速、准确地检测出癌症的迹象,帮助医生尽早发现癌症,以便更早的有效治疗,此举或许能捕风捉影体会到黄士杰之后的动态走向。

Redmond九段还着重强调了AlphaGo的棋风如何激发人类棋手挑战创新的边界,并赋予一些传统套路新的生命。“柯洁在开局阶段就使用了他从早前Master连胜系列中学习到的下法,并和自己的风格融合到了一起。”在接下来这一周里,柯洁在周四和周六的两局比赛中依然有获胜机会。

黄士杰,他就是AlphaGo本身

职业围棋九段,韩文解说金成龍观察到,“和去年AlphaGo与李世石的对局相比,今年的 AlphaGo 更加稳健。过去 AlphaGo 应对简单的落子前都需花时间判断,而如今对时间的利用更加自如且有效。”

黄士杰出生于台湾,1997考入台湾国立交通大学就读大学本科,专业为计算机与信息科学。2001年到2003年,在国立台湾师范大学就读计算机科学和信息工程硕士。2004年到2011年在国立台湾师范大学完成了博士学业,博士论文就是“应用于电脑围棋之蒙地卡罗树搜索法的新启发式演算法”。

黄士杰专精于人工智慧领域,硕博士论文都在台师大资工所教授林顺喜指导下完成,据其导师林顺喜回忆,黄士杰是个很努力的学生,对围棋也非常有兴趣,是台师大围棋社创社社长,就读时就有围棋业余6段的资格。

林顺喜透露,黄士杰的博士本来5年就可念完,但为了延续研发成果,多念了2年,博士班7年级时,他所开发的围棋程式“Erica”击败了当时国际公认的最强程式“Zen”,并在日本举办的国际电脑奥林匹亚中拿下19路电脑围棋金牌。

黄士杰博士毕业后在加拿大艾伯塔大学做了一年研究员,随后于2012年加入DeepMind,担任高级研究员。2014年1月26日,谷歌以5亿美元收购了这家日后将会大放异彩的公司。自此,黄士杰在谷歌DeepMind任研究科学家。同年2月,AlphaGo项目正式启动,团队只有3个人:哈萨比斯、席尔瓦、黄士杰。

项目启动伊始,团队就决定将沿着深度学习和强化学习的方向探索。无疑,这条道路将无比艰难。然而,他们还是上路了。

2014年6月,AlphaGo通过卷积神经网络学习了很多人类棋谱,能在3毫秒内做出堪比人类的下棋直觉。黄士杰将它命名为“策略网络”,并在GPU上进行持续的训练优化。

一年之后,AlphaGo阅读棋局的能力提升了很多,可以检索多种局面变化,并且找到最佳的应对方式,可以算出后续40-60步棋。

自此,有越来越多的深度学习专家加入了这个一开始只有三人的团队。8月,AlphaGo将掌握称霸围棋世界最关键的能力:形势判断。AlphaGo通过自我对弈,训练出价值网络,进而可以判断每一手棋背后代表的胜率。这就形成了形势判断的能力。据黄士杰回忆,他当时已经感觉到AlphaGo的强大。10月,樊麾大战AlphaGo,当时代替AlphaGo落子的正是黄士杰。樊麾输了。但这一消息当时并未被公布。

2016年1月27日,Nature杂志介绍了DeepMind团队的AlphaGo,以及樊麾输了的消息。黄士杰与席尔瓦是这篇论文的第一作者。

又过了2个月,AlphaGo击败了李世乭。这次,依旧是黄士杰代替AlphaGo落子。这也是黄士杰第一次出现在观众的眼前。

这年年底,一个叫Master的棋手大开杀戒,连续斩杀各路围棋高手。取得59场连胜之后,Master公布了自己的真实身份:“我是AlphaGo的黄博士”。黄士杰,又是黄士杰。

2017年5月23日,柯洁对面坐的,仍然是黄士杰。在对战结束后,柯洁说,“黄博士来摆棋,可能更让我有和AI对战的感觉。我也特别佩服黄博士,大家看直播也能看到我很爱动,总喜欢活动身体,而黄博士总是一动不动,不上厕所、不喝水、也不吃东西……所以跟黄博士下棋时,我觉得黄博士就是AlphaGo。”

AlphaGo一路厮杀,黄士杰始终在侧,甚至可以说,他就是AlphaGo本身。

AlphaGo 小传

姓名:AlphaGo(Fan,Lee,Master,Zero)

别名:阿老师,阿尔法狗

生日:2014年

出生地:英国伦敦

1、击败樊麾

2015年10月,AlphaGo击败樊麾,成为第一个无需让子即可在19路棋盘上击败围棋职业棋手的电脑围棋程序,写下了历史,相关成果在2016年1月发表于Nature

2、击败李世石

2016年3月,AlphaGo在一场五番棋比赛中4:1击败尖端职业棋手李世石,成为第一个不借助让子而击败围棋职业九段棋手的电脑围棋程序,再创历史。五局赛后韩国棋院授予AlphaGo有史以来第一位名誉职业九段

3、排名短暂超越柯洁

2016年7月18日,AlphaGo在Go Ratings网站的排名升至世界第一。但几天之后被柯洁反超。

4、Alpha Go化名“Master” 60连胜

2016年的倒数第三天,一个用户名为“Master”的围棋用户,连续在围棋平台大开杀戒,“斩杀”包括柯洁、朴廷桓、井山裕太、陈耀烨、申真谞、常昊、古力等各路围棋高手,最终以以60连胜告终。柯洁连输三场,期间还因为急性肠胃炎住院……

在第59场时候,“Master”自报家门:“我是AlphaGo的黄博士”。

5、AlphaGo大败柯洁,柯洁落泪哽咽

2017年5月27日,乌镇围棋峰会,柯洁总比分 0:3 败于AlphaGo。比赛中,柯洁在局面不利时长时间离开,回来后又泪洒现场。赛后柯洁一度哽咽称:它太完美我很痛苦,看不到任何胜利的希望。

6、AlphaGo Zero横空出世 自学21天虐Master

2017年10月,DeepMind最新版AlphaGo论文介绍了迄今最强最新的版本AlphaGo Zero:使用纯强化学习,将价值网络和策略网络整合为一个架构,3天训练后就以100比0击败了上一版本的AlphaGo。

7、AlphaGo教学工具正式上线,柯洁:重新学习围棋

2017年12月11日,AlphaGo的启蒙老师、欧洲围棋冠军樊麾在微博上透露:“AlphaGo教学工具共有两万多个变化,三十七万多步棋组成,通过AlphaGo的视角,分析并建议围棋开局的诸多下法。随后,当今世界围棋第一人柯洁随后转发此条微博,并评论到:“重新学习围棋。”

AlphaGo已经退休,但技术永存。

谨以此文,致敬AlphaGo,以及研发AlphaGo的人。

图片 2

本文由www.1495.com发布于体育教学,转载请注明出处:AlphaGo超多棋步我也不懂,AlphaGo项目正式甘休

您可能还会对下面的文章感兴趣: