科技时报 全球最新科技资讯专业发布平台

AlphaGo已经再升级 柯洁年内能否获胜?

2016-06-06 09:11:34已围观次来源:澎湃新闻网编辑:夏雪

  (原标题:阿尔法狗已今非昔比,柯洁年内大战阿尔法狗能否获胜?)

  澎湃新闻记者 王心馨

  谷歌人工智能系统阿尔法狗(AlphaGo)下一个对手或许会是目前世界排名第一的中国棋手柯洁。

  6月4日,在第37届世界业余围棋锦标赛新闻发布会上国家体育总局棋牌运动管理中心党委书记、国际围棋联盟事务总长杨俊安透露,如果不出意外柯洁九段将在年内进行和“阿尔法狗”的围棋“终极人机大战”。

  不过,这场对决的具体时间地点目前尚未确定。

  今年3月15日,阿尔法狗最终以4:1的比分战胜韩国棋手李世石,随后韩国棋院为阿尔法狗颁发名誉九段证书。

  根据“Go Ratings”世界围棋等级分排名,截至2016年6月4日,柯洁排名第一,AlphaGo排名第二。

  

AlphaGo已经再升级 柯洁年内能否获胜?


  世界围棋等级分排名。

  AlphaGo软件、硬件升级,变得更加强大

  AlphaGo与李世石之战,是人工智能首次与最高段位围棋选手之间的对弈。不同于1997年深蓝对弈的国际象棋,AlphaGo对弈的围棋更加复杂,每下一步后能产生的可能性也更多。但AlphaGo背后的算法在比赛中已经显示出自己的优势。通过深度学习,它已经能模拟人类下棋,拥有“直觉”,并能给出下一步的最佳策略选择。

  对于AlphaGo来说,赢了李世石后,并没有停下学习的脚步,在软件和硬件上都进行了升级。就在今年5月份,谷歌宣布它已经建立了专为机器学习定制的“TPU”(Tensor Processing Unit)的ASIC芯片,它专门针对TensorFlow进行优化,性能要优于英伟达的GPU,相当于谷歌依据摩尔定律向前跳了三步。

  根据《the verge》的报道,谷歌其实利用TPU来处理数据已有一年多时间,并利用其来优化了搜索结果和谷歌街景项目。同时,AlphaGo与李世石的挑战也用了TPU处理器。

  对于计算机来说,几乎所有的应用程序都可以通过专用硬件加速,但你必须让这样的操作物有所值。例如,因为人们喜欢看视频,大多人会使用一些标准的编解码器,使得回放更流畅,电池消耗也更少一些。现在谷歌可以从“TPU”的ASIC芯片中受益。

  此外,AlphaGo若真的确定与柯洁对战,谷歌可能会使用另一个更强大版本的AlphaGo。AlphaGo两个版本,一个是“单机版”,另一个是“分散式”,也可以称为联网版本。两者的演算法完全相同,差别在于所用的硬件。

  单机版AlphaGo拥有48个中央处理器(CPU)和8个图形处理器(GPU)。而分散式版AlphaGo则拥有1202个中央处理器和176个图形处理器。

  作为比较,在AlphaGo之前的几个围棋人工智能程序,CrazyStone只有32个CPU,而Zen只有8个CPU。单机版AlphaGo曾经与5种围棋程序进行了495场比赛,对手是CrazyStone、Zen、Pachi、Fuego和GnuGo,AlphaGo全部取得压倒性的胜利。即使是让4子,AlphaGo对Crazystone和Zen的胜率也达到了77%和86%。至于分散式版的AlphaGo,如果对上自家的单机版AlphaGo,则分散式版本的比赛胜率是77%。另外,有外媒称,AlphaGo团队在与李世石的对战后,经过简单的休整,不但没有减少对围棋的研究,反而扩大了团队人数和投入资源。换句话说,柯洁将会面对一个更强大的“阿尔法狗”。

  除了自身能力的改进让外界期待外,此前AlphaGo与李世石对决时,被人诟病的比赛规则这次可能会改变比赛走向。AlphaGo与李世石大战5盘,使用的是中国围棋竞赛规则(比赛结束时,后走棋的棋手贴目),也是Alpha Go平时“训练”使用的规则,而李世石则更熟悉韩式规则。按照比赛规则,双方各有2小时的布局时间及3次60秒的读秒(棋手将限时用完后的倒计时时间)。每场比赛预计需要4-5个小时。

  柯洁扬言:阿法狗战胜了李世石,但它赢不了我

  在李世石与AlphaGo大战期间,中国职业围棋九段选手柯洁曾在微博上介绍过自己:我叫做柯洁,97年出生。现在暂时是世界围棋第一人,正式比赛我是单盘8:2碾压李世石(他赢得这两盘没有任何作用),世界冠军获得过三次(此年龄如此成绩前无古人),大小国内赛事冠军无数次。在阿尔法狗赢下第一盘棋后,柯洁发微博称,“就算阿法狗战胜了李世石,但它赢不了我。”

  

AlphaGo已经再升级 柯洁年内能否获胜?


  

AlphaGo已经再升级 柯洁年内能否获胜?


  最终比赛以4:1结束,柯洁扬言:“来吧!管你是阿法狗还是阿法猫!我柯洁在棋上什么大风大浪没见过?让风暴再来的猛烈点吧!这个X我就装了怎样!”

  谷歌方面也在赢下李世石后就将目光投向了柯洁。DeepMind的研发工程师拉利亚·哈德塞尔在其个人Facebook账号上公开表示,“AlphaGo现在可以有正式排名了。(谢谢输给你,李世石,如果一直赢棋就不能被排名算法统计)。现在AlphaGo的积分是3533分,排名世界第4。柯洁,准备好了吗?”

  

AlphaGo已经再升级 柯洁年内能否获胜?


  最终,无论柯洁与AlphaGo的比赛能否成行,以及柯洁能否在比赛中获胜,我们或许更应该关注的是谷歌对于人工智能的投入和战略眼光。

  AlphaGo的开发团队DeepMind的创始人Demis Hassabis在AlphaGo击败李世石后说:“在一定程度上,我们只对那些有助于我们研究计划的东西感兴趣。DeepMind的目标不仅仅是获得游戏胜利,还要从中获得乐趣和启发。但从个人角度来说,我喜欢玩游戏,我也曾开发过电脑游戏。可是从某种程度上说,它们又都是试验台,即尝试编写算法并对其进行测试的平台。最终,我们希望能将技术应用于解决现实世界的难题。”