主管QQ:818690

鹿鼎新闻

AlphaGo Zero证明 机器无需帮助即可成为超人

  导语:麻省理工科技评论今日发表文章表示,用不了多长时间,AlphaGo将不再是地球上最好的棋手。新式高超的人工智能程序版本AlphaGo Zero已经出现,它堪称怪物。它从零开始,面对的只是一张空白棋盘和游戏规则。它无师自通,仅仅通过自学使自己的游戏技能得以提高。但是它从来都不仅仅关乎棋盘游戏,未来将会在更多领域发挥作用。

  以下为文章内容:

  采用新的机器学习形式,升级版人工智能AlphaGo Zero可以自学围棋棋谱中的一招一式。

  用不了多长时间,AlphaGo将不再是地球上最好的棋手。新式高超的人工智能程序版本已经出现,它堪称怪物:在一场白热化对决中,AlphaGo Zero以100:0的不败战绩绝杀“前辈”。

  真正炫酷之处在于Alphabet Zero是如何做到这一点的。原来的AlphaGo需要与人类专家进行成千上万次对弈,才能从中获取数据,Alphabet Zero则截然不同。虽然它也是由Alphabet旗下的子公司DeepMind开发的,但它从零开始,面对的只是一张空白棋盘和游戏规则。它无师自通,仅仅通过自学使自己的游戏技能得以提高。

  这种新程序代表着人类在建造真正智能化机器方面向前迈进了一步,因为即使在没有大量训练数据的情况下,机器也需要找出解决困难问题的方法。

  “最引人注目的一点是,我们不再需要任何人工数据,”DeepMind联合创始人兼首席执行官戴密斯·哈萨比斯(Demis Hassabis)说。哈萨比斯认为,建造Alphago Zero的技术已经足够强大,可以应用在现实世界,例如药物发现与材料科学等一些有必要继续探索各种可能性的行业。Alphago Zero的相关研究成果发表在今天的《自然》杂志上。

  值得注意的是,在自学过程中,Alphago Zero发现了许多人类围棋选手在过去几千年中形成的诀窍和技术。“在几天的时间里,它重新找到了已知的最佳玩法,在最后一天,甚至在此之上发现了更好的东西,”哈萨比斯说。“看到这一切,感觉很酷。”

  DeepMind公司总部位于伦敦,2014年被谷歌收购。该公司专注于利用游戏、模拟和机器学习在人工智能领域取得巨大进步;迄今为止,他们已经聘请了数百名AI研究人员共同追寻这一目标。哈萨比斯说,大约15人参与AlphaGo Zero的研发,耗费的计算资源估计达数百万美元。

  AlphaGo和AlphaGo Zero都采用一种被称之为强化学习的机器学习方法及深层神经网络系统。强化学习的灵感来源于动物可通过实验和反馈进行学习,DeepMind已经使用这种技术,在简单的雅达利游戏有着超人的表现。

  然而,掌握围棋有着特别重要的意义,因为围棋十分复杂,最好的棋手可以凭借本能落子。换句话说,一盘好棋很难用代码来解释或写出来。

围棋中各种变数的数量,甚至超过了宇宙中原子的数量

围棋中各种变数的数量,甚至超过了宇宙中原子的数量

  毫无疑问,AlphaGo Zero在围棋世界标志着颠覆性进步,但是,它对世界其他领域有什么潜在影响?麻省理工学院计算机科学和人工智能实验室(CSAIL)的研究生尼克·海因斯(Nick Hynes)认为,在一段时间内,它只是一种专门工具,不太可能对我们的日常生活造成冲击。

  “到目前为止,该算法只适用于采取简单几个步骤就能解决的问题,如果要将其运用于移动等连续控制问题,那就需要加以改进,”海因斯告诉Gizmodo。“而且,它要求你具备非常好的环境模型。在这种情况下,它差不多了解所有规则。这就像你拥有一个机器人,你可以准确地预测它的行动结果,但在不完美的现实系统中,它是不灵的。”

  他说,好消息是目前有几项人工智能研究正在致力于解决上述两个问题(例如机器学习、进化算法等),所以,它实际上只是个集成问题。海因斯说,“这里的真正关键在于技术。”

  “正如预期和期望的那样,我们正在与获得一堆人类标记数据并训练一种模型来模仿它的经典模式渐行渐远,”他说,“我们在这里看到的是一个毫无人类偏见和预设的模型:它可以从它认为最优的东西中学习,可能比我们自己对这个概念的看法更加细致入微。如同一种外星文明发明了自己的数学,允许它去做像时间旅行之类的事情,”对此他补充说,“尽管我们距离奇点还很远,但我们肯定正在朝着那个方向前进。”