谷歌宣布新算法,通用型AI又迈进一步

2017-03-16 10:16:38  来源:每日科技网

        【每日科技网】

 

  近日,谷歌的DeepMind团队刚刚发表的新论文《Enabling Continual Learning in Neural Network》就又在这一问题上取得了突破,其联合帝国理工学院开发出一套名为弹性权重固化(elastic weight consolidation)新的算法,描述了让机器学习、记住并重新使用信息将成为可能。
  DeepMind的James Kirkpatrick就说:“如果我们想要拥有更智能、更有应用价值的计算机程序,那么,它就必须具备“通用型人工智能”的能力。”
  对于人类来说,知识技能的迁移是再正常不过的事情了,最典型的例子是:一个专业的滑雪玩家往往在滑冰上面也会表现的得心应手。但这一步的跨越对于人工智能来说却是不小的挑战。
  其症结在于大多数的人工智能系统都是基于所谓的神经网络来解决问题,就像DeepMind的 AI 可以学会下围棋或打扑克,这其实都是在经历了无数次的训练和失误之后才练就的技能。但这两种技能实际上是不能并存的,就比如AI学会了打扑克,那它就必须要把有关下围棋的知识抹除掉。想来也是可惜,难怪研究人员将之称为“灾难性遗忘”。
  这一问题得不到解决,人工智能就永远不会达到人类的智慧程度,自然其解决问题灵活程度也就不会和人类看齐。“人类和动物能够掌握大量知识的一个关键因素,就在于他们可以在以前知识的基础上不断学习新东西。”Kirkpatrick说。
  而为了实现这一目标,研究人员首先在神经科学领域进行了探索,他们发现,动物是通过保持住头脑中关于过往技能印象,来实现不断的学习,而这往往也是在面临生存的压力使所不得不做出的抉择,就比如老鼠如果不能快速地学会寻找食物的技能,那它们很快就会被饿死。
  DeepMind新的AI程序同时应付两个任务的学习过程
  早在 2014 年,DeepMind通过用机器学习的方法,教会AI玩一款Atari公司出品的游戏,由此突然间吸引了极大关注。那时,AI可以做到顺利通关,并取得比人类更高的得分,但却不能记住它赢得游戏的过程。
  玩每一款Atari公司出品的游戏,AI都需要创建一个单独的神经网络。一旦没有把游戏相关的信息传递给计算机,AI 就无法运行这一款游戏
  如今,DeepMind 联合帝国理工学院开发出一套新的算法,让神经网络学习、记住并重新使用信息成为可能。这种名为弹性权重固化(elastic weight consolidation)的算法所依赖的是“突触固化(synaptic consolidation)”理论。在人脑中,这一点被称为学习和记忆的基础。
  Atari公司出品的游戏
  论文称:“我们的方法是通过有选择性地减慢对重要权重值的学习,使机器能记住之前的任务。”
  Kirkpatrick解释说,算法会选择运用它所学习的内容来玩一款游戏,然后保留其中学到的最为重要的部分。他也提到,“我们只允许程序间非常缓慢地渐进式的改变,那样的话才总是会有学习新任务的空间,而同时这种改变不会覆盖我们之前学到的内容。”
  在测试中,研究人员利用被新算法强化过的DQN深度神经网络随机玩10款Atari公司的游戏,几天之后,他们发现AI已经可以做到和人类玩家一样了,这其中很大的一部分功劳都在于这种新的算法。没了它,人工智能几乎学不会其中任何一个游戏
  Kirkpatrick说,“我们之前的游戏AI只能学习玩一款游戏,而如今我们新发布的系统已经对多款游戏都得心应手了。”
  在AI玩游戏的过程中,研究人员还注意到一些有趣的现象。例如,当AI在玩赛车类游戏的时候,对于游戏中的白天、晚上、雪等不同的场景,AI已经可以将它们分解为不同的任务来一一进行解决了,这倒是很出乎大家的预料。
  DeepMind新算法与其他算法的对比
  然而,紧接着又有新的问题出现了,那就是研究人员无法证明,AI是否可以把每一款游戏都玩到。概括来讲,AI虽然已经可以利用学过的知识来解决现有的问题,但它是否会因为运用这种方法而将问题解决的更好,还值得商榷。“对于AI来说,还有改进的余地。”Kirkpatrick说。
  而AI没有精通每一款游戏的一个原因就在于,它对于游戏策略的运用仍然非常茫然。“虽然我们知道连贯学习的重要性,但我们始终没能做出突破,进入到模拟人类和动物那种学习模式的阶段。这的确是一个艰难的挑战,但我们知道没有什么事是不可逾越的。”Kirkpatrick说。
  “我们距离通用型人工智能还有很长的路要走,也还有很多的研究和挑战需要解决”,Kirkpatrick补充道。“关键在于,搭建起一个可以学习解决新任务和新挑战的系统,同时还要继续保留他们已经学到的技能。而我们所做的研究就是朝这个方向所做的一个有意义的摸索。”
  伦敦大学学院Gatsby计算神经科学科主任Peter Dayan也十分称赞这项研究工作。他说,计算机如果实现通用型人工智能就意味着,它已经可以做到将不同任务进行关联,充分利用已掌握的技能来解决新的问题。

免责声明:本文仅代表作者个人观点,与每日科技网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

相关新闻

图片中心