DeepMind人工智能新突破:没有预设规则也能掌握围棋、Atari游戏等
对于那些认为人工智能是威胁的人来说,可能不太喜欢 DeepMind 的最新研究成果。这家隶属于 Alphabet 的人工智能部门提出了名为 MuZero 的新算法,能够让机器在不了解规则的情况下成功击败人类选手。这绝对是人工智能领域的一个惊人发展,因为该算法能够让人工智能更好地的应对现实生活中的场景,而且不需要提供任何特定的算法。
DeepMind 在探索人工智能的道路上从未停止脚步。在 AlphaGo 学会围棋并成功击败职业围棋手之后,DeepMind 又推出了 AlphaGo Zero,通过观察人和人之间的真实比赛,然后让两台计算机一同来下棋。
随后,该团队再次推出了 AlphaZero,只是在告知游戏规则的情况下,实现了对围棋、将棋和国际象棋的熟练掌握。而现在该团队推出的 MuZero,并没有告知任何的棋类运行规则,让它自己通过观察来掌握围棋、国际象棋、将棋和 Atari 游戏。
MuZero 在没有传授规则的情况下可以自己学习,制定相应的计划并取得胜利。MuZero 可以在雅达利游戏中做同样的事情。新的人工智能在学习了规则之后,可以变得和以前的版本一样好,甚至比以前的版本更好。
这个项目的目标是提供一个单一的算法,可以让AI在不知道该方案的规则的情况下想出下一步行动。对于象棋和围棋这样的游戏来说,这可能说起来容易做起来难,因为在这些游戏中,有一套预定义的动作可以让你获得胜利或失败。但在大多数现实世界的情况下,如果没有获得复杂的算法,人工智能可能难以驾驭更多的种类,而这种算法基本上可以让它思考。
但事实上 MuZero 并不会自己思考,更没有达到科幻小说/电影中可怕的人工智能。然而,DeepMind确实达到了一个重要的里程碑,如果它的算法允许计算机在它不知道所有规则的模拟中提出一个胜利的解决方案。
Engadget解释说,MuZero在做决定时会考虑三件事。首先,它会考虑上一次行动的结果、当前所处的位置以及下一次行动的最佳方案。DeepMind发现,MuZero与之前的AIs相匹配。而且,它的时间越多,它提供的解决方案就越好。即使加入了时间限制,比如在行动前限制吃豆人女士的模拟次数,MuZero也取得了不错的效果。