【导读】去年,基于ELF平台开发出了的开源版本,以期复现,并希望通过开源行为激励研究者思考这一技术的应用点及研究方向。时隔半年,再次发布新版,大幅度提升算法模型性能。
介绍:
去年我们发布了ELF ,已经得到了AI研究者们的广泛使用,来构建游戏机器人,以便更好的理解AI系统如何学习,以及方便围棋爱好者们测试自己的技艺。这款开源机器人与人类对局过程中,表现得非常出色,包括与顶级职业围棋选手的20比0的战绩。因此也被广泛应用于人工智能研究团体中,进行围棋实验,复现他人研究成果中。ELF 已经在AI围棋比赛中与多个修改版本进行了较量。同时也会与人类组队,曾经在一次比赛中,展示了混合配对能力,每个人与一个机器人组队,共同对抗另一个AI-human团队。
AI研究团队(FAIR)宣布了ELF 的新功能特点以及最新的研究成果,包括了一个重新训练的模型,同时还包括了一个系统的可执行机器人,使得围棋玩家更容易使用该系统作为训练辅助工具。另外,还包括了一份特殊的档案,其中包括了个职业围棋游戏的分析。现在玩家可以看到我们的系统是如何对18世纪最优秀的选手进行排名的。我们很高兴这个多功能平台能够帮助研究人员更好的理解AI,页很高兴看到Go社区的玩家使用它来训练自己的技艺。
韩国Baduk协会公关副总监 Cho说:“我可以肯定的说,ELF 项目给韩国围棋界带来了巨大的影响。自ELF Go面试以来,几乎所有的韩国职业棋手都在使用该软件分析自己和其他选手的器具,正因为如此,韩国的围棋水平不仅提高了,而且全世界的围棋水平同样跟着得到了提升。”
当在2017年发布 Zero机器人的结果时,展示了这款有着4000年历史的围棋游戏作为深度强化学习实验台的潜力。但尽管及其后继者已经证明,人工智能虽然可以击败人类围棋棋手,但它们的功能更多的是作为深度强化学习的一个理想例子,而非更广泛的人工智能研究领域的工具。
我们去年发布了的重新实现版本,同时我们呢认识到,由于需要大量的计算资源,即使发布了开源大卖,大多数研究人员也无法重现我们的结果,这也是我们在一篇文章中分享的那样,这项研究揭示了为什么人工智能对人类玩家如此强大,也阐明了这项技术的局限性,这可能有助于研究人员更好的理解其潜在机制,并将其应用于其他情况。
对于研究社区,我们更新的模型是目前ELF 最好的版本,通过2000万局自我对弈来生成实现。对于那些项深入研究基于RL的围棋机器人如何学习的研究人员来说,论文中详细介绍了大量的消融实验结果,在评估过程中修改个体特征,以更好的理解这类算法的特性。
更详细内容,请参见原始链接及论文原文~~
【论文便捷下载】
请关注专知公众号(点击上方蓝色专知关注)
原文链接:
项目链接:
链接:
附论文全文:
评论(0)