5月23日,围棋峰会柯洁对阵AlphaGo三番棋首局人机大战在浙江桐乡战罢。最终,柯洁执黑1/4子负围棋人工智能AlphaGo。赛后新闻发布会上,Deepmind团队负责人哈萨比斯与AlphaGo团队负责人席尔瓦在接受采访时坦言:“此次出战的AlphaGo是单机版,比李世石对弈的版本要高出十倍。” 华学明:请问是否发现AlphaGo弱点? 哈萨比斯:即使是AlphaGo自我对局,我们也没有发现弱点所在。来参加峰会就是希望柯洁去发现AlphaGo的弱点。与李世石对弈时,我们发现了AlphaGo的缺陷,回去改善体系,让AlphaGo自我学习以不断自我完善。 问:有说法AlphaGo并非只是去争胜,而是去控制胜负差距? 哈萨比斯:AlphaGo总是希望将获胜概率最大化,需要做决策来实现完胜。 席尔瓦:AlphaGo扩大获胜概率,我们也可以想象其他目标,如果AlphaGo只是想获胜的话,他就会降低取胜的风险。 华学明:我理解是未来AlphaGo可以探索人类极限? 席尔瓦:希望通过与像柯洁、李世石这样伟大的棋手比赛,来获得更多收获。 问:请问这次是纯净版AlphaGo吗? 哈萨比斯:AlphaGo仍需要和人类对弈,是先学人类棋谱,随后开始通过自我对局来进步提高,所以AlphaGo是依靠人类棋谱数据和此前版本来进一步提升。仅通过自身对决可能发现不了缺陷,和顶尖棋手对决才能提高。我们希望通过完善AlphaGo,在其他领域为人类服务。 问:AlphaGo这次是什么版本,这是最后一次现身吗? 席尔瓦:AlphaGo算法超越数据计算,比去年李世石对弈的版本强了十倍。 哈萨比斯:我们在科学杂志《自然》发表了论文,这周之后我们会公布更多细节和计划,众所周知目前也有很多强大人工智能软件,我们也会在今后公开AlphaGo更多技术细节,使其他实验室或团队能够建造自己的AlphaGo。 问:AlphaGo用了多少GPU? 席尔瓦:AlphaGo这次是单独机器,利用谷歌云。和去年不一样,去年是分布式实施,有很多机器。这次这台机器是更好、更快、结果更好的,依靠TPU,比李世石对弈的版本要高十倍。 华学明:对于我这样不懂计算机的,可以理解这是单机版的AlphaGo吗? 哈萨比斯:是的。
|