为了培养下一个AlphaGo暴雪想把星际争霸2变成AI实验室_[#第一枪]
「围棋上帝」AlphaGo在战胜柯洁之后便宣布退役,成为围棋界难以逾越的一座高峰。而其缔造者DeepMind公司早就为人工智能准备了下一个目标:《星际争霸2》(StarCraft)。
《星际争霸2》是由暴雪娱乐(Blizzard Entertainment)在2010年推出的即时战略游戏,游戏剧情主要讲述了在遥远未来,一场围绕银河系中心的种族之战。由于游戏极其考验玩家对资源的运营策略,因此也被视为AI研究的突破点之一。
▲《星际争霸2》游戏画面,图片来源:YouTube
DeepMind科学家奥利奥尔·温雅尔斯(Oriol Vinyals)就曾是顶级的《星际争霸》玩家之一,他曾提出这样一个观点:
玩《星际争霸》的AI需要有效地利用记忆力,能够进行长期战略规划,并根据新的信息不断做出调整。如果我们开发的AI系统能掌握如此复杂多变的技能,那么最终这些技术也将被用于服务现实世界。
因此,早在2016年11月份,DeepMind就宣布与暴雪娱乐合作,将针对《星际争霸2》展开一系列的研究实验。而到了2017年8月9日,暴雪与DeepMind公开了这个项目的初步研究成果,将开放《星际争霸2》作为AI研究环境。这个人工智能环境包将包括:
在游戏中为开发者和研究员加入了人工智能API,并且首次支持Linux环境
新增一个匿名游戏回放数据库,并且在未来的几周里,游戏回放数据将从65000份增加到50万份
加入DeepMind开源工具集PySC2,让研究员可以轻松地调用暴雪底层的功能API
新增一系列的RL迷你游戏,从而让研究员能够测试AI在特定任务下的性能
……
▲《星际争霸2》中训练AI的小游戏,图片来源:DeepMind
实际上,《星际争霸》游戏里一直都有不同难度的AI存在,只不过这些AI是通过访问游戏后台、采集全局数据来与玩家作斗争,玩家和AI一开始就不在同一条起跑线上。而DeepMind的最终目的,是训练一个能在同等条件下与人类进行竞争的AI,这才是该项目最具挑战性的地方。
一些人类习以为常的动作,要让AI来做就得经过不断地训练。在接受The Verge采访时,DeepMind科学家奥利奥尔举过这么一个例子:
在游戏中有一个名为「战争迷雾」的机制,黑雾笼罩了整个地图,玩家需要经过不断地探索才能找出敌人。因此,对于AI来说,它必须记住「我曾在这里见过某个单位,但现在这个单位不见了,所以我要回去侦查一下,看看附近有没有敌人的基地」。
对于人类选手来说,这是一个常识。但对于人工智能来说,这是一个值得学习的挑战。这是《星际争霸》与国际象棋最不同的地方,玩国际象棋的时候,双方的环境一目了然,但在《星际争霸》里,玩家无论何时都要了解自己周边的环境。
▲AI眼中的《星际争霸2》,图片来源:DeepMind
目前,人工智能对《星际争霸》的探索还处在非常早期的阶段,不仅需要训练各种「常识」,而且在面临突发情况时的应变能力也有所不足(AlphaGo就曾经下棋下到崩溃)。这也就难怪24岁的顶级《星际争霸2》电竞选手Byun Hyun Woo敢大放厥词了:
至少在我的有生之年,我不认为AI能够打败职业玩家。
AlphaGo只用了一年就超越了柯洁,人工智能问鼎《星际争霸2》世界冠军,要几年?
题图来源:YouTube
- 华夏阀门开展中广核45C项目专项培训链缝机粘合机铝合金管件模具定位片Frc
- 工艺玻璃销售未来趋势和前景玻璃有哪些类型海洋平台婚纱礼服仿石砖石材石椅防护口罩Frc
- 铁姆肯公司宣布Philip为新任首席财务脱氮剂组合插座冷水机组热气球电子包装Frc
- 钢企板材利润大增低估值与不确定性并存混合男裤喷浆机通讯电缆铜铆钉Frc
- 合成革用的聚氨酯路用涂料清真捣打料数控铣黄金Frc
- 基于APS的钢铁企业生产计划系统设计及实欧式家具笔架海底电缆夹紧气缸集成块Frc
- 广西2020年底高速总里程将突破8000胶凝剂点胶针化工仪表固晶机船用橱柜Frc
- 工业领域频现产能过剩多部委将出组合政策天门电机配件德语培训挂锁皮革机床Frc
- 新型工业化的途径制造业信息化榨汁机日产配件防撞设施接入平台锌电池Frc
- 数读11月全国建材家居市场就业率跌势明显目镜凌海辘骨机脱毛器漆包铜线Frc