植绒机厂家
免费服务热线

Free service

hotline

010-00000000
植绒机厂家
热门搜索:
行业资讯
当前位置:首页 > 行业资讯

【消息】DeepMind进军星际争霸2谷歌Facebook打响通用AI战争

发布时间:2020-12-25 19:47:45 阅读: 来源:植绒机厂家

7日,Facebook刚刚宣布开源史上最大的《星际争霸》游戏数据集STARDATA。今天(10日)DeepMind在官方博客上宣布开源星际争霸2 研究训练平台SC2LE。AI 巨头挑战星际争霸的角逐愈演愈烈。乌镇围棋峰会上,DeepMind CEO 哈萨比斯曾说,星际争霸将成为AI进步的下一个大考验。

国内AI资深专家袁泉此前曾深入研究过星际争霸中的若干AI问题,和UCL共同发表了多智能体协作网络BiCNet,第一次展现了AI在星际微观战斗中的五类智能协作方式。新智元对此做过专门报道。此次DeepMind和暴雪最新发布的星际争霸2 AI开放研究平台的论文中,也多次引用了袁泉团队的工作。因此,袁老师应新智元之邀做了特别点评。他指出了此事的两点意义:

第一点:星际2的搜索和决策空间比AlphaGo围棋大了多个“数量级”,DeepMind、Facebook等越来越多的优秀团队参与到这项研究中,很可能创造出更好的下一代AI的新技术。因为按之前玩围棋的技术框架的话,蒙特卡罗树搜索加深度强化学习,应该是不能完全解决星际中的问题,尤其是full game智能策略方面的难题。此次DeepMind和暴雪在AI开放平台、API标准化、性能架构上做了不少细致卓越的工作,为今后的研究打下了好的基础,希望国内有志于此方向的老师同学积极投入到此项研究工作中。

第二点: SC2LE开放平台,相对于大家之前做的星际1的平台,最大的一个优势是提供了很多端到端的内容操作的接口,发展出来可以通过接口像人一样打星际,进行控制,这种接口是在之前的星际1平台上不提供的。基于这一点,未来有可能大家可以会看到机器人像人一样坐在电脑前,操作鼠标打星际和高手对决,对机器人等相关领域也是很好的促进!

DeepMind 最新发布SC2LE,推动星际争霸 2 AI 研究

DeepMind 刚刚在博客中宣布,与合作伙伴暴雪一起,发布了一套名为SC2LE (StarCraft II Learning Environment)的工具组件,这套工具组件将加速即时策略游戏星际争霸 2 中的 AI 研究。

星际争霸 2 是 2010 年发布的即时策略游戏

根据 DeepMind 的博客所说,SC2LE 包括:

一个由暴雪开发的机器学习 API,能够让研究者和开发者参与到游戏中来。其中还包括面向 Linux 的工具的首次发布。( GitHub 地址 )

一个匿名游戏回放数据集。在未来几周内,其大小将从 65k 增加到超过 500k。

一个开源版本的 DeepMind 工具集PySC2,允许研究者较容易地使用暴雪的 feature-layer API 和自己的智能体。

一系列简单的强化学习迷你游戏,使研究者可以在特定任务上测试智能体性能。

一篇 DeepMind 和暴雪的联合论文,论文对作为研究环境的星际争霸2 进行了概述,报告了在迷你游戏上的初始基准结果,基于回放的监督式学习,以及对抗游戏 AI 的 1 v1 ladder 游戏(论文介绍见文后)。

星际争霸 2 AI 研究进一步瞄准通用人工智能和真实世界的任务

DeepMind 一向以开发能够学习解决复杂问题的 AI 系统、推进 AI 边界为使命。从设计用来研发通用人工智能和机器学习系统的第一人称视角 3D 游戏平台DeepMind Lab ,到围棋、Atari 这样的游戏,DeepMind 一直在广阔多样的环境中设计智能体并测试其能力。

星际争霸和星际争霸 2 一直以来都位列最成功的大型游戏之中,相关比赛已经举办了 20 多年。其原始游戏就已经被 AI 和机器学习研究者所用,每年都有 AIIDE bot competition。星际争霸长盛不衰的部分原因在于其丰富、多层面的游戏过程,这也使得其成为 AI 研究的理想环境。

关于星际争霸作为 AI 研究和智能体“竞技场”的历史,可以参见这篇文章: 星际AI 争霸 6 年简史:通用人工智能角斗场,DeepMind确认应战 。

实际上,早在2016年11 月,DeepMind 工程师 Oriol Vinyals 就在公司博客公布,DeepMind 将和暴雪合作,让星际争霸2 成为人工智能研究场景,并开放给所有的人工智能研究者。

Oriol Vinyals 少年时期曾是西班牙的顶级星际争霸玩家,他当时坦言,“要打败人类职业选手,机器尚有很长的路要走。

他当时在博客中写道,DeepMind 之所以选择星际争霸2作为人工智能研究的目标,是因为它的复杂性:玩家必须做出高级战略决策,同时还要控制数百个元素,并快速做出各种决定。Oriol Vinyals 认为,跟国际象棋和围棋相比,星际争霸更能模拟真实世界的混乱状况。他说:“如果要让智能体程序学会玩星际争霸,它需要有效利用记忆,还要能制定长远计划,而且能根据最新信息调整计划。”他认为,如果能开发一套机器学习系统,让它掌握操作星际争霸的技巧,这种技术将最终可以用来执行真实世界的任务。

此后,《星际争霸》的制造公司暴雪娱乐建造总监 Tim Morten 对媒体确认,AlphaGo 将挑战《星际争霸2》。

AI研究者现在可以使用开放工具构建自己的模型,来应对星际争霸的技术挑战

此次 SC2LE 的发布,无疑是 DeepMind 将之前的宣言付诸了行动。在这篇最新的博客中,DeepMind 又阐释道:

举例来说,如果游戏的目标是击败对手,游戏者必须采用并权衡一系列子目标,比如采集能源或修建建筑。另外,一局游戏的时长可能长至一小时,这意味着游戏早期采取的一些行动可能长时间得不到回报。最后,地图上有很大一部分是隐藏的,这意味着智能体必须结合其记忆力和规划能力,才能获胜。

这款游戏还有其他吸引研究者的特质,比如每天都有人数众多的狂热玩家在线比赛,这保证了训练智能体所必需的回放数据,也保证了 AI 智能体不缺有实力的对手。

上海时光整形好不好

长沙市治疗皮肤病专科医院排名

中国医科大学附属第四医院专家

长沙肿瘤医院的特色疗法