双子塔首页

返回首页 微信
微信
手机版
手机版

DeepMind的AI再次打败人类玩家,“攻下”57款雅达利游戏_365bet官网

2020-04-02 新闻来源:双子塔首页 围观:53
电脑广告
手机广告
bet007足球即时比分bet007足球即时比分

聆听创业故事,对接融资需求

迎接做客【镁客・请讲】栏目

Agent57为我们构建越发壮大的AI决议计划模子奠基了基本。

谋划&撰写:巫盼

AI打游戏会比普通人优异?DeepMind给了一定的答案。近日,DeepMind宣告它们的智能体Agent57初次在所有57款雅达利游戏上逾越人类玩家。

近年来,DeepMind一直在研讨进步智能体在游戏环境下的智能性,通常状况下,智能体在游戏中能够应对的环境越庞杂,它在实在环境中的适应能力也会越强。

此次Agent57应战的街机进修环境(Arcade Learning Environment,ALE)包含57款游戏,为智能体的强化进修供应了庞杂的应战。

而之所以会挑选雅达利游戏作为练习的数据集,DeepMind示意雅达利游戏充足多样化,能够评价智能体的泛化机能,其次它能够模拟在实在环境中大概碰到的状况,而且雅达利游戏是由自力的构造构建,能够防止试验私见。

据悉,Agent57在多台计算机上并行实行,并启用强化进修算法(Reinforcement learning,简称“RL”)驱动智能体采用行为,使得嘉奖的效果最大化。此前,强化进修在游戏范畴就获得不少希望,比方OpenAI的OpenAI Five和DeepMind的AlphaStar RL智能体离别打败了99.4%的Dota 2玩家和99.8%的星际2玩家。

装一台“价格不贵”,“竖装显卡”RGB颜值主机:能战3、5年游戏bet36备用188bet备用网址

图 | Agent57的框架

雅达利游戏中的Montezuma、Revenge和Pitfall都很难,AI必须先尝试多种差别的战略,才找到可行的要领。而在Solaris和Skiing游戏中,须要一段时间才显现决议计划效果,这意味着AI必须在相称长的时间内网络尽量多的信息。

Agent57经由过程让差别的计算机研讨游戏的各个方面来克服了这些困难,然后将网络到的信息反馈给一个控制器,由控制器对所有这些要素举行剖析以制订出最好战略。

DeepMind将Agent57与当前最先进的算法MuZero、R2D2和NGU做了比较,Agent57显现出了更高的均匀机能(100)。

研讨团队示意,“这并不意味着雅达利游戏研讨的完毕,我们不仅要关注数据效力,也须要关注整体表现,将来的重要革新大概会是Agent57在探究、计划和信度分配上。”比方削减AI运转的算力,在鸠合中的一些较简朴的游戏中变得更好。

Agent57在雅达利游戏中获得逾越人类玩家的结果,为我们构建越发壮大的AI决议计划模子奠基了基本:AI不仅能够自动完成重复性的使命,也能够自动推理环境。

星标我们,不要错过

镁客网

科技 | 人文 | 行业

10bet365bet官网
文章底部电脑广告
手机广告位-内容正文底部

相关文章