当前位置：首页 > 元宇宙 > AI

GPT-4o 能玩《黑神话：悟空》：精英怪胜率超人类，无强化学习纯大模型方案

来源：责编：时间：2024-09-25 16:36:07 199观看

导读 AI 玩黑神话，第一个精英怪牯护院轻松拿捏啊。有方向感，视角也没有问题。躲闪劈棍很丝滑。甚至在打鸦香客和牯护院时，AI 的胜率已经超过人类。而且是完全使用大模型玩，没有使用强化学习。阿里巴巴的研究人员们提出

AI 玩黑神话，第一个精英怪牯护院轻松拿捏啊。

有方向感，视角也没有问题。

躲闪劈棍很丝滑。

甚至在打鸦香客和牯护院时，AI 的胜率已经超过人类。

而且是完全使用大模型玩，没有使用强化学习。

阿里巴巴的研究人员们提出了一个新型 VARP（视觉动作角色扮演）智能体框架。它能直接将游戏截图作为输入，通过视觉语言模型推理，最终生成 Python 代码形式的动作，以此来操作游戏。

以玩《黑神话・悟空》为例，该智能体在 90% 简单和中等水平战斗场景中取胜。

GPT-4o、Claude 3.5 都来迎战

研究人员以《黑神话・悟空》为研究平台，一共定义了 12 个任务，75% 与战斗有关。

他们构建了一个人类操作数据集，包含键鼠操作和游戏截图，一共 1000 条有效数据。

每个操作都是由原子命令的各种组合组成的序列。原子命令包括轻攻、闪避、重攻击、回血等。

然后，他们提出了 VARP 智能体框架。主要包含动作规划系统和人类引导轨迹系统。

其中动作规划系统由情境库、动作库和人类引导库组成，利用 VLMs 进行动作推理和生成，引入分解特定任务的辅助模块和自我优化的动作生成模块。

人类引导轨迹系统利用人类操作数据改进智能体性能，对于困难任务，通过查询人类引导库获取相似截图和操作，生成新的人类引导动作。

同时 VARP 还包含 3 个库：情景库、动作库和人工引导库。这些库中存储了 agent 自我学习和人类指导的内容，可以进行检索和更新。

动作库中，“def new_func_a ()”表示动作计划系统生成的新动作，“def new_func_h ()”表示人导轨迹系统生成的动作。“def pre_func ()”代表预定义的动作。

动作案例研究和相应的游戏截图。第一行和第二行中的操作是预定义的函数。第三行动作由人工制导轨迹系统生成。

SOAG 会在玩家角色与敌人的每次战斗互动后总结第四行和第五行中的新动作，并将其存储在动作库中。

框架分别使用了 GPT-4o（2024-0513 版本）、Claude 3.5 Sonnet 和 Gemini 1.5 Pro。

对比人类和 AI 的表现结果，可以看到小怪部分 AI 们的表现达到人类玩家水平。

到了牯护院时，Claude 3.5 Sonnet 败下阵来，GPT-4o 胜率最高。

但是对于新手玩家普遍头疼的幽魂，AI 们也都束手无策了。

另外研究还提到，由于 VLMs 推理速度受到限制，是无法实时输入每一帧画面的。它只能间隔输入关键帧，这也会导致 AI 在一些情况下错过 boss 攻击的关键信息。

以及由于游戏中没有明确的道路引导且存在很多空气墙，在没有人类引导下，智能体也不能自已找到正确的路线。

如上研究来自阿里团队，一共有 5 位作者。

后续相关代码和数据集有发布计划，感兴趣的童鞋可以蹲下。

One More Thing

AI 打游戏并不是一个新鲜事了，比如 AI 基于强化学习方法打《星际争霸 II》已经可以击败人类职业高手。

利用强化学习方案，往往需要输入大量对局。商汤此前训练的 DI-star（监督学习 + 强化学习），就用了“16 万场录像”和“1 亿局对战”。

但是纯大模型也能打游戏，还是很出乎意料的。在本项研究中，数据集中的有效数据为 1000 条。

论文地址：

https://arxiv.org/abs/2409.12889

项目地址：

https://varp-agent.github.io/

本文来自微信公众号：微信公众号（ID：QbitAI），作者：小明，原标题《GPT-4o 能玩《黑神话》！精英怪胜率超人类，无强化学习纯大模型方案》

本文链接：http://www.28at.com/showinfo-45-7750-0.htmlGPT-4o 能玩《黑神话：悟空》：精英怪胜率超人类，无强化学习纯大模型方案

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：微软亚洲研究院与上海市精神卫生中心展开联合研究，借助多模态大模型为认知障碍患者带来全新训练方法

下一篇： AI“攻克”CAPTCHA 网站验证系统

标签：

热门焦点

关于ChatGPT的10点思考

作者：晏涛三寿近日ChatGPT又有大动作。5月19日，OpenAI在官网宣布正式发布App应用，并登录苹果应用商店。与网页版的聊天机器人相比，iOS应用程序的发布有望让更多人接触到ChatGPT
企业热、用户冷，元宇宙第一站将是“营销场”？

如果说2021年底什么最火热，那元宇宙当之无愧。“万物皆可元宇宙”似乎成为新的流行语，在广告中也常常听到“社交元宇宙”“购物元宇宙”等等。就在近日，有消息传
百度元宇宙希壤是什么？（附下载）

百度元宇宙希壤是什么，最近很多人关注。还有很多人问希壤怎么下载、百度希壤怎么进入？今天小编带你来全面了解一下。“希壤”是百度于2021年12月27日于百度AI开
全面拥抱“虚拟世界”，摩登天空要打造“音乐元宇宙”

作者：袁佳琦沈黎晖不怎么打游戏，但许多事儿在他眼里都“有意思”。好玩，有意思，是他的口头禅，在接受娱乐独角兽的采访过程中，他多次提到，做虚拟音乐人，“是件挺好玩的
「国产良心」NFT嘲讽了谁？

2月23日，一个名为「国产良心」的NFT项目被许多活跃的加密用户注意到。该项目的官网风格尤为「不正经」，它丝毫没有避讳自己的小作坊出身，还将「中国人不骗中国人
NFT Insider #47：YGG发布2021Q4社区报告，GameFi领域1月份获超10亿美元融资

引言：NFT Insider由WHALE社区、BeepCrypto联合出品，浓缩每周NFT新闻，为大家带来关于NFT最全面、最新鲜、最有价值的讯息。每期周报将从NFT市场数据，艺术新闻类，游戏
暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗？

NFT Worlds 系列产品于 2021 年 10 月 5 日免费铸造，该NFT系列是将传统的中心化电子游戏minecraft 与去中心化资产相结合。传统游戏Minecraft 对用户定制非常开
Meta 呼吁行业合作建立元宇宙网络基础设施

Facebook 的母公司 Meta呼吁，建立必要的全球合作的基础设施，以支持其蓬勃发展的元宇宙野心。“元宇宙”成为 2021 年的主要流行语之一，这在很大程度上是由 Facebo
虚拟偶像行业的商用价值逐渐凸显，IP生态圈也逐渐成型

六月的第一个周六，一场虚拟偶像七海Nana7mi的个人3D演唱会在万代南梦宫上海文化中心举行，相较于洛天依、百大UP主泠鸢yousa等，这位虚拟Up主在B站上的粉丝数43.6万

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

GPT-4o 能玩《黑神话：悟空》：精英怪胜率超人类，无强化学习纯大模型方案

关于ChatGPT的10点思考

企业热、用户冷，元宇宙第一站将是“营销场”？

百度元宇宙希壤是什么？（附下载）

全面拥抱“虚拟世界”，摩登天空要打造“音乐元宇宙”

「国产良心」NFT嘲讽了谁？

NFT Insider #47：YGG发布2021Q4社区报告，GameFi领域1月份获超10亿美元融资

暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗？

Meta 呼吁行业合作建立元宇宙网络基础设施

虚拟偶像行业的商用价值逐渐凸显，IP生态圈也逐渐成型

最新推荐

虚拟人再升级，企业可以解放双手了？

在元宇宙卖酸奶，这波联动燃爆了！

文心一言排名垫底，却成为百度业绩增长杠杆

网易音乐、理想申请元宇宙商标被驳回，“啫喱”暂停新用户进入

Interface正大光明的“跑路”，社区成员赞格局大

Snoop Dogg 计划推出致力于数字媒体NFT的专业公司

猜你喜欢

热门推荐

相关资讯