当前位置:首页 > 元宇宙 > AI

GPT-4o 能玩《黑神话:悟空》:精英怪胜率超人类,无强化学习纯大模型方案

来源: 责编: 时间:2024-09-25 16:36:07 192观看
导读 AI 玩黑神话,第一个精英怪牯护院轻松拿捏啊。有方向感,视角也没有问题。躲闪劈棍很丝滑。甚至在打鸦香客和牯护院时,AI 的胜率已经超过人类。而且是完全使用大模型玩,没有使用强化学习。阿里巴巴的研究人员们提出

AI 玩黑神话,第一个精英怪牯护院轻松拿捏啊。Tlq28资讯网——每日最新资讯28at.com

Tlq28资讯网——每日最新资讯28at.com

有方向感,视角也没有问题。Tlq28资讯网——每日最新资讯28at.com

Tlq28资讯网——每日最新资讯28at.com

躲闪劈棍很丝滑。Tlq28资讯网——每日最新资讯28at.com

Tlq28资讯网——每日最新资讯28at.com

甚至在打鸦香客和牯护院时,AI 的胜率已经超过人类。Tlq28资讯网——每日最新资讯28at.com

Tlq28资讯网——每日最新资讯28at.com

而且是完全使用大模型玩,没有使用强化学习。Tlq28资讯网——每日最新资讯28at.com

阿里巴巴的研究人员们提出了一个新型 VARP(视觉动作角色扮演)智能体框架。它能直接将游戏截图作为输入,通过视觉语言模型推理,最终生成 Python 代码形式的动作,以此来操作游戏。Tlq28资讯网——每日最新资讯28at.com

以玩《黑神话・悟空》为例,该智能体在 90% 简单和中等水平战斗场景中取胜。Tlq28资讯网——每日最新资讯28at.com

GPT-4o、Claude 3.5 都来迎战

研究人员以《黑神话・悟空》为研究平台,一共定义了 12 个任务,75% 与战斗有关。Tlq28资讯网——每日最新资讯28at.com

Tlq28资讯网——每日最新资讯28at.com

他们构建了一个人类操作数据集,包含键鼠操作和游戏截图,一共 1000 条有效数据。Tlq28资讯网——每日最新资讯28at.com

每个操作都是由原子命令的各种组合组成的序列。原子命令包括轻攻、闪避、重攻击、回血等。Tlq28资讯网——每日最新资讯28at.com

Tlq28资讯网——每日最新资讯28at.com

然后,他们提出了 VARP 智能体框架。主要包含动作规划系统和人类引导轨迹系统。Tlq28资讯网——每日最新资讯28at.com

其中动作规划系统由情境库、动作库和人类引导库组成,利用 VLMs 进行动作推理和生成,引入分解特定任务的辅助模块和自我优化的动作生成模块。Tlq28资讯网——每日最新资讯28at.com

人类引导轨迹系统利用人类操作数据改进智能体性能,对于困难任务,通过查询人类引导库获取相似截图和操作,生成新的人类引导动作。Tlq28资讯网——每日最新资讯28at.com

Tlq28资讯网——每日最新资讯28at.com

同时 VARP 还包含 3 个库:情景库、动作库和人工引导库。这些库中存储了 agent 自我学习和人类指导的内容,可以进行检索和更新。Tlq28资讯网——每日最新资讯28at.com

动作库中,“def new_func_a ()”表示动作计划系统生成的新动作,“def new_func_h ()”表示人导轨迹系统生成的动作。“def pre_func ()”代表预定义的动作。Tlq28资讯网——每日最新资讯28at.com

动作案例研究和相应的游戏截图。第一行和第二行中的操作是预定义的函数。第三行动作由人工制导轨迹系统生成。Tlq28资讯网——每日最新资讯28at.com

SOAG 会在玩家角色与敌人的每次战斗互动后总结第四行和第五行中的新动作,并将其存储在动作库中。Tlq28资讯网——每日最新资讯28at.com

Tlq28资讯网——每日最新资讯28at.com

框架分别使用了 GPT-4o(2024-0513 版本)、Claude 3.5 Sonnet 和 Gemini 1.5 Pro。Tlq28资讯网——每日最新资讯28at.com

对比人类和 AI 的表现结果,可以看到小怪部分 AI 们的表现达到人类玩家水平。Tlq28资讯网——每日最新资讯28at.com

到了牯护院时,Claude 3.5 Sonnet 败下阵来,GPT-4o 胜率最高。Tlq28资讯网——每日最新资讯28at.com

但是对于新手玩家普遍头疼的幽魂,AI 们也都束手无策了。Tlq28资讯网——每日最新资讯28at.com

Tlq28资讯网——每日最新资讯28at.com

另外研究还提到,由于 VLMs 推理速度受到限制,是无法实时输入每一帧画面的。它只能间隔输入关键帧,这也会导致 AI 在一些情况下错过 boss 攻击的关键信息。Tlq28资讯网——每日最新资讯28at.com

以及由于游戏中没有明确的道路引导且存在很多空气墙,在没有人类引导下,智能体也不能自已找到正确的路线。Tlq28资讯网——每日最新资讯28at.com

如上研究来自阿里团队,一共有 5 位作者。Tlq28资讯网——每日最新资讯28at.com

Tlq28资讯网——每日最新资讯28at.com

后续相关代码和数据集有发布计划,感兴趣的童鞋可以蹲下。Tlq28资讯网——每日最新资讯28at.com

One More Thing

AI 打游戏并不是一个新鲜事了,比如 AI 基于强化学习方法打《星际争霸 II》已经可以击败人类职业高手。Tlq28资讯网——每日最新资讯28at.com

利用强化学习方案,往往需要输入大量对局。商汤此前训练的 DI-star(监督学习 + 强化学习),就用了“16 万场录像”和“1 亿局对战”。Tlq28资讯网——每日最新资讯28at.com

但是纯大模型也能打游戏,还是很出乎意料的。在本项研究中,数据集中的有效数据为 1000 条。Tlq28资讯网——每日最新资讯28at.com

论文地址:Tlq28资讯网——每日最新资讯28at.com

https://arxiv.org/abs/2409.12889Tlq28资讯网——每日最新资讯28at.com

项目地址:Tlq28资讯网——每日最新资讯28at.com

https://varp-agent.github.io/Tlq28资讯网——每日最新资讯28at.com

本文来自微信公众号:微信公众号(ID:QbitAI),作者:小明,原标题《GPT-4o 能玩《黑神话》!精英怪胜率超人类,无强化学习纯大模型方案》Tlq28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-7750-0.htmlGPT-4o 能玩《黑神话:悟空》:精英怪胜率超人类,无强化学习纯大模型方案

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 微软亚洲研究院与上海市精神卫生中心展开联合研究,借助多模态大模型为认知障碍患者带来全新训练方法

下一篇: AI“攻克”CAPTCHA 网站验证系统

标签:
  • 热门焦点
  • ChatGPT访问量增速下滑,AI真的是一场泡沫吗?

    来源:首席商业评论2023年,最火的莫过于ChatGPT,席卷全球的同时也引发了生成式AI(人工智能)的投资热潮。在美股,ChatGPT相关概念股飙涨,以AI算力龙头英伟达为例,其股价年内一度累计上
  • 10亿基金,李彦宏呼唤下一个AI独角兽

    ©️深响原创 · 作者|何文 AI太热了。 在海外,OpenAI估值已超270亿美元、英伟达市值破万亿、微软把GPT整合进了全线产品。在国内,百度、阿里、华为、商汤等大公司,以及
  • 游戏玩家才是最“元宇宙”的

    01元宇宙的概念,最早由科幻作家尼尔·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一个脱胎于现实世界,又与现实世界平行、相互影响,并且始终在线的虚拟世
  • 江西将探索成立元宇宙联盟,韩国将加强对NFT和元宇宙的监管

    《元宇宙新鲜事》有:江西将探索成立元宇宙联盟,支持南昌规划建设元宇宙试验区;韩国金融监督局将加强对NFT和元宇宙的监管;任天堂社长表示暂时不打算加入元宇宙。【
  • 百度元宇宙希壤是什么?(附下载)

    百度元宇宙希壤是什么,最近很多人关注。还有很多人问希壤怎么下载、百度希壤怎么进入?今天小编带你来全面了解一下。“希壤”是百度于2021年12月27日于百度AI开
  • NFT教育要从娃娃抓起!这些青少年艺术家已经赚取了几千万美金

    一些艺术家通过将他们的创作作为NFT出售而获得了巨大收益。令人惊讶的是,许多赚取了数百万美元的艺术家们仍在读高中。这可能有点让人难以置信。然而,请记住,在短
  • 盘点9个主流元宇宙平台,你都知道哪些?

    随着NFT的持续升温,它也加入了现在的元宇宙浪潮。本文介绍元宇宙的基本概念以及 九个最流行的元宇宙NFT平台,如Decentraland、sandbox等。用熟悉的语言学习 以太
  • 新闻业在元宇宙的现状和未来

    “美联社有毛病吧,这真的过分了!”,一位媒体编辑在推特中愤怒地表示。这是针对一款视频NFT的批评言论之一,之后取消了此次销售,因为该视频呈现了移民穿越地中海的苦
  • 虚拟人行业研究报告

    最早的虚拟人出现于 20 世纪 80 年代,受限于技术,当时的虚拟人制作以手绘为主。21 世纪初,随着动捕、渲染等技术的逐步发展,虚拟人相关技术开始在影视领域逐渐普及
Top