当前位置:首页 > 科技  > 网络

GPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类

来源: 责编: 时间:2024-09-23 08:54:37 32观看
导读 AI玩黑神话,第一个精英怪牯护院轻松拿捏啊。有方向感,视角也没有问题。躲闪劈棍很丝滑。甚至在打鸦香客和牯护院时,AI的胜率已经超过人类。而且是完全使用大模型玩,没有使用强化学习。阿里巴巴的研究人员们提出

AI玩黑神话,第一个精英怪牯护院轻松拿捏啊。7H428资讯网——每日最新资讯28at.com

GPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类7H428资讯网——每日最新资讯28at.com

有方向感,视角也没有问题。7H428资讯网——每日最新资讯28at.com

GPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类7H428资讯网——每日最新资讯28at.com

躲闪劈棍很丝滑。7H428资讯网——每日最新资讯28at.com

GPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类7H428资讯网——每日最新资讯28at.com

甚至在打鸦香客和牯护院时,AI的胜率已经超过人类。7H428资讯网——每日最新资讯28at.com

GPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类7H428资讯网——每日最新资讯28at.com

而且是完全使用大模型玩,没有使用强化学习。7H428资讯网——每日最新资讯28at.com

阿里巴巴的研究人员们提出了一个新型VARP(视觉动作角色扮演)智能体框架。7H428资讯网——每日最新资讯28at.com

它能直接将游戏截图作为输入,通过视觉语言模型推理,终生成Python代码形式的动作,以此来操作游戏。7H428资讯网——每日最新资讯28at.com

以玩《黑神话·悟空》为例,该智能体在90%简单和中等水平战斗场景中取胜。7H428资讯网——每日最新资讯28at.com

GPT-4o、Claude 3.5都来迎战研究人员以《黑神话·悟空》为研究平台,一共定义了12个任务,75%与战斗有关。7H428资讯网——每日最新资讯28at.com

GPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类7H428资讯网——每日最新资讯28at.com

他们构建了一个人类操作数据集,包含键鼠操作和游戏截图,一共1000条有效数据。7H428资讯网——每日最新资讯28at.com

每个操作都是由原子命令的各种组合组成的序列。原子命令包括轻攻、闪避、重攻击、回血等。7H428资讯网——每日最新资讯28at.com

GPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类7H428资讯网——每日最新资讯28at.com

然后,他们提出了VARP智能体框架。7H428资讯网——每日最新资讯28at.com

主要包含动作规划系统和人类引导轨迹系统。7H428资讯网——每日最新资讯28at.com

其中动作规划系统由情境库、动作库和人类引导库组成,利用 VLMs 进行动作推理和生成,引入分解特定任务的辅助模块和自我优化的动作生成模块。7H428资讯网——每日最新资讯28at.com

人类引导轨迹系统利用人类操作数据改进智能体性能,对于困难任务,通过查询人类引导库获取相似截图和操作,生成新的人类引导动作。7H428资讯网——每日最新资讯28at.com

GPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类7H428资讯网——每日最新资讯28at.com

同时VARP还包含3个库:情景库、动作库和人工引导库。7H428资讯网——每日最新资讯28at.com

这些库中存储了agent自我学习和人类指导的内容,可以进行检索和更新。7H428资讯网——每日最新资讯28at.com

动作库中,“def new_func_a()”表示动作计划系统生成的新动作,“def new_func_h()”表示人导轨迹系统生成的动作。”def pre_func()”代表预定义的动作。7H428资讯网——每日最新资讯28at.com

动作案例研究和相应的游戏截图。第一行和第二行中的操作是预定义的函数。第三行动作由人工制导轨迹系统生成。7H428资讯网——每日最新资讯28at.com

SOAG会在玩家角色与敌人的每次战斗互动后总结第四行和第五行中的新动作,并将其存储在动作库中。7H428资讯网——每日最新资讯28at.com

GPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类7H428资讯网——每日最新资讯28at.com

框架分别使用了GPT-4o(2024-0513版本)、Claude 3.5 Sonnet和Gemini 1.5 Pro。7H428资讯网——每日最新资讯28at.com

对比人类和AI的表现结果,可以看到小怪部分AI们的表现达到人类玩家水平。7H428资讯网——每日最新资讯28at.com

到了牯护院时,Claude 3.5 Sonnet败下阵来,GPT-4o胜率高。7H428资讯网——每日最新资讯28at.com

但是对于新手玩家普遍头疼的幽魂,AI们也都束手无策了。7H428资讯网——每日最新资讯28at.com

GPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类7H428资讯网——每日最新资讯28at.com

另外研究还提到,由于VLMs推理速度受到限制,是无法实时输入每一帧画面的。7H428资讯网——每日最新资讯28at.com

它只能间隔输入关键帧,这也会导致AI在一些情况下错过boss攻击的关键信息。7H428资讯网——每日最新资讯28at.com

以及由于游戏中没有明确的道路引导且存在很多空气墙,在没有人类引导下,智能体也不能自己找到正确的路线。7H428资讯网——每日最新资讯28at.com

如上研究来自阿里团队,一共有5位作者。7H428资讯网——每日最新资讯28at.com

GPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类7H428资讯网——每日最新资讯28at.com

后续相关代码和数据集有发布计划,感兴趣的童鞋可以蹲下。7H428资讯网——每日最新资讯28at.com

One More Thing7H428资讯网——每日最新资讯28at.com

AI打游戏并不是一个新鲜事了,比如AI基于强化学习方法打《星际争霸II》已经可以击败人类职业高手。7H428资讯网——每日最新资讯28at.com

利用强化学习方案,往往需要输入大量对局。7H428资讯网——每日最新资讯28at.com

商汤此前训练的DI-star(监督学习+强化学习),就用了“16万场录像”和“1亿局对战”。7H428资讯网——每日最新资讯28at.com

但是纯大模型也能打游戏,还是很出乎意料的。在本项研究中,数据集中的有效数据为1000条。7H428资讯网——每日最新资讯28at.com

论文地址:https://arxiv.org/abs/2409.128897H428资讯网——每日最新资讯28at.com

项目地址:https://varp-agent.github.io/7H428资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-115181-0.htmlGPT-4o AI不学习就能玩《黑神话:悟空》!精英怪胜率超人类

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OPPO周意保:手机黑边技术研究三年、很多胶水每克成本超黄金

下一篇: 用AI干预老年痴呆治疗!微软联合上海“600号”

标签:
  • 热门焦点
  • 7月安卓手机性能榜:红魔8S Pro再夺榜首

    7月安卓手机性能榜:红魔8S Pro再夺榜首

    7月份的手机市场风平浪静,除了红魔和努比亚带来了两款搭载骁龙8Gen2领先版处理器的新机之外,别的也想不到有什么新品了,这也正常,通常6月7月都是手机厂商修整的时间,进入8月份之
  • 一文看懂为苹果Vision Pro开发应用程序

    一文看懂为苹果Vision Pro开发应用程序

    译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实(MR)头戴设备。Vision Pro结合了虚拟现实(VR)和增强现实(AR)的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
  • SpringBoot中使用Cache提升接口性能详解

    SpringBoot中使用Cache提升接口性能详解

    环境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架从 3.1 开始,对 Spring 应用程序提供了透明式添加缓存的支持。和事务支持一样,抽象缓存允许一致地使用各
  • 如何通过Python线程池实现异步编程?

    如何通过Python线程池实现异步编程?

    线程池的概念和基本原理线程池是一种并发处理机制,它可以在程序启动时创建一组线程,并将它们置于等待任务的状态。当任务到达时,线程池中的某个线程会被唤醒并执行任务,执行完任
  • 深度探索 Elasticsearch 8.X:function_score 参数解读与实战案例分析

    深度探索 Elasticsearch 8.X:function_score 参数解读与实战案例分析

    在 Elasticsearch 中,function_score 可以让我们在查询的同时对搜索结果进行自定义评分。function_score 提供了一系列的参数和函数让我们可以根据需求灵活地进行设置。近期
  • 认真聊聊东方甄选:如何告别低垂的果实

    认真聊聊东方甄选:如何告别低垂的果实

    来源:山核桃作者:财经无忌爆火一年后,俞敏洪和他的东方甄选依旧是颇受外界关心的“网红”。7月5日至9日,为期5天的东方甄选“甘肃行”首次在自有App内直播,
  • 2纳米决战2025

    2纳米决战2025

    集微网报道 从三强争霸到四雄逐鹿,2nm的厮杀声已然隐约传来。无论是老牌劲旅台积电、三星,还是誓言重回先进制程领先地位的英特尔,甚至初成立不久的新
  •  三星推出Galaxy Tab S9系列平板电脑以及Galaxy Watch6系列智能手表

    三星推出Galaxy Tab S9系列平板电脑以及Galaxy Watch6系列智能手表

    2023年7月26日,三星电子正式发布了Galaxy Z Flip5与Galaxy Z Fold5。除此之外,Galaxy Tab S9系列平板电脑以及三星Galaxy Watch6系列智能手表也同期
  • 与兆芯合作  联想推出全新旗舰版笔记本电脑开天N7系列

    与兆芯合作 联想推出全新旗舰版笔记本电脑开天N7系列

    联想与兆芯合作推出全新联想旗舰版笔记本电脑开天 N7系列。这个系列采用兆芯KX-6640MA处理器平台,KX-6640MA 处理器是采用了陆家嘴架构,16nm 工艺,4 核 4 线
Top