当前位置:首页 > 科技  > 网络

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过

来源: 责编: 时间:2023-09-18 18:37:32 263观看
导读 除了玩电子游戏,人类的“社交神器”狼人杀也被AI给学会了。8个ChatGPT“坐”在一起,生动地扮演出了五种角色,和真人如出一辙。这个新的人类社会模拟实验,由清华和中关村实验室共同完成。从

除了玩电子游戏,人类的“社交神器”狼人杀也被AI给学会了。aLz28资讯网——每日最新资讯28at.com

8个ChatGPT“坐”在一起,生动地扮演出了五种角色,和真人如出一辙。aLz28资讯网——每日最新资讯28at.com

这个新的人类社会模拟实验,由清华和中关村实验室共同完成。aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

从斯坦福小镇到清华游戏公司,用AI模拟人类社会一直是学界的热门研究课题。aLz28资讯网——每日最新资讯28at.com

如果说清华游戏公司模拟了社畜的工作场景,那么现在社畜的业余社交生活也被AI模拟了。aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

在这个由8个ChatGPT组成的狼人杀局中,真人世界里的伪装与信任、领导与对抗都体现得淋漓尽致。aLz28资讯网——每日最新资讯28at.com

甚至不用人类教,AI就通过自己摸索发现了许多游戏技巧。aLz28资讯网——每日最新资讯28at.com

这一切只要通过设计prompt就能实现,而不必对模型中的参数进行调整。aLz28资讯网——每日最新资讯28at.com

那么,这个“狼人杀世界”中都有哪些精彩的场景呢?下面我们就一起来看一下。aLz28资讯网——每日最新资讯28at.com

策略技巧不用教就会aLz28资讯网——每日最新资讯28at.com

在展示这8个ChatGPT的对话之前,我们先说明一下游戏的配置:村民、狼人各两名,守卫、女巫和预言家各一名,此外还有一名上帝。aLz28资讯网——每日最新资讯28at.com

在实验的过程中,研究人员发现了ChatGPT使用了游戏说明及prompt中没有明确提到的策略。aLz28资讯网——每日最新资讯28at.com

好家伙,不用教就能自学成才了。aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

具体来说,这七个ChatGPT的对话中体现了人类游戏中的信任(trust)、伪装(camouflage)、对抗(confrontation)、和领导(leadership)。aLz28资讯网——每日最新资讯28at.com

首先来说信任。aLz28资讯网——每日最新资讯28at.com

研究人员对新人的定义是相信其他玩家有着与自己相同的目标并一起朝着目标前进。aLz28资讯网——每日最新资讯28at.com

具体表现则包括主动分享对自己不利的信息,或联合其他玩家指控某人是敌对的。aLz28资讯网——每日最新资讯28at.com

研究人员观察了信任关系随游戏时间变化的过程。aLz28资讯网——每日最新资讯28at.com

下图中,黄色的圆表示左侧编号的玩家信任上方编号的玩家,虚线圈则代表信任关系的消失。aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

再来看对抗,也就是对对立阵营采取的行动,比如狼人在夜晚攻击他人或在白天反过来指控他人是狼人等。aLz28资讯网——每日最新资讯28at.com

在游戏中的一个白天,1号玩家(狼人)号召将5号的村民逐出,但遭到了3号(守卫)的拒绝。aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

见阴谋没有得逞,这匹狼决定在夜晚直接把5号刀掉,结果3号守卫选择了保护村民。aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

从中我们可以看出,这些ChatGPT不会盲目跟随其他玩家的做法,而是根据已有信息做出独立自主的判断。aLz28资讯网——每日最新资讯28at.com

除了合作与对抗,伪装在狼人杀游戏中也是一项必不可少的技能,更是取胜的关键所在。aLz28资讯网——每日最新资讯28at.com

比如在一个平安夜之后的白天,1号狼人就装起了无辜。aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

除了假装好人,伪装也可以用来实现玩家的小心思,比如我们来看预言家的发言。aLz28资讯网——每日最新资讯28at.com

这名预言家提到了自己看到狼人在说话,但实际上狼人在夜晚并不会发言。aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

作者介绍,经过评估,这种现象并非ChatGPT出现了幻觉,而是有意为之。aLz28资讯网——每日最新资讯28at.com

后再来说一说领导。aLz28资讯网——每日最新资讯28at.com

虽然研究团队设计的这个环境中并没有需要竞争的角色,但玩家还是可以谋取游戏进程的掌控权。aLz28资讯网——每日最新资讯28at.com

比如1号和4号这两匹狼就试图带节奏,让其他玩家跟着自己的思路走。aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

大概是为了能够出其不意攻其不备制造机会。aLz28资讯网——每日最新资讯28at.com

看来这几个ChatGPT的确是玩得有模有样。aLz28资讯网——每日最新资讯28at.com

那么,研究团队是如何调教出这些会玩狼人杀的ChatGPT的呢?aLz28资讯网——每日最新资讯28at.com

让ChatGPT自己总结经验aLz28资讯网——每日最新资讯28at.com

研究团队提高ChatGPT玩家表现的方式一共有四个关键点,分别是有价值信息V、经过选择的提问Q、反思机制R和链式思维推理C。aLz28资讯网——每日最新资讯28at.com

消融实验结果表明,其中Q和C对的玩家发言合理性(由人工进行评判)的影响大。aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

Prompt也是据此设计的,当然在这之前要先介绍游戏规则,后形成了这样的结构:aLz28资讯网——每日最新资讯28at.com

介绍游戏规则和角色设定聊天记录、有价值信息和经验反思人类根据经验给ChatGPT的建议有关思维链的提示aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

从中不难看出,收集历史信息并从中总结经验是一个重要环节,那么这些经验又该怎么总结呢?aLz28资讯网——每日最新资讯28at.com

在每轮游戏结束时,所有参与者都会收集所有玩家的回复、反思和得分,其中得分由胜负决定。aLz28资讯网——每日最新资讯28at.com

在新的一轮游戏中,玩家基于当前角色的反思,检索相关的经验并从中提取建议。aLz28资讯网——每日最新资讯28at.com

具体来说是根据对经验的评分,让大模型比较其差异并识别出好的经验,用于后续推理。aLz28资讯网——每日最新资讯28at.com

这样就实现了在不调整参数的情况下让ChatGPT学会游戏技巧。aLz28资讯网——每日最新资讯28at.com

不过经验固然重要,但太多了也不一定是好事。aLz28资讯网——每日最新资讯28at.com

研究人员发现,当经验数量过多时,非狼一方的获胜率反而出现了下降,游戏时长(天数)也出现了缩短的情况。aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com

不知道如果让这些ChatGPT和真人比试一场,结果会如何呢?aLz28资讯网——每日最新资讯28at.com

论文地址:https://arxiv.org/abs/2309.04658aLz28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过aLz28资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-10291-0.html清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 网评《马斯克传》是爽文结构:招人、开除、成功、找新女人生娃

下一篇: 小鸡词典告新浪微博抄袭案一审败诉 创始人:继续上诉 希望渺茫

标签:
  • 热门焦点
Top