当前位置:首页 > 科技  > 网络

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过

来源: 责编: 时间:2023-09-18 18:37:32 492观看
导读 除了玩电子游戏,人类的“社交神器”狼人杀也被AI给学会了。8个ChatGPT“坐”在一起,生动地扮演出了五种角色,和真人如出一辙。这个新的人类社会模拟实验,由清华和中关村实验室共同完成。从

除了玩电子游戏,人类的“社交神器”狼人杀也被AI给学会了。Pow28资讯网——每日最新资讯28at.com

8个ChatGPT“坐”在一起,生动地扮演出了五种角色,和真人如出一辙。Pow28资讯网——每日最新资讯28at.com

这个新的人类社会模拟实验,由清华和中关村实验室共同完成。Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

从斯坦福小镇到清华游戏公司,用AI模拟人类社会一直是学界的热门研究课题。Pow28资讯网——每日最新资讯28at.com

如果说清华游戏公司模拟了社畜的工作场景,那么现在社畜的业余社交生活也被AI模拟了。Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

在这个由8个ChatGPT组成的狼人杀局中,真人世界里的伪装与信任、领导与对抗都体现得淋漓尽致。Pow28资讯网——每日最新资讯28at.com

甚至不用人类教,AI就通过自己摸索发现了许多游戏技巧。Pow28资讯网——每日最新资讯28at.com

这一切只要通过设计prompt就能实现,而不必对模型中的参数进行调整。Pow28资讯网——每日最新资讯28at.com

那么,这个“狼人杀世界”中都有哪些精彩的场景呢?下面我们就一起来看一下。Pow28资讯网——每日最新资讯28at.com

策略技巧不用教就会Pow28资讯网——每日最新资讯28at.com

在展示这8个ChatGPT的对话之前,我们先说明一下游戏的配置:村民、狼人各两名,守卫、女巫和预言家各一名,此外还有一名上帝。Pow28资讯网——每日最新资讯28at.com

在实验的过程中,研究人员发现了ChatGPT使用了游戏说明及prompt中没有明确提到的策略。Pow28资讯网——每日最新资讯28at.com

好家伙,不用教就能自学成才了。Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

具体来说,这七个ChatGPT的对话中体现了人类游戏中的信任(trust)、伪装(camouflage)、对抗(confrontation)、和领导(leadership)。Pow28资讯网——每日最新资讯28at.com

首先来说信任。Pow28资讯网——每日最新资讯28at.com

研究人员对新人的定义是相信其他玩家有着与自己相同的目标并一起朝着目标前进。Pow28资讯网——每日最新资讯28at.com

具体表现则包括主动分享对自己不利的信息,或联合其他玩家指控某人是敌对的。Pow28资讯网——每日最新资讯28at.com

研究人员观察了信任关系随游戏时间变化的过程。Pow28资讯网——每日最新资讯28at.com

下图中,黄色的圆表示左侧编号的玩家信任上方编号的玩家,虚线圈则代表信任关系的消失。Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

再来看对抗,也就是对对立阵营采取的行动,比如狼人在夜晚攻击他人或在白天反过来指控他人是狼人等。Pow28资讯网——每日最新资讯28at.com

在游戏中的一个白天,1号玩家(狼人)号召将5号的村民逐出,但遭到了3号(守卫)的拒绝。Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

见阴谋没有得逞,这匹狼决定在夜晚直接把5号刀掉,结果3号守卫选择了保护村民。Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

从中我们可以看出,这些ChatGPT不会盲目跟随其他玩家的做法,而是根据已有信息做出独立自主的判断。Pow28资讯网——每日最新资讯28at.com

除了合作与对抗,伪装在狼人杀游戏中也是一项必不可少的技能,更是取胜的关键所在。Pow28资讯网——每日最新资讯28at.com

比如在一个平安夜之后的白天,1号狼人就装起了无辜。Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

除了假装好人,伪装也可以用来实现玩家的小心思,比如我们来看预言家的发言。Pow28资讯网——每日最新资讯28at.com

这名预言家提到了自己看到狼人在说话,但实际上狼人在夜晚并不会发言。Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

作者介绍,经过评估,这种现象并非ChatGPT出现了幻觉,而是有意为之。Pow28资讯网——每日最新资讯28at.com

后再来说一说领导。Pow28资讯网——每日最新资讯28at.com

虽然研究团队设计的这个环境中并没有需要竞争的角色,但玩家还是可以谋取游戏进程的掌控权。Pow28资讯网——每日最新资讯28at.com

比如1号和4号这两匹狼就试图带节奏,让其他玩家跟着自己的思路走。Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

大概是为了能够出其不意攻其不备制造机会。Pow28资讯网——每日最新资讯28at.com

看来这几个ChatGPT的确是玩得有模有样。Pow28资讯网——每日最新资讯28at.com

那么,研究团队是如何调教出这些会玩狼人杀的ChatGPT的呢?Pow28资讯网——每日最新资讯28at.com

让ChatGPT自己总结经验Pow28资讯网——每日最新资讯28at.com

研究团队提高ChatGPT玩家表现的方式一共有四个关键点,分别是有价值信息V、经过选择的提问Q、反思机制R和链式思维推理C。Pow28资讯网——每日最新资讯28at.com

消融实验结果表明,其中Q和C对的玩家发言合理性(由人工进行评判)的影响大。Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

Prompt也是据此设计的,当然在这之前要先介绍游戏规则,后形成了这样的结构:Pow28资讯网——每日最新资讯28at.com

介绍游戏规则和角色设定聊天记录、有价值信息和经验反思人类根据经验给ChatGPT的建议有关思维链的提示Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

从中不难看出,收集历史信息并从中总结经验是一个重要环节,那么这些经验又该怎么总结呢?Pow28资讯网——每日最新资讯28at.com

在每轮游戏结束时,所有参与者都会收集所有玩家的回复、反思和得分,其中得分由胜负决定。Pow28资讯网——每日最新资讯28at.com

在新的一轮游戏中,玩家基于当前角色的反思,检索相关的经验并从中提取建议。Pow28资讯网——每日最新资讯28at.com

具体来说是根据对经验的评分,让大模型比较其差异并识别出好的经验,用于后续推理。Pow28资讯网——每日最新资讯28at.com

这样就实现了在不调整参数的情况下让ChatGPT学会游戏技巧。Pow28资讯网——每日最新资讯28at.com

不过经验固然重要,但太多了也不一定是好事。Pow28资讯网——每日最新资讯28at.com

研究人员发现,当经验数量过多时,非狼一方的获胜率反而出现了下降,游戏时长(天数)也出现了缩短的情况。Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com

不知道如果让这些ChatGPT和真人比试一场,结果会如何呢?Pow28资讯网——每日最新资讯28at.com

论文地址:https://arxiv.org/abs/2309.04658Pow28资讯网——每日最新资讯28at.com

清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过Pow28资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-10291-0.html清华攒局8个ChatGPT狼人杀 心机伪装都在这一局里 清华:我没教过

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 网评《马斯克传》是爽文结构:招人、开除、成功、找新女人生娃

下一篇: 小鸡词典告新浪微博抄袭案一审败诉 创始人:继续上诉 希望渺茫

标签:
  • 热门焦点
  • 十个简单但很有用的Python装饰器

    装饰器(Decorators)是Python中一种强大而灵活的功能,用于修改或增强函数或类的行为。装饰器本质上是一个函数,它接受另一个函数或类作为参数,并返回一个新的函数或类。它们通常用
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • 梁柱接棒两年,腾讯音乐闯出新路子

    文丨田静 出品丨牛刀财经(niudaocaijing)7月5日,企鹅FM发布官方公告称由于业务调整,将于9月6日正式停止运营,这意味着腾讯音乐长音频业务走向消亡。腾讯在长音频领域还在摸索。为
  • ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 小米公益基金会捐赠2500万元驰援北京、河北暴雨救灾

    8月2日消息,今日小米科技创始人雷军在其微博上发布消息称,小米公益基金会宣布捐赠2500万元驰援北京、河北暴雨救灾。携手抗灾,京冀安康!以下为公告原文
  • OPPO K11搭载高性能石墨散热系统:旗舰同款 性能凉爽释放

    日前OPPO官方宣布,将于7月25日14:30举办新品发布会,届时全新的OPPO K11将正式与大家见面,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼
  • 最薄的14英寸游戏笔记本电脑 Alienware X14已可以购买

    2022年1月份在国际消费电子展(CES2022)上首次亮相的Alienware新品——Alienware X14现在已经可以购买了,这款笔记本电脑被誉为世界上最薄的 14 英寸游戏笔
  • 由于成本持续增加,笔记本产品价格预计将明显上涨

    根据知情人士透露,由于材料、物流等成本持续增加,笔记本产品价格预计将在2021年下半年有明显上涨。进入6月下旬以来,全球半导体芯片缺货情况加剧,显卡、处理器
  • AI艺术欣赏体验会在上海梅赛德斯奔驰中心音乐俱乐部上演

    光影交错的镜像世界,虚实幻化的视觉奇观,虚拟偶像与真人共同主持,这些场景都出现在2019世界人工智能大会的舞台上。8月29日至31日,“AI艺术欣赏体验会”在上海
Top