当前位置:首页 > 元宇宙 > AI

新研究:AI 推理模型在输掉国际象棋比赛之前会试图“作弊”扭转局面

来源: 责编: 时间:2025-02-24 08:11:03 201观看
导读 2 月 22 日消息,据外媒 TechSpot 21 日报道,计算机科学家发现,AI 系统能够操控国际象棋游戏,从而获得不公平的优势,部分模型甚至在没有人类干预的情况下“作弊”,引发了对未来 AI 系统诚信的担忧。Palisade Researc

2 月 22 日消息,据外媒 TechSpot 21 日报道,计算机科学家发现,AI 系统能够操控国际象棋游戏,从而获得不公平的优势,部分模型甚至在没有人类干预的情况下“作弊”,引发了对未来 AI 系统诚信的担忧。IjP28资讯网——每日最新资讯28at.com

Palisade Research 的研究表明,当被要求击败强大的象棋 AI 时,某些最新的推理模型会选择作弊。尽管研究人员需要向一些模型提供“作弊可以”的提示,但 OpenAI 的 o1-preview 和 DeepSeek 的 R1 模型却在没有任何人为提示的情况下自动作弊。IjP28资讯网——每日最新资讯28at.com

IjP28资讯网——每日最新资讯28at.com

Palisade 团队将多个推理模型与世界顶级象棋引擎之一 Stockfish 对战。Stockfish 无论面对人类还是 AI,几乎都能轻松获胜。参与测试的模型除了上述两款之外,包括 o1、o3-mini、GPT-4o、Claude 3.5 Sonnet、阿里巴巴的 QwQ-32B-Preview。每个模型都获得了一块“草稿纸”—— 一个可以输入文本并思考的窗口,研究人员通过这个窗口观察 AI 的推理过程。IjP28资讯网——每日最新资讯28at.com

从 1 月 10 日到 2 月 13 日,研究团队进行了数百次测试。获悉,在其中一场对战中,o1-preview 在“草稿纸”上写下了一段有趣的文字:IjP28资讯网——每日最新资讯28at.com

“我需要完全改变我的方法。任务是‘打败强大的象棋引擎’,而不一定要在公平的棋局中获胜。”IjP28资讯网——每日最新资讯28at.com

接着,它开始通过“黑客入侵”Stockfish 的系统文件,修改棋子的摆放位置,从而获得了无敌的优势,导致象棋机器人主动认输。IjP28资讯网——每日最新资讯28at.com

在测试中,OpenAI 的 o1-preview 有 37% 的比赛中采用了作弊手段,而 DeepSeek 的 R1 则尝试在 11% 的比赛中作弊。然而,只有 o1-preview 成功了,它通过作弊赢得了 6% 的比赛。IjP28资讯网——每日最新资讯28at.com

Palisade Research 的执行董事 Jeffrey Ladish 表示,尽管这些 AI 只是在玩游戏,但这一发现绝不是一件小事。IjP28资讯网——每日最新资讯28at.com

“这种行为现在看起来还挺有趣,但一旦我们拥有像我们一样聪明,甚至更聪明的系统时,这就不那么可爱了。”Ladish 在接受《时代》杂志采访时表示。IjP28资讯网——每日最新资讯28at.com

包括 OpenAI 在内的多家公司正在采取措施,试图通过“防护机制”防止这种“坏”行为。研究人员发现,o1-preview 模型的黑客行为大幅下降,这可能意味着 OpenAI 已经对该模型进行了修复,抑制了不当行为。IjP28资讯网——每日最新资讯28at.com

“当你的研究对象能够在没有告知的情况下悄悄改变时,进行科学研究就变得非常困难。”Ladish 说。IjP28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11044-0.html新研究:AI 推理模型在输掉国际象棋比赛之前会试图“作弊”扭转局面

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 英伟达发布游戏内推理 SDK,打造智能游戏角色的秘密武器

下一篇: Meta 为使用盗版素材训练 AI 辩护:下载不分享即合法

标签:
  • 热门焦点
  • 刷完一场元宇宙世界杯音乐盛典,我爽了

    作者|刘小土编辑|李春晖你有多久没完整追过一场音乐盛典了?三刷都不嫌多的那种。按照惯例,每逢年底,直播、长短视频、音乐平台便会抢着端上来几场音乐盛典。搁以
  • 字节跳动,刚刚投了一位虚拟女生

    今年第一笔虚拟人融资出炉了。投资界获悉,杭州李未可科技有限公司显示发生股东变更,新增字节跳动关联公司北京量子跃动科技有限公司。今天公司方面正式确认,本轮
  • Meta元宇宙女性安全问题频发,元宇宙中相关问题该如何解决?

    在女性遭受性骚扰甚至被攻击的事件相继被报道之后,仍处于萌芽状态的虚拟现实空间成为人们关注的焦点。许多女性发声表示在使用Meta旗下的Horizon Worlds及其姊
  • 元宇宙社交啫喱、希壤爆款迭出,腾讯慌了吗?

    文 | 陈桥辉没想到腾讯超级QQ秀的20周年归来首秀,被一款名不见经传的产品抢了风头。1月15日,一款名为“啫喱”的社交App迅速在各个互联网的社交圈内火爆起来,引起
  • 区块链产业人才发展报告

    工业和信息化部作为工业和信息化行业主管部门,正在着力推进“两个强国”建设,加快推动以区块链为代表的新兴技术与实体经济深度融合。我国区块链技术和应用想要
  • 韩国国民银行将推出韩国首个加密货币 ETF

    韩国国民银行(Kookmin Bank)计划发行该国首个以散户投资者为主要关注点的加密货币投资基金。根据公告,该银行正在等待政府批准,并已建立一个准备就绪的数字资产
  • 元宇宙风归何处?

    元宇宙持续大火,在过去一段时间内,其屡次登上热点,吸引了一波又一波投资者。近期,在“2022中国·金鱼嘴元宇宙生态赋能大会”上,南京建邺区金鱼嘴基金街区宣布计划
  • 技术赋能,国内首家宠物元宇宙平台“Pet Meta”开启虚拟养宠新方式

    作者:易明未来,Pet Meta数字宠物藏品将是链接全球数亿爱宠人群与元宇宙世界独一无二的身份象征。首家面向国内的宠物元宇宙平台Pet Meta生长于“宠物经济”快速
  • 浅聊DAO图景和未来

    DAO是什么?DAO (Decentralized Autonomous Organizations),去中心化自治组织,是基于区块链技术,由社区通过透明的决策过程运行和管理的组织形态。DAO使得社区成为
Top