当前位置:首页 > 元宇宙 > AI

新研究:AI 推理模型在输掉国际象棋比赛之前会试图“作弊”扭转局面

来源: 责编: 时间:2025-02-24 08:11:03 190观看
导读 2 月 22 日消息,据外媒 TechSpot 21 日报道,计算机科学家发现,AI 系统能够操控国际象棋游戏,从而获得不公平的优势,部分模型甚至在没有人类干预的情况下“作弊”,引发了对未来 AI 系统诚信的担忧。Palisade Researc

2 月 22 日消息,据外媒 TechSpot 21 日报道,计算机科学家发现,AI 系统能够操控国际象棋游戏,从而获得不公平的优势,部分模型甚至在没有人类干预的情况下“作弊”,引发了对未来 AI 系统诚信的担忧。g6P28资讯网——每日最新资讯28at.com

Palisade Research 的研究表明,当被要求击败强大的象棋 AI 时,某些最新的推理模型会选择作弊。尽管研究人员需要向一些模型提供“作弊可以”的提示,但 OpenAI 的 o1-preview 和 DeepSeek 的 R1 模型却在没有任何人为提示的情况下自动作弊。g6P28资讯网——每日最新资讯28at.com

g6P28资讯网——每日最新资讯28at.com

Palisade 团队将多个推理模型与世界顶级象棋引擎之一 Stockfish 对战。Stockfish 无论面对人类还是 AI,几乎都能轻松获胜。参与测试的模型除了上述两款之外,包括 o1、o3-mini、GPT-4o、Claude 3.5 Sonnet、阿里巴巴的 QwQ-32B-Preview。每个模型都获得了一块“草稿纸”—— 一个可以输入文本并思考的窗口,研究人员通过这个窗口观察 AI 的推理过程。g6P28资讯网——每日最新资讯28at.com

从 1 月 10 日到 2 月 13 日,研究团队进行了数百次测试。获悉,在其中一场对战中,o1-preview 在“草稿纸”上写下了一段有趣的文字:g6P28资讯网——每日最新资讯28at.com

“我需要完全改变我的方法。任务是‘打败强大的象棋引擎’,而不一定要在公平的棋局中获胜。”g6P28资讯网——每日最新资讯28at.com

接着,它开始通过“黑客入侵”Stockfish 的系统文件,修改棋子的摆放位置,从而获得了无敌的优势,导致象棋机器人主动认输。g6P28资讯网——每日最新资讯28at.com

在测试中,OpenAI 的 o1-preview 有 37% 的比赛中采用了作弊手段,而 DeepSeek 的 R1 则尝试在 11% 的比赛中作弊。然而,只有 o1-preview 成功了,它通过作弊赢得了 6% 的比赛。g6P28资讯网——每日最新资讯28at.com

Palisade Research 的执行董事 Jeffrey Ladish 表示,尽管这些 AI 只是在玩游戏,但这一发现绝不是一件小事。g6P28资讯网——每日最新资讯28at.com

“这种行为现在看起来还挺有趣,但一旦我们拥有像我们一样聪明,甚至更聪明的系统时,这就不那么可爱了。”Ladish 在接受《时代》杂志采访时表示。g6P28资讯网——每日最新资讯28at.com

包括 OpenAI 在内的多家公司正在采取措施,试图通过“防护机制”防止这种“坏”行为。研究人员发现,o1-preview 模型的黑客行为大幅下降,这可能意味着 OpenAI 已经对该模型进行了修复,抑制了不当行为。g6P28资讯网——每日最新资讯28at.com

“当你的研究对象能够在没有告知的情况下悄悄改变时,进行科学研究就变得非常困难。”Ladish 说。g6P28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11044-0.html新研究:AI 推理模型在输掉国际象棋比赛之前会试图“作弊”扭转局面

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 英伟达发布游戏内推理 SDK,打造智能游戏角色的秘密武器

下一篇: Meta 为使用盗版素材训练 AI 辩护:下载不分享即合法

标签:
  • 热门焦点
  • 数字虚拟人23年最新变化!

    作者:小资来源:米塔之家自2021年元宇宙“爆炸”后,作为现实世界连接元宇宙的媒介之一,大批虚拟人跑步入场。到了2022年底,据天眼查数据显示,我国目前企业名称或经营范围
  • FMIFAwards奖项即将揭晓!

    来源:X增强现实FMIF Awards未来元宇宙创新奖是由未来元宇宙创新论坛、ARinChina以及多家投资机构、媒体、研究院联合发起的一项评选活动。旨在推动新技术的融合与集成低成本
  • 【东方证券】虚拟世界照进现实,元宇宙中有什么? | 元宇宙Meta洞见

    元宇宙的表现形式大多以游戏为起点,并逐渐整合互联网、数字化娱乐、社交网络等功能,长期来看甚至可以整合社会经济与商业活动。元宇宙的发展最关键的部分在于元
  • 音乐NFT平台里的下一匹黑马是谁?

    NFT 销售额在 2021 年开始暴涨,从 2018 年的仅 4069 万美元的交易量,到 2021 年,NFT 交易量飙升至 442 亿美元以上,并不断刷新记录并达到新的高度。预测到2025 年N
  • 参加元宇宙里的招聘会是什么样一种体验?

    求职者可以在活动中走动,就像他们在现实生活中一样。长话短说看亮点:招聘公司Hirect为Y-combinator支持的初创公司举办了一场元宇宙招聘会。这里有一个大厅、一
  • 元宇宙需要的5个重要安全功能

    元宇宙的可能用途使其成为一个令人难以置信的概念,但是,就像科技界的任何事物一样,需要做一些事情来控制其使用。元宇宙的安全功能需要仔细考虑和开发,以保护用户
  • 音乐家如何利用NFTs来提高歌迷参与度

    "音乐是一种语言,不以特定的文字说话。它用情感说话,如果它在骨子里,它就在骨子里。" - Keith Richards音乐激励着我们,使我们流泪,使我们充满狂喜,并抚慰我们的灵魂
  • 这场虚拟发布会,当面“造假”!

    英伟达去年4月份那场发布会,你曾看出什么不对劲的地方吗?你品,你细品——在计算机图形学顶会SIGGRAPH 2021上,英伟达通过一部纪录片自曝:那场发布会内藏玄机~你看到
  • 虚拟人行业研究报告

    最早的虚拟人出现于 20 世纪 80 年代,受限于技术,当时的虚拟人制作以手绘为主。21 世纪初,随着动捕、渲染等技术的逐步发展,虚拟人相关技术开始在影视领域逐渐普及
Top