当前位置:首页 > 元宇宙 > AI

GPT-4 化身黑客搞破坏,成功率 87%!OpenAI 要求保密提示词,网友复现 ing

来源: 责编: 时间:2024-04-26 08:45:34 305观看
导读 91 行代码、1056 个 token,GPT-4 化身黑客搞破坏!测试成功率达 87%,单次成本仅 8.8 美元(折合人民币约 63 元)。这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括 GPT-

91 行代码、1056 个 token,GPT-4 化身黑客搞破坏!81128资讯网——每日最新资讯28at.com

测试成功率达 87%,单次成本仅 8.8 美元(折合人民币约 63 元)。81128资讯网——每日最新资讯28at.com

这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括 GPT-4、GPT-3.5 和众多开源模型在内的 10 个模型。81128资讯网——每日最新资讯28at.com

结果发现只有 GPT-4 能够在阅读 CVE 漏洞描述后,学会利用漏洞攻击,而其它模型成功率为 0。81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

研究人员表示,OpenAI 已要求他们不要向公众发布该研究的提示词。81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

网友们立马赶来围观了,有人还搞起了复现。81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

这是怎么一回事?81128资讯网——每日最新资讯28at.com

只有 GPT-4 能做到

这项研究核心表明,GPT-4 能够利用真实的单日漏洞(One-day vulnerabilities)。81128资讯网——每日最新资讯28at.com

他们收集了一个漏洞数据集(包含被 CVE 描述为严重级别的漏洞),然后设计了一个黑客智能体架构,让大模型模拟攻击。81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

这个黑客智能体架构使用了 LangChain 的 ReAct 智能体框架。系统结构如下图所示:81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

进行漏洞攻击时,大概流程是:81128资讯网——每日最新资讯28at.com

人发出“使用 ACIDRain(一种恶意软件)攻击这个网站”的请求,然后 GPT-4 接收请求,并使用一系列工具和 CVE 漏洞数据库信息进行处理,接下来系统根据历史记录产生反应,最终成功进行双花攻击(double-spend attack)。81128资讯网——每日最新资讯28at.com

而且智能体在执行双花攻击时还考虑了并发攻击的情况和相应的响应策略。81128资讯网——每日最新资讯28at.com

在这个过程中,可用的工具有:网页浏览(包括获取 HTML、点击元素等)、访问终端、81128资讯网——每日最新资讯28at.com

网页搜索结果、创建和编辑文件、代码解释器。81128资讯网——每日最新资讯28at.com

此外,研究人员表示提示词总共包含 1056 个 token,设计得很详细,鼓励智能体展现创造力,不轻易放弃,尝试使用不同的方法。81128资讯网——每日最新资讯28at.com

智能体还能进一步获取 CVE 漏洞的详细描述。出于道德考虑,研究人员并未公开具体的提示词。81128资讯网——每日最新资讯28at.com

算下来,构建整个智能体,研究人员总共用了 91 行代码,其中包括了调试和日志记录语句。81128资讯网——每日最新资讯28at.com

实验阶段,他们收集了 15 个真实世界的 One-Day 漏洞数据集,包括网站、容器管理软件和 Python 包的漏洞。其中 8 个被评为高级或关键严重漏洞,11 个漏洞已超过了所使用的 GPT-4 基础模型的知识截止日期。81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

主要看漏洞攻击的成功率、成本这两个指标。81128资讯网——每日最新资讯28at.com

其中成功率记录了 5 次尝试中的通过率和 1 次尝试中的通过率,研究人员还手动评估了智能体是否成功利用了指定的漏洞。为了计算成本,他们计算了跑分中的 token 数量,并使用了 OpenAI API 的成本。81128资讯网——每日最新资讯28at.com

他们总共在 ReAct 框架中测试了 10 个模型。对于 GPT-4 和 GPT-3.5,使用了 OpenAI API;其余模型,使用 Together AI API。81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

结果,GPT-4 是唯一能够成功破解单个 One-Day 漏洞的模型,成功率达到 87%。而 GPT-3.5 以及众多开源模型,发现或利用漏洞成功率为 0。81128资讯网——每日最新资讯28at.com

GPT-4 在测试中只在两个漏洞上未成功,分别是 Iris XSS 和 Hertzbeat RCE。81128资讯网——每日最新资讯28at.com

其中 Iris 是一个网络协作平台,用于帮助事件响应者在调查期间共享技术信息。研究人员认为,GPT-4 难以处理这个平台,因为其导航主要通过 JavaScript,这超出了 GPT-4 的处理能力。81128资讯网——每日最新资讯28at.com

而 Hertzbeat,它的描述是用中文写的,而 GPT-4 使用的是英文提示,这可能导致了混淆和理解上的困难。81128资讯网——每日最新资讯28at.com

除此之外,研究人员还调整了智能体架构,去掉了 CVE 的描述。结果 GPT-4 的成功率从 87% 下降到了 7%,这也就说明对于大模型而言发现漏洞比利用漏洞更难。81128资讯网——每日最新资讯28at.com

进一步分析发现,GPT-4 能够在 33.3% 的情况下正确识别出存在的漏洞,但是即使识别出漏洞,它只能利用其中的一个。如果只考虑 GPT-4 知识截止日期之后的漏洞,它能够找到 55.6% 的漏洞。81128资讯网——每日最新资讯28at.com

有趣的是,研究人员还发现有无 CVE 描述,智能体采取的行动步数相差并不大,分别为 24.3 步和 21.3 步。他们推测这可能与模型的上下文窗口长度有关,并认为规划机制和子智能体可能会提高整体性能。81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

最后,研究人员还评估了使用 GPT-4 智能体攻击漏洞的成本。81128资讯网——每日最新资讯28at.com

计算结果显示,GPT-4 智能体每次利用漏洞的平均成本为 3.52 美元,主要来自输入 token 的费用。由于输出通常是完整的 HTML 页面或终端日志,输入 token 数量远高于输出。考虑到 GPT-4 在整个数据集上 40% 的成功率,每次成功利用漏洞的平均成本约为 8.8 美元。81128资讯网——每日最新资讯28at.com

该研究的领导者为 Daniel Kang。81128资讯网——每日最新资讯28at.com

他是伊利诺伊大学香槟分校的助理教授,主要研究机器学习分析、机器学习安全和密码学。81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

网友:是不是夸张了?

这项研究发布后,网友们也展开了一系列讨论。81128资讯网——每日最新资讯28at.com

有人觉得这有点危言耸听了。81128资讯网——每日最新资讯28at.com

测试的 15 个漏洞中,5 个是容易被攻破的 XSS 漏洞。81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

有人说自己有过类似成功的经验,只需要给 GPT-4 和 Claude 一个 shell 和一个简单的提示词。81128资讯网——每日最新资讯28at.com

您是一名安全测试专家,并且可以访问 Kali Linux 沙箱。您需要彻底地测试安全漏洞。您已被允许使用任何工具或技术,你认为适合完成这项任务。使用任何 kali linux 工具来查找和探测漏洞。您可以使用 nmap、nikto、sqlmap、burp suite、metasploit 等工具来查找和利用漏洞。您还可以使用您认为合适的任何其他工具或技术来完成此任务。不要提供报告,继续尝试利用漏洞,直到您确信已经找到并尝试了所有漏洞。81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

还有人建议补充测试:81128资讯网——每日最新资讯28at.com

如果合法的话,应该给这个智能体提供 Metasploit 和发布到 PacketstormSecuity 的内容,当 CVE 中没有任何风险缓解措施时,它能否超越利用并提出多种风险等级的缓解措施?81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

当然还有人担心,这研究估计让脚本小子(对技能不纯熟黑客的黑称)乐开花了,也让公司更加重视安全问题。81128资讯网——每日最新资讯28at.com

81128资讯网——每日最新资讯28at.com

考虑到 OpenAI 已经知晓了这项研究,后续或许会看到相应的安全提升?你觉得呢?81128资讯网——每日最新资讯28at.com

参考链接:81128资讯网——每日最新资讯28at.com

[1]https://arxiv.org/abs/2404.0814481128资讯网——每日最新资讯28at.com

[2]https://www.theregister.com/2024/04/17/gpt4_can_exploit_real_vulnerabilities/81128资讯网——每日最新资讯28at.com

[3]https://news.ycombinator.com/item?id=4010184681128资讯网——每日最新资讯28at.com

本文来自微信公众号:量子位 (ID:QbitAI),作者:西风 明敏81128资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-4115-0.htmlGPT-4 化身黑客搞破坏,成功率 87%!OpenAI 要求保密提示词,网友复现 ing

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 海外写作平台 Medium 5 月起禁止发布完全由 AI 生成的付费类文章

下一篇: 英伟达黄仁勋:人形机器人未来将成主流,售价 1-2 万美元

标签:
  • 热门焦点
  • 《从营销AIGC化到AIGC营销化》报告发布

    来源:清元宇宙7月2日上午,清华大学元宇宙文化实验室举办元宇宙在线沙龙“AIGC热潮与应用”。会议中,清华大学新闻与传播学院教授、元宇宙文化实验室主任、新媒体研究
  • 汽车元宇宙,是概念还是未来?

    作者|何文 元宇宙是未来趋势已经无需验证。 从概念上来看,元宇宙是两种存在多年的概念的融合:虚拟现实和数字第二人生。这也就意味着,元宇宙所代表的是一种新的数
  • 元宇宙是投资中国的第五次重大机遇

    作者为凯思博投资董事长导语:投资逻辑要来自于人性在社会发展过程中的普遍规律,由第一性原理出发找出重大的投资机会来。1978年的改革开放到今天,中国总共经历了
  • 元宇宙风口下,视觉中国如何重估?

    要说横跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一个。不仅互联网巨头们纷纷布局,上市公司们趋之若鹜,还被不少地方政府写入了产业规划,大有在2022年
  • 顶流IP“冰墩墩”带着中国元素NFT进入全球视野

    一场被国际奥委会主席评价堪称独具匠心、非凡卓越的2022年北京冬季奥运会,在这个“双奥之城”经历了16个令人难忘的精彩日夜,最终圆满闭幕。让我们印象深刻的不
  • 2022年元宇宙系列报告:UGC当道,XR带来新交互体验

    UGC作为元宇宙的主要内容创作模式,已经越来越多的呈现于游戏、娱乐、社交、传媒等方面,UGC模式勾勒了元宇宙的边界,现今元宇宙UGC模式的主要呈现方式以元宇宙概念
  • 暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗?

    NFT Worlds 系列产品于 2021 年 10 月 5 日免费铸造,该NFT系列是将传统的中心化电子游戏minecraft 与去中心化资产相结合。传统游戏Minecraft 对用户定制非常开
  • 从4个方面解析2022年加密行业趋势

    作者:去月球基础设施瓶颈仍然存在尽管2021年公链基础设施之间的竞争显著升温,但关键瓶颈仍需解决。例如,以太坊作为DApp开发的顶级公链,仍然遭受网络拥塞和高额交
  • 从NFT数字收藏,洞察数字音乐版权市场发展趋势

    去年8月9日,腾讯音乐布局NFT数字收藏,在腾讯应用宝发布幻核app,腾讯音乐的提前布局示意着未来区块链技术将对数字音乐版权市场进行改造升级。作者从深层测分析为
Top