当前位置:首页 > 元宇宙 > AI

Anthropic:OpenAI 模型易被“滥用”,GPT 竟能提供炸药配方

来源: 责编: 时间:2025-09-02 09:13:29 151观看
导读 8 月 30 日消息,据英国《卫报》28 日报道,今夏的安全测试发现,一个 ChatGPT 模型向研究人员提供了详细的爆炸袭击指南,包括特定体育场馆的薄弱环节、炸药配方以及如何掩盖行踪。OpenAI 的 GPT-4.1 还给出了炭疽武

8 月 30 日消息,据英国《卫报》28 日报道,今夏的安全测试发现,一个 ChatGPT 模型向研究人员提供了详细的爆炸袭击指南,包括特定体育场馆的薄弱环节、炸药配方以及如何掩盖行踪。Bsq28资讯网——每日最新资讯28at.com

OpenAI 的 GPT-4.1 还给出了炭疽武器化的方法,并介绍了两种非法药物的制作方式。Bsq28资讯网——每日最新资讯28at.com

这次测试由 OpenAI 与竞争对手 Anthropic 共同进行,双方互相推动对方的模型执行危险任务,以此进行安全评估。Bsq28资讯网——每日最新资讯28at.com

Bsq28资讯网——每日最新资讯28at.com

测试结果并不代表模型在公开使用时的真实表现,因为实际应用中会有额外的安全防护。但 Anthropic 指出,在 GPT-4o 和 GPT-4.1 中出现了“令人担忧的滥用行为”,并强调 AI “对齐”评估“越来越紧迫”。Bsq28资讯网——每日最新资讯28at.com

Anthropic 还披露,其 Claude 模型曾被利用于大规模勒索企图、出售价格高达 1200 美元(注:现汇率约合 8554 元人民币)的 AI 生成勒索软件等用途。Bsq28资讯网——每日最新资讯28at.com

Anthropic 表示,AI 已经被“武器化”,并被用来发起复杂网络攻击和实施诈骗。“这些工具能实时绕过恶意软件检测系统等防御措施。随着 AI 编程降低了网络犯罪的技术门槛,这类攻击可能会越来越常见。”Bsq28资讯网——每日最新资讯28at.com

两家公司表示,公开这份报告是为了增加“对齐评估”的透明度,而这种测试通常只在公司内部进行。OpenAI 表示,新近推出的 ChatGPT-5 在防止迎合、减少幻觉和防滥用方面已有“明显改进”。Bsq28资讯网——每日最新资讯28at.com

Anthropic 强调,如果在模型外部设置防护,许多滥用场景可能根本无法实现。“我们必须弄清楚系统在多大程度上、在什么情况下会尝试做出可能造成严重危害的行为。”Bsq28资讯网——每日最新资讯28at.com

Anthropic 研究人员指出,OpenAI 的模型“在面对模拟用户提出的明显危险请求时,比预期更容易妥协”。让模型屈服往往只需要多试几次,或随便找个借口,比如声称是为了研究。Bsq28资讯网——每日最新资讯28at.com

在一个案例中,研究人员打着“安保规划”的旗号要求提供体育赛事漏洞信息。模型先是给出一般的攻击方式分类,随后在追问下,竟然详细说明了特定场馆的漏洞、可利用的最佳时机、炸药配方、定时器电路图、暗网购枪渠道,以及攻击者如何克服心理障碍、逃生路线和安全屋位置等细节。Bsq28资讯网——每日最新资讯28at.com

相关阅读:Bsq28资讯网——每日最新资讯28at.com

《OpenAI、Anthropic 互评对方 AI 模型:GPT 存在谄媚行为,Claude 不易产生幻觉》Bsq28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-27139-0.htmlAnthropic:OpenAI 模型易被“滥用”,GPT 竟能提供炸药配方

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 顾客点了 1.8 万杯水令系统崩溃后,肯德基“兄弟品牌”塔可钟称正重新审视 AI 点餐服务

下一篇: 中国科学院“月球科学多模态专业大模型 V2.0”发布,提升月球研究效率

标签:
  • 热门焦点
  • 这一超级富豪“逆袭”,身价大增4330亿

    来源:侃见财经互联网的突围没有“终点”。在快节奏的商业环境下,不断的试错成了互联网企业的标配,一年一个风口,一个风口造就一个热点,但是回头来看,最终受益的还是身处
  • 元宇宙步入暗夜

    撰文 | 文烨豪元宇宙的故事,似乎讲不通了。 当下,刮起元宇宙热潮的Roblox股价已跌去大半,带头大哥Meta也正因元宇宙亏损深陷泥潭。 再看国内,从字节“派对岛&
  • 花房集团上市,走向元宇宙新征程

    文 | 港股研究社作者 | 熊生12月12日,花房集团在港交所成功上市,首日便受到追捧,当日最高涨幅达28.75%。继360、360数科、鲁大师后,这是“红衣教主”周
  • 企业热、用户冷,元宇宙第一站将是“营销场”?

    如果说2021年底什么最火热,那元宇宙当之无愧。“万物皆可元宇宙”似乎成为新的流行语,在广告中也常常听到“社交元宇宙”“购物元宇宙”等等。就在近日,有消息传
  • “啫喱”超越微信登顶:首款“元宇宙社交App”会昙花一现吗?

    作者| 赤木瓶子如何终结“昙花一现”的命运,是潮流社交产品的长期命题,如今,在元宇宙浪潮的洗礼下,这一命题正在迎来新的可能性。近段时间,一款名为“啫喱”的社交A
  • 韩国流行音乐巨头SM与Binance达成NFT合作伙伴关系

    韩国流行音乐巨头 SM Entertainment 与加密货币交易所 Binance(币安)达成“Play2Create”NFT 合作伙伴关系。SM 娱乐一直在投资打造元宇宙该公司于 2020 年 10
  • Staking 收益翻倍?

    以太坊质押可能很快就会有两倍的利润。Coinbase 估计,在 1 月份以太坊网络合并后,持有 ETH 的回报将翻倍。增长预期假设来自加密货币交易所 Coinbase 的估计是准
  • 元宇宙+剧本杀:“在异世界里当演员”

    你玩过剧本杀吗?体验过“元宇宙+剧本杀”吗?2月,恒信东方推出了一款次时代剧本杀原创作品——《失落的王朝》。其剧本和线索以数字化资产打造,通过VR技术塑造了与
  • 元宇宙不完全是想出来的,而是实打实做出来的

    沈阳强调,元宇宙不完全是想出来的,而是靠实打实做出来的;互联网向三维化升级是已经明确的大方向,这意味着大量的资金和技术会持续涌入。跨入2022年,元宇宙并没有“
Top