当前位置:首页 > 元宇宙 > AI

数月 → 几天:OpenAI 被曝缩水模型安全测试,AI 竞赛埋下隐患

来源: 责编: 时间:2025-04-15 07:13:39 175观看
导读 4 月 12 日消息,金融时报(FT)昨日(4 月 11 日)发布博文,报道称 OpenAI 大幅压缩最新大型语言模型(LLM)安全测试时间,此前需要数月时间,而最新 o3 模型仅有几天时间。竞争驱动,安全让步据八位知情人士透露,OpenAI 大幅压缩

4 月 12 日消息,金融时报(FT)昨日(4 月 11 日)发布博文,报道称 OpenAI 大幅压缩最新大型语言模型(LLM)安全测试时间,此前需要数月时间,而最新 o3 模型仅有几天时间。WWx28资讯网——每日最新资讯28at.com

竞争驱动,安全让步WWx28资讯网——每日最新资讯28at.com

据八位知情人士透露,OpenAI 大幅压缩模型的安全测试时间,留给员工和第三方测试团队“评估”(evaluations,即测试模型风险和性能)时间仅有数天时间,而此前通常会耗时数月时间。WWx28资讯网——每日最新资讯28at.com

援引博文介绍,OpenAI 面临来自 Meta、Google 及 xAI 等对手的激烈竞争,需快速推出新模型以维持市场优势。o3 模型计划最早下周发布,留给测试者安全检查时间不到一周,而此前 GPT-4 的测试期长达六个月。WWx28资讯网——每日最新资讯28at.com

一位测试过 GPT-4 的人士透露,过去安全测试更彻底,某些危险能力在测试两个月后才被发现,而如今竞争压力迫使公司追求速度,忽视潜在风险。WWx28资讯网——每日最新资讯28at.com

测试不足,监管缺位WWx28资讯网——每日最新资讯28at.com

全球目前尚未统一 AI 安全测试标准,但欧盟《AI 法案》将于今年晚些时候上线,要求企业对其最强大的模型进行安全测试。WWx28资讯网——每日最新资讯28at.com

AI Futures Project 负责人 Daniel Kokotajlo 表示,由于缺乏强制监管,企业不会主动披露模型的危险能力,竞争压力进一步加剧了风险。WWx28资讯网——每日最新资讯28at.com

OpenAI 曾承诺构建定制模型版本,测试其潜在滥用风险,例如是否能协助制造更具传染性的生物病毒。WWx28资讯网——每日最新资讯28at.com

这种测试需投入大量资源,包括聘请外部专家、创建特定数据集并进行“微调”(fine-tuning)。但 OpenAI 仅对较老旧的模型进行有限微调,最新模型如 o1 和 o3-mini 未全面测试。前 OpenAI 安全研究员 Steven Adler 批评,若不兑现测试承诺,公众有权知情。WWx28资讯网——每日最新资讯28at.com

WWx28资讯网——每日最新资讯28at.com

安全测试未覆盖最终模型WWx28资讯网——每日最新资讯28at.com

另一问题在于,安全测试通常基于早期“检查点”(checkpoints),而非最终发布模型。一位前 OpenAI 技术人员表示,发布未经测试的更新模型是“不良做法”,而 OpenAI 辩称,其检查点与最终模型“基本一致”,并通过自动化测试提高效率,确保安全。WWx28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12245-0.html数月 → 几天:OpenAI 被曝缩水模型安全测试,AI 竞赛埋下隐患

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 字节跳动推出 VAPO 框架:突破 AI 推理极限,Qwen2.5-32B 提分 12 倍超 Deepseek-R1

下一篇: 谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索

标签:
  • 热门焦点
  • ChatGPT访问量增速下滑,AI真的是一场泡沫吗?

    来源:首席商业评论2023年,最火的莫过于ChatGPT,席卷全球的同时也引发了生成式AI(人工智能)的投资热潮。在美股,ChatGPT相关概念股飙涨,以AI算力龙头英伟达为例,其股价年内一度累计上
  • 《从营销AIGC化到AIGC营销化》报告发布

    来源:清元宇宙7月2日上午,清华大学元宇宙文化实验室举办元宇宙在线沙龙“AIGC热潮与应用”。会议中,清华大学新闻与传播学院教授、元宇宙文化实验室主任、新媒体研究
  • 沉寂3年,大模型激活小度天猫精灵?

    Tech星球(微信ID:tech618)文 | 何煦阳 沉寂了许久的智能音箱,在今年大模型横空出世之后,又再次燃起了新的希望。 2月9日,小度宣布将融合文心一言,打造针对智能设备场景的AI模型&ldq
  • “虚拟人”角斗场,基于“硬实力”下的人性平衡法则?

    在打工人“反内卷”的当下,一众虚拟人却“内卷”了起来。从北京春晚虚拟人苏小妹与刘宇演绎歌舞《星河入梦》,央美毕业的虚拟人夏语冰登上央视节目《对话》,湖南
  • 2022年最具关注的9个头像NFT项目

    什么是 PFP NFT 项目?PFP NFT (个人资料图片NFT)是一组独特的数字收藏品,人们用来在互联网平台上代表自己。这些数字艺术作品通常是一系列可作为头像的角色,在 Twit
  • 8个最适合艺术家发行NFT的交易市场

    近年来,加密风靡全球。加密圈最令人兴奋的方面之一是它能够用于创建称为NFT 的数字资产。从 CyberKitties 到 Cyber Galleries,NFT 已成为艺术家和艺术鉴赏家的
  • 《刀剑神域》VR展开幕;《Puzzling Places》发布第二个付费DLC

    今日热点:《刀剑神域:Ex-Chronicle Online Edition》VR展开幕;虚拟活动平台EventX再获800万美元B轮融资;VR射击游戏《Outlier》确认将于3月17日登陆Steam平台等。
  • 纽约街头出现NFT自动贩卖机

    一家初创公司宣布在纽约市开放一台NFT自动售货机,允许任何人——即使是没有加密资产的人也能购买NFT。该交易平台名为Neon,上个月完成了一轮300万美元的种子募捐
  • Staking 收益翻倍?

    以太坊质押可能很快就会有两倍的利润。Coinbase 估计,在 1 月份以太坊网络合并后,持有 ETH 的回报将翻倍。增长预期假设来自加密货币交易所 Coinbase 的估计是准
Top