当前位置:首页 > 科技  > 网络

OpenAI并未让DeepSeek惊出一身冷汗

来源: 责编: 时间:2025-04-18 06:48:34 245观看
导读 “OpenAI的创新好像到瓶颈期了。”一位业界人士这样说道。今日凌晨,预热了很久的OpenAI o3模型完整版终于面世,且与以往直播“挤牙膏”式的依次、慢吞发布方式不同的是,这次o3和o4-mini是

“OpenAI的创新好像到瓶颈期了。”一位业界人士这样说道。ivA28资讯网——每日最新资讯28at.com

今日凌晨,预热了很久的OpenAI o3模型完整版终于面世,且与以往直播“挤牙膏”式的依次、慢吞发布方式不同的是,这次o3和o4-mini是同时发布。ivA28资讯网——每日最新资讯28at.com

在OpenAI官方的陈述中,o3和o4-mini的亮点主要在于可以组合调用ChatGPT中的各个工具,像是网络搜索、Python、图像分析、文件解释和图像生成等。这可以看作是OpenAI开始后发补足自身在Agent能力上的探索。ivA28资讯网——每日最新资讯28at.com

其中,o3作为推理模型,在编程、数学、科学、视觉感知等多个维度的基准测试中都刷新了纪录。比如在Codeforces、SWE-bench、MMMU基准测试中,视觉任务准确率高达87.5%,而MathVista达到75.4%。ivA28资讯网——每日最新资讯28at.com

其实分数、榜单,这些都是常规操作。相较于以往,这次的大不同在于,o3和o4-mini将上传的图像直接集中到思维链中,这就意味着,图像不仅仅是被看到,还能被用来作为思考过程中的一部分。ivA28资讯网——每日最新资讯28at.com

从OpenAI团队成员、中科大校友Jiahui Yu发布的帖文来看,“用图像思考”应该是OpenAI去年9月发布o系列模型以来,就在研发计划中,之前还悄悄推出了o1 Vision并进行了初步预览,但并没有取得很好的效果,也没有引起关注,直到这次在o3和o4-mini上实现了这一能力。ivA28资讯网——每日最新资讯28at.com

根据外部专家评估,o3作为o1系列模型的继任者,其在复杂问题上的错误率要比后者低20%,适合在生物学、数学和工程领域的复杂问题查询。ivA28资讯网——每日最新资讯28at.com

针对这一点,国外一位医学博士在测评后发帖表示,这一点确实有很大进步,当他向o3来提问一些颇具挑战性的临床或医学问题时,回答精准、全面,符合对一位该领域真正专家的期望。ivA28资讯网——每日最新资讯28at.com

对于那些想亲自测评、体验的用户来说,OpenAI官方已经表示,目前ChatGPT的Plus、Pro会员以及Team用户,即日起就可以直接体验o3、o4-mini,以及o4-mini-high,而之前的o1、o3-mini和o3-mini-high已默默退出舞台。这一操作也被有些网友戏称为“内部赛马”,新的产品出来后,之前的通通让路。ivA28资讯网——每日最新资讯28at.com

到目前为止,之前预告要发布的GPT?4.1全家桶系列、o3、o4-mini模型就已经全部亮相展示了。据Sam Altman表示,o3和o4-mini可能是ChatGPT在GPT-5发布之前的后独立AI推理模型了,期间大概率是不会再有其他新款模型出来了,另外他也说了,预计将在几周内将o3-pro升级到专业版。ivA28资讯网——每日最新资讯28at.com

在OpenAI官方的宣传口径中,o3和o4-mini是OpenAI所有模型中为强大、智能的模型,一些开发者、用户在使用时,也感受到了进步。但是,创新能力似乎并没有达到预期。ivA28资讯网——每日最新资讯28at.com

“OpenAI的步调已经不再挺胸阔步了,更不知所措。”在看完OpenAI这次发布的新品后,一位业内人士这样感叹道。ivA28资讯网——每日最新资讯28at.com

虽然o3、o4-mini模型作为新产品,效果不错,但相较于OpenAI以往的激进和高举旗帜式前进,如今在创新上面呈现出明显的心有余而力不足。ivA28资讯网——每日最新资讯28at.com

其实前两天在GPT4.1系列套餐发布后,不少业内人士就向虎嗅表示,“暂时还没看到有什么特别亮眼的突破。”“对o3期待值没有那么高。”ivA28资讯网——每日最新资讯28at.com

或者这种“失望”要来得更早一点。ivA28资讯网——每日最新资讯28at.com

去年12月,o3在OpenAI的系列直播尾声亮相,Sam Altman称其为“一个非常、非常聪明的模型”,完全将O1甩在身后,更是在ARC-AGI测试这一旨在评估AI系统适应新任务和展示流动智力能力的测试中,获得87.5%的成绩,也是首次超越人类平均水平(85%),令业界感到震惊,被认为是在通往AGI的道路上迎来了新突破。但在业界开发者看来,似乎并不是这样。ivA28资讯网——每日最新资讯28at.com

“这就好比高考成绩不能代表工作业务能力。”一位开源领域人士锐评道。而且,如今的行业趋势已经进入到对数据高要求、对Agent全适配方向中,这就意味着私有化和混合模型推理为主的时代到来了。但是OpenAI对于开源的态度,众所周知。ivA28资讯网——每日最新资讯28at.com

尤其是在年初,当DeepSeek-R1凭借着超低的训练成本和性能媲美o1精彩亮相时,无疑是给了OpenAI一记响亮的耳光,而DeepSeek的全方位、无死角开源,像是又给了OpenAI再一记更响亮的耳光。ivA28资讯网——每日最新资讯28at.com

之后,这两记耳光不仅打得OpenAI黯然失色,还乱了它的阵脚和节奏,模型命名混乱、功能创新不足、尝试开源但态度暧昧不明,再加上内部人员高频流失,等等,无疑正在让它慢慢失去竞争优势,再不复一年之前被视为通往AGI的正确的、领先的道路引领者角色……ivA28资讯网——每日最新资讯28at.com

而官方也说了,此次发布的GPT4.1系列、o3,以及o4-mini是GPT-5正式发布前的后一次模型发布了,也被视为GPT-5时刻的关键一步,可以理解为是GPT-5的前菜,主打“量大管饱”。但是,在技术的攀登道路上,量变能够引起质变并非唯一真理,更何况,这个量还远远不足。ivA28资讯网——每日最新资讯28at.com

“GPT-5应该是多个GPT4.1组成的吧。”一位业内人士这样戏谑道,一直传GPT-5或将在5月发布,到底OpenAI还能不能重回巅峰,只有到时候揭晓了。ivA28资讯网——每日最新资讯28at.com

OpenAI并未让DeepSeek惊出一身冷汗ivA28资讯网——每日最新资讯28at.com


文章出处:虎嗅网

本文链接:http://www.28at.com/showinfo-17-145040-0.htmlOpenAI并未让DeepSeek惊出一身冷汗

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: “反马斯克”情绪高涨 特斯拉失守加州

下一篇: 贾跃亭:再次被恶意做空者盯上 将打赢梦想实现战

标签:
  • 热门焦点
  • 一加Ace2 Pro真机揭晓 钛空灰配色质感拉满

    终于,在经过了几波预热之后,一加Ace2 Pro的外观真机图在网上出现了。还是博主数码闲聊站曝光的,这次的外观设计还是延续了一加11的方案,只是细节上有了调整,例如新加入了钛空灰
  • JavaScript 混淆及反混淆代码工具

    介绍在我们开始学习反混淆之前,我们首先要了解一下代码混淆。如果不了解代码是如何混淆的,我们可能无法成功对代码进行反混淆,尤其是使用自定义混淆器对其进行混淆时。什么是混
  • 在线图片编辑器,支持PSD解析、AI抠图等

    自从我上次分享一个人开发仿造稿定设计的图片编辑器到现在,不知不觉已过去一年时间了,期间我经历了裁员失业、面试找工作碰壁,寒冬下一直没有很好地履行计划.....这些就放在日
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • 10天营收超1亿美元,《星铁》比《原神》差在哪?

    来源:伯虎财经作者:陈平安即便你没玩过《原神》,你一定听说过的它的大名。恨它的人把《原神》开服那天称作是中国游戏史上最黑暗的一天,有粉丝因为索尼在PS平台上线《原神》,怒而
  • 腾讯盖楼,字节拆墙

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之“想重温暴刷深渊、30+技能搭配暴搓到爽的游戏体验吗?一起上晶核,即刻暴打!”曾凭借直播腾讯旗下代理格斗游戏《DNF》一
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • 国行版三星Galaxy Z Fold5/Z Flip5发布 售价7499元起

    2023年8月3日,三星电子举行Galaxy新品中国发布会,正式在国内推出了新一代折叠屏智能手机三星Galaxy Z Fold5与Galaxy Z Flip5,以及三星Galaxy Tab S9
  • OPPO K11采用全方位护眼屏:三大护眼能力减轻视觉疲劳

    日前OPPO官方宣布,全新的OPPO K11将于7月25日正式发布,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼IMX890主摄,堪称是2000档位影像表
Top