当前位置:首页 > 科技  > 通信

OpenAI和科大讯飞,瞄准了同一件事

来源: 责编: 时间:2025-08-12 10:56:11 87观看
导读 阿里云优惠券 先领券再下单夏季大模型行业的密集上新随着上周GPT-5的推出终于落下帷幕。北京时间8月8日凌晨,OpenAI正式发布下一代旗舰模型GPT-5,距离上代模型GPT-4的推出已经过去了29个月。但GPT-5上线初期的反馈却

 阿里云优惠券 先领券再下单VQZ28资讯网——每日最新资讯28at.com

夏季大模型行业的密集上新随着上周GPT-5的推出终于落下帷幕。北京时间8月8日凌晨,OpenAI正式发布下一代旗舰模型GPT-5,距离上代模型GPT-4的推出已经过去了29个月。VQZ28资讯网——每日最新资讯28at.com

但GPT-5上线初期的反馈却有些两极分化。GPT-5仍然是当前能力最为全面的模型,但和此前OpenAI一直保持着断代式的模型性能领先相比,GPT-5并未与市场主流模型拉开显著差距,部分基准测试场景下甚至被马斯克的Grok 4或者同期发布的Claude Opus 4.1超越。VQZ28资讯网——每日最新资讯28at.com

部分原因在于OpenAI的先发优势正在减弱,但更关键的原因或许在于OpenAI试图将大模型从“能用”推向“好用”。和此前发布的旗舰模型不同,OpenAI在此次GPT-5发布会中尤其强调他们在减少模型幻觉、提升指令遵循能力和降低模型谄媚性方面的进展。VQZ28资讯网——每日最新资讯28at.com

VQZ28资讯网——每日最新资讯28at.com

这和此前国内大模型代表星火 X1 的升级不谋而合。作为当前市面上唯一全栈自主可控的全国产大模型,星火X1在7月25日的升级同样着重强调对大模型实用痛点尤其是幻觉问题的精准攻克上。VQZ28资讯网——每日最新资讯28at.com

在对模型幻觉问题治理上,星火X1取得显著突破,无论是对自身生成内容真实性的把控(事实性幻觉治理),还是参考外部资料时对原文的忠实程度都有显著改善(忠诚性幻觉治理),大大提升了大模型在行业应用中的可靠性。VQZ28资讯网——每日最新资讯28at.com

甚至二者在技术路线的探索上都颇为一致。OpenAI在官网介绍,针对模型幻觉问题,他们在GPT-5训练中加入了多目标奖励机制以及思维链监控等手段,来改善模型幻觉问题。多目标奖励改变了此前模型单一奖惩机制容易迎合用户的弊病,即便模型给出不确定性回答也可以得到正向反馈,思维链监控则可以有限防止推理模型在深度思考过程中的幻觉问题。VQZ28资讯网——每日最新资讯28at.com

VQZ28资讯网——每日最新资讯28at.com

大模型幻觉的后果VQZ28资讯网——每日最新资讯28at.com

在强化学习技术上,科大讯飞同样试图改进大模型粗糙的数值奖励机制,将评语模型与细粒度反馈的强化学习技术结合起来,就像是给AI配了一个耐心的老师,能在解题的每个环节给出具体建议。这种做法让复杂的数学推理训练变得更加高效,也解决了强化学习训练中“奖励太少”的痛点问题。VQZ28资讯网——每日最新资讯28at.com

此外,科大讯飞提出的基于多路径采样验证及事实性约束强化学习的幻觉治理技术,则可以在大模型思考过程及恢复生成阶段,实现客观问题与标准答案的深度对齐,从而大幅减少慢思考下的幻觉率。VQZ28资讯网——每日最新资讯28at.com

但在治理模型幻觉问题上,作为大模型国家队的科大讯飞还是比OpenAI更多走了一步。科大讯飞不仅从模型训练与监督角度入手,还深入介入了大模型训练更前置的数据环节。VQZ28资讯网——每日最新资讯28at.com

在此前已经建立行业高质量数据集以及讯飞知识工程平台的基础上,科大讯飞还开创性地提出了基于多路径采样验证及事实性约束强化学习的幻觉治理技术,在大模型思考过程及回复生成阶段,实现客观问题与标准答案的深度强对齐,大幅减少了在慢思考下的幻觉率让大模型回复通用常识及专业知识问题更加可靠。VQZ28资讯网——每日最新资讯28at.com

从全国产大模型代表的星火X1,到海外大模型代表的GPT-5,全球顶尖大模型同时强调模型可靠性的升级。这背后是因为,大模型已经日益深入到社会应用的方方面面,在性能稳步提升的同时,也对模型的可靠性和易用性提出了更高要求。VQZ28资讯网——每日最新资讯28at.com

“我们的核心追求的是模型的实际应用价值以及大众的可访问性/可负担性。我们可以发布更智能的模型,但更重要的这次的模型可以让超过十亿人受益。”OpenAI创始人兼CEO萨姆·奥尔特曼说。VQZ28资讯网——每日最新资讯28at.com

纵观此次OpenAI针对GPT-5的升级,你可能会感到些许熟悉。在发布会中,模型性能的提升一笔带过,更多时间都用在了讲述GPT-5的具体行业应用,尤其是编程、写作以及医疗等三个大模型核心应用场景上。VQZ28资讯网——每日最新资讯28at.com

其实,大模型行业中最早呼吁关注模型行业应用价值的正是科大讯飞。早在科大讯飞立项攻坚大模型时,就确立了“1+N”的研发方向,在研发一个通用大模型的同时,也同步推出教育、医疗、法律等行业大模型。过去几年来,讯飞星火围绕医疗、教育、法律、汽车、科研等多个重点行业发布多个行业大模型,同时与多个行业龙头、央国企展开深入合作,共同推进大模型落地应用。VQZ28资讯网——每日最新资讯28at.com

7月25日全新升级的星火X1,更是科大讯飞推动模型从“能用”走向“好用”的关键一步。二者虽然只一字之差,但背后的技术深度和应用广度完全不同。升级后的星火X1已全面赋能教育、医疗、企业应用、代码、科研等行业大模型和智能体,在复杂行业场景任务上进一步满足用户核心需求。VQZ28资讯网——每日最新资讯28at.com

VQZ28资讯网——每日最新资讯28at.com

星火代码大模型已深度赋能金融、制造、能源、科技等100余家关键领域客户,在典型应用场景中驱动研发效率提升超过50%。测试集合来源:测试集合来自认知智能全国重点实验室构建的代码实用场景测试集VQZ28资讯网——每日最新资讯28at.com

大模型产业已经到了产业化与规模化落地的关键时期,大模型不仅要能用,更要好用。作为大模型产业真正的国家队代表,星火X1更是肩负着中国大模型产业真正自主可控的使命要求。在保持性能领先的同时,也要真正赋能关乎社会民生的重点行业,为世界提供第二种选择。VQZ28资讯网——每日最新资讯28at.com

VQZ28资讯网——每日最新资讯28at.com

量子位智库VQZ28资讯网——每日最新资讯28at.com

星火X1能够先于GPT-5提出大模型要从“能用”走向“好用”,要在智能领先的同时拥有更广的行业应用,这背后彰显了中国人工智能产业已经从追赶逐渐走向领先阶段。VQZ28资讯网——每日最新资讯28at.com

今年是国家《新一代人工智能发展规划》“第二步”的关键之年,在人工智能基础理论实现重大突破的同时,尤为强调在技术与应用达到世界领先水平,人工智能成为带动我国产业升级和经济转型的主要动力。VQZ28资讯网——每日最新资讯28at.com

作为大模型国家队的突出代表,星火X1更要率先解决横亘在大模型行业落地难的关键技术与应用难题。从这个角度上来说,星火X1已经交出了一份出色的答卷。VQZ28资讯网——每日最新资讯28at.com

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!VQZ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-20-176623-0.htmlOpenAI和科大讯飞,瞄准了同一件事

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 唐人街-锦鲤国际11周年庆暨乔迁盛典:以专业深耕跨境服务,开启国际化新篇章

下一篇: 我店科技全球总部正式落户海南儋州海花岛 借力自贸港政策开启战略新篇章

标签:
  • 热门焦点
  • 6月安卓手机好评榜:魅族20 Pro蝉联冠军

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年6月1日至6月30日,仅限国内市场。第一名:魅族20 Pro好评率:95%5月份的时候魅族20 Pro就是
  • 5月安卓手机好评榜:魅族20 Pro夺冠

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年5月1日至5月31日,仅限国内市场。第一名:魅族20 Pro好评率:97.50%不得不感慨魅族老品牌还
  • 轿车从天而降电动车主被撞身亡 超速抢道所致:现场视频让网友吵翻

    近日,上海青浦区法院判决轿车从天而降电动车主被撞身亡案,轿车车主被判有期徒刑一年。案件显示当时男子驾驶轿车在上海某路段行驶,前车忽然转弯提速超车,
  • Java NIO内存映射文件:提高文件读写效率的优秀实践!

    Java的NIO库提供了内存映射文件的支持,它可以将文件映射到内存中,从而可以更快地读取和写入文件数据。本文将对Java内存映射文件进行详细的介绍和演示。内存映射文件概述内存
  • 多线程开发带来的问题与解决方法

    使用多线程主要会带来以下几个问题:(一)线程安全问题  线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间,该数据被其他的线程所修改,那么对于当前线程而言,该线程
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • 重估百度丨大模型,能撑起百度的“今天”吗?

    自象限原创 作者|程心 罗辑2023年之前,对于自己的“今天”,百度也很迷茫。“新业务到 2022 年底还是 0,希望 2023 年出来一个 1。”这是2022年底,李彦宏
  • iQOO Neo8 Pro评测:旗舰双芯加持 最强性能游戏旗舰

    【Techweb评测】去年10月,iQOO推出了一款Neo7手机,该机搭载了联发科天玑9000+,配备独显芯片Pro+,带来了同价位段最佳的游戏体验,一经上市便受到了诸多用
  • 滴滴违法违规被罚80.26亿 共存在16项违法事实

    滴滴违法违规被罚80.26亿 存在16项违法事实开始于2121年7月,历经一年时间,网络安全审查办公室对“滴滴出行”网络安全审查终于有了一个暂时的结束。据“网信
Top