当前位置:首页 > 元宇宙 > AI

华为盘古718B模型如何突围?从数据质量到Agent能力的系统化创新

来源: 责编: 时间:2025-09-30 10:28:16 97观看
导读在最新一期的SuperCLUE中文大模型通用基准测评中,华为凭借其7180亿参数的MoE架构大模型openPangu-Ultra-MoE-718B跻身前三,与DeepSeek-V3.1、Qwen3-235B等开源模型同台竞技。这一成绩的背后,是团队对模型训练逻辑的深度

在最新一期的SuperCLUE中文大模型通用基准测评中,华为凭借其7180亿参数的MoE架构大模型openPangu-Ultra-MoE-718B跻身前三,与DeepSeek-V3.1、Qwen3-235B等开源模型同台竞技。这一成绩的背后,是团队对模型训练逻辑的深度重构——通过数据质量优先、三阶段预训练、批判性思维内化等创新策略,突破了传统“堆数据”的路径依赖。PX928资讯网——每日最新资讯28at.com

数据构建环节,团队摒弃了“以量取胜”的常规做法,转而建立“质量评估-科学筛选-精准增强”的全流程体系。在指令数据清洗阶段,采用规则、模型、人工三重审核机制,确保低质量样本被彻底过滤;在任务设计上,通过领域与任务类型的双重维度覆盖,结合去重算法避免冗余;针对模型易在简单任务上过拟合的问题,团队量化推理步骤、概念抽象度等指标,重点强化中高难度任务的训练比例。这种对数据质量的严苛把控,为模型在复杂场景下的推理能力奠定了基础。PX928资讯网——每日最新资讯28at.com

预训练阶段,团队将整个过程拆解为通用、推理、退火三个递进阶段。通用阶段通过海量文本与代码数据,构建模型的世界知识基础;推理阶段大幅增加泛数学、STEM及代码数据的比重,并引入高难度多步骤推理题库,配合详细思维链(CoT)引导模型学习逻辑路径;退火阶段则通过阶梯式扩展上下文长度至128K,同时增加指令类数据与Agent工具使用数据,使模型逐步掌握外部工具调用能力。这种分阶段训练策略,有效平衡了模型的基础认知与专项能力。PX928资讯网——每日最新资讯28at.com

针对大型语言模型普遍存在的幻觉问题,团队提出“批判内化”机制。与传统批判微调(CFT)依赖固定人类反馈数据不同,该机制在模型训练完成后,通过拒绝采样引入自我批判信号,迫使模型在生成答案时主动审视推理过程。例如,在数学推理任务中,模型需检查逻辑链条是否完整、计算步骤是否准确;在代码生成任务中,则需验证语法正确性与功能实现度。实验数据显示,这一机制使模型的指令遵从性与输出可靠性显著提升。PX928资讯网——每日最新资讯28at.com

在工具使用能力方面,团队开发的ToolACE框架通过四项关键技术实现突破:领域工具组合技术将关联工具(如日历查询与航班预订)绑定,提供工具依赖图;交互式目标轨迹生成采用“计划-执行”分离策略,先由AI规划工具调用序列,再通过模拟环境执行;多智能体对话生成引入随机打断、反问澄清等复杂交互;多维校验与错例迭代则对生成数据进行内容满足度、状态变化正确性等多维度评估,低分数据将反哺生成策略优化。经此训练的模型,在复杂多轮交互中展现出精准的工具调用能力。PX928资讯网——每日最新资讯28at.com

后训练阶段,团队采用“渐进动态微调-强化学习-模型融合”三步策略。渐进动态微调(PDFT)通过动态调整训练权重,避免模型对特定数据过拟合;强化学习环节选用GSPO算法,相比传统GRPO算法在训练稳定性上提升30%;模型融合阶段则通过黑盒优化算法,自动搜索不同版本模型的最佳组合权重,生成综合性能更强的最终模型。这一系列优化,使openPangu-718B在数学推理、代码生成、幻觉控制等六个维度的评估中均表现优异。PX928资讯网——每日最新资讯28at.com

从数据筛选到训练策略,从幻觉控制到工具学习,openPangu-718B的突破印证了一个核心逻辑:大模型的竞争力不在于参数规模或数据体量,而在于对技术细节的极致打磨。当行业仍在争论“规模定律”是否适用时,华为用实践给出了另一种答案——通过系统性技术创新,同样能在激烈竞争中开辟新路径。PX928资讯网——每日最新资讯28at.com

   更多>同类资讯华为盘古718B模型脱颖而出:数据质量与技术创新双轮驱动09-29象屿集团携手钉钉,借AI之力开启数智化新篇,3万员工共赴转型新程象屿集团此次与钉钉合作,不仅是AI技术平台的引入,更是双方对未来发展方向的高度共识。 值得一提的是,象屿集团此次全面引入钉钉One、DingTalk A1、AI听记、AI搜问、AI表格等钉钉AI新品,聚焦用…09-29云天励飞加入OISA生态,以“算力积木”助力国产AI算力突破MoE大模型瓶颈凭借在 AI 推理芯片与算力架构的长期积累,云天励飞成为 OISA 生态的重要一员。 未来,云天励飞将继续秉持“AI时代的加速器”愿景,持续迭代芯片技术与架构创新,携手 OISA 生态伙伴,共同推动智能算…09-29四川资源集团携手华为 共绘智慧矿山蓝图 探索数智化赋能新路径封面新闻记者 付文超9月29日,记者获悉,四川省自然资源投资集团有限责任公司(以下简称“四川资源集团”)与华为技术有限公司(以下简称“华为”)签署框架合作协议。 根据协议,双方将在智慧矿山规划和建设、人工智…09-29Flash Attention作者Tri Dao:英伟达GPU主导地位或三年内瓦解,AI硬件将迎多元生态他们设计了非常好的芯片,也有非常好的软件支持,这让我能够做很多有意思的事情,而这正是我追求的:能不能做出有意思的东西。举例我做的Mamba,思路是让模型把历史压缩成更小的状态向量,而不是保存完整的KV c…09-29​长智具身智能科技公司在海南成立 智元机器人长飞光纤等携手布局​09-29AMD与NVIDIA下一代AI GPU竞速:设计迭代升级,技术差距或缩小09-29中国算力生态竞速:华为开源破局,产业链协同共筑全球竞争力09-29奥特曼携OpenAI大举布局AI投资,与英伟达等合作能否成就AI未来?09-29第22届东博会AI元素爆棚:“黑科技”互动不断,共绘中国—东盟新蓝图09-29科技浪潮下的人文温度:莫言忆小学课堂“粉笔头”里的鲜活记忆09-29俄罗斯数字服务员亮相高端餐厅:AI精准推荐,重塑餐饮服务新体验09-29高德云栖大会亮剑:空间智能赋能千行百业,构建物理世界交互新生态09-29京东JDD大会发布AI全景图,推三大新品四大应用,绘万亿AI生态蓝图该体系依托Joy AI大模型打造丰富的系统能力和多元化智能体,通过AI技术构建电商购物、供应链管理等智能应用场景,系统展现了AI技术在京东电商业务中的应用,描摹出京东零售面向未来的AI电商蓝图。同时,承载新一…09-29“人机共创”三重真相:AI为翼 人为舵 共拓创作新边界09-29点击查看更多 +全站最新科大讯飞P30学习机:宝妈育儿好帮手,护眼又高效,孩子学习更轻松科大讯飞P30学习机:宝妈育儿好帮手,护眼又高效,孩子学习更轻松王心凌倾情代言!马自达EZ-60携双动力上市,11.99万起开启合资新体验王心凌倾情代言!马自达EZ-60携双动力上市,11.99万起开启合资新体验深蓝汽车X华为乾崑长沙试驾落幕:智能增程齐发力,亲子互动共团圆深蓝汽车X华为乾崑长沙试驾落幕:智能增程齐发力,亲子互动共团圆MAZDA EZ-60售价11.99万元起,王心凌代言,智能配置拉满开启电动新篇MAZDA EZ-60售价11.99万元起,王心凌代言,智能配置拉满开启电动新篇小米定制服务:以顶级工艺邂逅个性色彩,三年百色计划解锁专属汽车美学小米定制服务:以顶级工艺邂逅个性色彩,三年百色计划解锁专属汽车美学小米新品发布会全览:一图解锁系列新品亮点与指南小米新品发布会全览:一图解锁系列新品亮点与指南热门内容
  • 寒武纪回应订单不实传闻:产品多行业部署,存货增长因云端备货
  • 热度攀升!千亿科技龙头频获机构调研,业务增长透露哪些行业新动向?
  • 苹果秋季发布会亮相iPhone 17系列:"史上最薄"Air登场,Pro Max 2TB版定价17999元
  • 苹果加速布局中国市场!Apple Intelligence和新版Siri或年底至明年上线
  • ​小米16系列或提前登场,首发骁龙8 Elite Gen5,9月机圈大战一触即发​
  • 均胜电子新品亮相:AI头部总成、全域控制器等完善机器人产品矩阵
  • 国金证券:A股第三轮重估脚步临近,三类资产投资方向值得关注
  • 18岁涂津豪:从DeepSeek实习生到Nature封面作者,以少年之力叩响AI新章
  • ‍阿里云与英伟达达成Physical AI合作,通义大模型升级,AI算力存力大增‍
  • WAVE SUMMIT大会新动态:文心大模型X1.1上线,多项能力显著跃升
  • 华为Mate系列2025年选购指南:三款高性价比机型技术解析与场景适配
  • 华为智能手表登顶全球,苹果需直面挑战求变革
  • ‍字节跳动千人芯片团队架构调整,转至新加坡子公司Picoheart引关注‍
  • 人工智能浪潮下胜宏科技19亿定增落地 获270名投资者追捧
  • 深圳众擎创始人赵同阳:10月郑州设子公司 规划打造全球生产制造中心
本栏最新第22届东博会AI元素亮眼:数字智能体引路 机器人炫技展风采第22届东博会AI元素亮眼:数字智能体引路 机器人炫技展风采AI云竞争下半场:华为以超节点、企业Agent等破局,谁能领跑产业?AI云竞争下半场:华为以超节点、企业Agent等破局,谁能领跑产业?2025网安周:每日互动刘宇谈AI时代,知识安全成关键,共筑数字新未来2025网安周:每日互动刘宇谈AI时代,知识安全成关键,共筑数字新未来中国大模型DeepSeek首登Nature封面,R1训练成本仅约208万引关注中国大模型DeepSeek首登Nature封面,R1训练成本仅约208万引关注华为全联接大会2025启幕,发布全球最强算力超节点与集群华为全联接大会2025启幕,发布全球最强算力超节点与集群有鹿机器人+连合直租:以智能租赁模式,开启高端场景清洁新未来有鹿机器人+连合直租:以智能租赁模式,开启高端场景清洁新未来

本文链接:http://www.28at.com/showinfo-45-28458-0.html华为盘古718B模型如何突围?从数据质量到Agent能力的系统化创新

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 余承东宣布:鸿蒙5终端设备达2000万

下一篇: 华为盘古718B模型脱颖而出:数据质量与技术创新双轮驱动

标签:
  • 热门焦点
  • 沉寂3年,大模型激活小度天猫精灵?

    Tech星球(微信ID:tech618)文 | 何煦阳 沉寂了许久的智能音箱,在今年大模型横空出世之后,又再次燃起了新的希望。 2月9日,小度宣布将融合文心一言,打造针对智能设备场景的AI模型&ldq
  • 蓝标亏钱、Meta裁员:天下秀还值得砸钱元宇宙吗?

    日前,天下秀数字科技集团正式公布了2022年报及2023年一季报。报告显示,2022年天下秀实现营收41.29亿元,同比下滑8.48%;归母净利润1.8亿元,同比下滑49.2%,几乎出现了盈利腰斩的态势
  • 刷完一场元宇宙世界杯音乐盛典,我爽了

    作者|刘小土编辑|李春晖你有多久没完整追过一场音乐盛典了?三刷都不嫌多的那种。按照惯例,每逢年底,直播、长短视频、音乐平台便会抢着端上来几场音乐盛典。搁以
  • 一个视频涨粉百万,柳夜熙们能成为元宇宙的“船票”吗?

    当数字人成为一种生意,我们更关心的是,他们如何赚到钱,以及这意味着什么?01#“柳夜熙”爆火之后不知道大家还记不记得,去年10月31日万圣节,有一位虚拟美妆
  • 冰墩墩还能火多久?

    作者:田巧云题图源自北京2022年冬奥会官方微博如果要问2022年的开年明星是谁,冰墩墩当仁不让。几乎所有人都被那个抖雪的动作实力圈粉。在社交媒体的助推,以及日
  • 2022年6款最佳的NFT稀有度查询工具

    NFT正在风靡全球,但拥有一个你自认为看起来很酷的 NFT 是不够的,因为它还应该是稀有的,稀有度会影响每个 NFT 的价值。因此,如果您打算投资 NFT,则需要使用 NFT 稀
  • 如何在元宇宙中建立品牌忠诚度

    Snoop Dogg、耐克、苏富比和普华永道都有什么共同点?他们都投资于元宇宙的房地产。除了我们在屏幕上看到的二维世界--手机、笔记本电脑、台式机或iPad--他们决
  • 头像类NFTs的统治能持续多久?

    在过去的一两年里,NFTs在互联网世界中掀起了一场风暴。今天,当我们想到NFTs时,我们主要想到的是那些充斥着我们的社交媒体屏幕的数字卡通--无聊猿、punks 和介于
  • 知名艺术家打造去中心化“好莱坞”:一部电影一个DAO

    根据市场追踪网站 DappRadar 的数据,随着 NFT 的“出圈”与加密货币的普及,NFT 市场在 2021 年的销售额达到约 250 亿美元,而 2020 年仅为 9490 万美元,同比增超 2
Top