当前位置:首页 > 科技  > 软件

大规模专家并行推理集群实现性能 3 倍跃迁,联通元景开启推理新纪元

来源: 责编: 时间:2025-04-08 10:05:19 121观看
导读 近日,中国联通持续技术攻坚,依托元景大模型 MaaS 平台成功搭建“大规模专家并行”推理集群,实现 DeepSeek MoE 大模型在多节点间的超高效集群推理,单卡吞吐提升 3 倍,解码时延降低 50%。这一成果不仅为人工智能技

近日,中国联通持续技术攻坚,依托元景大模型 MaaS 平台成功搭建“大规模专家并行”推理集群,实现 DeepSeek MoE 大模型在多节点间的超高效集群推理,单卡吞吐提升 3 倍,解码时延降低 50%。这一成果不仅为人工智能技术的创新发展提供了强大助力,也让各行业以更高效率应用 AI 技术,加速推动千行百业的数字化转型。2jo28资讯网——每日最新资讯28at.com

伴随大模型 MoE 结构重大技术革新,以往少量“全能型”专家的模式逐渐被取代,大量“专科型”小专家逐渐成为主流。这一转变,极大地提升了模型的针对性和精细化程度,使得模型效果显著改善。2jo28资讯网——每日最新资讯28at.com

推理应用在各行业的落地随之全面加速,市场对于推理服务的需求呈井喷式增长,Tokens 处理量的需求与日俱增,这对推理系统的性能提出了更高的要求。为应对这一挑战,大规模专家并行推理技术应运而生,为大模型推理的加速规模应用提供了强大的技术支撑。2jo28资讯网——每日最新资讯28at.com

联通元景大模型与昇腾深度合作,围绕大规模专家并行推理技术展开全方位创新,将 DeepSeek 671B 满血版大模型的数百个“专科型”小专家按最优方式分布到不同的 NPU 上,使得单卡权重占用显存降低 75%,权重加载耗时大幅减少,可用于数据计算的显存显著增加。2jo28资讯网——每日最新资讯28at.com

在通信环节,双方对集群跨机通信方案进行深度优化,通过引入先进计算与通信并行算法,整体通信效率提升 40%。此外,双方联合创新多级负载均衡算法,精准识别并均衡各 NPU 的负载,将卡间负载差异成功控制在 10% 以下,有效提升系统吞吐和计算资源利用率。2jo28资讯网——每日最新资讯28at.com

2jo28资讯网——每日最新资讯28at.com

联通元景大模型 MaaS 平台结合大规模专家并行推理集群系统,基于 DeepSeek 671B 满血版大模型持续进行针对性推理优化创新,打造高可靠、高性能、易运维推理服务。2jo28资讯网——每日最新资讯28at.com

围绕高可靠2jo28资讯网——每日最新资讯28at.com

依托实例内和实例间的多级容灾机制,保障业务连续性,提供长稳推理服务。围绕高性能,进行高并发请求调度、管理、转发等,打造整个集群的高效数据请求管理入口。2jo28资讯网——每日最新资讯28at.com

围绕易运维2jo28资讯网——每日最新资讯28at.com

进行集群内推理业务状态监控、以及 PD 身份和资源管理与决策等,打造整个推理集群的状态监控器和决策大脑,持续提升大规模专家并行推理集群易用性。2jo28资讯网——每日最新资讯28at.com

在数字经济蓬勃发展的浪潮中,中国联通始终勇立潮头,全面发力人工智能。从精心搭建智算基础设施,构建强大算力“引擎”,到成功落地大规模专家并行推理集群,打造高性能低时延推理“中枢”,联通元景大模型持续筑牢国产化智算底座,以技术需求双轮驱动,打造“普惠速成”的元景 MaaS 平台,让人工智能更简单,为 AI 产业发展注入强劲的“加速度”。2jo28资讯网——每日最新资讯28at.com

这一推理创新举措必将助力各行业在复杂多变、竞争激烈的市场环境中抢占先机,以智能化驱动数字化转型,进而推动实体经济高质量发展。2jo28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-141944-0.html大规模专家并行推理集群实现性能 3 倍跃迁,联通元景开启推理新纪元

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 电力“深海高速路”:全国首个海陆一体海上风电柔直工程开工

下一篇: 抖音上线“辟谣卡”功能:搜索涉及谣言信息,即展示辟谣信息

标签:
  • 热门焦点
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • 官方承诺:K60至尊版将会首批升级MIUI 15

    全新的MIUI 15今天也有了消息,在官宣了K60至尊版将会搭载天玑9200+处理器和独显芯片X7的同时,Redmi给出了官方承诺,K60至尊重大更新首批升级,会首批推送MIUI 15。也就是说虽然
  • 影音体验是真的强 简单聊聊iQOO Pad

    大公司的好处就是产品线丰富,非常细分化的东西也能给你做出来,例如早先我们看到了新的vivo Pad2,之后我们又在iQOO Neo8 Pro的发布会上看到了iQOO的首款平板产品iQOO Pad。虽
  • JavaScript 混淆及反混淆代码工具

    介绍在我们开始学习反混淆之前,我们首先要了解一下代码混淆。如果不了解代码是如何混淆的,我们可能无法成功对代码进行反混淆,尤其是使用自定义混淆器对其进行混淆时。什么是混
  • Flowable工作流引擎的科普与实践

    一.引言当我们在日常工作和业务中需要进行各种审批流程时,可能会面临一系列技术和业务上的挑战。手动处理这些审批流程可能会导致开发成本的增加以及业务复杂度的上升。在这
  • 2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • 2纳米决战2025

    集微网报道 从三强争霸到四雄逐鹿,2nm的厮杀声已然隐约传来。无论是老牌劲旅台积电、三星,还是誓言重回先进制程领先地位的英特尔,甚至初成立不久的新
  • iQOO 11S或7月上市:搭载“鸡血版”骁龙8Gen2 史上最强5G Soc

    去年底,iQOO推出了“电竞旗舰”iQOO 11系列,作为一款性能强机,iQOO 11不仅全球首发2K 144Hz E6全感屏,搭载了第二代骁龙8平台及144Hz电竞屏,同时在快充
  • 荣耀Magicbook V 14 2021曙光蓝版本正式开售,拥有触摸屏

    荣耀 Magicbook V 14 2021 曙光蓝版本正式开售,搭载 i7-11390H 处理器与 MX450 显卡,配备 16GB 内存与 512GB SSD,重 1.48kg,厚 14.5mm,具有 1.5mm 键盘键程、
Top