当前位置:首页 > 元宇宙 > AI

商汤大装置与华为昇腾 384 超节点全面适配,多项创新提升训练效率

来源: 责编: 时间:2025-09-09 11:32:41 60观看
导读 9 月 6 日消息,据商汤科技官方消息,近日,商汤大装置 SenseCore 与昇腾 384 超节点率先完成全面适配,在功能、性能验证上达到预期目标。据官方介绍,超节点(SuperPod)是一种通过高速互联技术,将多个 GPU / NPU 整合为统

9 月 6 日消息,据商汤科技官方消息,近日,商汤大装置 SenseCore 与昇腾 384 超节点率先完成全面适配,在功能、性能验证上达到预期目标。tIi28资讯网——每日最新资讯28at.com

tIi28资讯网——每日最新资讯28at.com

据官方介绍,超节点(SuperPod)是一种通过高速互联技术,将多个 GPU / NPU 整合为统一计算单元的新型架构,解决 AI 大模型训练中的算力协同与通信效率问题。tIi28资讯网——每日最新资讯28at.com

昇腾 384 超节点(Atlas 900 A3 SuperPoD)是华为推出的业界最大规模超节点方案,凭借创新的“全对等架构”,实现高速互联总线的关键突破 —— 把总线从服务器内部扩展到整机柜、甚至跨机柜,最终将 CPU、NPU、DPU、存储和内存等资源全部互联和池化,形成一台“超级计算机”,实现更大的算力密度和互联带宽。tIi28资讯网——每日最新资讯28at.com

基于商汤大装置 SenseCore 与昇腾 384 超节点的特点,双方团队联合攻关,在调度优化、系统稳定性以及故障恢复等方面提出多项行业创新:tIi28资讯网——每日最新资讯28at.com

调度优化:在调度能力上,除了支持 POD 内单机和多机调度、跨 POD 多机调度、亲和性调度等基础能力,SenseCore 平台配合模型并行策略实现了逻辑超节点自动划分,使 EP / TP 等大通信策略可以充分利用灵衢网络,提升模型训练效率。tIi28资讯网——每日最新资讯28at.com

跨 POD 训练稳定性:另外 SenseCore 团队提交了多个 MR 修复多 POD 场景下 master / work 任务 rank 乱序问题,从根本上解决了跨 POD 训练任务概率性失败的问题。tIi28资讯网——每日最新资讯28at.com

多维度故障检测与恢复:在故障检测能力上覆盖了从服务器硬件、高速互联总线、RoCE 网络到任务、进程软硬件多维度检测,结合检测能力实现 Job / Pod / 进程多级恢复机制,全面提升昇腾 384 超节点在训练场景下的可靠性与容错性。tIi28资讯网——每日最新资讯28at.com

从官方新闻稿获悉,未来,双方还将探索更多应用场景,包括大模型推理加速、智能体应用部署、面向垂直行业的大模型训练与推理优化等,进一步加速基于 SenseCore 的昇腾 384 超节点在各行各业的应用落地。tIi28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-27422-0.html商汤大装置与华为昇腾 384 超节点全面适配,多项创新提升训练效率

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI 研究人员宣称已破解模型“幻觉”难题:现有评估方式在鼓励 AI“瞎蒙”

下一篇: 通义千问系列最强大的语言模型:Qwen3-Max-Preview 上线

标签:
  • 热门焦点
  • AI网红能年赚百万,普通人的新机会来了?

    来源|运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁2023 年 ,数字人成为了当红的“流量话题”和“商业机会"。不管是 AI 孙燕姿走红网络,还是 AI 数字
  • 雷克萨斯高管,“受贿”5000万?

    来源:毒舌科技作者:潘磊雷克萨斯的高管,好像出事了。五六家日本小媒体,突然曝出了一个与中国市场有关的大新闻——雷克萨斯中国区一个高管受贿10亿日元(约合人民币5000
  • 花房集团上市,走向元宇宙新征程

    文 | 港股研究社作者 | 熊生12月12日,花房集团在港交所成功上市,首日便受到追捧,当日最高涨幅达28.75%。继360、360数科、鲁大师后,这是“红衣教主”周
  • 中国区块链产业生态地图报告(2021)

    区块链是技术整合创新、金融创新、组织方式创新、产业应用创新的多维度创新,以服务实体经济、政务民生以及公共服务等领域为落脚点,以期实现整个地区和产业的资
  • 2022年中国元宇宙产业系列研究报告-基础设施篇(5)

    传感器是由敏感元件和转换元件构成,能够感受规定的检测量(物理量、化学量、生物量等),并按照一定规律将检测量转化成可用的输出信号的器件和装置,进而满足信息的
  • DAO登上了历史舞台,但是主流准备好采用DAO了吗?

    Block-807DAO要么是定义虚拟未来、无领导组织的革命性概念,要么是充满存在主义和自我毁灭挑战的反乌托邦结构,取决于你在与谁交谈。近几个月来, DAO已经从Crypto
  • 解决NFT流动性问题:一文了解Floor DAO

    流动性是证券市场上的一个术语,流动性是指资产在不影响其市场价格的情况下可以转换为现成现金的效率,流动性最强的资产是现金本身。现在让我们试着从流动性的角
  • 参加元宇宙里的招聘会是什么样一种体验?

    求职者可以在活动中走动,就像他们在现实生活中一样。长话短说看亮点:招聘公司Hirect为Y-combinator支持的初创公司举办了一场元宇宙招聘会。这里有一个大厅、一
  • 元宇宙专题二:GameFi 深度解析,元宇宙内容雏形显现

    GameFi=Game(游戏)+DEFI(去中心化金融),核心特点为“Play to Earn”。通过技术与去中心化价值观赋能,GameFi 游戏资产化身为NFT 和代币上链,具备了可验证性和流通性;开
Top