当前位置:首页 > 元宇宙 > AI

摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

来源: 责编: 时间:2025-03-02 09:07:16 161观看
导读 2 月 27 日消息,在 DeepSeek 开源周第四日,摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe,并发布相关开源代码仓库:MT-DeepEP 和 MT-DualPipe。据介绍,DeepEP 是一个用于 MoE(混合专家)模

2 月 27 日消息,在 DeepSeek 开源周第四日,摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe,并发布相关开源代码仓库:MT-DeepEP 和 MT-DualPipe。hSz28资讯网——每日最新资讯28at.com

hSz28资讯网——每日最新资讯28at.com

据介绍,DeepEP 是一个用于 MoE(混合专家)模型训练和推理的开源 EP(expert parallelism,专家并行)通信库,主要适用于大模型训练,特别是需要 EP 的集群训练。它通过优化通信信道的使用率,提升了训练效率。摩尔线程基于 MUSA Compute Capability 3.1 全功能 GPU 适配了 DeepEP,并支持以下特性:hSz28资讯网——每日最新资讯28at.com

高效优化的 All-to-All 通信,支持 dispatch & combinehSz28资讯网——每日最新资讯28at.com

支持 MTLink + GPU(MUSA Compute Capability 3.1)节点内通信hSz28资讯网——每日最新资讯28at.com

训练及推理预填充阶段的高吞吐量计算核心hSz28资讯网——每日最新资讯28at.com

推理解码阶段的低延迟计算核心hSz28资讯网——每日最新资讯28at.com

原生支持 FP8 数据分发hSz28资讯网——每日最新资讯28at.com

灵活控制 GPU 资源,实现计算与通信的高效重叠hSz28资讯网——每日最新资讯28at.com

DualPipe 是 DeepSeek-V3 提出的双向流水线并行算法,通过前向计算与后向计算阶段的计算与通信完全重叠,减少了“流水线气泡”(设备空闲等待)。摩尔线程依托深度学习框架 Torch-MUSA(已开源)和 MUSA 软件栈全方位的兼容性,实现了对 DualPipe 这一算法的支持。hSz28资讯网——每日最新资讯28at.com

目前,MT-DualPipe 可以完整接入摩尔线程 MT-Megatron 框架和 MT-TransformerEngine 框架(即将开源),实现 DeepSeek V3 训练流程完整复现。此外,MT-DualPipe 结合 MT-Megatron 可实现完整 DeepSeek V3 模型 MLP-FFN 分离以及 DW-DG 分离,进一步降低气泡占比,优化通信效率。同时,MT-DualPipe 与 MT-TranformerEngine 和 MT-DeepEP 的结合,可利用 MT-DeepEP 和异步通信引擎实现更高效的通信掩盖,降低对计算资源损耗。hSz28资讯网——每日最新资讯28at.com

附 Torch-MUSA 开源地址如下:hSz28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/Torch_MUSAhSz28资讯网——每日最新资讯28at.com

相关阅读:hSz28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 4/5:DualPipe、EPLB 优化并行策略》hSz28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 3/5:深度学习利器 DeepGEMM》hSz28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP》hSz28资讯网——每日最新资讯28at.com

《DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA》hSz28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11260-0.html摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 腾讯混元新一代快思考模型 Turbo S 发布,支持“秒回”

下一篇: 地道表达 + 文化解读:谷歌翻译酝酿“追问”功能,打造你的专属 AI 外教

标签:
  • 热门焦点
  • FMIFAwards奖项即将揭晓!

    来源:X增强现实FMIF Awards未来元宇宙创新奖是由未来元宇宙创新论坛、ARinChina以及多家投资机构、媒体、研究院联合发起的一项评选活动。旨在推动新技术的融合与集成低成本
  • 不同于传统数字经济,元宇宙赋予商业生态更多数字资产价值!

    作者:中科基大数据元宇宙是一个去中心化的开放平台,而为了维护这样的平台,需要建立一个公平的游戏规则,确保每个元宇宙的参与者通过这个规则都可以挣到钱,他们的利益都可以得到保
  • 元宇宙带来沉浸式智能登录?你学会了吗?

    备受资本市场宠爱的元宇宙概念,正掀起一番番波澜。元宇宙作为虚实相融的互联网应用和社会形态,与沉浸式体验紧密相关。 多重路径,打造无感知沉浸式智能登录《设计
  • 索尼公布PSVR 2头显渲染图;社区开发者发布Quest版《我的世界》

    近日热点:索尼正式公布PSVR 2头显及控制器官方渲染图;入局元宇宙,鸿海科技与XRSPACE签订合作备忘录;研究人员表示面部追踪可增强VR操控体验;社区开发者QuestCraft发
  • Shiba Inu布局元宇宙 走出Meme局限

    以「狗狗币杀手」成名的Shiba Inu(SHIB)在人们的印象中始终有着浓厚的Meme(模因恶搞)烙印,但它似乎一直在尝试突破这种局限。建立起一个庞大的粉丝社区后,Shiba Inu
  • 就业年龄歧视如何解决?来Web3看看

    上周,我突然想到我的第一份工作实际上是在为一家失败的航空公司制定破产退出计划,那年我们的协议实习生刚出生。在一阵恐慌后,我又花了一点时间反思我这个拥有近1
  • 对讽刺无动于衷,Nori将碳市场放在区块链上

    当我们聊气候问题的解决方案时,以太坊区块链应该不是最首想到的,但这正是Nori所选择的方案,它建立了一个引擎,鼓励农民使用负碳耕作方法,将空气中的碳抽出并放回地
  • Ceramic:为Web3.0社交应用打造的中间件

    大家关注老雅痞公众号这么久,对Web3的概念不陌生吧?让我们做一个简短的回顾,Web3主要被描述为去中心化的网络,旨在实现无服务器、去中心化的互联网,即用户掌握自己
  • 在互联网考古后,我被豆瓣上这座元宇宙古城征服了

    最近一段时间,豆瓣可谓命途多舛:APP屡次下架,平台也被相关部门约谈、处罚,国家网信办甚至派人入驻豆瓣以督促整改。有爆料称豆瓣将陆续关闭“小组”功能:这个曾经小
Top