当前位置:首页 > 元宇宙 > AI

摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

来源: 责编: 时间:2025-03-02 09:07:16 150观看
导读 2 月 27 日消息,在 DeepSeek 开源周第四日,摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe,并发布相关开源代码仓库:MT-DeepEP 和 MT-DualPipe。据介绍,DeepEP 是一个用于 MoE(混合专家)模

2 月 27 日消息,在 DeepSeek 开源周第四日,摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe,并发布相关开源代码仓库:MT-DeepEP 和 MT-DualPipe。dJJ28资讯网——每日最新资讯28at.com

dJJ28资讯网——每日最新资讯28at.com

据介绍,DeepEP 是一个用于 MoE(混合专家)模型训练和推理的开源 EP(expert parallelism,专家并行)通信库,主要适用于大模型训练,特别是需要 EP 的集群训练。它通过优化通信信道的使用率,提升了训练效率。摩尔线程基于 MUSA Compute Capability 3.1 全功能 GPU 适配了 DeepEP,并支持以下特性:dJJ28资讯网——每日最新资讯28at.com

高效优化的 All-to-All 通信,支持 dispatch & combinedJJ28资讯网——每日最新资讯28at.com

支持 MTLink + GPU(MUSA Compute Capability 3.1)节点内通信dJJ28资讯网——每日最新资讯28at.com

训练及推理预填充阶段的高吞吐量计算核心dJJ28资讯网——每日最新资讯28at.com

推理解码阶段的低延迟计算核心dJJ28资讯网——每日最新资讯28at.com

原生支持 FP8 数据分发dJJ28资讯网——每日最新资讯28at.com

灵活控制 GPU 资源,实现计算与通信的高效重叠dJJ28资讯网——每日最新资讯28at.com

DualPipe 是 DeepSeek-V3 提出的双向流水线并行算法,通过前向计算与后向计算阶段的计算与通信完全重叠,减少了“流水线气泡”(设备空闲等待)。摩尔线程依托深度学习框架 Torch-MUSA(已开源)和 MUSA 软件栈全方位的兼容性,实现了对 DualPipe 这一算法的支持。dJJ28资讯网——每日最新资讯28at.com

目前,MT-DualPipe 可以完整接入摩尔线程 MT-Megatron 框架和 MT-TransformerEngine 框架(即将开源),实现 DeepSeek V3 训练流程完整复现。此外,MT-DualPipe 结合 MT-Megatron 可实现完整 DeepSeek V3 模型 MLP-FFN 分离以及 DW-DG 分离,进一步降低气泡占比,优化通信效率。同时,MT-DualPipe 与 MT-TranformerEngine 和 MT-DeepEP 的结合,可利用 MT-DeepEP 和异步通信引擎实现更高效的通信掩盖,降低对计算资源损耗。dJJ28资讯网——每日最新资讯28at.com

附 Torch-MUSA 开源地址如下:dJJ28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/Torch_MUSAdJJ28资讯网——每日最新资讯28at.com

相关阅读:dJJ28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 4/5:DualPipe、EPLB 优化并行策略》dJJ28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 3/5:深度学习利器 DeepGEMM》dJJ28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP》dJJ28资讯网——每日最新资讯28at.com

《DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA》dJJ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11260-0.html摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 腾讯混元新一代快思考模型 Turbo S 发布,支持“秒回”

下一篇: 地道表达 + 文化解读:谷歌翻译酝酿“追问”功能,打造你的专属 AI 外教

标签:
  • 热门焦点
  • 错过了BRC20还有eths,eth铭文协议

    来源:三头鸟NFT大家好,我是鸟哥,了解鸟哥的人都知道鸟哥擅撸空投,说实话撸毛虽然回报大但周期还是有点长的,所以除了撸毛我们自己也在研究早期项目,打新,比如BRC20协议ordi当时就有
  • 元宇宙里卖酸奶,好炸裂的操作!

    作者 | 李东阳 来源 | 首席营销官有没有发现,当下的热搜出现一个有意思的现象,那就是“情怀”不知不觉成为了主流,爷青回话题讨论性非常高。前有名侦探柯南和优衣库
  • 不同于传统数字经济,元宇宙赋予商业生态更多数字资产价值!

    作者:中科基大数据元宇宙是一个去中心化的开放平台,而为了维护这样的平台,需要建立一个公平的游戏规则,确保每个元宇宙的参与者通过这个规则都可以挣到钱,他们的利益都可以得到保
  • 花房集团上市,走向元宇宙新征程

    文 | 港股研究社作者 | 熊生12月12日,花房集团在港交所成功上市,首日便受到追捧,当日最高涨幅达28.75%。继360、360数科、鲁大师后,这是“红衣教主”周
  • 保时捷推出虚拟超跑,车企元宇宙营销这么香?

    保时捷又出超跑了,不过这次不是在现实世界,而是在虚拟世界。这款Vision Gran Turismo概念车,由保时捷和日本视频游戏开发工作室Polyphony Digital联合打造,将于202
  • 冰墩墩的NFT暴涨千倍?真相则是价格暴跌、成交遇冷

    《区块链日报》记者查证,近日来冰墩墩数字藏品交易数量出现大幅下滑,而所谓的暴涨千倍更是有价无市的自嗨。昨日,北京冬奥会正式闭幕。在这届冬奥会上,吉祥物“冰
  • 量子计算在未来能否提高区块链技术的效率

    区块链技术的主要成功之处在于对不透明的金融流程进行了去中心化的访问量子计算机的内在目标是解决传统计算机不可能解决的问题随着区块链技术的使用案例逐渐
  • 3月份值得关注的5个NFT项目

    2021年,我们见证了一个新的创造者经济的诞生。它是在区块链上诞生的。自从NFT成为流行文化的中心舞台以来,有些艺术家们已经成为了NFT的超级明星,在几个月的时间
  • 76亿美金估值、2022年最具创新力公司,Dapper Labs如何做到?

    “元宇宙的开拓者”是我们针对元宇宙的发展而设立的专栏,主要面向那些深挖元宇宙产业或者在元宇宙进行“淘金”的从业者,分享这些企业或者创业者们的故事,以独特
Top