当前位置:首页 > 元宇宙 > AI

摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

来源: 责编: 时间:2025-03-02 09:07:16 187观看
导读 2 月 27 日消息,在 DeepSeek 开源周第四日,摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe,并发布相关开源代码仓库:MT-DeepEP 和 MT-DualPipe。据介绍,DeepEP 是一个用于 MoE(混合专家)模

2 月 27 日消息,在 DeepSeek 开源周第四日,摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe,并发布相关开源代码仓库:MT-DeepEP 和 MT-DualPipe。3zj28资讯网——每日最新资讯28at.com

3zj28资讯网——每日最新资讯28at.com

据介绍,DeepEP 是一个用于 MoE(混合专家)模型训练和推理的开源 EP(expert parallelism,专家并行)通信库,主要适用于大模型训练,特别是需要 EP 的集群训练。它通过优化通信信道的使用率,提升了训练效率。摩尔线程基于 MUSA Compute Capability 3.1 全功能 GPU 适配了 DeepEP,并支持以下特性:3zj28资讯网——每日最新资讯28at.com

高效优化的 All-to-All 通信,支持 dispatch & combine3zj28资讯网——每日最新资讯28at.com

支持 MTLink + GPU(MUSA Compute Capability 3.1)节点内通信3zj28资讯网——每日最新资讯28at.com

训练及推理预填充阶段的高吞吐量计算核心3zj28资讯网——每日最新资讯28at.com

推理解码阶段的低延迟计算核心3zj28资讯网——每日最新资讯28at.com

原生支持 FP8 数据分发3zj28资讯网——每日最新资讯28at.com

灵活控制 GPU 资源,实现计算与通信的高效重叠3zj28资讯网——每日最新资讯28at.com

DualPipe 是 DeepSeek-V3 提出的双向流水线并行算法,通过前向计算与后向计算阶段的计算与通信完全重叠,减少了“流水线气泡”(设备空闲等待)。摩尔线程依托深度学习框架 Torch-MUSA(已开源)和 MUSA 软件栈全方位的兼容性,实现了对 DualPipe 这一算法的支持。3zj28资讯网——每日最新资讯28at.com

目前,MT-DualPipe 可以完整接入摩尔线程 MT-Megatron 框架和 MT-TransformerEngine 框架(即将开源),实现 DeepSeek V3 训练流程完整复现。此外,MT-DualPipe 结合 MT-Megatron 可实现完整 DeepSeek V3 模型 MLP-FFN 分离以及 DW-DG 分离,进一步降低气泡占比,优化通信效率。同时,MT-DualPipe 与 MT-TranformerEngine 和 MT-DeepEP 的结合,可利用 MT-DeepEP 和异步通信引擎实现更高效的通信掩盖,降低对计算资源损耗。3zj28资讯网——每日最新资讯28at.com

附 Torch-MUSA 开源地址如下:3zj28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/Torch_MUSA3zj28资讯网——每日最新资讯28at.com

相关阅读:3zj28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 4/5:DualPipe、EPLB 优化并行策略》3zj28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 3/5:深度学习利器 DeepGEMM》3zj28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP》3zj28资讯网——每日最新资讯28at.com

《DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA》3zj28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11260-0.html摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 腾讯混元新一代快思考模型 Turbo S 发布,支持“秒回”

下一篇: 地道表达 + 文化解读:谷歌翻译酝酿“追问”功能,打造你的专属 AI 外教

标签:
  • 热门焦点
  • 保时捷推出虚拟超跑,车企元宇宙营销这么香?

    保时捷又出超跑了,不过这次不是在现实世界,而是在虚拟世界。这款Vision Gran Turismo概念车,由保时捷和日本视频游戏开发工作室Polyphony Digital联合打造,将于202
  • 星展银行(DBS)计划推出零售数字资产交易服务

    2月14日消息,新加坡星展银行CEO Piyush Gupta在财报会议上表示,计划于2022年年底前推出零售数字资产交易服务。据悉,DBS于2021年初开设了机构数字资产交易平台,全
  • 元宇宙是推动NFT发展的初始家园

    现在大家都知道了什么是NFT,但好像离自己的生活还有一定距离。随着我们与NFT 接触增加,该如何将这些数字资产带入我们的日常生活?NFT还是主流吗?如果我们将“主流
  • 全面拥抱“虚拟世界”,摩登天空要打造“音乐元宇宙”

    作者:袁佳琦沈黎晖不怎么打游戏,但许多事儿在他眼里都“有意思”。好玩,有意思,是他的口头禅,在接受娱乐独角兽的采访过程中,他多次提到,做虚拟音乐人,“是件挺好玩的
  • 2022年元宇宙系列报告:UGC当道,XR带来新交互体验

    UGC作为元宇宙的主要内容创作模式,已经越来越多的呈现于游戏、娱乐、社交、传媒等方面,UGC模式勾勒了元宇宙的边界,现今元宇宙UGC模式的主要呈现方式以元宇宙概念
  • 大厂打造元宇宙平台的业务重心是什么?

    知名市场研究机构IDC发布《2022年中国元宇宙市场十大预测》报告,其中提出互联网大厂各自独立布局元宇宙平台。事实上,在2021年的最后一个季度,包括Meta、英伟达、
  • MR——元宇宙平台的下一代入口

    作为“元宇宙”的领头羊,Meta的一举一动都受到业内的高度关注。华尔街见闻提及,2月17日周四,Facebook母公司Meta在透露,其混合现实技术(MR)将在几年后实现,让人们对元
  • 超级账本Julian Gordon:联盟链与公链的竞争不是非此即彼

    在2021年《福布斯》区块链50强榜单中,29家企业使用Hyperledger超级账本技术,占比近60%。同年,研究机构Blockdata发布了的调查报告显示,访问Top100上市公司中,有 81
  • 虚拟人行业研究报告

    最早的虚拟人出现于 20 世纪 80 年代,受限于技术,当时的虚拟人制作以手绘为主。21 世纪初,随着动捕、渲染等技术的逐步发展,虚拟人相关技术开始在影视领域逐渐普及

相关资讯

    SQL Error: select * from ***_ecms_news11 where id in(108,64,90,,43,200) limit 6
Top