当前位置:首页 > 元宇宙 > AI

DeepSeek 开源进度 2 5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP

来源: 责编: 时间:2025-02-26 12:23:46 263观看
导读 2 月 25 日消息,DeepSeek 的“开源周”活动今日已经来到第二天,今天发布的是首个开源的用于 MoE 模型训练和推理的 EP 通信库 ——DeepEP。附开源地址:https://github.com/deepseek-ai/DeepEP官方表示其具备如下

2 月 25 日消息,DeepSeek 的“开源周”活动今日已经来到第二天,今天发布的是首个开源的用于 MoE 模型训练和推理的 EP 通信库 ——DeepEP。G3X28资讯网——每日最新资讯28at.com

附开源地址:https://github.com/deepseek-ai/DeepEPG3X28资讯网——每日最新资讯28at.com

G3X28资讯网——每日最新资讯28at.com

官方表示其具备如下特征:G3X28资讯网——每日最新资讯28at.com

高效优化的全到全通信方式G3X28资讯网——每日最新资讯28at.com

支持节点内外通信,兼容 NVLink 和 RDMA 技术G3X28资讯网——每日最新资讯28at.com

提供高吞吐量的内核,提升训练和推理前期填充效率G3X28资讯网——每日最新资讯28at.com

提供低延迟内核,优化推理解码速度G3X28资讯网——每日最新资讯28at.com

完全支持 FP8 数据格式调度G3X28资讯网——每日最新资讯28at.com

提供灵活的 GPU 资源管理,支持计算与通信的重叠执行G3X28资讯网——每日最新资讯28at.com

详细介绍的大意如下:G3X28资讯网——每日最新资讯28at.com

DeepEP 是一款专为混合专家(MoE)和专家并行(EP)设计的通信库,提供了高吞吐量和低延迟的 all-to-all GPU 内核,常用于 MoE 派发和合并操作。该库还支持低精度计算,包括 FP8。G3X28资讯网——每日最新资讯28at.com

为了与 DeepSeek-V3 论文中提出的组限制门控算法兼容,DeepEP 提供了一些针对不对称带宽转发优化的内核,比如将数据从 NVLink 域转发到 RDMA 域。这些优化的内核能够提供高吞吐量,适合用于训练和推理的预填充任务,同时支持 SM(流式多处理器)数量控制。G3X28资讯网——每日最新资讯28at.com

对于延迟敏感型的推理解码任务,DeepEP 提供了一套低延迟内核,采用纯 RDMA 技术以最大程度减少延迟。此外,该库还采用了一种基于 Hook 的通信与计算重叠方法,不会占用任何 SM 资源。G3X28资讯网——每日最新资讯28at.com

需求:G3X28资讯网——每日最新资讯28at.com

Hopper GPUs (may support more architectures or devices later)G3X28资讯网——每日最新资讯28at.com

Python 3.8 及以上版本G3X28资讯网——每日最新资讯28at.com

CUDA 12.3 及以上版本G3X28资讯网——每日最新资讯28at.com

PyTorch 2.1 及以上版本G3X28资讯网——每日最新资讯28at.com

使用 NVLink 进行节点间通信G3X28资讯网——每日最新资讯28at.com

基于 RDMA 网络的节点间通信G3X28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11125-0.htmlDeepSeek 开源进度 2 5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 上海明星 AI 公司“澜码科技”曝“员工停薪社保停缴”,创始人周健回应称“借钱卖房补偿,正寻求被并购的可能性”

下一篇: 阿里 Qwen Chat 平台上线“深度思考”功能:基于 QwQ-Max-Preview 推理模型,支持联网搜索

标签:
  • 热门焦点
  • 人间诚实周鸿祎:360 All in 大模型的六个解读

    主笔 / 村口有牛文章架构师 / 毛自聪出品 / 巨头财经5月至今,人间躁动,各路大模型你方唱罢我登场,VC圈互联网圈媒体圈已近癫狂。谁也没想到,今日,360再度刷屏,老牌互联网巨头展现
  • 避坑指南:远离具有这些特性的NFT

    关于NFT,在我们的文章中一直以来都是常驻嘉宾,不止因为NFT背后隐藏的潜力,更因为在这个NFT世界里冥冥之中仿佛有一双幕后的手,OpenSea、库里、ERC115、视觉中国、
  • 星展银行(DBS)计划推出零售数字资产交易服务

    2月14日消息,新加坡星展银行CEO Piyush Gupta在财报会议上表示,计划于2022年年底前推出零售数字资产交易服务。据悉,DBS于2021年初开设了机构数字资产交易平台,全
  • “我没搞懂元宇宙,但一天能赚9w块”

    作者:郑宇轩最近几个月,“元宇宙”爆火,除了 Facebook 改名为 Meta 高调进军元宇宙外, BAT 为代表的大厂纷纷着手“元宇宙”新业务。刹那之间,元宇宙成为新风口,除了
  • 虚拟数字人:元宇宙的主角破圈而来

    虚拟数字人市场逐步进入成熟期,商业化进程加速。1982年世界第一位虚拟歌姬林明美诞生,虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破,制
  • 如何在元宇宙中建立品牌忠诚度

    Snoop Dogg、耐克、苏富比和普华永道都有什么共同点?他们都投资于元宇宙的房地产。除了我们在屏幕上看到的二维世界--手机、笔记本电脑、台式机或iPad--他们决
  • 头像类NFTs的统治能持续多久?

    在过去的一两年里,NFTs在互联网世界中掀起了一场风暴。今天,当我们想到NFTs时,我们主要想到的是那些充斥着我们的社交媒体屏幕的数字卡通--无聊猿、punks 和介于
  • PayPal CEO 的加密语录:加密货币将重新定义金融世界

    PayPal 近年来一直是加密行业的倡导者。这个本身拥有超过 3.5 亿名活跃用户的支付巨头,已经允许美国和英国的用户交易或持有比特币(BTC)、以太坊(ETH)、比特现金(BCH
  • 虚拟偶像行业的商用价值逐渐凸显,IP生态圈也逐渐成型

    六月的第一个周六,一场虚拟偶像七海Nana7mi的个人3D演唱会在万代南梦宫上海文化中心举行,相较于洛天依、百大UP主泠鸢yousa等,这位虚拟Up主在B站上的粉丝数43.6万
Top