当前位置:首页 > 元宇宙 > AI

DeepSeek 开源进度 5 5:高性能并行文件系统 3FS 实现聚合吞吐 6.6 TiB s

来源: 责编: 时间:2025-03-03 11:55:06 212观看
导读 2 月 28 日消息,DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File System),这是一个专为充分利用现代 SSD 和 RDMA 网络带宽而设计的并行文件系统,具备惊人的数据访问性能,为深度学习等数据密集型应用提供了强大

2 月 28 日消息,DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File System),这是一个专为充分利用现代 SSD 和 RDMA 网络带宽而设计的并行文件系统,具备惊人的数据访问性能,为深度学习等数据密集型应用提供了强大的支持。pkF28资讯网——每日最新资讯28at.com

附上开源地址:https://github.com/deepseek-ai/3FS。pkF28资讯网——每日最新资讯28at.com

基于 3FS 的数据处理框架 Smallpond:https://github.com/deepseek-ai/smallpond。pkF28资讯网——每日最新资讯28at.com

pkF28资讯网——每日最新资讯28at.com

3FS 性能亮点

集群高吞吐: 在 180 节点集群中,3FS 实现了高达 6.6 TiB/s 的聚合读取吞吐量。pkF28资讯网——每日最新资讯28at.com

基准测试优异: 在 25 节点集群的 GraySort 基准测试中,3FS 达到了 3.66 TiB / min 的吞吐量。pkF28资讯网——每日最新资讯28at.com

单节点高性能: 每个客户端节点的 KVCache 查找峰值吞吐量超过 40 GiB/s。pkF28资讯网——每日最新资讯28at.com

架构先进: 3FS 采用去中心化架构,并具备强一致性语义。pkF28资讯网——每日最新资讯28at.com

3FS 应用场景

3FS (Fire-Flyer File System) 是一款高性能的分布式文件系统,旨在解决 AI 训练和推理工作负载带来的挑战,利用现代 SSD 和 RDMA 网络提供共享存储层,简化分布式应用程序的开发。pkF28资讯网——每日最新资讯28at.com

其核心优势在于高性能、强一致性和易用性,能够有效支持各种 AI 工作负载,包括数据准备、数据加载、检查点设置和推理缓存。pkF28资讯网——每日最新资讯28at.com

3FS 在 DeepSeek 的 V3 / R1 版本中得到广泛应用,涵盖了训练数据预处理、数据集加载、检查点保存 / 重新加载、嵌入向量搜索以及推理过程中的 KVCache 查找等关键环节。pkF28资讯网——每日最新资讯28at.com

Smallpond

此外,DeepSeek 还开源了基于 3FS 的数据处理框架 Smallpond,是一款构建于 DuckDB 和 3FS 之上的轻量级数据处理框架。它拥有高性能数据处理能力,可扩展至 PB 级数据集,并且操作简便,无需长期运行的服务。pkF28资讯网——每日最新资讯28at.com

相关阅读:pkF28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 4/5:DualPipe、EPLB 优化并行策略》pkF28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 3/5:深度学习利器 DeepGEMM》pkF28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP》pkF28资讯网——每日最新资讯28at.com

《DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA》pkF28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11301-0.htmlDeepSeek 开源进度 5 5:高性能并行文件系统 3FS 实现聚合吞吐 6.6 TiB s

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 奥尔特曼坦诚 OpenAI 急缺 GPU,GPT-4.5 只能分阶段推出

下一篇: 盒马X会员店大调整,上海三店将关,全国仅剩五家门店运营

标签:
  • 热门焦点
  • 花房集团上市,走向元宇宙新征程

    文 | 港股研究社作者 | 熊生12月12日,花房集团在港交所成功上市,首日便受到追捧,当日最高涨幅达28.75%。继360、360数科、鲁大师后,这是“红衣教主”周
  • “任何国产元宇宙都是假元宇宙”

    上个月,华语乐坛的优质偶像之一,DOTA2资深玩家林俊杰,在国外元宇宙产品分布式大陆(Decentraland)上买了三块虚拟地产,花了12.3万美元(也就是人民币接近80万)。截至目
  • 现在的元宇宙:一款低配版的科幻游戏

    在2021年的岁末之际,不禁感叹元宇宙元年之热闹,从元宇宙NFT头像,到元宇宙数字地产,再到元宇宙旅游景区等等,仿佛科幻感十足的元宇宙眨眼间就从人们的概念认知中完全
  • 餐桌上怎么变出元宇宙?

    作者:星影“元宇宙让餐饮业脱胎换骨。”实体的餐饮与虚拟的元宇宙,看起来风马牛不相及,但最近全世界的餐饮企业都掀起了一股注册元宇宙商标的热潮。2月初,全球最大
  • 元宇宙社交时代,华丽归来的超级QQ秀重构虚拟社交场景

    作者:狂人 不知不觉间,QQ已经迎来了第23个生日。作为国内社交平台的起点,QQ可谓是睥睨全网,不仅有庞大的用户群体,还将虚拟形象及QQ整合成在线虚拟社区,开启了时髦
  • 用户可以把自己的医疗健康数据做成NFT出售给医药公司挣钱

    你可能听说过不可伪造的代币,或NFTs。NFTs是数字代币,代表完全独特的项目的所有权;存储在区块链中并可追踪,它们不能被修改、替换或复制。作为NFT铸造的资产在数字
  • 从4个方面解析2022年加密行业趋势

    作者:去月球基础设施瓶颈仍然存在尽管2021年公链基础设施之间的竞争显著升温,但关键瓶颈仍需解决。例如,以太坊作为DApp开发的顶级公链,仍然遭受网络拥塞和高额交
  • 以太坊面临来自Fantom的巨大挑战

    众所周知,区块链和加密货币项目经常因其对环境的影响而受到批评。但是有一个非营利性的加密货币和区块链项目说它比其他的更环保。今天老雅痞就给大家聊一聊加
  • 这场虚拟发布会,当面“造假”!

    英伟达去年4月份那场发布会,你曾看出什么不对劲的地方吗?你品,你细品——在计算机图形学顶会SIGGRAPH 2021上,英伟达通过一部纪录片自曝:那场发布会内藏玄机~你看到
Top