当前位置:首页 > 科技  > 软件

开源高性能文件系统 3FS,DeepSeek 为何自研存储?

来源: 责编: 时间:2025-03-03 11:54:53 183观看
导读 这两天 DeepSeek 开源 3FS 并行文件系统的消息,犹如向 AI 基础设施领域投下一枚深水炸弹。3FS 每秒能搬运 6.6TB 数据,相当于 1 秒钟传输完 700 部 4K 高清电影。还能自动调资源,国产芯片用了它,跟国际大牌的差距

这两天 DeepSeek 开源 3FS 并行文件系统的消息,犹如向 AI 基础设施领域投下一枚深水炸弹。3FS 每秒能搬运 6.6TB 数据,相当于 1 秒钟传输完 700 部 4K 高清电影。还能自动调资源,国产芯片用了它,跟国际大牌的差距直接缩到 15%。nFl28资讯网——每日最新资讯28at.com

这并非简单的技术迭代 —— 当 Llama3 70B 模型单次训练需吞掉 15PB 数据(相当于连续播放 250 万小时 4K 视频)时,全球 AI 实验室突然意识到:决定大模型训练效率的不仅是 GPU 算力,存储系统正成为影响进度的一大瓶颈。nFl28资讯网——每日最新资讯28at.com

当 AI 算力狂飙时,存储正在成为隐形战场nFl28资讯网——每日最新资讯28at.com

2024 年,某头部 AI 公司曾因存储带宽不足,导致 2000 张 A100 显卡的算力利用率长期低于 40%,单日经济损失超百万美元。这暴露了 AI 时代的 "木桶效应"—— 当 GPU 计算速度进入微秒级时,一次突发的存储抖动就可能导致整个训练任务崩溃,让数周的计算成果瞬间蒸发。这或许也是 DeepSeek 自研存储的原因。nFl28资讯网——每日最新资讯28at.com

数据显示,存储优化可直接将 175B 参数模型的训练周期压缩 30%,对应百万美元级的成本被填平。而在推理端,当 10% 的异常请求遭遇存储延迟波动时,P99 响应时间会瞬间突破 SLA 红线,这正是某自动驾驶公司在线服务突发降级的根本诱因。nFl28资讯网——每日最新资讯28at.com

DeepSeek 之所以选择自研 3FS 的本质,正是发现了存储架构在 AI 应用中的重要性。《金融行业先进 AI 存力报告》》报告中提到,在同样的 GPU 算力规模下,存储性能的高低可能造成模型训练周期 3 倍的差异。在算力军备竞赛的背后,一场关于存储性能密度的暗战悄然升级,自研存储显得尤为重要。nFl28资讯网——每日最新资讯28at.com

5 家头部厂商角逐 AI 存储,国产能否拔得头筹nFl28资讯网——每日最新资讯28at.com

相比于传统 AI 的需求,大模型对存力需求场景具有数据量大、参数规模大、训练周期长等特点。nFl28资讯网——每日最新资讯28at.com

为了提升大模型训练速度,需要对大规模数据集进行快速加载,且一般采用数百甚至上万张 GPU 构成计算集群进行高效的并行计算,需要高并发输入 / 输出(I/O)处理,而训练数据集呈现海量小文件的特点,文件量在几亿到几十亿量级,对应的带宽需求可能每秒要达到上 TB,这就要求存储系统具备强大的数据管理能力,业界能达到该能力的仅寥寥几家。nFl28资讯网——每日最新资讯28at.com

小编搜集了国内外优秀的并行存储产品,对具体能力进行对比nFl28资讯网——每日最新资讯28at.com

nFl28资讯网——每日最新资讯28at.com

IBM 作为老牌存储品牌,其产品从 HPC 场景成功向 AI 场景演进。在全球 AI 场景得到广泛应用的 DDN,多个读、写带宽等关键性能指标上表现突出,但 DDN 由于技术封闭性、专有化硬件等原因,导致用户建设成本过高。nFl28资讯网——每日最新资讯28at.com

国产厂商 DeepSeek 3FS 虽然是开源的新产品,但相对老牌存储也有不错的表现,在读带宽能力上表现优异,单集群 6.6TB/s,平均单节点 36.7GB/s 的读带宽。nFl28资讯网——每日最新资讯28at.com

我们还惊喜发现,另一家国产厂商京东云云海,在这个专业领域同样表现出色,以单节点 95GB/s 的读带宽、60GB/s 的写带宽,进一步拉低了国产存储与国际老牌厂商的差距。相较于 DeepSeek 的 3FS,京东云云海在提供高性能的同时适用性更广,可以同时满足 DeepSeek、ChatGPT、LLaMA 等 20 余种主流大模型的存力需求。nFl28资讯网——每日最新资讯28at.com

综上来看,随着大模型快速向纵深场景演进,对存储的要求也越来越高,以 DeepSeek、京东云云海等国产存储,显示出在处理大规模数据集时的优越性能,未来国产存储能否拔得头筹,让我们拭目以待。nFl28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-135149-0.html开源高性能文件系统 3FS,DeepSeek 为何自研存储?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 抖音李亮:没有所谓“抖音会议”,这是仿冒诈骗

下一篇: 中兴通讯 2024 年报发布:转型成效显著,AI 布局向实发展

标签:
  • 热门焦点
  • 一加Ace2 Pro真机揭晓 钛空灰配色质感拉满

    终于,在经过了几波预热之后,一加Ace2 Pro的外观真机图在网上出现了。还是博主数码闲聊站曝光的,这次的外观设计还是延续了一加11的方案,只是细节上有了调整,例如新加入了钛空灰
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 多线程开发带来的问题与解决方法

    使用多线程主要会带来以下几个问题:(一)线程安全问题  线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间,该数据被其他的线程所修改,那么对于当前线程而言,该线程
  • 为什么你不应该使用Div作为可点击元素

    按钮是为任何网络应用程序提供交互性的最常见方式。但我们经常倾向于使用其他HTML元素,如 div span 等作为 clickable 元素。但通过这样做,我们错过了许多内置浏览器的功能。
  • 重估百度丨“晚熟”的百度云,能等到春天吗?

    ©自象限原创作者|程心排版|王喻可2016年7月13日,百度云计算战略发布会在北京举行,宣告着百度智能云的正式启程。彼时的会场座无虚席,甚至排队排到了门外,在场的所有人几乎都
  • 消费结构调整丨巨头低价博弈,拼多多还卷得动吗?

    来源:征探财经作者:陈香羽随着流量红利的退潮,电商的存量博弈越来越明显。曾经主攻中高端与品质的淘宝天猫、京东重拾“低价”口号。而过去与他们错位竞争的拼多多,靠
  • 华为HarmonyOS 4.0将于8月4日发布 或搭载AI大模型技术

    华为宣布HarmonyOS4.0将于8月4日正式发布。此前,华为已经针对开发者公布了HarmonyOS4.0,以便于开发者提前进行适配,也因此被曝光出了一些新系统的特性
  • iQOO Neo8 Pro抢先上架:首发天玑9200+ 安卓性能之王

    经过了一段时间的密集爆料,昨日iQOO官方如期对外宣布:将于5月23日推出全新的iQOO Neo8系列新品,官方称这是一款拥有旗舰级性能调校的作品。随着发布时
  • 联想的ThinkBook Plus下一版曝光,键盘旁边塞个平板

    ThinkBook Plus 是联想的一个特殊笔记本类别,它在封面放入了一块墨水屏,也给人留下了较为深刻的印象。据有人爆料,联想的下一款 ThinkBook Plus 可能更特殊,它
Top