当前位置:首页 > 科技  > 软件

焱融存储 YRCloudFile 发布面向 AI 推理的分布式 KV Cache 特性

来源: 责编: 时间:2025-03-19 09:41:27 147观看
导读 AI 存储厂商焱融科技宣布,其自主研发的分布式文件存储系统YRCloudFile已成功支持大模型推理场景的 KV Cache 特性,为 AI 推理带来显著价值提升。 KV Cache 通过高效缓存机制加速数据读取,显著提升推理性能,

nPO28资讯网——每日最新资讯28at.com

AI 存储厂商焱融科技宣布,其自主研发的分布式文件存储系统YRCloudFile已成功支持大模型推理场景的 KV Cache 特性,为 AI 推理带来显著价值提升。nPO28资讯网——每日最新资讯28at.com

KV Cache 通过高效缓存机制加速数据读取,显著提升推理性能,突破 GPU 显存瓶颈,大幅提升推理 GPU 效率和并发处理能力。这意味着用户可以在不增加 GPU 资源的情况下,实现更高并发的推理请求,大幅降低 GPU 资源消耗与投入成本。同时,它还能够降低推理的首个 Token 耗时和 Token 间耗时延时,提升用户使用体验。nPO28资讯网——每日最新资讯28at.com

此外,焱融科技实现了DeepSeek级架构,构建与DeepSeek一致的推理场景存算参考架构。用户在使用支持 KV Cache 的焱融存储时,能够享受到与DeepSeek同等架构带来的优质体验。在相同规模和推理速度下,焱融存储支持更长的上下文处理和更多查询请求,为大模型推理提供更优的性价比。nPO28资讯网——每日最新资讯28at.com

焱融存储支持 KV Cache 技术新优势nPO28资讯网——每日最新资讯28at.com

优势一|焱融 AI 推理存储优化实时交互性能nPO28资讯网——每日最新资讯28at.com

在实时交互场景中,用户对 AI 服务的响应速度要求极高。焱融存储 KV Cache 技术,大幅缩短大模型推理的首个 Token 耗时(Time To First Token)和 Token 间耗时(Time Between Token),显著提升复杂场景的响应效率。该方案采用 NVMe SSD 加速与高性能网络,实现微秒级推理延迟,提升 Token 处理速度,减少资源占用,支持更多并发访问,优化业务成本。同时,通过 GPUDirect Storage 与 RDMA 网络的结合进一步优化数据传输效率,提升用户体验。nPO28资讯网——每日最新资讯28at.com

优势二|显存资源动态优化与推理加速nPO28资讯网——每日最新资讯28at.com

焱融存储 KV Cache 技术,突破显存容量对上下文长度的限制,实现 GPU 资源动态调度,提升单卡并发推理能力。这意味着用户可以在不增加 GPU 资源的情况下,实现更高并发的推理请求,大幅降低 GPU 资源消耗与投入成本。目前,该技术已应用于多模态大模型、实时交互等高算力需求场景,为 AGI 时代规模化 AI 落地提供高性价比的算力底座。nPO28资讯网——每日最新资讯28at.com

优势三|DeepSeek级架构体验nPO28资讯网——每日最新资讯28at.com

针对当前企业广泛采用的 DeepSeek 等主流大模型,焱融存储 KV Cache 技术进一步降低企业使用成本的同时,提升推理场景下的响应效率。可灵活适配从百亿级参数模型到万亿级 MoE 混合专家模型,满足政务、金融等高安全要求场景的数据本地化需求,同时支持国产与海外芯片的异构算力环境,为企业提供自主可控的技术路径。nPO28资讯网——每日最新资讯28at.com

此次技术突破正值国内企业 AI 私有化部署浪潮,焱融科技以存储技术创新推动算力资源的高效利用,为 AI 规模化应用提供了关键基础设施支撑。随着多模态与实时交互场景的普及,存储与计算的协同优化,KVCache“以存换算”将成为企业降本增效的核心竞争力。nPO28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-137834-0.html焱融存储 YRCloudFile 发布面向 AI 推理的分布式 KV Cache 特性

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 大尺寸面板需求向好,TCL 科技收购乐金显示股权完成工商变更

下一篇: 宏碁 AIPC Yes!多款产品亮相 AMD AIPC 创新峰会

标签:
  • 热门焦点
  • 影音体验是真的强 简单聊聊iQOO Pad

    大公司的好处就是产品线丰富,非常细分化的东西也能给你做出来,例如早先我们看到了新的vivo Pad2,之后我们又在iQOO Neo8 Pro的发布会上看到了iQOO的首款平板产品iQOO Pad。虽
  • 2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • 从零到英雄:高并发与性能优化的神奇之旅

    作者 | 波哥审校 | 重楼作为公司的架构师或者程序员,你是否曾经为公司的系统在面对高并发和性能瓶颈时感到手足无措或者焦头烂额呢?笔者在出道那会为此是吃尽了苦头的,不过也得
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人员可能会涉及各种各样的安全任务,包括但不限于:开发某些安全工具的插件,满足自己特定的安全需求;自定义github搜索工具,快速查找所需的安全资料、漏洞poc、exp
  • 一条抖音4亿人围观 ! 这家MCN比无忧传媒还野

    作者:Hiu 来源:互联网品牌官01 擦边少女空降热搜,幕后推手曝光被网友誉为“纯欲天花板”的女网红井川里予,近期因为一组哥特风照片登上热搜,引发了一场互联网世界关于
  • 造车两年股价跌六成,小米的估值逻辑变了吗?

    如果从小米官宣造车后的首个交易日起持有小米集团的股票,那么截至2023年上半年最后一个交易日,投资者将浮亏59.16%,同区间的恒生科技指数跌幅为52.78%
  • 苹果公司要求三星和LG Display生产「无边框」OLED iPhone显示屏

    据 The Elec 报道,苹果已要求其供应商为未来的 iPhone 型号开发「无边框」OLED 显示面板。苹果显然已要求三星和 LG Display 开发新的 OLED 显示面
  • 苹果MacBook Pro 2021测试:仍不支持平滑滚动

    据10月30日9to5 Mac 消息报道,苹果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后获得了不错的评价,亮点包括行业领先的性能,令人印象深刻的电池续航,精美丰
  • 上海举办人工智能大会活动,建设人工智能新高地

    人工智能大会在上海浦江两岸隆重拉开帷幕,人工智能新技术、新产品、新应用、新理念集中亮相。8月30日晚,作为大会的特色活动之一的上海人工智能发展盛典人工
Top