当前位置:首页 > 科技  > 资讯

大模型开启新赛季,腾讯云存储升级:已有80%头部厂商采用

来源: 责编: 时间:2024-04-09 09:01:29 294观看
导读 图源:腾讯云官方 过去一年,大模型搅动全球科技圈。2024年初,Sora、Kimi等应用产品爆火,大模型迎来新一轮狂欢。时代财经从腾讯云获悉,数据存储约占大模型训练整体工程量的20%-30%

图源:腾讯云官方NDW28资讯网——每日最新资讯28at.com

过去一年,大模型搅动全球科技圈。2024年初,Sora、Kimi等应用产品爆火,大模型迎来新一轮狂欢。NDW28资讯网——每日最新资讯28at.com

时代财经从腾讯云获悉,数据存储约占大模型训练整体工程量的20%-30%。AIGC相关应用持续爆发,数据存储的重要性正在逐渐凸显。NDW28资讯网——每日最新资讯28at.com

“训练数据是大模型云存储的重要步骤,云存储系统需要能够快速响应数据读写请求,提供低延迟、高吞吐量的存储服务。还要具备可扩容性和暂存能力,比如训练出现突发情况后,能在原有基础上重启继续训练。”某云厂商行业人员向时代财经表示。NDW28资讯网——每日最新资讯28at.com

4月8日,腾讯云宣布云存储解决方案面向AIGC场景全面升级,能够针对AI大模型数据采集清洗、训练、推理、数据治理全流程提供全面、高效的云存储支持。数据显示,采用腾讯云AIGC云存储解决方案,可将大模型的数据清洗和训练效率均提升一倍,需要的时间缩短一半。NDW28资讯网——每日最新资讯28at.com

AI大模型的研发生产流程主要分成数据采集与清洗、模型训练、推理三大环节,各环节都涉及海量的数据处理。在数据采集与清洗环节,由于原始训练数据规模海量,且来源多样,对存储技术提出了多协议支持、高性能、大带宽的需求。NDW28资讯网——每日最新资讯28at.com

腾讯云对象存储COS支持单集群管理百 EB 级别存储规模,提供便捷、高效的数据公网接入能力,并支持多种协议,充分支持大模型PB级别的海量数据采集。NDW28资讯网——每日最新资讯28at.com

在数据清洗环节,大数据引擎需要快速地读取并过滤出有效数据,COS通过自研数据加速器GooseFS提升数据访问性能,可实现高达数TBps的读取带宽,支撑计算高速运行,大大提升数据清洗效率。NDW28资讯网——每日最新资讯28at.com

在模型训练环节,通常需要每2-4小时保存一次训练成果,以便能在GPU故障时时能回滚,因此快速地读写checkpoint(检查点)文件也成了能否高效利用算力资源、提高训练效率的关键。NDW28资讯网——每日最新资讯28at.com

腾讯云自主研发并行文件存储CFS Turbo ,面向AIGC训练场景的进行了专门优化,每秒总读写吞吐达到TiB/s级别,每秒元数据性能高达百万OPS,均为业界第一。3TB checkpoint 写入时间从10分钟,缩短至10秒内,使大模型训练效率大幅提升。NDW28资讯网——每日最新资讯28at.com

大模型推理场景对数据安全与可追溯性提出更高要求。腾讯云数据万象CI为此提供图片隐式水印、AIGC内容审核、智能数据检索MetaInsight等能力,为数据生产从“用户输入——预处理——内容审核——版权保护——安全分发——信息检索”业务全流程提供有力支撑,优化AIGC内容生产与管理模式,顺应监管导向,拓宽存储边界。NDW28资讯网——每日最新资讯28at.com

同时,随着训练数据和推理数据的增长,需要提供低成本的存储能力,减少存储开销。对象存储服务提供了高达 12 个 9 的数据持久性和 99.995% 的数据可用性,能够为业务提供持续可用的存储服务。NDW28资讯网——每日最新资讯28at.com

在此之前,腾讯云已经面向AIGC场景推出了基于星脉网络的大模型训练集群HCC、向量数据库、以及行业大模型服务MaaS等大模型全链路云服务。NDW28资讯网——每日最新资讯28at.com

“稳定性、性能、性价比是大模型时代云存储的核心。”腾讯云智能存储总监叶嘉梁说道,他认为,腾讯云存储未来要做的是把数据的价值开放给客户,让客户能有效地利用好数据。NDW28资讯网——每日最新资讯28at.com

据今年1月国际调研机构沙利文联合头豹研究院发布的《2023年中国云存储解决方案》报告,腾讯云存储位居国内厂商第一位,获增长指数和创新指数双第一,入选中国云存储解决方案市场“领导者”阵营。NDW28资讯网——每日最新资讯28at.com

时代财经从腾讯方面获悉,目前已有80%的头部大模型企业选择腾讯云AIGC云存储解决方案,包括百川智能、智谱、元象等明星大模型企业。NDW28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-82076-0.html大模型开启新赛季,腾讯云存储升级:已有80%头部厂商采用

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 腾讯文档调整策略:新建在线文档将占用个人存储空间

下一篇: 小米要求智己汽车就标注小米SU 7错误参数公开道歉

标签:
  • 热门焦点
  • 十个可以手动编写的 JavaScript 数组 API

    JavaScript 中有很多API,使用得当,会很方便,省力不少。 你知道它的原理吗? 今天这篇文章,我们将对它们进行一次小总结。现在开始吧。1.forEach()forEach()用于遍历数组接收一参
  • 如何通过Python线程池实现异步编程?

    线程池的概念和基本原理线程池是一种并发处理机制,它可以在程序启动时创建一组线程,并将它们置于等待任务的状态。当任务到达时,线程池中的某个线程会被唤醒并执行任务,执行完任
  • 在线图片编辑器,支持PSD解析、AI抠图等

    自从我上次分享一个人开发仿造稿定设计的图片编辑器到现在,不知不觉已过去一年时间了,期间我经历了裁员失业、面试找工作碰壁,寒冬下一直没有很好地履行计划.....这些就放在日
  • 一文搞定Java NIO,以及各种奇葩流

    大家好,我是哪吒。很多朋友问我,如何才能学好IO流,对各种流的概念,云里雾里的,不求甚解。用到的时候,现百度,功能虽然实现了,但是为什么用这个?不知道。更别说效率问题了~下次再遇到,
  • 电视息屏休眠仍有网络上传 爱奇艺被质疑“薅消费者羊毛”

    记者丨宁晓敏 见习生丨汗青出品丨鳌头财经(theSankei) 前不久,爱奇艺发布了一份亮眼的一季报,不仅营收和会员营收创造历史最佳表现,其运营利润也连续6个月实现增长。自去年年初
  • 2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 荣耀Magic4 至臻版 首创智慧隐私通话 强劲影音系统

    2022年第一季度临近尾声,在该季度内,许多品牌陆续发布自己的最新产品,让大家从全新的角度来了解当今的手机技术。手机是电子设备中,更新迭代十分迅速的一款产品,基
Top