当前位置：首页 > 科技 > 芯片

S-LoRA技术：减轻企业LLM部署负担

来源：责编：时间：2023-12-06 09:20:13 242观看

导读随着人工智能的快速发展，大型语言模型（LLM）在商业领域的应用越来越广泛。然而，传统的微调方法往往需要耗费大量的运算资源和成本，这对于资源有限的企业来说是一个巨大的阻碍。为了解决这个问题，史丹佛大学和加州大学柏克莱

随着人工智能的快速发展，大型语言模型（LLM）在商业领域的应用越来越广泛。然而，传统的微调方法往往需要耗费大量的运算资源和成本，这对于资源有限的企业来说是一个巨大的阻碍。

为了解决这个问题，史丹佛大学和加州大学柏克莱分校（UC Berkeley）的研究团队共同开发了一种名为S-LoRA的创新技术，该技术可以大幅降低微调LLM的成本，让企业能够在单一图形处理单元（GPU）上运行数百个甚至数千个模型。

传统上，微调LLM需要使用新的范例，重新训练预训练模型并调整所有参数。然而，LLM通常拥有数十亿个参数，因此需要大量的运算资源。S-LoRA技术通过参数高效微调法（PEFT）解决了这个问题。

LoRA是一种由微软开发的低端适应款模型，它可以降低可训练参数的数量，同时维持准确度，从而大幅减少定制化模型所需的存储器和运算资源。S-LoRA则拥有动态存储器管理系统，可以在主存储器（RAM）和GPU之间灵活切换LoRA适配器。

S-LoRA系统还引入了“统一分页”（Unified Paging），让服务器能够处理数百个甚至数千个批量的查询，而不会出现存储器碎片化问题。此外，S-LoRA还整合了“张量平行系统”（Tensor parallelism）。

这些特点使得S-LoRA能够在单一GPU或多个GPU上服务许多LoRA适配器。最显著的成就是，S-LoRA能够同时服务2,000个适配器。

目前，S-LoRA的程序码已经公布在GitHub上。研究人员计划将其整合到当今流行的LLM服务架构中，这样企业就可以轻松地将S-LoRA融入自家应用程序，以最小的成本享受定制化的LLM驱动服务。

本文链接：http://www.28at.com/showinfo-27-38475-0.htmlS-LoRA技术：减轻企业LLM部署负担

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：索尼计划为PlayStation Portal增加云端串流功能

下一篇：罗姆与Quanmatic公司利用量子技术优化制造工序并完成验证

标签：

热门焦点

对标苹果的灵动岛华为带来实况窗功能

继苹果的灵动岛之后，华为也在今天正式推出了“实况窗”功能。据今天鸿蒙OS 4.0的现场演示显示，华为的实况窗可以更高效的展现出实时通知，比如锁屏上就能看到外卖、打车、银行
2023 年的 Node.js 生态系统

随着技术的不断演进和创新，Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统，可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
得物效率前端微应用推进过程与思考

一、背景效率工程随着业务的发展，组织规模的扩大，越来越多的企业开始意识到协作效率对于企业团队的重要性，甚至是决定其在某个行业竞争中突围的关键，是企业长久生存的根本。得物
多线程开发带来的问题与解决方法

使用多线程主要会带来以下几个问题：（一）线程安全问题　　线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间，该数据被其他的线程所修改，那么对于当前线程而言，该线程
认真聊聊东方甄选：如何告别低垂的果实

来源：山核桃作者：财经无忌爆火一年后，俞敏洪和他的东方甄选依旧是颇受外界关心的“网红”。7月5日至9日，为期5天的东方甄选“甘肃行”首次在自有App内直播，
半导体需求下滑三星电子DS业务部门今年营业亏损预计超10万亿韩元

7月17日消息，据外媒报道，去年下半年开始的半导体需求下滑，影响到了三星电子、SK海力士、英特尔等诸多厂商，营收明显下滑，部分厂商甚至出现了亏损。作为
iQOO Neo8 Pro即将开售：到手价3099元起安卓性能最强旗舰

5月23日，iQOO如期举行了新品发布会，全新的iQOO Neo8系列也正式与大家见面，包含iQOO Neo8和iQOO Neo8 Pro两个版本，其中标准版搭载高通骁龙8+，而Pro版更
Android 14发布：首批适配机型公布

5月11日消息，谷歌在今天凌晨举行了I/O大会，本次发布会谷歌带来了自家的AI语言模型PaLM 2、谷歌Pixel Fold折叠屏、谷歌Pixel 7a手机，同时发布了Androi
“买真退假” 这种“羊毛”不能薅

□ 法治日报记者王春　　□ 本报通讯员胡佳丽　　2020年初，还在上大学的小东加入了一个大学生兼职QQ群。群主“七王”在群里介绍一些刷单赚

S-LoRA技术：减轻企业LLM部署负担

对标苹果的灵动岛华为带来实况窗功能

2023 年的 Node.js 生态系统

得物效率前端微应用推进过程与思考

多线程开发带来的问题与解决方法

认真聊聊东方甄选：如何告别低垂的果实

半导体需求下滑三星电子DS业务部门今年营业亏损预计超10万亿韩元

iQOO Neo8 Pro即将开售：到手价3099元起安卓性能最强旗舰

Android 14发布：首批适配机型公布

“买真退假” 这种“羊毛”不能薅

最新推荐

猜你喜欢

热门推荐

相关资讯