当前位置:首页 > 科技  > 芯片

S-LoRA技术:减轻企业LLM部署负担

来源: 责编: 时间:2023-12-06 09:20:13 431观看
导读随着人工智能的快速发展,大型语言模型(LLM)在商业领域的应用越来越广泛。然而,传统的微调方法往往需要耗费大量的运算资源和成本,这对于资源有限的企业来说是一个巨大的阻碍。为了解决这个问题,史丹佛大学和加州大学柏克莱

随着人工智能的快速发展,大型语言模型(LLM)在商业领域的应用越来越广泛。然而,传统的微调方法往往需要耗费大量的运算资源和成本,这对于资源有限的企业来说是一个巨大的阻碍。5j628资讯网——每日最新资讯28at.com


5j628资讯网——每日最新资讯28at.com

为了解决这个问题,史丹佛大学和加州大学柏克莱分校(UC Berkeley)的研究团队共同开发了一种名为S-LoRA的创新技术,该技术可以大幅降低微调LLM的成本,让企业能够在单一图形处理单元(GPU)上运行数百个甚至数千个模型。5j628资讯网——每日最新资讯28at.com


5j628资讯网——每日最新资讯28at.com

传统上,微调LLM需要使用新的范例,重新训练预训练模型并调整所有参数。然而,LLM通常拥有数十亿个参数,因此需要大量的运算资源。S-LoRA技术通过参数高效微调法(PEFT)解决了这个问题。5j628资讯网——每日最新资讯28at.com


5j628资讯网——每日最新资讯28at.com

LoRA是一种由微软开发的低端适应款模型,它可以降低可训练参数的数量,同时维持准确度,从而大幅减少定制化模型所需的存储器和运算资源。S-LoRA则拥有动态存储器管理系统,可以在主存储器(RAM)和GPU之间灵活切换LoRA适配器。5j628资讯网——每日最新资讯28at.com


5j628资讯网——每日最新资讯28at.com

S-LoRA系统还引入了“统一分页”(Unified Paging),让服务器能够处理数百个甚至数千个批量的查询,而不会出现存储器碎片化问题。此外,S-LoRA还整合了“张量平行系统”(Tensor parallelism)。5j628资讯网——每日最新资讯28at.com


5j628资讯网——每日最新资讯28at.com

这些特点使得S-LoRA能够在单一GPU或多个GPU上服务许多LoRA适配器。最显著的成就是,S-LoRA能够同时服务2,000个适配器。5j628资讯网——每日最新资讯28at.com


5j628资讯网——每日最新资讯28at.com

目前,S-LoRA的程序码已经公布在GitHub上。研究人员计划将其整合到当今流行的LLM服务架构中,这样企业就可以轻松地将S-LoRA融入自家应用程序,以最小的成本享受定制化的LLM驱动服务。5j628资讯网——每日最新资讯28at.com


5j628资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-27-38475-0.htmlS-LoRA技术:减轻企业LLM部署负担

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 索尼计划为PlayStation Portal增加云端串流功能

下一篇: 罗姆与Quanmatic公司利用量子技术优化制造工序并完成验证

标签:
  • 热门焦点
  • 一文看懂为苹果Vision Pro开发应用程序

    译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实(MR)头戴设备。Vision Pro结合了虚拟现实(VR)和增强现实(AR)的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
  • 三言两语说透设计模式的艺术-单例模式

    写在前面单例模式是一种常用的软件设计模式,它所创建的对象只有一个实例,且该实例易于被外界访问。单例对象由于只有一个实例,所以它可以方便地被系统中的其他对象共享,从而减少
  • 让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • 在线图片编辑器,支持PSD解析、AI抠图等

    自从我上次分享一个人开发仿造稿定设计的图片编辑器到现在,不知不觉已过去一年时间了,期间我经历了裁员失业、面试找工作碰壁,寒冬下一直没有很好地履行计划.....这些就放在日
  • 当家的盒马,加速谋生

    来源 | 价值星球Planet作者 | 归去来自己“当家”的盒马,开始加速谋生了。据盒马官微消息,盒马计划今年开放生鲜供应链,将其生鲜商品送往食堂。目前,盒马在上海已经与
  • 网红炒股不为了赚钱,那就是耍流氓!

    来源:首席商业评论6月26日高调宣布入市,网络名嘴大v胡锡进居然进军了股市。在一次财经媒体峰会上,几个财经圈媒体大佬就“胡锡进炒股是否知道认真报道”展开讨论。有
  • 微博大门常打开,迎接海外画师漂洋东渡

    作者:互联网那些事“起猛了,我能看得懂日语了”。“为什么日本人说话我能听懂?”“中文不像中文,日语不像日语,但是我竟然看懂了”…&hell
  • 华为HarmonyOS 4升级计划公布:首批34款机型今日开启公测

    8月4日消息,今天下午华为正式发布了HarmonyOS 4系统,在更流畅的前提下,还带来了不少新功能,UI设计也有变化,会让手机焕然一新。华为宣布,首批机型将会在
  • 滴滴违法违规被罚80.26亿 共存在16项违法事实

    滴滴违法违规被罚80.26亿 存在16项违法事实开始于2121年7月,历经一年时间,网络安全审查办公室对“滴滴出行”网络安全审查终于有了一个暂时的结束。据“网信
Top