当前位置：首页 > 科技 > 芯片

地平线旭日3成功部署14亿参数大语言模型

来源：责编：时间：2023-09-14 09:33:23 592观看

导读近日，地平线成功在旭日3中的BPU®️计算单元上，部署运行参数规模高达14亿的大语言模型（Large Language Model,LLM）。这不仅是业界在端侧成功部署大模型的一次突破性实践，更验证了BPU®️对先进神经网络算法的高效支持，为大模型

近日，地平线成功在旭日3中的BPU®️计算单元上，部署运行参数规模高达14亿的大语言模型（Large Language Model,LLM）。这不仅是业界在端侧成功部署大模型的一次突破性实践，更验证了BPU®️对先进神经网络算法的高效支持，为大模型在端侧实现产品级应用拓展了更广阔的想象空间。

大模型端侧部署的技术实践对加速智能化产业变革具有重要意义。端侧部署具备实时性、低时延优势，能够灵活支持弱网或无网等丰富场景，为终端用户提供更流畅、稳定的交互体验；同时端侧支持信息本地化处理，可有效保护用户数据与隐私安全；端侧计算还将大幅缓解云端算力压力，端云协同更会驱动产业降本提效，加速实现大模型技术的应用普惠。

然而，大模型端侧推理部署仍面临巨大挑战。区别于云端推理部署计算资源应用尽用，端侧部署大模型并实现产品级应用，则需综合考量不同应用间的计算资源分配，以及计算效率、带宽占用与功耗等各项指标。如何在众多约束条件下最大程度地提高大模型端侧推理效率是面临的首要技术挑战。此外，推理过程将大量占用内存带宽，如何在不影响推理结果的前提下减少内存访问，降低带宽依赖，进而减少推理耗时，则需要在软件工程层面进行系统优化。

作为软硬协同技术路径的坚定践行者，地平线通过硬件资源的最大化利用和软件工程的极致优化，并成功在5 TOPS算力的边缘计算芯片上部署高达14亿级参数的大语言模型。这源于旭日3所搭载的双核BPU®️伯努利计算单元对神经网络计算的原生性支持，能够在处理大语言模型方面提供高性能、低功耗的计算处理能力。另一方面，地平线通过软硬协同编译，采用算子重写、算子重排、算子融合和KV-Cache等技术，进一步优化了模型结构，实现推理速度的成倍提升。

从资源占用情况看，该大语言模型在旭日3上的应用效果表现优异，CPU占用单核60%、BPU占用单核50%，为后续其他应用预留充足的算力资源；同时在5GB/s内存带宽基础上实现了约4~5字/秒的生成速度，可充分满足实时性需求；在最能体现真实效能的FPS/Watt指标上，该模型的运行效能相较于LLaMA.cpp等纯CPU方案提升了2.5倍。这也意味着，旭日3对此大预言模型的支持性可达到产品级应用水平。

地平线现已通过GitHub开放该模型的推理代码，开发者可通过RDK X3系列开发者套件，即刻前往「NodeHub全开源机器人应用中心」推荐项目（https://developer.horizon.cc/nodehubdetail/181982806623334400），尝鲜体验大语言模型在旭日3上的实际运行效果，更期待各位开发者参与「星光之路」活动，一同探索大模型在旭日3的上层应用落地！

我们相信，通过软硬协同的技术路径，大模型端侧应用部署将驱动人机交互方式变革，多维度提升用户智能化体验，加速“智能计算平权”时代的到来。

icspec【芯片求购】https://www.icspec.com/inquiry/index/1/0

本文链接：http://www.28at.com/showinfo-27-9692-0.html地平线旭日3成功部署14亿参数大语言模型

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：第三届紫外LED国际会议暨长治LED产业发展推进大会盛大开幕

下一篇：两股力道拉扯 iPhone 15换机潮仍蠢动

标签：

热门焦点

直屏旗舰来了 iQOO 12和K70 Pro同台竞技

旗舰机基本上使用的都是双曲面屏幕，这就让很多喜欢直屏的爱好者在苦等一款直屏旗舰，这次，你们等到了。据博主数码闲聊站带来的最新爆料称，Redmi下代旗舰K70 Pro和iQOO 12两款手
太卷！Redmi MAX 100英寸电视便宜了：12999元买Redmi史上最大屏

8月5日消息，从小米商城了解到，Redmi MAX 100英寸巨屏电视日前迎来官方优惠，到手价12999元，比发布价便宜了7000元，在大屏电视市场开卷。据了解，Redmi MAX 100
三言两语说透设计模式的艺术-单例模式

写在前面单例模式是一种常用的软件设计模式，它所创建的对象只有一个实例，且该实例易于被外界访问。单例对象由于只有一个实例，所以它可以方便地被系统中的其他对象共享，从而减少
企业采用CRM系统的11个好处

客户关系管理（CRM）软件可以为企业提供很多的好处，从客户保留到提高生产力。　　CRM软件用于企业收集客户互动，以改善客户体验和满意度。　　CRM软件市场规模如今超过580
OPPO、vivo、小米等国内厂商Q2在印度智能手机市场份额依旧高达55%

7月20日消息，据外媒报道，研究机构的报告显示，在全球智能手机出货量同比仍在下滑的大背景下，印度这一有潜力的市场也未能幸免，出货量同比也有下滑，多家厂
三星Galaxy Z Fold/Flip 5国行售价曝光：最低7499元/12999元起

据官方此前宣布，三星将于7月26日也就是明天在韩国首尔举办Unpacked活动，届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
回归OPPO两年，一加赢了销量，输了品牌

成为OPPO旗下主打性能的先锋品牌后，一加屡创佳绩。今年618期间，一加手机全渠道销量同比增长362%，凭借一加 11、一加 Ace 2、一加 Ace 2V三款爆品，一加
OPPO K11采用全方位护眼屏：三大护眼能力减轻视觉疲劳

日前OPPO官方宣布，全新的OPPO K11将于7月25日正式发布，将主打旗舰影像，和同档位竞品相比，其最大的卖点就是将配备索尼IMX890主摄，堪称是2000档位影像表
onebot M24巧系列一体机采用轻薄机身设计，现已在各平台开售

onebot M24 巧系列一体机目前已在线上线下各平台同步开售。onebot M24 巧系列采用一体化轻薄机身设计，最薄处为 10.15mm，拥有宝石红、午夜蓝、石墨绿、雅致

地平线旭日3成功部署14亿参数大语言模型

直屏旗舰来了 iQOO 12和K70 Pro同台竞技

太卷！Redmi MAX 100英寸电视便宜了：12999元买Redmi史上最大屏

三言两语说透设计模式的艺术-单例模式

企业采用CRM系统的11个好处

OPPO、vivo、小米等国内厂商Q2在印度智能手机市场份额依旧高达55%

三星Galaxy Z Fold/Flip 5国行售价曝光：最低7499元/12999元起

回归OPPO两年，一加赢了销量，输了品牌

OPPO K11采用全方位护眼屏：三大护眼能力减轻视觉疲劳

onebot M24巧系列一体机采用轻薄机身设计，现已在各平台开售

最新推荐

猜你喜欢

热门推荐

相关资讯