当前位置：首页 > 科技 > 数码

运行130亿参数的大语言模型！你只需要一台轻薄的AI PC

来源：责编：时间：2023-10-25 15:47:40 485观看

导读说起AI大语言模型，相信熟悉的人都会立刻联想到性能强大的通用CPU处理器、专用GPU加速器，只有它们才能提供足够的算力进行训练。不过在推理应用方面，算力需求就没有那么高了，再加上厂商们在软硬件和开发工具上的

说起AI大语言模型，相信熟悉的人都会立刻联想到性能强大的通用CPU处理器、专用GPU加速器，只有它们才能提供足够的算力进行训练。

不过在推理应用方面，算力需求就没有那么高了，再加上厂商们在软硬件和开发工具上的不断优化，一台轻薄的笔记本如今也能轻松胜任大量AI工作，AI PC的时代正在逐渐到了。

比如Intel，如今的12/13代酷睿处理器、锐炫A系列显卡，以及即将发布的全新酷睿Ultra处理器，都有足够的算力满足生成式AI(AIGC)的需求。

再加上Intel的软件生态、模型优化，可以快速推动AIGC场景在PC上的落地，包括轻薄本、创作本、全能本、游戏本、台式机等多种形态。

特别是通过模型优化，Intel大大降低了对硬件资源的需求，进而提升推理速度，使得社区开源模型可以很好地运行在PC上。

以大语言模型为例，Intel通过13代酷睿处理器XPU加速、低比特(low-bit)量化，结合其他软件层面优化，通过BigDL-LLM框架，就可以运行在16GB及以上内存的PC上运行高160亿参数。

已经验证过的模型包括但不限于：LLAMA/LLAMA2、ChatGLM/ChatGLM2、MPT、Falcon、MOSS、Baichuan、QWen、Dolly、RedPajama、StarCoder、Whisper等等。

此外，Intel还提供了Transformers、LangChain等易用的API接口，并支持Windows、Linux操作系统。

运行130亿参数的大语言模型！你只需要一台轻薄的AI PC

比如，Intel正在打造的开源框架BigDL-LLM，专门针对Intel硬件的低比特量化设计，支持INT3、INT4、INT5、INT8等各种低比特数据精度，性能更好，内存占用更少。

它在i9-12900K处理器上就可以达成飞快的运行速度，输出性能达到了每个Token 47毫秒左右，已经不弱于很多云侧计算。

运行130亿参数的大语言模型！你只需要一台轻薄的AI PC

在LLaMA2 130亿参数大语言模型、StarCoder 155亿参数代码大模型上，Intel酷睿处理器也都能获得良好的运行速度。

运行130亿参数的大语言模型！你只需要一台轻薄的AI PC

Intel还设计了一个大语言模型DEMO，集成ChatGLM2、LLaMA2、StarCoder，通过优化和量化操作，在任何基于12/13代酷睿的PC上都可以快速生成想要的结果，哪怕是轻薄本。

这个DEMO可以选择不同的大语言模型、设定不同的参数，支持中文应用、英文应用、代码生成三大方面，其中中文应用就包括聊天助手、情感分析、中文翻译、故事创作、生成大纲、信息提取、美食指南、旅游规划等八个方面，覆盖日常生活、工作的方方面面。

运行130亿参数的大语言模型！你只需要一台轻薄的AI PC

此外，Intel还积极拥抱AI社区，基于OpenVINO PyTorch后端方案，通过Pytorch API，使得社区开源模型可以很好地运行在Intel的消费级处理器、集成显卡、独立显卡、专用AI引擎之上。

比如图形视觉领域火的Stable Diffusion的实现Automatic1111 WebUI，已经可以在Intel处理器、显卡上以FP16的浮点精度运行，包括文生图、图生图、局部修复等都可以获得良好的体验。

运行130亿参数的大语言模型！你只需要一台轻薄的AI PC

哪怕是使用Arc A730M这样的入门级笔记本显卡，都可以在几秒钟内完成高质量的文生图、图生图、图像风格转换等，从而极大地节省工作量，让设计师将更多精力放在创意上。

这足以证明，在Intel软硬件的联合调校之下，一台普通的笔记本在端侧运行大模型，依然可以获得足够快的响应速度和良好的体验。

相信随着全行业的不断努力，PC端侧的AI应用会越来越广泛、高效，让更多人随时随地享受AI带来的变革性体验。

本文链接：http://www.28at.com/showinfo-24-14867-0.html运行130亿参数的大语言模型！你只需要一台轻薄的AI PC

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：早上8点不用熬夜！苹果官宣10月31日新品发布会：M3芯片iMac来了

下一篇： 1099元联想新款27寸电竞显示器预售：可超频至180Hz

标签：

热门焦点

轿车从天而降电动车主被撞身亡超速抢道所致：现场视频让网友吵翻

近日，上海青浦区法院判决轿车从天而降电动车主被撞身亡案，轿车车主被判有期徒刑一年。案件显示当时男子驾驶轿车在上海某路段行驶，前车忽然转弯提速超车，
之家push系统迭代之路

前言在这个信息爆炸的互联网时代，能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大，传统的靠"主动拉"获取信息的方式已不能满足用
.NET 程序的 GDI 句柄泄露的再反思

一、背景1. 讲故事上个月我写过一篇如何洞察 C# 程序的 GDI 句柄泄露文章，当时用的是 GDIView + WinDbg 把问题搞定，前者用来定位泄露资源，后者用来定位泄露代码，后面有朋友反
WebRTC.Net库开发进阶，教你实现屏幕共享和多路复用！

WebRTC.Net库：让你的应用更亲民友好，实现视频通话无痛接入！除了基本用法外，还有一些进阶用法可以更好地利用该库。自定义 STUN/TURN 服务器配置WebRTC.Net 默认使用 Google 的
雅柏威士忌多款单品价格大跌，泥煤顶流也不香了？

来源 | 烈酒商业观察编 | 肖海林今年以来，威士忌市场开始出现了降温迹象，越来越多不断暴涨的网红威士忌也开始悄然回归市场理性。近日，LVMH集团旗下苏格兰威士忌品牌雅柏（Ardbeg
8月见！小米MIX Fold 3获得3C认证：支持67W快充

这段时间以来，包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都得到了不少爆料，而小米新一代折叠屏旗舰——小米MIX Fold 3此前也屡屡被传
苹果公司要求三星和LG Display生产「无边框」OLED iPhone显示屏

据 The Elec 报道，苹果已要求其供应商为未来的 iPhone 型号开发「无边框」OLED 显示面板。苹果显然已要求三星和 LG Display 开发新的 OLED 显示面
OPPO K11评测：旗舰级IMX890加持 2000元档最强影像手机

【Techweb评测】中端机型用户群体巨大，占了中国目前手机市场的大头，一直以来都是各手机品牌的“必争之地”，其中OPPO K系列机型一直以来都以高品质、
OPPO Reno10 Pro英雄联盟定制礼盒公布：萨勒芬妮同款配色梦幻十足

5月24日，OPPO推出了全新的OPPO Reno 10系列，包含OPPO Reno10、OPPO Reno10 Pro和OPPO Reno10 Pro+三款新机，全系标配了超光影长焦镜头，是迄今为止拍照

运行130亿参数的大语言模型！你只需要一台轻薄的AI PC

轿车从天而降电动车主被撞身亡超速抢道所致：现场视频让网友吵翻

之家push系统迭代之路

.NET 程序的 GDI 句柄泄露的再反思

WebRTC.Net库开发进阶，教你实现屏幕共享和多路复用！

雅柏威士忌多款单品价格大跌，泥煤顶流也不香了？

8月见！小米MIX Fold 3获得3C认证：支持67W快充

苹果公司要求三星和LG Display生产「无边框」OLED iPhone显示屏

OPPO K11评测：旗舰级IMX890加持 2000元档最强影像手机

OPPO Reno10 Pro英雄联盟定制礼盒公布：萨勒芬妮同款配色梦幻十足

最新推荐

猜你喜欢

热门推荐

相关资讯