当前位置:首页 > 科技  > 数码

运行130亿参数的大语言模型!你只需要一台轻薄的AI PC

来源: 责编: 时间:2023-10-25 15:47:40 530观看
导读 说起AI大语言模型,相信熟悉的人都会立刻联想到性能强大的通用CPU处理器、专用GPU加速器,只有它们才能提供足够的算力进行训练。不过在推理应用方面,算力需求就没有那么高了,再加上厂商们在软硬件和开发工具上的

说起AI大语言模型,相信熟悉的人都会立刻联想到性能强大的通用CPU处理器、专用GPU加速器,只有它们才能提供足够的算力进行训练。ugh28资讯网——每日最新资讯28at.com

不过在推理应用方面,算力需求就没有那么高了,再加上厂商们在软硬件和开发工具上的不断优化,一台轻薄的笔记本如今也能轻松胜任大量AI工作,AI PC的时代正在逐渐到了。ugh28资讯网——每日最新资讯28at.com

运行130亿参数的大语言模型!你只需要一台轻薄的AI PCugh28资讯网——每日最新资讯28at.com

比如Intel,如今的12/13代酷睿处理器、锐炫A系列显卡,以及即将发布的全新酷睿Ultra处理器,都有足够的算力满足生成式AI(AIGC)的需求。ugh28资讯网——每日最新资讯28at.com

再加上Intel的软件生态、模型优化,可以快速推动AIGC场景在PC上的落地,包括轻薄本、创作本、全能本、游戏本、台式机等多种形态。ugh28资讯网——每日最新资讯28at.com

特别是通过模型优化,Intel大大降低了对硬件资源的需求,进而提升推理速度,使得社区开源模型可以很好地运行在PC上。ugh28资讯网——每日最新资讯28at.com

以大语言模型为例,Intel通过13代酷睿处理器XPU加速、低比特(low-bit)量化,结合其他软件层面优化,通过BigDL-LLM框架,就可以运行在16GB及以上内存的PC上运行高160亿参数。ugh28资讯网——每日最新资讯28at.com

已经验证过的模型包括但不限于:LLAMA/LLAMA2、ChatGLM/ChatGLM2、MPT、Falcon、MOSS、Baichuan、QWen、Dolly、RedPajama、StarCoder、Whisper等等。ugh28资讯网——每日最新资讯28at.com

此外,Intel还提供了Transformers、LangChain等易用的API接口,并支持Windows、Linux操作系统。ugh28资讯网——每日最新资讯28at.com

运行130亿参数的大语言模型!你只需要一台轻薄的AI PCugh28资讯网——每日最新资讯28at.com

比如,Intel正在打造的开源框架BigDL-LLM,专门针对Intel硬件的低比特量化设计,支持INT3、INT4、INT5、INT8等各种低比特数据精度,性能更好,内存占用更少。ugh28资讯网——每日最新资讯28at.com

它在i9-12900K处理器上就可以达成飞快的运行速度,输出性能达到了每个Token 47毫秒左右,已经不弱于很多云侧计算。ugh28资讯网——每日最新资讯28at.com

运行130亿参数的大语言模型!你只需要一台轻薄的AI PCugh28资讯网——每日最新资讯28at.com

在LLaMA2 130亿参数大语言模型、StarCoder 155亿参数代码大模型上,Intel酷睿处理器也都能获得良好的运行速度。ugh28资讯网——每日最新资讯28at.com

运行130亿参数的大语言模型!你只需要一台轻薄的AI PCugh28资讯网——每日最新资讯28at.com

运行130亿参数的大语言模型!你只需要一台轻薄的AI PCugh28资讯网——每日最新资讯28at.com

Intel还设计了一个大语言模型DEMO,集成ChatGLM2、LLaMA2、StarCoder,通过优化和量化操作,在任何基于12/13代酷睿的PC上都可以快速生成想要的结果,哪怕是轻薄本。ugh28资讯网——每日最新资讯28at.com

这个DEMO可以选择不同的大语言模型、设定不同的参数,支持中文应用、英文应用、代码生成三大方面,其中中文应用就包括聊天助手、情感分析、中文翻译、故事创作、生成大纲、信息提取、美食指南、旅游规划等八个方面,覆盖日常生活、工作的方方面面。ugh28资讯网——每日最新资讯28at.com

运行130亿参数的大语言模型!你只需要一台轻薄的AI PCugh28资讯网——每日最新资讯28at.com

此外,Intel还积极拥抱AI社区,基于OpenVINO PyTorch后端方案,通过Pytorch API,使得社区开源模型可以很好地运行在Intel的消费级处理器、集成显卡、独立显卡、专用AI引擎之上。ugh28资讯网——每日最新资讯28at.com

比如图形视觉领域火的Stable Diffusion的实现Automatic1111 WebUI,已经可以在Intel处理器、显卡上以FP16的浮点精度运行,包括文生图、图生图、局部修复等都可以获得良好的体验。ugh28资讯网——每日最新资讯28at.com

运行130亿参数的大语言模型!你只需要一台轻薄的AI PCugh28资讯网——每日最新资讯28at.com

哪怕是使用Arc A730M这样的入门级笔记本显卡,都可以在几秒钟内完成高质量的文生图、图生图、图像风格转换等,从而极大地节省工作量,让设计师将更多精力放在创意上。ugh28资讯网——每日最新资讯28at.com

这足以证明,在Intel软硬件的联合调校之下,一台普通的笔记本在端侧运行大模型,依然可以获得足够快的响应速度和良好的体验。ugh28资讯网——每日最新资讯28at.com

相信随着全行业的不断努力,PC端侧的AI应用会越来越广泛、高效,让更多人随时随地享受AI带来的变革性体验。ugh28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-14867-0.html运行130亿参数的大语言模型!你只需要一台轻薄的AI PC

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 早上8点不用熬夜!苹果官宣10月31日新品发布会:M3芯片iMac来了

下一篇: 1099元 联想新款27寸电竞显示器预售:可超频至180Hz

标签:
  • 热门焦点
  • 一加Ace2 Pro官宣:普及16G内存 引领24G

    一加官方今天继续为本月发布的新机一加Ace2 Pro带来预热,公布了内存方面的信息。“淘汰 8GB ,12GB 起步,16GB 普及,24GB 引领,还有呢?#一加Ace2Pro#,2023 年 8 月,敬请期待。”同时
  • 影音体验是真的强 简单聊聊iQOO Pad

    大公司的好处就是产品线丰富,非常细分化的东西也能给你做出来,例如早先我们看到了新的vivo Pad2,之后我们又在iQOO Neo8 Pro的发布会上看到了iQOO的首款平板产品iQOO Pad。虽
  • 摸鱼心法第一章——和配置文件说拜拜

    为了能摸鱼我们团队做了容器化,但是带来的问题是服务配置文件很麻烦,然后大家在群里进行了“亲切友好”的沟通图片图片图片图片对比就对比,简单对比下独立配置中心和k8s作为配
  • 谷歌KDD'23工作:如何提升推荐系统Ranking模型训练稳定性

    谷歌在KDD 2023发表了一篇工作,探索了推荐系统ranking模型的训练稳定性问题,分析了造成训练稳定性存在问题的潜在原因,以及现有的一些提升模型稳定性方法的不足,并提出了一种新
  • 微信语音大揭秘:为什么禁止转发?

    大家好,我是你们的小米。今天,我要和大家聊一个有趣的话题:为什么微信语音不可以转发?这是一个我们经常在日常使用中遇到的问题,也是一个让很多人好奇的问题。让我们一起来揭开这
  • 拼多多APP上线本地生活入口,群雄逐鹿万亿市场

    Tech星球(微信ID:tech618)文 | 陈桥辉 Tech星球独家获悉,拼多多在其APP内上线了“本地生活”入口,位置较深,位于首页的“充值中心”内,目前主要售卖美食相关的
  • 猿辅导与新东方的两种“归途”

    作者|卓心月 出品|零态LT(ID:LingTai_LT)如何成为一家伟大企业?答案一定是对“势”的把握,这其中最关键的当属对企业战略的制定,且能够站在未来看现在,即使这其中的
  • iQOO 11S或7月上市:搭载“鸡血版”骁龙8Gen2 史上最强5G Soc

    去年底,iQOO推出了“电竞旗舰”iQOO 11系列,作为一款性能强机,iQOO 11不仅全球首发2K 144Hz E6全感屏,搭载了第二代骁龙8平台及144Hz电竞屏,同时在快充
  • 外交部:美方应停止在网络安全问题上不负责任地指责他国

      中国外交部今天(16日)举行例行记者会。会上,有记者问,美国情报官员称,他们正在阻拦来自中国以及其他国家的黑客获取相关科研成果。 中方对此有何评论?对此
Top