当前位置:首页 > 元宇宙 > AI

国产大模型第一梯队玩家,为什么pick了CPU?

来源: 责编: 时间:2024-07-11 09:23:54 218观看
导读AI一天,人间一年。现在不论是大模型本身,亦或是AI应用的更新速度简直令人直呼跟不上——Sora、Suno、Udio、Luma……重磅应用一个接一个问世。也正如来自InfoQ的调查数据显示的那般,虽然AIGC目前还处于起步阶段,但市场规

AI一天,人间一年。bj328资讯网——每日最新资讯28at.com

现在不论是大模型本身,亦或是AI应用的更新速度简直令人直呼跟不上——bj328资讯网——每日最新资讯28at.com

Sora、Suno、Udio、Luma……重磅应用一个接一个问世。bj328资讯网——每日最新资讯28at.com

也正如来自InfoQ的调查数据显示的那般,虽然AIGC目前还处于起步阶段,但市场规模已初具雏形:bj328资讯网——每日最新资讯28at.com

行业整体迅速发展固然是好事,但具体到每个的应用或者大模型的落地来说,面临的竞争也越发激烈了bj328资讯网——每日最新资讯28at.com

例如前不久各个大模型厂商之间展开的非常激烈的“价格战”,主打一个比谁更便宜,甚至直接把大模型价格推向“厘时代”bj328资讯网——每日最新资讯28at.com

加上最近OpenAI的“断供”事件,更是让国内厂商们在打出“轻松搬家”计划的同时,再加码Tokens送送送的力度。bj328资讯网——每日最新资讯28at.com

究其原因,也是与当下应用为王,尤其是以尽量低的成本把业务快速落地的这一大趋势紧密相关。bj328资讯网——每日最新资讯28at.com

那么问题来了,大模型玩家们何以在又快又好又省之间做到平衡?bj328资讯网——每日最新资讯28at.com

这就回到了那个避不开,同时又是成本里占绝对大头的因素——算力。bj328资讯网——每日最新资讯28at.com

现在提及大模型的训练和推理,很多人的第一反应或许就是想到了GPU。bj328资讯网——每日最新资讯28at.com

诚然GPU在高性能上占据着一定的优势,但它所存在“硬伤”也是比较明显,那便是供应不足价格昂贵bj328资讯网——每日最新资讯28at.com

何以破局?国产大模型第一梯队玩家百度智能云千帆大模型平台,就给出了自己的一个更具“效价比”的解法:bj328资讯网——每日最新资讯28at.com

具体到算力的部署上,百度智能云AI与大模型平台总经理忻舟认为:bj328资讯网——每日最新资讯28at.com

一言蔽之,在大模型时代,CPU甚至比以往更加重要了,而且是能让大模型和应用做到“快好省”落地的关键因素之一。bj328资讯网——每日最新资讯28at.com

那么具体“上岗”效果又是如何,我们继续往下看。bj328资讯网——每日最新资讯28at.com

国产头部大模型玩家,pick了CPUbj328资讯网——每日最新资讯28at.com

国内AIGC应用爆发,这其中,百度智能云千帆大模型平台功不可没。bj328资讯网——每日最新资讯28at.com

作为企业使用大模型的”一站式”服务平台,千帆大模型平台自去年3月发布以来已有超12万客户使用,累计调优模型2万个,孵化应用4.2万个。bj328资讯网——每日最新资讯28at.com

这些应用覆盖教育、金融、办公、医疗等众多场景,为行业数字化转型提供了有力支撑。bj328资讯网——每日最新资讯28at.com

教育领域,千帆大模型平台赋能了试题生成、在线批改、题目解析等应用,大大提升了教学和备考效率。bj328资讯网——每日最新资讯28at.com

例如用户可以提供参考材料,设定题型和难度,平台就能自动生成高质量的试题。而交互式的题目解析,则可以针对每位学生的薄弱环节,提供个性化的学习指导。bj328资讯网——每日最新资讯28at.com

办公场景,千帆大模型平台与业内头部企业合作,共同打造了智能写作助手等创新应用,能够根据用户输入的关键词,快速生成招聘文案、营销方案、数据报告等专业文档。bj328资讯网——每日最新资讯28at.com

还可以专注于各类写作场景,可以智能生成论文大纲、项目汇报、品牌宣传稿等,大大提升了行政和营销人员的工作效率。bj328资讯网——每日最新资讯28at.com

医疗健康是千帆大模型平台的另一大应用赛道。基于医疗知识库训练的模型,可以自动生成体检报告解读,用通俗易懂的语言向用户解释各项指标,并给出个性化的健康指导。bj328资讯网——每日最新资讯28at.com

这让普通大众也能更好地了解自己的身体状况,实现”健康自主管理”。bj328资讯网——每日最新资讯28at.com

可以看到,千帆大模型平台在多个领域实现了AI模型的”最后一公里”落地。bj328资讯网——每日最新资讯28at.com

那么千帆大模型平台是怎么支撑如此多AI应用的呢?bj328资讯网——每日最新资讯28at.com

答案是:让CPU成为客户的选择之一,让“效价比”的红利普惠千行百业bj328资讯网——每日最新资讯28at.com

之所以如此,百度智能云所给出的解释是:bj328资讯网——每日最新资讯28at.com

至于效果,以Llama-2-7B为例,在第四代英特尔® 至强® 可扩展处理器上输出 Token 吞吐可达 100 TPS以上,相比第三代提升了60%。bj328资讯网——每日最新资讯28at.com

Llama-2-7b模型输出Token吞吐bj328资讯网——每日最新资讯28at.com

在低延迟的场景,同等并发下,第四代至强® 可扩展处理器的首Token时延比第三代至强® 可降低50%以上。bj328资讯网——每日最新资讯28at.com

在将处理器升级为第五代至强® 可扩展处理器之后,较上代的吞吐可提升45%左右,首 Token 时延下降50%左右。bj328资讯网——每日最新资讯28at.com

Llama-2-7b模型首Token时延bj328资讯网——每日最新资讯28at.com

并且千帆大模型平台团队根据实践经验还表示:bj328资讯网——每日最新资讯28at.com

不仅如此,利用充足的CPU资源,降低对于AI加速卡的需求,从而降低 LLM 推理服务的总体拥有成本 (TCO),特别是在离线的 LLM推理场景中表现出色。bj328资讯网——每日最新资讯28at.com

而且在千帆大模型平台上,可不止是有自家的ERNIE,还有很多主流的大模型都集成于此。bj328资讯网——每日最新资讯28at.com

这也在一定程度上从侧面印证了第五代英特尔® 至强® 可扩展处理器在性能上的过关。bj328资讯网——每日最新资讯28at.com

英特尔第五代至强,如何让性能和效率变得ProMax?bj328资讯网——每日最新资讯28at.com

百度智能云千帆大模型平台,不止需要大模型推理一种工作负载,它其实是一个覆盖大模型全生命周期的平台。bj328资讯网——每日最新资讯28at.com

具体来说,千帆大模型平台提供数据标注,模型训练与评估,推理服务与应用集成的全面功能服务,以及快速应用编排与插件集成,助力大模型多场景落地应用。这样一来,比起专为大模型推理部署专用加速器,充分利用平台已广泛部署的CPU资源,就是更划算的选择了。bj328资讯网——每日最新资讯28at.com

对于千帆大模型平台上存在的大量离线大模型应用需求来说,如生成文章总结、摘要、评估多个模型的效果等,这类需求对推理的时延要求其实不高,但内存容易成为瓶颈。bj328资讯网——每日最新资讯28at.com

采用CPU来做,扩展内存更方便,还可以利用起平台闲时的算力资源,进一步提高资源利用率,起到降低总拥有成本的作用。bj328资讯网——每日最新资讯28at.com

在这个大背景下,第五代英特尔® 至强® 可扩展处理器中的性能密集型通用计算应用负载(类似P Core性能核)的设计就尤为关键了。bj328资讯网——每日最新资讯28at.com

与E Core(能效核)相比,P Core采用了追求性能最大化的设计,能承载非常重的负载,同时还兼顾了AI推理加速。bj328资讯网——每日最新资讯28at.com

采用此设计的第五代至强® 可扩展处理器,在兼顾AI推理加速这一点上可不是说说而已,而是软硬件协同优化,各方面都考虑到位了。bj328资讯网——每日最新资讯28at.com

硬件方面,英特尔® AMX(高级矩阵扩展)技术,正是为大模型推理重深度学习中大量的矩阵乘法运算专门优化的,可以理解成”CPU 里的 TensorCore”。bj328资讯网——每日最新资讯28at.com

有了英特尔® AMX,处理器每个时钟周期可完成高达2048个INT8运算,比上一代AVX512_VNNI指令提升8倍之多。bj328资讯网——每日最新资讯28at.com

更重要的是,英特尔®AMX加速器是内置在CPU核心里的,让矩阵存储和运算更近,这一特性应用在大模型推理上,能够降低处理下一个Token的时延,让终端用户的体验更好。bj328资讯网——每日最新资讯28at.com

英特尔®AMX 可以更高效的实现 AI 加速bj328资讯网——每日最新资讯28at.com

软件方面,百度智能云千帆大模型平台已经引入了针对英特尔® 至强® 可扩展平台深度优化的大模型推理软件解决方案xFasterTransformer(xFT),并将其作为后端推理引擎。主要优化策略如下:bj328资讯网——每日最新资讯28at.com

充分利用 AMX/AVX512 等指令集,高效实现核心算子如 Flash Attention 等bj328资讯网——每日最新资讯28at.com

采用低精度量化,降低数据访存量,发挥 INT8/BF16 运算的优势bj328资讯网——每日最新资讯28at.com

支持超大规模模型的多机多卡并行推理bj328资讯网——每日最新资讯28at.com

英特尔®至强® 可扩展处理器 LLM 推理软件解决方案bj328资讯网——每日最新资讯28at.com

最后还要补充的一点是,要知道选择一种硬件平台,不止关乎于设备本身的采购价格,还会影响到后续的维护成本,甚至人才储备成本。bj328资讯网——每日最新资讯28at.com

所以正如百度智能云所言,高性价比的算力基础设施,与先进的大模型算法和平台软件相辅相成,让上层的开发者们能够更加平滑地应用,构建他们的业务,才能最大化云计算平台的商业价值。bj328资讯网——每日最新资讯28at.com

大模型时代,CPU大有可为bj328资讯网——每日最新资讯28at.com

纵观当下,大模型正从实验室走向产业,从少数人的“玩具”变为大众可用的“工具”。bj328资讯网——每日最新资讯28at.com

这意味着,大模型服务不仅要有优秀的性能表现,还要做到价格亲民、部署便捷。一言以蔽之,“快好省”成了大模型商业化的关键一环。bj328资讯网——每日最新资讯28at.com

而要实现“快好省”,算力基础设施的选择至关重要bj328资讯网——每日最新资讯28at.com

传统观点认为,专用加速器才是AI的“标配”。但在供应紧张、成本高企的背景下,专用加速器的优势正在减弱。bj328资讯网——每日最新资讯28at.com

相比之下,优化良好的高端 CPU不仅能提供足够应对大模型推理的算力,而且具有更广泛的部署基础和更成熟的软件生态、以及更好的安全保障,开始受到越来越多业界玩家的青睐。bj328资讯网——每日最新资讯28at.com

以英特尔® 至强®系列为代表的x86架构CPU,拥有成熟完善的软件生态和广泛的应用基础。数以百万计的开发者可以利用现有工具和框架,快速构建和优化AI应用,而无需额外学习专门的加速器软件栈,大大降低了开发难度和迁移成本。bj328资讯网——每日最新资讯28at.com

同时,企业级用户还可以利用CPU内置的多层次安全技术,实现从硬件到软件的全栈保护,充分保障数据安全和隐私。这些优势,是当前专用加速器难以比拟的。bj328资讯网——每日最新资讯28at.com

由此可见,充分利用CPU进行推理,让AI从“烧钱游戏”变为“普惠科技”,正是AIGC产业应对算力门槛,推动规模化应用落地的关键一招。未来,随着技术创新和生态完善,这一模式还将为更多企业创造价值,为产业发展注入新的动力。bj328资讯网——每日最新资讯28at.com

除了直接加速推理任务外,CPU在完整的端到端AI管线中还能高效完成数据预处理、特征工程等AI全流程中的关键步骤。而支持机器学习和图分析的各类数据库,也主要是构建在CPU之上的。以至强®可扩展处理器为例,除了英特尔® AMX之外,还有诸如英特尔® 数据保护与压缩加速技术(英特尔® QAT)、英特尔® 存内分析加速器(英特尔®IAA)等一系列数据分析引擎内置于处理器中,通过卸载特定任务使CPU得到更好的利用,从而提升工作负载整体性能,实现数据分析加速。bj328资讯网——每日最新资讯28at.com

由此可见,构建“快、准、稳”的AI 应用,既要靠专用加速器强大的算力,也离不开CPU超强的通用计算能力去释放整个系统的潜力bj328资讯网——每日最新资讯28at.com

为了科普CPU在AI推理新时代的玩法,量子位开设了《最“in”AI》专栏,将从技术科普、行业案例、实战优化等多个角度全面解读。bj328资讯网——每日最新资讯28at.com

我们希望通过这个专栏,让更多的人了解CPU在AI推理加速,甚至是整个AI平台或全流程加速上的实践成果,重点就是如何更好地利用CPU来提升大模型应用的性能和效率。(量子位)bj328资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
布雷博投资移动互联初创公司——SPOKE SAFETY
布雷博投资移动互联初创公司——SPOKE SAFETY
微软对“中国区员工必须使用iPhone”回应:为员工提供访问必要应用的途径
微软对“中国区员工必须使用iPhone”回应:为员工提供访问必要应用的途径
周鸿祎称免费杀毒、QQ等让国人生活实现了数字化改变
周鸿祎称免费杀毒、QQ等让国人生活实现了数字化改变
苹果信心满满,iPhone 16备货目标提升至9000万部!
苹果信心满满,iPhone 16备货目标提升至9000万部!
靠一套自研系统就能运转!雷军揭秘小米手机新智能工厂
靠一套自研系统就能运转!雷军揭秘小米手机新智能工厂
博主实测:理想MEGA充电功率飙升至522kW,11分钟充电75%
博主实测:理想MEGA充电功率飙升至522kW,11分钟充电75%
热门内容
  • 2024欧洲杯赛程时间出炉,用当贝D6X Pro享受“身临其境”的观赛体验
  • 2024欧洲杯直播在哪看?在哪个软件可以看比赛直播、回放
  • 破土而出:Hamster Kombat和TON区块链的双重冲击
  • 父亲节送什么礼物好?送一台当贝F6更贴心!
  • 2024年欧洲杯赛程出炉!当贝X5S投影仪让你最直观体验赛场!
  • 重磅官宣!宏碁暗影骑士·擎6成无畏契约冠军巡回赛虎牙直播合作伙伴
  • 优学派全球首款纳米蛾眼仿生护眼学生平板P26面世,引领学习机护眼新高度!
  • 重塑儿童智能陪护体验 跃然创新推出全球首款AI玩具BubblePal
  • 深信服牵头!立项制定《网络安全运营大模型参考架构》技术规范
  • 亿达中国大连软件园引入日本知名企业星崎集团,在中国成立首家独立海外研发中心
  • 洞察智能化趋势,筑牢金融安全基石:BCS第五届金融业网络安全论坛成功举办
  • 值得推荐的3000元左右家用投影仪:当贝D6X Pro轻薄便携体验超赞
  • 小笨智能:机器人灵活运动的秘密,就藏在SLAM技术里
  • 618惊喜价格 三星Galaxy S24系列限时加赠Galaxy Buds2 Pro
  • 2024年618性价比最高的4K投影仪!为什么说当贝X5S Pro性价比最高
本栏最新
澳鹏Appen(中国)精彩亮相2024世界人工智能大会(WAIC2024)
澳鹏Appen(中国)精彩亮相2024世界人工智能大会(WAIC2024)
布雷博投资移动互联初创公司——SPOKE SAFETY
布雷博投资移动互联初创公司——SPOKE SAFETY
外媒横评联想和惠普Copilot+PC,联想更胜一筹
外媒横评联想和惠普Copilot+PC,联想更胜一筹
亚信科技入选信通院“数据智能产业图谱”, 打通数据智能服务全链路
亚信科技入选信通院“数据智能产业图谱”, 打通数据智能服务全链路
初赛倒计时 | 第二届OPENAIGC开发者大赛作品提交开始
初赛倒计时 | 第二届OPENAIGC开发者大赛作品提交开始
一图读懂超聚变《2023年可持续发展报告》
一图读懂超聚变《2023年可持续发展报告》

本文链接:http://www.28at.com/showinfo-45-5960-0.html国产大模型第一梯队玩家,为什么pick了CPU?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 微软放弃OpenAI董事会观察员席位,苹果也不会担任类似角色

下一篇: 澳鹏Appen(中国)精彩亮相2024世界人工智能大会(WAIC2024)

标签:
  • 热门焦点
  • 元宇宙风口下,视觉中国如何重估?

    要说横跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一个。不仅互联网巨头们纷纷布局,上市公司们趋之若鹜,还被不少地方政府写入了产业规划,大有在2022年
  • 冰墩墩NFT遇冷,价格跌80%,日成交仅3笔。

    “两日上涨千倍”并不存在,且冰墩墩NFT的市场热度远不及社交媒体所称的那样高。2月11日,获得国际奥委会授权的2022冬奥会吉祥物冰墩墩相关NFT产品在nWayPlay上线
  • 区块链产业人才发展报告

    工业和信息化部作为工业和信息化行业主管部门,正在着力推进“两个强国”建设,加快推动以区块链为代表的新兴技术与实体经济深度融合。我国区块链技术和应用想要
  • 2021年中国元宇宙行业用户行为分析热点报告

    元宇宙网络热度高涨,中国网民对虚拟生态兴趣浓厚。艾媒咨询数据显示,超六成的网民对“元宇宙”了解程度较高,在元宇宙较基础的游戏领域,超九成的人对VR游戏更感兴
  • 与元宇宙美少女艺术家的对话

    我最近宣布了我自己的NFT项目,这是我已经工作了几个月的事情。由于我之前只是一个收藏家,拥有自己的项目真的给了我一个新的视角来看待这个领域。我一直欢迎人们
  • NFT:新骗局的狩猎场

    骗局的自动化需要更好的防御,从数字身份开始。前几天我在OpenSea上购买了一个NFT,是才华横溢的艺术家海伦·福尔摩斯 (Helen Holmes) 的漫画,来自她的 "原作 "收
  • 如何在元宇宙中建立品牌忠诚度

    Snoop Dogg、耐克、苏富比和普华永道都有什么共同点?他们都投资于元宇宙的房地产。除了我们在屏幕上看到的二维世界--手机、笔记本电脑、台式机或iPad--他们决
  • NFT高玩必备:NFT分析工具大盘点

    NFT市场的火热让越来越多的投资者投身其中,但当前的 NFT 生态系统存在几个问题却困扰了大多数人,如难以准确评估 NFT 项目的资产价格、缺乏 NFT 市场动态信息、
  • 超级账本Julian Gordon:联盟链与公链的竞争不是非此即彼

    在2021年《福布斯》区块链50强榜单中,29家企业使用Hyperledger超级账本技术,占比近60%。同年,研究机构Blockdata发布了的调查报告显示,访问Top100上市公司中,有 81

最新推荐

猜你喜欢

热门推荐

相关资讯

Top