当前位置:首页 > 科技  > 软件

生成式 AI 算力新台阶,第五代至强可扩展处理器详解

来源: 责编: 时间:2024-03-21 09:43:54 125观看
导读 如今 AI 的生意越做越大,从出圈爆火,到千行百业都开始拥抱 AI,越来越多的企业,都会将 AI 导入到他们的生意模式当中。预计到 2026 年有超过 3000 亿美金将投入到生成式 AI 当中,这其中包括硬件、软件、解决方案等

如今 AI 的生意越做越大,从出圈爆火,到千行百业都开始拥抱 AI,越来越多的企业,都会将 AI 导入到他们的生意模式当中。预计到 2026 年有超过 3000 亿美金将投入到生成式 AI 当中,这其中包括硬件、软件、解决方案等。50% 以上的边缘应用也会采用 AI 技术。到 2028 年有 80% 以上的 PC 都会转换成 AI PC,通过 AI 可以提升大家在 PC 上的生产力。还有 80% 以上的公司,也会在 2026 年之前会导入某种程度的生成式 AI 以提高企业生产力。5aN28资讯网——每日最新资讯28at.com

各行各业都在积极的拥抱 AI,这离不开强大的算力支持,英特尔在去年 AI 风头正劲的时候推出了第五代英特尔至强可扩展处理器,为云端 AI 能力带来了全新的体验。5aN28资讯网——每日最新资讯28at.com

5aN28资讯网——每日最新资讯28at.com

第五代至强最多拥有 64 个核,并引入了诸多 AI 特性,如 AMX、AVX-512 指令集等,并通过性能的提升,对生成式 AI 应用带来更快的体验。第五代至强可扩展处理器内存达 5600MT/s,三级缓存进一步提升,加速处理器的数据交换。在软件生态上英特尔也进行了很大投入,目前,英特尔上传了 300 个以上的深度学习模型到社区,也支持了 50 个以上的基于机器学习的、且基于第五代至强优化过的模型,这些开发者都可以调用。针对开发者,英特尔同步更新了其 AI 开发软件,可以在第五代至强上的应用做到较大优化,针对主流大模型、生成式 AI 模型的框架,如 PyTorch 和 TensorFlow,可以无缝拓展至英特尔至强可扩展处理器上。5aN28资讯网——每日最新资讯28at.com

针对第五代至强可扩展处理器的诸多变化,英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰表示,“基于硬件和软件的优化,第五代至强和第四代至强相比,在 AI 训练、实时推理、批量推理上,基于不同的算法,都可以看到不同性能的提升,最高可提升 40%。”5aN28资讯网——每日最新资讯28at.com

5aN28资讯网——每日最新资讯28at.com

庄秉翰表示,“对新兴的,尤其是基于云原生的设计,我们提供能效核,每瓦性能可以做到相对极致,而且因为它的核比较精简,可以放更多高密度的核数到每一款的 CPU 和服务器,所以它会支持面向云的高密度超高能效的运算进行能效的优化。在近期对于产品淘汰换新的要求中,有一个重要考量因素就是能效比,而我们在今年推出的能效核,也是符合国家对设备淘汰换新的要求。”5aN28资讯网——每日最新资讯28at.com

‎第五代至强大调整,性能更强功耗控制更好

第五代英特尔至强可扩展处理器带来了五项升级,在制程工艺方面,第五代至强采用 Intel 7 制程,从第四代至强到第五代至强,英特尔也关键的技术指标做了改进,特别是在系统的漏电流控制和动态电容方面,这两方面的指标都对整个晶体管的性能表现有比较大的影响。通过这些调整,整体上第五代至强在同等功耗下的频率可以提升 3%。5aN28资讯网——每日最新资讯28at.com

5aN28资讯网——每日最新资讯28at.com

芯片布局方面,通过把四片芯片改成两片芯片的设计,可以更好的对芯片的面积进行控制。通过 MDF 和 SCF 连接,在第五代至强可进一步实现芯片之间的高效互连。5aN28资讯网——每日最新资讯28at.com

在关键表现上,第五代至强做了如下调整:5aN28资讯网——每日最新资讯28at.com

升级到 Raptor Cove 核心。5aN28资讯网——每日最新资讯28at.com

核心数增加,从最多的 60 核升级到 64 核。5aN28资讯网——每日最新资讯28at.com

LLC 大小从 1.875MB 增加到 5MB。5aN28资讯网——每日最新资讯28at.com

DDR 速度从 4800MT/s提升到了 5600MT/s。5aN28资讯网——每日最新资讯28at.com

UPI 速度从 16GT/s提升到 20GT/s。5aN28资讯网——每日最新资讯28at.com

SoC 芯片拓扑结构更改,4 芯片封装改为 2 芯片封装。5aN28资讯网——每日最新资讯28at.com

待机功耗降低。5aN28资讯网——每日最新资讯28at.com

待机功耗下降是通过英特尔全集成供电模块(FIVR),实现不同场景下节电优化。在性能能效方面,与第四代至强相比,第五代至强有两个数据提升比较明显,一个是常规的整数计算,第五代至强 SPEC integer 和整数相关的一系列的性能评价指标有 21% 的提升。针对 AI 负载,性能提升更多达到 42%。5aN28资讯网——每日最新资讯28at.com

为了达到这一性能提升,英特尔引入了新的 Raptor cove 核心并将四芯片封装改成两个芯片,这样可以减少芯片间的功耗,把更多功耗放在处理器的性能提升上。另外,DDR 的频率以及 LLC 的提升,这些都是和内存带宽相关的业务,有更好的性能表现。5aN28资讯网——每日最新资讯28at.com

在三级缓存上,第五代至强每个模块的三级缓存容量达到了 5MB,所以这款芯片有高达 320MB 缓存,如果数据集不是很大,大部分的数据都可以放在 LLC 缓存当中,大量减少对内存的访问。而在数据停留在缓存里面和到内存去访问,能带来的性能收益是比较大的。第五代至强在设计上做到同频同延迟下密度提升 30%。5aN28资讯网——每日最新资讯28at.com

内存方面,第五代至强 DDR 速度从 4800MT/s提升到 5600MT/s,英特尔做了很多优化,包括一些 MIM 的内存、基板上走线的提升以及片上的低噪声的供电措施等,还通过 DFE 功能尽可能的减少码间干扰(ISI)。5aN28资讯网——每日最新资讯28at.com

软件解决方案发展迅速,充分利用第五代至强性能

如今数字化又有了新的需求,英特尔通过新的计算范式支持新的数字化需求。云计算是 AI 时代离不开的话题,AI 时代下,存在三个瓶颈,一是算力,二是数据,三是工程化能力。到了 AI 时代,数据中心的耗电量问题,也是摆在企业面前的一座大山。如何提升能效?英特尔的技术专家提出两种方式,一是为前端客户提供智能,二是自身的底层设施智能化。在过去的 10 年,英特尔致力于构建一个完备的生态,通过软、硬件结合帮助生态合作伙伴们充分挖掘和利用底层 CPU 能力。5aN28资讯网——每日最新资讯28at.com

第五代至强可扩展处理器在 AI 推理训练上最高提升了 14 倍,基础架构的存储能够达到 2.8 倍,网络边缘可以达到 3.2 倍,高性能计算能达到 3 倍,数据分析可以达到 3.7 倍,这些综合起来可以获得了多维度的提升,L3 缓存增加,受益最大的是数据库,AI 和大数据分析也会从 L3 的提升中受益。核数增加之后,“红利”最大的是科学计算和大数据。核之间 UPI 总线也会越来越快,所以核数多少对于 AI / 大数据比较重要。当然若是底层主频高了,内存带宽大了,4800MT/s提升至 5600MT/s了,那么大家都能获益。在 AI 当中,通过英特尔 AMX 加速器专门针对矩阵运算,性能便会大幅提升。5aN28资讯网——每日最新资讯28at.com

英特尔在第五代至强产品上充分挖掘 CPU 的能力,通过不同层次的深度挖掘,让 CPU 更适合 AI 场景,成为 AI 时代全能的大侠。5aN28资讯网——每日最新资讯28at.com

5aN28资讯网——每日最新资讯28at.com

第五代至强可扩展处理器将持续保持至强平台性能的领先地位,与第四代至强可扩展处理器相比,其 AI 推理的高性能提升高达 42%,通用计算性能增益 21%。5aN28资讯网——每日最新资讯28at.com

英特尔拥有开放的生态,也帮助行业伙伴直接使用,并很好带动整个生态的发展。英特尔始终致力于在 CPU 上部署 AI,并基于 OpenVINO 对整个模型进行优化、量化。包括推荐、语音识别、图像识别、基因测序等,英特尔均做了大量的优化,尤其是推荐系统,其模型非常大,当 GPU 无法运行的时候,用 CPU 反而是主流的。因为 GPU 不够的时候,就意味着需要跨 GPU,或者说和 CPU 有频繁交互。那么,跟主存有频繁交互的时候,实际上使用 CPU 会更快。因此,对于推荐系统、大模型、稀疏矩阵等,用 CPU 效率更高。5aN28资讯网——每日最新资讯28at.com

5aN28资讯网——每日最新资讯28at.com

对于通用的 AI 工作负载,英特尔采用 AMX 和 AVX-512 两个指令集,基于 OpenVINO 进行优化。在推理的过程中,指令集上可以进行切分,通过加速器定向加速某一部分,整个效果替代传统的基于 GPU 的 AI 模型。5aN28资讯网——每日最新资讯28at.com

5aN28资讯网——每日最新资讯28at.com

依靠第五代英特尔至强可扩展处理器的硬件特性包括对 AI 的支持及内存带宽和吞吐量的提升使得 AI 推理能力也得到了增强,对于最终企业客户而言带来了整体性能的提升。配合软件优化使得在 CPU 上进行大模型推理成为可能。CPU 在推理能力上可以与 GPU 媲美,通过 oneCCL 的加持,甚至可以支持 700 亿参数的模型推理,延迟在 100ms 以内。5aN28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-78151-0.html生成式 AI 算力新台阶,第五代至强可扩展处理器详解

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 金山软件 2023 年营收 85.3 亿元增长 12%,净利润 4.835 亿元扭亏为盈

下一篇: 友盟 + U-APP 首批适配 HarmonyOS NEXT,提供免费的统计分析工具

标签:
  • 热门焦点
  • 影音体验是真的强 简单聊聊iQOO Pad

    影音体验是真的强 简单聊聊iQOO Pad

    大公司的好处就是产品线丰富,非常细分化的东西也能给你做出来,例如早先我们看到了新的vivo Pad2,之后我们又在iQOO Neo8 Pro的发布会上看到了iQOO的首款平板产品iQOO Pad。虽
  • Rust中的高吞吐量流处理

    Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • 从 Pulsar Client 的原理到它的监控面板

    从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 得物效率前端微应用推进过程与思考

    得物效率前端微应用推进过程与思考

    一、背景效率工程随着业务的发展,组织规模的扩大,越来越多的企业开始意识到协作效率对于企业团队的重要性,甚至是决定其在某个行业竞争中突围的关键,是企业长久生存的根本。得物
  • 微信语音大揭秘:为什么禁止转发?

    微信语音大揭秘:为什么禁止转发?

    大家好,我是你们的小米。今天,我要和大家聊一个有趣的话题:为什么微信语音不可以转发?这是一个我们经常在日常使用中遇到的问题,也是一个让很多人好奇的问题。让我们一起来揭开这
  • 拼多多APP上线本地生活入口,群雄逐鹿万亿市场

    拼多多APP上线本地生活入口,群雄逐鹿万亿市场

    Tech星球(微信ID:tech618)文 | 陈桥辉 Tech星球独家获悉,拼多多在其APP内上线了“本地生活”入口,位置较深,位于首页的“充值中心”内,目前主要售卖美食相关的
  • 消息称小米汽车开始筛选交付中心:需至少120个车位

    消息称小米汽车开始筛选交付中心:需至少120个车位

    IT之家 7 月 7 日消息,日前,有微博简介为“汽车行业从业者、长三角一体化拥护者”的微博用户 @长三角行健者 发文表示,据经销商集团反馈,小米汽车目前
  • 到手价3099元起!iQOO Neo8 Pro今日首销:安卓性能最强旗舰

    到手价3099元起!iQOO Neo8 Pro今日首销:安卓性能最强旗舰

    5月23日,iQOO如期举行了新品发布会,全新的iQOO Neo8系列也正式与大家见面,包含iQOO Neo8和iQOO Neo8 Pro两个版本,其中标准版搭载高通骁龙8+,而Pro版更
  • 联想小新Pad Pro 12.6将要推出,搭载高通骁龙 870 处理器

    联想小新Pad Pro 12.6将要推出,搭载高通骁龙 870 处理器

    联想小新Pad Pro 12.6将于秋季新品会上推出,官方按照惯例直接在发布会前给出了机型的所有参数。联想小新 Pad Pro 12.6 将搭载高通骁龙 870 处理器,重量为 5
Top