当前位置:首页 > 科技  > 数码

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片

来源: 责编: 时间:2024-04-11 17:30:02 354观看
导读 AI的纷争越来越激烈,老黄跟苏妈都相继推出了自家的AI加速器。不过大家似乎忘记了还有一个芯片巨头——Intel。在美国亚利桑那州Intel Vision 2024会议上,Intel发布性能强的新一代Gaudi3 AI 加速芯

AI的纷争越来越激烈,老黄跟苏妈都相继推出了自家的AI加速器。不过大家似乎忘记了还有一个芯片巨头——Intel。khv28资讯网——每日最新资讯28at.com

在美国亚利桑那州Intel Vision 2024会议上,Intel发布性能强的新一代Gaudi3 AI 加速芯片。当然,也包括全新的下一代英特尔至强6处理器等产品。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

不过,我们今天的重点还是看看这个号称“超越H100”的Gaudi3 AI 加速芯片。khv28资讯网——每日最新资讯28at.com

Intel的Gaudi AI加速芯片已经推出了三代了,现有的Gaudi2芯片已经是两年前的产物,在2023年7月才正式引入国内,不错的性能与性价比一度成为不少大厂的优选。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

从下图可以看到,Gaudi2 AI芯片为台积电7nm工艺制造,集成24个可编程的Tenor张量核心(TPC)、48MB SRAM缓存、21个10万兆内部互连以太网接口(ROCEv2 RDMA)、96GB HBM2E高带宽内存(总带宽2.4TB/s)、多媒体引擎等,支持PCIe 4.0 x16,高功耗800W。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

而全新一代的Gaudi3 AI芯片显然更胜一筹,专为高性能、高效率的生成式 AI 计算而生。其采用台积电5nm工艺打造,每个加速器都具有独特的异构计算引擎,由64个AI定制和可编程TPC和8个MME组成,支持128GB HBMe2内存以及配备96MB SRAM缓存。khv28资讯网——每日最新资讯28at.com

相比上代产品,Intel的 Gaudi 3带来了4倍的BF16 AI计算能力提升,1.5 倍的内存带宽以及 2 倍的网络带宽提升。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

同时,每个Gaudi 3当中都集成24个200 Gb以太网端口,提供灵活且开放标准的网络。而Gaudi 3 的PCIe 功率为600w,带宽为每秒 3.7TB。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

当然,AI芯片重要的还是性能表现,在AI模型算力中,相比NVIDIA的H100 GPU,Gaudi3 AI芯片的模型训练速度、推理速度都更出色,分别提升了40%和50%,平均性能提升达到了50%,能效更是提高了40%,更重要的是,Gaudi3 AI芯片的成本比H100更低,妥妥的性能更强,价格更低。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

即使是面对NVIDIA的H200 GPU,Gaudi 3也毫不逊色。在LLAMA-7B以及LLAMA-70B的部分场景与H200基本是伯仲之间,差距基本在10%以内。如果是在Faicon 180B的大模型里,Gaudi 3的推理吞吐量和能效则非常出色,高甚至可以领先H200 30%以上。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

性能表现想必已经足够惊艳你了,Intel还为Gaudi 3提供多种灵活的形态,包括OAM兼容夹层卡、通用基板、PCIe扩展卡。其中OAM的型号是HL-325L,其实就是单颗Gaudi 3的性能表现,TDP设定为900W,一般用于风冷型服务器。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

更高端的HLB-325则包含八颗 Gaudi 3芯片,提供 14.6 PFLOPS FP8 性能,1TB带宽速率达 29.6TB/s的HBM2e 内存,64个线性计算引擎,192条200GbE 网络总线,9.6TB/s吞吐能力。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

当然,还有更加精致小巧的版本,适合普通用户选用。PCIe 版本型号为 HL-338,提供单卡 1835 TFLOPS FP8 峰值性能,128GB HBM2e 内存,8个线性计算引擎,24条200GbE网络总线,600W TDP,整张卡仅有两槽宽。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

硬件够硬,软件也要够软。软件生态方面,Intel也在发力,Gaudi 3将针对生成式AI提供端到端全栈AI软件解决方案,包括嵌入式软件、软件套件、AI软件、AI应用等。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

Gaudi 3 AI加速芯片兼具高性能、经济实用、节能、可快速部署等优点,能够充分满足复杂性、成本效益、碎片化、数据可靠性、合规性等AI应用需求。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

Intel在Vision 2024上也同步介绍了这款芯片的生产节点,计划在今年第三季度向客户发货Gaudi 3 AI芯片,包括联想、惠普、Dell和Supermicro等OEM厂商都会使用这款新品构建系统。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com

随着Gaudi 3的正式发布,当前AI芯片市场呈现出NVIDIA B200、AMD MI300系列和Intel Gaudi 3三足鼎立的格局。khv28资讯网——每日最新资讯28at.com

Intel希望能够利用长期的 AI 技术积累,通过开放生态系统的力量以及出色的Gaudi 3硬件基础,乘上AI的热潮。khv28资讯网——每日最新资讯28at.com

此次的Gaudi 3 AI加速芯片虽然有着出色的性能与极具竞争力的定价,不过AI领域绕不开的还有生态,这方面NVIDIA依旧是遥遥领先与红蓝两家,现在AMD与Intel在硬件层面已经追上来了,在软件层面我们也期待它们能够持续进步,让AI新技术普及、普惠到各行各业。khv28资讯网——每日最新资讯28at.com

性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片khv28资讯网——每日最新资讯28at.com


文章出处:太平洋科技

本文链接:http://www.28at.com/showinfo-24-82863-0.html性能超越H100!老黄的劲敌来了 一文了解Intel新Gaudi 3 AI加速芯片

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 台湾省7.3级地震不会让内存涨价!影响不到1%

下一篇: 苹果回应 iPhone“零件序列化”争议:兼容多数第三方零件、提高维修透明度

标签:
  • 热门焦点
  • Redmi Buds 4开箱简评:才199还有降噪 可以无脑入

    在上个月举办的Redmi Note11T Pro系列新机发布会上,除了两款手机新品之外,Redmi还带来了两款TWS真无线蓝牙耳机产品,Redmi Buds 4和Redmi Buds 4 Pro,此前我们在Redmi Note11T
  • 7月安卓手机性价比榜:努比亚+红魔两款新机入榜

    7月登场的新机有努比亚Z50S Pro和红魔8S Pro,除了三星之外目前唯二的两款搭载超频版骁龙8Gen2处理器的产品,而且努比亚和红魔也一贯有着不错的性价比,所以在本次的性价比榜单
  • 三言两语说透设计模式的艺术-单例模式

    写在前面单例模式是一种常用的软件设计模式,它所创建的对象只有一个实例,且该实例易于被外界访问。单例对象由于只有一个实例,所以它可以方便地被系统中的其他对象共享,从而减少
  • 得物效率前端微应用推进过程与思考

    一、背景效率工程随着业务的发展,组织规模的扩大,越来越多的企业开始意识到协作效率对于企业团队的重要性,甚至是决定其在某个行业竞争中突围的关键,是企业长久生存的根本。得物
  • Flowable工作流引擎的科普与实践

    一.引言当我们在日常工作和业务中需要进行各种审批流程时,可能会面临一系列技术和业务上的挑战。手动处理这些审批流程可能会导致开发成本的增加以及业务复杂度的上升。在这
  • 从零到英雄:高并发与性能优化的神奇之旅

    作者 | 波哥审校 | 重楼作为公司的架构师或者程序员,你是否曾经为公司的系统在面对高并发和性能瓶颈时感到手足无措或者焦头烂额呢?笔者在出道那会为此是吃尽了苦头的,不过也得
  • 东方甄选单飞:有些鸟注定是关不住的

    作者:彭宽鸿来源:华尔街科技眼‍‍‍‍‍‍‍‍‍‍东方甄选创始人俞敏洪带队的“7天甘肃行”直播活动已在近日顺利收官。成立后一
  • 支持aptX Lossless无损传输 iQOO TWS 1赛道版发布限时优惠价369元

    2023年7月4日,“无损音质,声动人心”iQOO TWS 1正式发布,支持aptX Lossless无损传输,限时优惠价369元。iQOO TWS 1耳机率先支持端到端aptX Lossless无
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
Top