当前位置:首页 > 科技  > 数码

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍

来源: 责编: 时间:2025-09-02 09:14:35 62观看
导读 快科技8月29日消息,NVIDIA日前发布了2季度财报,业绩依然暴涨,新一代AI显卡Blackwell系列中的强者GB300今年4季度也会正式上市,下下代的Rubin有6款产品正在推进。GB300的详细规格可以参考之前的文章,这里要来看一

快科技8月29日消息,NVIDIA日前发布了2季度财报,业绩依然暴涨,新一代AI显卡Blackwell系列中的强者GB300今年4季度也会正式上市,下下代的Rubin有6款产品正在推进。aMo28资讯网——每日最新资讯28at.com

GB300的详细规格可以参考之前的文章,这里要来看一个可能影响中美AI技术的变化,那就是在算法选择上,国产的AI跟NVIDIA已经有了分裂,前者选择的是UE8M0 FP8,而在Blackwell上NVIDIA强化的是NVFP4标准。aMo28资讯网——每日最新资讯28at.com

UE8M0 FP8这几天引爆了国产算力行业,这是Deepseek 3.1正式问世时DS官方公布的消息,称UE8M0 FP8已经全面适配即将发布的新一代国产AI芯片。aMo28资讯网——每日最新资讯28at.com

虽然没有特指哪家厂商,但是华为昇腾、摩尔线程、砺算科技、芯原科技、海光科技等厂商的新一代算力芯片几乎都会支持这个标准。aMo28资讯网——每日最新资讯28at.com

相比之前国产AI算力芯片主要采用FP16+INT8的算法标准,UE8M0 FP8带来的好处很多,性能是之前的2-3倍,并且大幅降低显存压力,还能降低功耗,具体就要看各大厂商的实现了。aMo28资讯网——每日最新资讯28at.com

那作为AI一哥的NVIDIA呢?相比国内AI领域率先有DS这种模型厂商来协同算法标准的情况,NVIDIA这几年一直以算力芯片上游厂商的身份来推动标准,FP64、FP32、FP16、INT8、FP8等标准都是支持的,而在Blackwell架构上,NVIDIA也支持FP4、MXFP4这两种标准,但重点推的是NVFP4,它跟E2M1 FP4结构差不多,但精度几乎没有多少损失。aMo28资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍aMo28资讯网——每日最新资讯28at.com

NVFP4标准的优点有哪些?首先来看性能上的,GB300的稠密性能大幅提升了50%而来到15PFlops,要知道它跟GB200基本架构可没什么变化。aMo28资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍aMo28资讯网——每日最新资讯28at.com

50%的性能提升或许不够惊人,那再来看看精度变化。aMo28资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍aMo28资讯网——每日最新资讯28at.com

与FP8的基准相比,NVFP4在DS 0528的模型精度上几乎持平,大部分落后不到1个百分点,AIME 2024中甚至还领先了2个百分点。aMo28资讯网——每日最新资讯28at.com

在内存使用上,NVFP4与FP16相比占用减少了3.5倍,相比FP8也减少了1.8倍,而GB300显卡HBM容量也从GB200的186GB提升到了288GB,同样的NVL72机柜中,系统的总内存容量可达40TB,能支持3000亿参数的大模型。aMo28资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍aMo28资讯网——每日最新资讯28at.com

第三个优势则是在能效上,GB300在NVFP4的支持下,每Token的能量消耗只有0.2J,GB200则是0.4J,H100架构的H100是10J,相比之下提升了50倍的能效。aMo28资讯网——每日最新资讯28at.com

简单来说,NVIDIA这次主导的NVFP4算法标准性能提升了50%,精度比FP8几乎没有损失,内存占用大幅减少2-3倍,能效则是50倍提升。aMo28资讯网——每日最新资讯28at.com

考虑到NVIDIA的影响力,NVFP4显然会成为前沿大模型广泛使用的算法标准,国内大厂应该也会大规模使用。aMo28资讯网——每日最新资讯28at.com

但在国产AI芯片上,UE8M0 FP8也已经成为新一代AI芯片的标准,尽管它还不能超越NVIDIA的CUDA生态,但是这显然也是国产AI软件及硬件领域的一次重大协同,同样有机会杀出重围,或许也能打造出自己的优势范围呢,一切都有可能。aMo28资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍aMo28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-179747-0.html与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 2nm晶圆超20万元 台积电暗示再涨价10%:手机、显卡都会更贵

下一篇: 极地纯白设计!蓝宝石PURE极地B850M WIFI主板图赏

标签:
  • 热门焦点
  • 一加Ace2 Pro真机揭晓 钛空灰配色质感拉满

    终于,在经过了几波预热之后,一加Ace2 Pro的外观真机图在网上出现了。还是博主数码闲聊站曝光的,这次的外观设计还是延续了一加11的方案,只是细节上有了调整,例如新加入了钛空灰
  • 从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 重估百度丨“晚熟”的百度云,能等到春天吗?

    ©自象限原创作者|程心排版|王喻可2016年7月13日,百度云计算战略发布会在北京举行,宣告着百度智能云的正式启程。彼时的会场座无虚席,甚至排队排到了门外,在场的所有人几乎都
  • 2纳米决战2025

    集微网报道 从三强争霸到四雄逐鹿,2nm的厮杀声已然隐约传来。无论是老牌劲旅台积电、三星,还是誓言重回先进制程领先地位的英特尔,甚至初成立不久的新
  • Counterpoint :OPPO双旗舰战略全面落地 高端产品销量增长22%

    2023年6月30日,全球行业分析机构Counterpoint Research发布的《中国智能手机高端市场白皮书》显示,中国智能手机品牌正在寻求高质量发展,中国高端智能
  • 2022爆款:ROG魔霸6 冰川散热系统持续护航

    喜逢开学季,各大商家开始推出自己的新产品,进行打折促销活动。对于忠实的端游爱好者来说,能够拥有一款梦寐以求的笔记本电脑是一件十分开心的事。但是现在的
  • 苹果MacBook Pro 2021测试:仍不支持平滑滚动

    据10月30日9to5 Mac 消息报道,苹果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后获得了不错的评价,亮点包括行业领先的性能,令人印象深刻的电池续航,精美丰
  • “买真退假” 这种“羊毛”不能薅

    □ 法治日报 记者 王春   □ 本报通讯员 胡佳丽  2020年初,还在上大学的小东加入了一个大学生兼职QQ群。群主“七王”在群里介绍一些刷单赚
  • 外交部:美方应停止在网络安全问题上不负责任地指责他国

      中国外交部今天(16日)举行例行记者会。会上,有记者问,美国情报官员称,他们正在阻拦来自中国以及其他国家的黑客获取相关科研成果。 中方对此有何评论?对此
Top