当前位置:首页 > 科技  > 数码

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍

来源: 责编: 时间:2025-09-02 09:14:35 128观看
导读 快科技8月29日消息,NVIDIA日前发布了2季度财报,业绩依然暴涨,新一代AI显卡Blackwell系列中的强者GB300今年4季度也会正式上市,下下代的Rubin有6款产品正在推进。GB300的详细规格可以参考之前的文章,这里要来看一

快科技8月29日消息,NVIDIA日前发布了2季度财报,业绩依然暴涨,新一代AI显卡Blackwell系列中的强者GB300今年4季度也会正式上市,下下代的Rubin有6款产品正在推进。6o828资讯网——每日最新资讯28at.com

GB300的详细规格可以参考之前的文章,这里要来看一个可能影响中美AI技术的变化,那就是在算法选择上,国产的AI跟NVIDIA已经有了分裂,前者选择的是UE8M0 FP8,而在Blackwell上NVIDIA强化的是NVFP4标准。6o828资讯网——每日最新资讯28at.com

UE8M0 FP8这几天引爆了国产算力行业,这是Deepseek 3.1正式问世时DS官方公布的消息,称UE8M0 FP8已经全面适配即将发布的新一代国产AI芯片。6o828资讯网——每日最新资讯28at.com

虽然没有特指哪家厂商,但是华为昇腾、摩尔线程、砺算科技、芯原科技、海光科技等厂商的新一代算力芯片几乎都会支持这个标准。6o828资讯网——每日最新资讯28at.com

相比之前国产AI算力芯片主要采用FP16+INT8的算法标准,UE8M0 FP8带来的好处很多,性能是之前的2-3倍,并且大幅降低显存压力,还能降低功耗,具体就要看各大厂商的实现了。6o828资讯网——每日最新资讯28at.com

那作为AI一哥的NVIDIA呢?相比国内AI领域率先有DS这种模型厂商来协同算法标准的情况,NVIDIA这几年一直以算力芯片上游厂商的身份来推动标准,FP64、FP32、FP16、INT8、FP8等标准都是支持的,而在Blackwell架构上,NVIDIA也支持FP4、MXFP4这两种标准,但重点推的是NVFP4,它跟E2M1 FP4结构差不多,但精度几乎没有多少损失。6o828资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍6o828资讯网——每日最新资讯28at.com

NVFP4标准的优点有哪些?首先来看性能上的,GB300的稠密性能大幅提升了50%而来到15PFlops,要知道它跟GB200基本架构可没什么变化。6o828资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍6o828资讯网——每日最新资讯28at.com

50%的性能提升或许不够惊人,那再来看看精度变化。6o828资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍6o828资讯网——每日最新资讯28at.com

与FP8的基准相比,NVFP4在DS 0528的模型精度上几乎持平,大部分落后不到1个百分点,AIME 2024中甚至还领先了2个百分点。6o828资讯网——每日最新资讯28at.com

在内存使用上,NVFP4与FP16相比占用减少了3.5倍,相比FP8也减少了1.8倍,而GB300显卡HBM容量也从GB200的186GB提升到了288GB,同样的NVL72机柜中,系统的总内存容量可达40TB,能支持3000亿参数的大模型。6o828资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍6o828资讯网——每日最新资讯28at.com

第三个优势则是在能效上,GB300在NVFP4的支持下,每Token的能量消耗只有0.2J,GB200则是0.4J,H100架构的H100是10J,相比之下提升了50倍的能效。6o828资讯网——每日最新资讯28at.com

简单来说,NVIDIA这次主导的NVFP4算法标准性能提升了50%,精度比FP8几乎没有损失,内存占用大幅减少2-3倍,能效则是50倍提升。6o828资讯网——每日最新资讯28at.com

考虑到NVIDIA的影响力,NVFP4显然会成为前沿大模型广泛使用的算法标准,国内大厂应该也会大规模使用。6o828资讯网——每日最新资讯28at.com

但在国产AI芯片上,UE8M0 FP8也已经成为新一代AI芯片的标准,尽管它还不能超越NVIDIA的CUDA生态,但是这显然也是国产AI软件及硬件领域的一次重大协同,同样有机会杀出重围,或许也能打造出自己的优势范围呢,一切都有可能。6o828资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍6o828资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-179747-0.html与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 2nm晶圆超20万元 台积电暗示再涨价10%:手机、显卡都会更贵

下一篇: 极地纯白设计!蓝宝石PURE极地B850M WIFI主板图赏

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 印度登月最关键一步!月船三号今晚进入环月轨道

    8月5日消息,据印度官方消息,月船三号将于北京时间今晚21时30分左右开始近月制动进入环月轨道。这是该探测器能够成功的最关键步骤之一,如果成功将开始围
  • CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • 一年经验在二线城市面试后端的经验分享

    忠告这篇文章只适合2年内工作经验、甚至没有工作经验的朋友阅读。如果你是2年以上工作经验,请果断划走,对你没啥帮助~主人公这篇文章内容来自 「升职加薪」星球星友 的投稿,坐
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • 腾讯盖楼,字节拆墙

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之“想重温暴刷深渊、30+技能搭配暴搓到爽的游戏体验吗?一起上晶核,即刻暴打!”曾凭借直播腾讯旗下代理格斗游戏《DNF》一
  • 自研Exynos回归!三星Galaxy S24系列将提供Exynos和骁龙双版本

    年初,全新的三星Galaxy S23系列发布,包含Galaxy S23、Galaxy S23+和Galaxy S23 Ultra三个版本,全系搭载超频版骁龙8 Gen 2,虽同样采用台积电4nm工艺制
  • 3699元!iQOO Neo8 Pro顶配版今日首销:1TB UFS 4.0同价位唯一

    5月23日,iQOO推出了全新的iQOO Neo8系列,包含iQOO Neo8和iQOO Neo8 Pro两个版本,其中标准版搭载高通骁龙8+,而Pro版更是首发搭载了联发科天玑9200+旗舰
  • iQOO Neo8 Pro即将开售:到手价3099元起 安卓性能最强旗舰

    5月23日,iQOO如期举行了新品发布会,全新的iQOO Neo8系列也正式与大家见面,包含iQOO Neo8和iQOO Neo8 Pro两个版本,其中标准版搭载高通骁龙8+,而Pro版更
Top