当前位置:首页 > 科技  > 网络

英伟达摊上大事儿了

来源: 责编: 时间:2024-08-06 09:01:13 408观看
导读 英伟达摊上大事儿了。据《The Information》报道,英伟达的新杀手锏——采用Blackwell架构的AI GPU从原定的今年Q3推迟到2025年Q1推出。据称,这款 GPU 存在设计缺陷,因此需要推迟发布产品以解决问题

英伟达摊上大事儿了。kcF28资讯网——每日最新资讯28at.com

据《The Information》报道,英伟达的新杀手锏——采用Blackwell架构的AI GPU从原定的今年Q3推迟到2025年Q1推出。据称,这款 GPU 存在设计缺陷,因此需要推迟发布产品以解决问题。kcF28资讯网——每日最新资讯28at.com

这一推迟直接鸽了微软、Meta 和 xAI 等大客户,这些公司总共订购了价值数百亿美元的芯片,关键数据中心的建设可能会因此受到影响。kcF28资讯网——每日最新资讯28at.com

有从业者表示,这可能会导致英伟达失去客户的信任,并存在被诉讼的可能。kcF28资讯网——每日最新资讯28at.com

尽管英伟达发言人很快做出了回复,并表示:“Hopper 的需求非常强劲,Blackwell 的产量将在下半年逐步提升。”kcF28资讯网——每日最新资讯28at.com

但种种迹象显示,被硅谷巨头们寄予厚望的Blackwell,可能真的要“跳票”了。kcF28资讯网——每日最新资讯28at.com

英伟达摊上大事儿了kcF28资讯网——每日最新资讯28at.com

硅谷巨头的“白月光”kcF28资讯网——每日最新资讯28at.com

当采用Blackwell架构的B100/B200芯片在GTC大会亮相后,知名华尔街投行Keybanc Capital Markets发出了一份预测:kcF28资讯网——每日最新资讯28at.com

“Blackwell芯片将推动英伟达数据中心业务的收入,从2024财年(截至2024年1月)的475亿美元增长到2025年的2000多亿美元。”kcF28资讯网——每日最新资讯28at.com

众所周知,在大模型的训练与部署中,英伟达的高性能算卡居功至伟,但BlackWell真的能凭一己之力带动业绩翻倍上涨吗?kcF28资讯网——每日最新资讯28at.com

答案是完全有可能,甚至未来五年内,硅谷巨头之间的军备竞赛,在硬件层面将完全基于Blackwell架构芯片展开。kcF28资讯网——每日最新资讯28at.com

首先需要明确的是,Blackwell并不是一种芯片,而是一个平台,可以把它看作是过去Hooper架构的延伸,但性能却实现了全方位的碾压。kcF28资讯网——每日最新资讯28at.com

在Blackwell架构的芯片上,英伟达承袭了H200上“拼装芯片”的思路,采用统一内存架构+双芯配置,将2枚GPU Die(裸晶)拼接到一个GPU上,实现192GB HBM3e内存及8TB/s显存带宽。kcF28资讯网——每日最新资讯28at.com

相较于前代产品Hooper架构GPU,Blackwell结构GPU单芯片训练性能(FP8)是Hooper架构的2.5倍,推理性能(FP4)是Hooper架构的5倍。kcF28资讯网——每日最新资讯28at.com

Blackwell架构的能耗表现也异常优秀,在GTC大会现场,黄仁勋曾提到过一个举证:kcF28资讯网——每日最新资讯28at.com

“训练一个1.8万亿参数的模型,需要8000个Hopper GPU和15MW的电力,而2000个Blackwell GPU就能完成这项工作,耗电量仅为4MW。kcF28资讯网——每日最新资讯28at.com

除了性能与功耗外,Blackwell架构真正的杀手锏是其使用了“第二代Transformer引擎”以及“第五代NVLink网络技术”。kcF28资讯网——每日最新资讯28at.com

前者通过对每个神经元使用4位而不是8位的精度,使得计算能力、带宽和模型参数规模翻倍。后者则是大幅提升了GPU集群的通信效率,高支持多达576个GPU间的无缝高速通信,解决了万亿参数混合专家模型通信瓶颈的问题。kcF28资讯网——每日最新资讯28at.com

在科技巨头们重金押注AI、自建数据中心的今天,Blackwell架构芯片所展示出的特性,让他们实在没有理由拒绝。kcF28资讯网——每日最新资讯28at.com

不过,就是这样一个具有划时代意义的平台,很可能存在设计缺陷。kcF28资讯网——每日最新资讯28at.com

正如上文所提到的,英伟达的设计思路是将两枚Die封装在一个GPU上,来实现性能的大幅度提升,但这也带来了隐患。根据《The Information》援引知情人士的爆料,近几周当台积电的工程师为量产做准备工作时,发现这个架构的连接处设计存在缺陷,会导致芯片的良率和产能受到较为严重的影响。kcF28资讯网——每日最新资讯28at.com

因此,原定的量产计划被终止,英伟达需要重新对Blackwell进行版图设计,而在此之后,台积电也不得再进行一轮试生产工作。kcF28资讯网——每日最新资讯28at.com

谁会受伤?kcF28资讯网——每日最新资讯28at.com

同样受这一设计缺陷影响的,可能还有同样采用Blackwell架构的英伟达RTX50系列显卡。kcF28资讯网——每日最新资讯28at.com

根据新曝料,原本预计在今年第四季发布的Blackwell RTX 50系列,将在明年1月7-10日举办的CES 2025大展上才会发布。与B100/B200这类用于AI的高性能GPU显卡不同,RTX系列是英伟达面向游戏玩家开发的显卡序列,如果不同如期发布,所带来的负面影响同样不容小觑。kcF28资讯网——每日最新资讯28at.com

当然,受伤的还是硅谷的互联网巨头们。kcF28资讯网——每日最新资讯28at.com

在AI热潮下,科技巨头动辄豪掷数十亿美元购买高性能计算卡也屡见不鲜,而在Blackwell问世后,这些公司似乎为其准备了更多的”弹药“。kcF28资讯网——每日最新资讯28at.com

据新季度财报显示,微软、Alphabet、亚马逊和Meta在2024年前六个月的资本支出大幅增加。不仅如此,为了在AI军备赛中保持领先地位,这些巨头还纷纷上调了支出指引,预示着对GPU的采购需求有增无减。kcF28资讯网——每日最新资讯28at.com

而这些热钱,大部分都流向了“卖铲人”英伟达。kcF28资讯网——每日最新资讯28at.com

作为英伟达大客户之一,微软内部定下了到 2024 年底囤积 180 万块 AI 芯片的目标,计划在明年 1 月向 OpenAI 提供采用 Blackwell 芯片的服务器。金融服务公司 DA Davidson 的分析师估计,去年微软在英伟达芯片上花费了 45 亿美元(325.6 亿元人民币),并计划在 2024 年将拥有的 GPU 数量增加两倍。kcF28资讯网——每日最新资讯28at.com

同样摩拳擦掌的还有Meta,在Blackwell于GTC大会上亮相的第二天,扎克伯格就发布声明表示,Meta计划将使用Blackwell来训练Llama模型。另据扎克伯格在今年年初的披露,Meta计划在年底前储备约60万枚高性能GPU,其中采用Hopper架构的H100芯片将占35万枚,而剩下的25万芯片,大概率会把位置留给Blackwell架构芯片。kcF28资讯网——每日最新资讯28at.com

值得一提的是,号称要自行研发AI芯片的马斯克,也对Blackwell展现出了极大的兴趣,他计划在2025年购买30万块 B200 GPU,金额高达90亿美元(652亿元人民币)。这批新GPU将升级X现有的 AI GPU 集群,该集群目前由10万块上一代H100 GPU组成。kcF28资讯网——每日最新资讯28at.com

随着下一代大模型所需算力的翻倍提升,各巨头间的算力军备竞赛又卷上了新高度,也让AI巨头对Blackwell B200的需求与日俱增,而这次英伟达出乎意料的延期,让这场看不到尽头的战争变得更加扑朔迷离。kcF28资讯网——每日最新资讯28at.com


文章出处:虎嗅网

本文链接:http://www.28at.com/showinfo-17-105934-0.html英伟达摊上大事儿了

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 乒乓球女单决赛不理性应援!抖音治理奥运会期间饭圈违规内容

下一篇: 诺贝尔物理学奖获得者李政道去世 张朝阳悼念:巨星陨落

标签:
  • 热门焦点
  • vivo TWS Air开箱体验:真轻 臻好听

    在vivo S15系列新机的发布会上,vivo的最新款真无线蓝牙耳机vivo TWS Air也一同发布,本次就这款耳机新品给大家带来一个简单的分享。外包装盒上,vivo TWS Air保持了vivo自家产
  • 6月安卓手机好评榜:魅族20 Pro蝉联冠军

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年6月1日至6月30日,仅限国内市场。第一名:魅族20 Pro好评率:95%5月份的时候魅族20 Pro就是
  • iPhone卖不动了!苹果股价创年内最大日跌幅:市值一夜蒸发万亿元

    8月5日消息,今天凌晨美股三大指数高开低走集体收跌,道指跌0.41%;纳指跌0.36%;标普500指数跌0.52%。热门科技股也都变化极大,其中苹果报181.99美元,跌4.8%,创
  • Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • 如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • 只需五步,使用start.spring.io快速入门Spring编程

    步骤1打开https://start.spring.io/,按照屏幕截图中的内容创建项目,添加 Spring Web 依赖项,并单击“生成”按钮下载 .zip 文件,为下一步做准备。请在进入步骤2之前进行解压。图
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • iQOO Neo8系列今日官宣:首发天玑9200+ 全球安卓最强芯!

    在昨日举行的的联发科新一代旗舰芯片天玑9200+的发布会上,iQOO官方也正式宣布,全新的iQOO Neo8系列新品将全球首发搭载这款当前性能最强大的移动平台
  • 中关村论坛11月25日开幕,15位诺奖级大咖将发表演讲

    11月18日,记者从2022中关村论坛新闻发布会上获悉,中关村论坛将于11月25至30日在京举行。本届中关村论坛由科学技术部、国家发展改革委、工业和信息化部、国务
Top