当前位置:首页 > 科技  > 数码

老黄赢麻了 英伟达H100订单排到24年

来源: 责编: 时间:2023-08-14 22:01:33 276观看
导读 炼大模型佳GPU英伟达H100,全部卖空了!即使现在立即订购,也要等2024年Q1甚至Q2才能用上。这是与英伟达关系密切的云厂商CoreWeave对华尔街日报透露的新消息。从4月初开始,供应就变得异常紧张。仅仅一周之内,预期

炼大模型佳GPU英伟达H100,全部卖空了!YpM28资讯网——每日最新资讯28at.com

即使现在立即订购,也要等2024年Q1甚至Q2才能用上。YpM28资讯网——每日最新资讯28at.com

这是与英伟达关系密切的云厂商CoreWeave对华尔街日报透露的新消息。YpM28资讯网——每日最新资讯28at.com

从4月初开始,供应就变得异常紧张。仅仅一周之内,预期交货时间就从合理水平跳到了年底。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

全球大云厂商亚马逊AWS也证实了这一消息,CEO Adam Selipsky近期表示:YpM28资讯网——每日最新资讯28at.com

A100和H100是先进的……即使对于AWS来说也很难获得。YpM28资讯网——每日最新资讯28at.com

更早时候,马斯克还在一场访谈节目中也说过:GPU现在比d品还难获得。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

如果找“黄牛”买,溢价高达25%。YpM28资讯网——每日最新资讯28at.com

如Ebay上的价格已从出厂价约36000美元涨到了45000美元,而且货源稀少。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

这种形势下,国内的百度、字节、阿里、腾讯等大型科技公司也向英伟达下了总计50亿美元的A800等芯片订单。YpM28资讯网——每日最新资讯28at.com

其中只有10亿美元的货能今年内交付,另外80%也要等2024年才行。YpM28资讯网——每日最新资讯28at.com

那么现有高端GPU都卖给谁了?这一波产能又是卡在了哪?YpM28资讯网——每日最新资讯28at.com

H100卖给谁,老黄说了算YpM28资讯网——每日最新资讯28at.com

ChatGPT爆发以来,擅长训练大模型的英伟达A100、H100成了香饽饽。YpM28资讯网——每日最新资讯28at.com

甚至H100已经可以作为初创公司的一种资产,找投资基金获得抵押贷款。YpM28资讯网——每日最新资讯28at.com

OpenAI、Meta为代表的AI公司,亚马逊、微软为代表的云计算公司,私有云Coreweave和Lambda,以及所有想炼自家大模型的各类科技公司,需求量都巨大。YpM28资讯网——每日最新资讯28at.com

然而卖给谁,基本是英伟达CEO黄仁勋说了算。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

据The Information消息,H100这么紧缺,英伟达把大量的新卡分配给了CoreWeave,对亚马逊微软等老牌云计算公司限量供应。YpM28资讯网——每日最新资讯28at.com

(英伟达还直接投资了CoreWeave。)YpM28资讯网——每日最新资讯28at.com

外界分析是因为这些老牌公司都在开发自己的AI加速芯片、希望减少对英伟达的依赖,那老黄也就成全他们。YpM28资讯网——每日最新资讯28at.com

老黄在英伟达内部还把控了公司日常运营的方方面面,甚至包括“审查销售代表准备对小型潜在客户说什么话”。YpM28资讯网——每日最新资讯28at.com

全公司约40名高管直接向老黄汇报,这比Meta小扎和微软小纳的直接下属加起来还多。YpM28资讯网——每日最新资讯28at.com

一位英伟达前经理透露,“在英伟达,黄仁勋实际上是每一款产品的首席产品官。”YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

前阵子,还传出老黄干了一件夸张的事:要求一些小型云计算公司提供他们的客户名单,想了解GPU的终使用者是谁。YpM28资讯网——每日最新资讯28at.com

外界分析,此举将使英伟达更了解客户对其产品的需求,也引起了对英伟达可能利用这些信息谋取额外利益的担忧。YpM28资讯网——每日最新资讯28at.com

也有人认为,还有一层原因是老黄想知道谁真的在用卡,而谁只是囤卡不用。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

为什么英伟达和老黄现在有这么大的话语权?YpM28资讯网——每日最新资讯28at.com

主要是高端GPU供需太不平衡,根据GPU Utils网站的测算,H100缺口高达43万张。YpM28资讯网——每日最新资讯28at.com

作者Clay Pascal根据各种已知信息和传言估计了AI行业各参与者近期还需要的H100数量。YpM28资讯网——每日最新资讯28at.com

AI公司方面:YpM28资讯网——每日最新资讯28at.com

OpenAI可能需要5万张H100来训练GPT-5YpM28资讯网——每日最新资讯28at.com

Meta据说需要10万YpM28资讯网——每日最新资讯28at.com

InflectionAI的2.2万张卡算力集群计划已公布YpM28资讯网——每日最新资讯28at.com

主要AI初创公司如Anthropic、Character.ai、欧洲的MistraAI和HelsingAI需求各自在1万数量级。YpM28资讯网——每日最新资讯28at.com

云计算公司方面:YpM28资讯网——每日最新资讯28at.com

大型公有云里,亚马逊、微软、谷歌、甲骨文都按3万算,共12万YpM28资讯网——每日最新资讯28at.com

以CoreWeave和Lambda为代表的私有云加起来总共需要10万YpM28资讯网——每日最新资讯28at.com

加起来就是43.2万了。YpM28资讯网——每日最新资讯28at.com

这还没算一些摩根大通、Two Sigma等也开始部署自己算力集群的金融公司和其他行业参与者。YpM28资讯网——每日最新资讯28at.com

那么问题来了,这么大的供应缺口,就不能多生产点吗?YpM28资讯网——每日最新资讯28at.com

老黄也想啊,但是产能被卡住了。YpM28资讯网——每日最新资讯28at.com

产能这次卡在哪里?YpM28资讯网——每日最新资讯28at.com

其实,台积电已经为英伟达调整过一次生产计划了。YpM28资讯网——每日最新资讯28at.com

不过还是没能填补上如此巨大的缺口。YpM28资讯网——每日最新资讯28at.com

英伟达DGX系统副总裁兼总经理Charlie Boyle称,这次并不是卡在晶圆,而是台积电的CoWoS封装技术产能遇到了瓶颈。YpM28资讯网——每日最新资讯28at.com

与英伟达抢台积电产能的正是苹果,要在9月发布会之前搞定下一代iPhone要用的A17芯片。YpM28资讯网——每日最新资讯28at.com

而台积电方面近期表示,预计需要1.5年才能使封装工艺积压恢复正常。YpM28资讯网——每日最新资讯28at.com

CoWoS封装技术是台积电的看家本领,台积电之所以能击败三星成为苹果的独家芯片代工厂靠的就是它。YpM28资讯网——每日最新资讯28at.com

这项技术封装出的产品性能高、可靠性强,H100能拥有3TB/s(甚至更高)的带宽正是得益于此。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

CoWoS全名叫Chip-on-Wafer-on-Substrate,是一种在晶圆层面上的芯片集成技术。YpM28资讯网——每日最新资讯28at.com

这项技术可以将多个芯片封装到厚度仅有100μm的硅中介层上。YpM28资讯网——每日最新资讯28at.com

据介绍,下一代中介层面积将达到6倍reticle,也就是约5000mm?。YpM28资讯网——每日最新资讯28at.com

目前为止,除了台积电,没有哪家厂商拥有这个水平的封装能力。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

虽然CoWoS的确强悍,但没有它就不行吗?其他厂商能不能代工呢?YpM28资讯网——每日最新资讯28at.com

先不说老黄已经表示过“不考虑新增第二家H100代工厂”。YpM28资讯网——每日最新资讯28at.com

从现实上看,可能也真的不行。YpM28资讯网——每日最新资讯28at.com

英伟达此前曾和三星有过合作,但后者从未给英伟达生产过H100系列产品,甚至其他5nm制程的芯片。YpM28资讯网——每日最新资讯28at.com

据此有人推测,三星的技术水平可能无法满足英伟达对尖端GPU的工艺需求。YpM28资讯网——每日最新资讯28at.com

至于英特尔……他们的5nm产品好像还迟迟没有问世。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

既然让老黄换生产厂家行不通,那用户直接改用AMD怎么样?YpM28资讯网——每日最新资讯28at.com

AMD,Yes?YpM28资讯网——每日最新资讯28at.com

如果单论性能的话,AMD倒的确是慢慢追上来了。YpM28资讯网——每日最新资讯28at.com

AMD新推出的MI300X,拥有192GB的HBM3内存、5.2TB/s的带宽,可运行800亿参数模型。YpM28资讯网——每日最新资讯28at.com

而英伟达刚刚发布的DGX GH200,内存为141GB的HBM3e,带宽则为5TB/s。YpM28资讯网——每日最新资讯28at.com

但这并不意味着AMD能马上填补N卡的空缺——YpM28资讯网——每日最新资讯28at.com

英伟达真正的“护城河”,在于CUDA平台。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

CUDA已经建立起一套完整的开发生态,意味着用户要是购买AMD产品,需要更长时间来进行调试。YpM28资讯网——每日最新资讯28at.com

一名某私有云公司的高管表示,没人敢冒险花3亿美元实验部署10000个AMD GPU。YpM28资讯网——每日最新资讯28at.com

这名高管认为,开发调试的周期可能至少需要两个月。YpM28资讯网——每日最新资讯28at.com

在AI产品飞速更新换代的大背景下,两个月的空档期对任何一家厂商来说可能都是致命的。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

不过微软倒是向AMD伸出了橄榄枝。YpM28资讯网——每日最新资讯28at.com

此前有传闻称 ,微软准备和AMD共同开发代号为“雅典娜”的AI芯片。YpM28资讯网——每日最新资讯28at.com

而更早之前,MI200发布时,微软第一个宣布采购,并在其云平台Azure上部署。YpM28资讯网——每日最新资讯28at.com

比如前一阵MSRA的新大模型基础架构RetNet就是在512张AMD MI200上训练的。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

在英伟达占据几乎整个AI市场的格局下,可能需要有人带头冲锋,先整个大型AMD算力集群打样,才有人敢于跟进。YpM28资讯网——每日最新资讯28at.com

不过短时间内,英伟达H100、A100还是主流的选择。YpM28资讯网——每日最新资讯28at.com

One More ThingYpM28资讯网——每日最新资讯28at.com

前一阵苹果发布高支持192GB内存新款M2 Ultra芯片的时候,还有不少从业者畅享过用它来微调大模型。YpM28资讯网——每日最新资讯28at.com

毕竟苹果M系列芯片的内存显存是统一的,192GB内存就是192GB显存,可是80GB H100的2.4倍,又或者24GB RTX4090的8倍。YpM28资讯网——每日最新资讯28at.com

老黄赢麻了 英伟达H100订单排到24年YpM28资讯网——每日最新资讯28at.com

然鹅,有人真的把这台机器买到手后,实际测试训练速度还不如英伟达RTX3080TI,微调都不划算,训练就更别想了。YpM28资讯网——每日最新资讯28at.com

毕竟M系列芯片的算力部分不是专门针对AI计算优化的,光大显存也没用。YpM28资讯网——每日最新资讯28at.com

炼大模型,看来主要还是得靠H100,而H100又求之不得。YpM28资讯网——每日最新资讯28at.com

面对这种情况,网络上甚至流传着一首魔性的“GPU之歌”。YpM28资讯网——每日最新资讯28at.com

很洗脑,慎入。YpM28资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-24-5451-0.html老黄赢麻了 英伟达H100订单排到24年

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 百元矿卡魔改GTX 1070玩游戏?先别激动

下一篇: 数十万张缺口 GPU瓶颈到底卡住了谁?

标签:
  • 热门焦点
  • 6月安卓手机性价比榜:Note 12 Turbo断层式碾压

    6月安卓手机性价比榜:Note 12 Turbo断层式碾压

    6月份有一个618,虽然这是京东周年庆的日子,但别的电商也都不约而同的跟进了,反正促销没坏处,厂商和用户都能满意。618期间一些产品也出现了历史低价,那么各个价位段的产品性价比
  • 线程通讯的三种方法!通俗易懂

    线程通讯的三种方法!通俗易懂

    线程通信是指多个线程之间通过某种机制进行协调和交互,例如,线程等待和通知机制就是线程通讯的主要手段之一。 在 Java 中,线程等待和通知的实现手段有以下几种方式:Object 类下
  • Rust中的高吞吐量流处理

    Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • 慕岩炮轰抖音,百合网今何在?

    慕岩炮轰抖音,百合网今何在?

    来源:价值研究所 作者:Hernanderz“难道就因为自己的一个产品牛逼了,从客服到总裁,都不愿意正视自己产品和运营上的问题,选择逃避了吗?”这一番话,出自百合网联合创
  • ESG的面子与里子

    ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 质感不错!OPPO K11渲染图曝光:旗舰IMX890传感器首次下放

    质感不错!OPPO K11渲染图曝光:旗舰IMX890传感器首次下放

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
  • 滴滴违法违规被罚80.26亿 共存在16项违法事实

    滴滴违法违规被罚80.26亿 共存在16项违法事实

    滴滴违法违规被罚80.26亿 存在16项违法事实开始于2121年7月,历经一年时间,网络安全审查办公室对“滴滴出行”网络安全审查终于有了一个暂时的结束。据“网信
  • Meta盲目扩张致超万人被裁,重金押注元宇宙而前景未明

    Meta盲目扩张致超万人被裁,重金押注元宇宙而前景未明

    图片来源:图虫创意日前,Meta创始人兼CEO 马克·扎克伯发布公开信,宣布Meta计划裁员超11000人,占其员工总数13%。他公开承认了自己的预判失误:“不仅
  • 荣耀Magic4 至臻版 首创智慧隐私通话 强劲影音系统

    荣耀Magic4 至臻版 首创智慧隐私通话 强劲影音系统

    2022年第一季度临近尾声,在该季度内,许多品牌陆续发布自己的最新产品,让大家从全新的角度来了解当今的手机技术。手机是电子设备中,更新迭代十分迅速的一款产品,基
Top