当前位置:首页 > 科技  > 数码

强大模型训练芯片H200发布!141G大内存 AI推理高提升90%

来源: 责编: 时间:2023-11-14 17:08:45 367观看
导读 英伟达老黄,带着新一代GPU芯片H200再次炸场。 官网毫不客气就直说了,“世界强GPU,专为AI和超算打造”。 听说所有AI公司都抱怨内存不够? 这回直接141GB大内存,与H100的80GB相比直接提升76%。 作为首

英伟达老黄,带着新一代GPU芯片H200再次炸场。RhR28资讯网——每日最新资讯28at.com

官网毫不客气就直说了,“世界强GPU,专为AI和超算打造”。RhR28资讯网——每日最新资讯28at.com

强大模型训练芯片H200发布!141G大内存 AI推理高提升90%RhR28资讯网——每日最新资讯28at.com

听说所有AI公司都抱怨内存不够?RhR28资讯网——每日最新资讯28at.com

这回直接141GB大内存,与H100的80GB相比直接提升76%。RhR28资讯网——每日最新资讯28at.com

作为首款搭载HBM3e内存的GPU,内存带宽也从3.35TB/s提升至4.8TB/s,提升43%。RhR28资讯网——每日最新资讯28at.com

强大模型训练芯片H200发布!141G大内存 AI推理高提升90%RhR28资讯网——每日最新资讯28at.com

对于AI来说意味着什么?来看测试数据。RhR28资讯网——每日最新资讯28at.com

在HBM3e加持下,H200让Llama-70B推理性能几乎翻倍,运行GPT3-175B也能提高60%。RhR28资讯网——每日最新资讯28at.com

强大模型训练芯片H200发布!141G大内存 AI推理高提升90%RhR28资讯网——每日最新资讯28at.com

对AI公司来说还有一个好消息:RhR28资讯网——每日最新资讯28at.com

H200与H100完全兼容,意味着将H200添加到已有系统中不需要做任何调整。RhR28资讯网——每日最新资讯28at.com

强AI芯片只能当半年RhR28资讯网——每日最新资讯28at.com

除内存大升级之外,H200与同属Hopper架构的H100相比其他方面基本一致。RhR28资讯网——每日最新资讯28at.com

台积电4nm工艺,800亿晶体管,NVLink 4每秒900GB的高速互联,都被完整继承下来。RhR28资讯网——每日最新资讯28at.com

甚至峰值算力也保持不变,数据一眼看过去,还是熟悉的FP64 Vector 33.5TFlops、FP64 Tensor 66.9TFlops。RhR28资讯网——每日最新资讯28at.com

强大模型训练芯片H200发布!141G大内存 AI推理高提升90%RhR28资讯网——每日最新资讯28at.com

对于内存为何是有零有整的141GB,AnandTech分析HBM3e内存本身的物理容量为144GB,由6个24GB的堆栈组成。RhR28资讯网——每日最新资讯28at.com

出于量产原因,英伟达保留了一小部分作为冗余,以提高良品率。RhR28资讯网——每日最新资讯28at.com

仅靠升级内存,与2020年发布的A100相比,H200就在GPT-3 175B的推理上加速足足18倍。RhR28资讯网——每日最新资讯28at.com

H200预计在2024年第2季度上市,但强AI芯片的名号H200只能拥有半年。RhR28资讯网——每日最新资讯28at.com

同样在2024年的第4季度,基于下一代Blackwell架构的B100也将问世,具体性能还未知,图表暗示了会是指数级增长。RhR28资讯网——每日最新资讯28at.com

强大模型训练芯片H200发布!141G大内存 AI推理高提升90%RhR28资讯网——每日最新资讯28at.com

多家超算中心将部署GH200超算节点RhR28资讯网——每日最新资讯28at.com

除了H200芯片本身,英伟达此次还发布了由其组成的一系列集群产品。RhR28资讯网——每日最新资讯28at.com

首先是HGX H200平台,它是将8块H200搭载到HGX载板上,总显存达到了1.1TB,8位浮点运算速度超过32P(10^15) FLOPS,与H100数据一致。RhR28资讯网——每日最新资讯28at.com

HGX使用了英伟达的NVLink和NVSwitch高速互联技术,可以以高性能运行各种应用负载,包括175B大模型的训练和推理。RhR28资讯网——每日最新资讯28at.com

HGX板的独立性质使其能够插入合适的主机系统,从而允许使用者定制其高端服务器的非GPU部分。RhR28资讯网——每日最新资讯28at.com

强大模型训练芯片H200发布!141G大内存 AI推理高提升90%RhR28资讯网——每日最新资讯28at.com

接下来是Quad GH200超算节点——它由4个GH200组成,而GH200是H200与Grace CPU组合而成的。RhR28资讯网——每日最新资讯28at.com

强大模型训练芯片H200发布!141G大内存 AI推理高提升90%RhR28资讯网——每日最新资讯28at.com

Quad GH200节点将提供288 Arm CPU内核和总计2.3TB的高速内存。RhR28资讯网——每日最新资讯28at.com

通过大量超算节点的组合,H200终将构成庞大的超级计算机,一些超级计算中心已经宣布正在向其超算设备中集成GH200系统。RhR28资讯网——每日最新资讯28at.com

据英伟达官宣,德国尤利希超级计算中心将在Jupiter超级计算机使用GH200超级芯片,包含的GH200节点数量达到了24000块,功率为18.2兆瓦,相当于每小时消耗18000多度电。RhR28资讯网——每日最新资讯28at.com

该系统计划于2024年安装,一旦上线,Jupiter将成为迄今为止宣布的大的基于Hopper的超级计算机。RhR28资讯网——每日最新资讯28at.com

Jupiter大约将拥有93(10^18) FLOPS的AI算力、1E FLOPS的FP64运算速率、1.2PB每秒的带宽,以及10.9PB的LPDDR5X和另外2.2PB的HBM3内存。RhR28资讯网——每日最新资讯28at.com

强大模型训练芯片H200发布!141G大内存 AI推理高提升90%RhR28资讯网——每日最新资讯28at.com

除了Jupiter,日本先进高性能计算联合中心、德克萨斯高级计算中心、伊利诺伊大学香槟分校国家超级计算应用中心等超算中心也纷纷宣布将使用GH200对其超算设备进行更新升级。RhR28资讯网——每日最新资讯28at.com

那么,AI从业者都有哪些尝鲜途径可以体验到GH200呢?RhR28资讯网——每日最新资讯28at.com

上线之后,GH200将可以通过Lambda、Vultr等特定云服务提供商进行抢先体验,Oracle和CoreWeave也宣布了明年提供GH200实例的计划,亚马逊、谷歌云、微软Azure同样也将成为首批部署GH200实例的云服务提供商。RhR28资讯网——每日最新资讯28at.com

英伟达自身,也会通过其NVIDIA LaunchPad平台提供对GH200的访问。RhR28资讯网——每日最新资讯28at.com

硬件制造商方面,华硕、技嘉等厂商计划将于今年年底开始销售搭载GH200的服务器设备。RhR28资讯网——每日最新资讯28at.com

参考链接:RhR28资讯网——每日最新资讯28at.com

[1]https://www.youtube.com/watch?v=6g0v3tMK2LURhR28资讯网——每日最新资讯28at.com

[2]https://www.nvidia.com/en-gb/data-center/h200/RhR28资讯网——每日最新资讯28at.com

[3]https://www.anandtech.com/show/21136/nvidia-at-sc23-h200-accelerator-with-hbm3e-and-jupiter-supercomputer-for-2024RhR28资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-24-24702-0.html强大模型训练芯片H200发布!141G大内存 AI推理高提升90%

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 八路达成1.1TB HBM3e内存!NVIDIA奉上全球第一GPU H200

下一篇: 搞定1730亿参数大语言模型!NVIDIA下代巨型GPU露出獠牙

标签:
  • 热门焦点
  • 鸿蒙OS 4.0公测机型公布:甚至连nova6都支持

    华为全新的HarmonyOS 4.0操作系统将于今天下午正式登场,官方在发布会之前也已经正式给出了可升级的机型产品,这意味着这些机型会率先支持升级享用。这次的HarmonyOS 4.0支持
  • 俄罗斯:将审查iPhone等外国公司设备 保数据安全

    iPhone和特斯拉都属于在各自领域领头羊的品牌,推出的产品也也都是数一数二的,但对于一些国家而言,它们的产品可靠性和安全性还是在限制范围内。近日,俄罗斯联邦通信、信息技术
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 电视息屏休眠仍有网络上传 爱奇艺被质疑“薅消费者羊毛”

    记者丨宁晓敏 见习生丨汗青出品丨鳌头财经(theSankei) 前不久,爱奇艺发布了一份亮眼的一季报,不仅营收和会员营收创造历史最佳表现,其运营利润也连续6个月实现增长。自去年年初
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • 三星Galaxy Z Fold5今日亮相:厚度缩减但仍略显厚重

    据官方此前宣布,三星将于7月26日也就是今天在韩国首尔举办Unpacked活动,届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
  • iQOO Neo8系列今日官宣:首发天玑9200+ 全球安卓最强芯!

    在昨日举行的的联发科新一代旗舰芯片天玑9200+的发布会上,iQOO官方也正式宣布,全新的iQOO Neo8系列新品将全球首发搭载这款当前性能最强大的移动平台
  • OPPO K11搭载长寿版100W超级闪充:26分钟充满100%

    据此前官方宣布,OPPO将于7月25日也就是今天下午14:30举办新品发布会,届时全新的OPPO K11将正式与大家见面,将主打旗舰影像,和同档位竞品相比,其最大的卖
Top