当前位置:首页 > 科技  > 数码

英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍

来源: 责编: 时间:2024-11-14 10:27:09 165观看
导读 11 月 14 日消息,科技媒体 WccfTech 昨日(11 月 13 日)发布博文,报道称英伟达首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 训练工作负载中的成绩,在训练 Llama 2 70B (Fine-Tuning)模型时比Hopper快2.2 倍。测试

11 月 14 日消息,科技媒体 WccfTech 昨日(11 月 13 日)发布博文,报道称英伟达首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 训练工作负载中的成绩,在训练 Llama 2 70B (Fine-Tuning)模型时比Hopper快2.2 倍。Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

测试简介

英伟达于今年 8 月,首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 推理方面的基准测试成绩,而今天首次公布了该 GPU 在 MLPerf v4.1 AI 训练工作负载方面的测试成绩。Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

NVIDIA 表示,随着新模型的推出,AI 领域对计算的需求正在以指数级增长,因此需要大幅提升训练和推理 AI 的能力,附上本次训练工作负载主要使用的模型如下:Ykb28资讯网——每日最新资讯28at.com

Llama 2 70B(LLM 微调)Ykb28资讯网——每日最新资讯28at.com

Stable Diffusion(文本到图像)Ykb28资讯网——每日最新资讯28at.com

DLRMv2(推荐系统)Ykb28资讯网——每日最新资讯28at.com

BERT(自然语言处理)Ykb28资讯网——每日最新资讯28at.com

RetinaNet(目标检测)Ykb28资讯网——每日最新资讯28at.com

GPT-3 175B(LLM 预训练)Ykb28资讯网——每日最新资讯28at.com

R-GAT(图神经网络)Ykb28资讯网——每日最新资讯28at.com

这些工作负载的基准测试为评估 AI 加速器的训练性能提供了准确的数据支持。Ykb28资讯网——每日最新资讯28at.com

Hopper GPU 的持续优化

Hopper GPU 自发布以来,经过持续的软件优化,性能得到了显著提升。H100 GPU 在 LLM 预训练性能上比首次提交时快了 1.3 倍,并且在 GPT-3(175B 训练)中实现了 70% 的性能提升。Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

英伟达利用 11616 个 H100 GPU 进行了 MLPerf 的最大规模提交,进一步证明了其在数据中心级别的强大能力。Ykb28资讯网——每日最新资讯28at.com

Blackwell 的技术优势

Blackwell GPU 的设计旨在提高每个 GPU 的计算吞吐量,配备更大更快的高带宽内存,不降低性能的前提下,能够在更少的 GPU 上运行 GPT-3 175B 基准测试。Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

根据测试结果,64 张 Blackwell GPU 的测试性能,可以达到 256 张 Hopper GPU 的水平。Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

Ykb28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-127106-0.html英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 酷冷至尊针对 SFF 市场推出 Hyper 411 Nano 散热器,采用 92mm 风扇

下一篇: 红魔氘锋三合一能量魔方发布:智能数码屏、支持 65W 功率充电,售价 279 元

标签:
  • 热门焦点
  • 一文看懂为苹果Vision Pro开发应用程序

    译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实(MR)头戴设备。Vision Pro结合了虚拟现实(VR)和增强现实(AR)的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
  • 学习JavaScript的10个理由...

    作者 | Simplilearn编译 | 王瑞平当你决心学习一门语言的时候,很难选择到底应该学习哪一门,常用的语言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
  • 重估百度丨“晚熟”的百度云,能等到春天吗?

    ©自象限原创作者|程心排版|王喻可2016年7月13日,百度云计算战略发布会在北京举行,宣告着百度智能云的正式启程。彼时的会场座无虚席,甚至排队排到了门外,在场的所有人几乎都
  • 电视息屏休眠仍有网络上传 爱奇艺被质疑“薅消费者羊毛”

    记者丨宁晓敏 见习生丨汗青出品丨鳌头财经(theSankei) 前不久,爱奇艺发布了一份亮眼的一季报,不仅营收和会员营收创造历史最佳表现,其运营利润也连续6个月实现增长。自去年年初
  • 品牌洞察丨服务本地,美团直播成效几何?

    来源:17PR7月11日,美团App首页推荐位出现“美团直播”的固定入口。在直播聚合页面,外卖“神枪手”直播间、美团旅行直播间、美团买菜直播间等均已上线,同时
  • 当家的盒马,加速谋生

    来源 | 价值星球Planet作者 | 归去来自己“当家”的盒马,开始加速谋生了。据盒马官微消息,盒马计划今年开放生鲜供应链,将其生鲜商品送往食堂。目前,盒马在上海已经与
  • 华为Mate60标准版细节曝光:经典星环相机模组回归

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
  • 自研Exynos回归!三星Galaxy S24系列将提供Exynos和骁龙双版本

    年初,全新的三星Galaxy S23系列发布,包含Galaxy S23、Galaxy S23+和Galaxy S23 Ultra三个版本,全系搭载超频版骁龙8 Gen 2,虽同样采用台积电4nm工艺制
  • iQOO 11S新品发布会

    iQOO将在7月4日19:00举行新品发布会,推出杭州亚运会电竞赛事官方用机iQOO 11S。
Top