当前位置:首页 > 科技  > 数码

英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍

来源: 责编: 时间:2024-11-14 10:27:09 115观看
导读 11 月 14 日消息,科技媒体 WccfTech 昨日(11 月 13 日)发布博文,报道称英伟达首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 训练工作负载中的成绩,在训练 Llama 2 70B (Fine-Tuning)模型时比Hopper快2.2 倍。测试

11 月 14 日消息,科技媒体 WccfTech 昨日(11 月 13 日)发布博文,报道称英伟达首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 训练工作负载中的成绩,在训练 Llama 2 70B (Fine-Tuning)模型时比Hopper快2.2 倍。B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

测试简介

英伟达于今年 8 月,首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 推理方面的基准测试成绩,而今天首次公布了该 GPU 在 MLPerf v4.1 AI 训练工作负载方面的测试成绩。B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

NVIDIA 表示,随着新模型的推出,AI 领域对计算的需求正在以指数级增长,因此需要大幅提升训练和推理 AI 的能力,附上本次训练工作负载主要使用的模型如下:B5P28资讯网——每日最新资讯28at.com

Llama 2 70B(LLM 微调)B5P28资讯网——每日最新资讯28at.com

Stable Diffusion(文本到图像)B5P28资讯网——每日最新资讯28at.com

DLRMv2(推荐系统)B5P28资讯网——每日最新资讯28at.com

BERT(自然语言处理)B5P28资讯网——每日最新资讯28at.com

RetinaNet(目标检测)B5P28资讯网——每日最新资讯28at.com

GPT-3 175B(LLM 预训练)B5P28资讯网——每日最新资讯28at.com

R-GAT(图神经网络)B5P28资讯网——每日最新资讯28at.com

这些工作负载的基准测试为评估 AI 加速器的训练性能提供了准确的数据支持。B5P28资讯网——每日最新资讯28at.com

Hopper GPU 的持续优化

Hopper GPU 自发布以来,经过持续的软件优化,性能得到了显著提升。H100 GPU 在 LLM 预训练性能上比首次提交时快了 1.3 倍,并且在 GPT-3(175B 训练)中实现了 70% 的性能提升。B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

英伟达利用 11616 个 H100 GPU 进行了 MLPerf 的最大规模提交,进一步证明了其在数据中心级别的强大能力。B5P28资讯网——每日最新资讯28at.com

Blackwell 的技术优势

Blackwell GPU 的设计旨在提高每个 GPU 的计算吞吐量,配备更大更快的高带宽内存,不降低性能的前提下,能够在更少的 GPU 上运行 GPT-3 175B 基准测试。B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

根据测试结果,64 张 Blackwell GPU 的测试性能,可以达到 256 张 Hopper GPU 的水平。B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

B5P28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-127106-0.html英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 酷冷至尊针对 SFF 市场推出 Hyper 411 Nano 散热器,采用 92mm 风扇

下一篇: 红魔氘锋三合一能量魔方发布:智能数码屏、支持 65W 功率充电,售价 279 元

标签:
  • 热门焦点
  • 红魔电竞平板评测:大屏幕硬实力

    前言:三年的疫情因为要上网课的原因激活了平板市场,如今网课的时代已经过去,大家的生活都恢复到了正轨,这也就意味着,真正考验平板电脑生存的环境来了。也就是面对着这种残酷的
  • Redmi Pad评测:红米充满野心的一次尝试

    从Note系列到K系列,从蓝牙耳机到笔记本电脑,红米不知不觉之间也已经形成了自己颇有竞争力的产品体系,在中端和次旗舰市场上甚至要比小米新机的表现来得更好,正所谓“大丈夫生居
  • 石头自清洁扫拖机器人G10S评测:多年黑科技集大成之作 懒人终极福音

    科技圈经常能看到一个词叫“缝合怪”,用来形容那些把好多功能或者外观结合在一起的产品,通常这样的词是贬义词,但如果真的是产品缝合的好、缝合的实用的话,那它就成了中性词,今
  • 5月iOS设备好评榜:iPhone 14仅排第43?

    来到新的一月,安兔兔的各个榜单又重新汇总了数据,像安卓阵营的榜单都有着比较大的变动,不过iOS由于设备的更新换代并没有那么快,所以相对来说变化并不大,特别是iOS好评榜,老款设
  • 三言两语说透设计模式的艺术-单例模式

    写在前面单例模式是一种常用的软件设计模式,它所创建的对象只有一个实例,且该实例易于被外界访问。单例对象由于只有一个实例,所以它可以方便地被系统中的其他对象共享,从而减少
  • 得物宠物生意「狂飙」,发力“它经济”

    作者|花花小萌主近日,得物宣布正式上线宠物鉴别,通过得物App内的“在线鉴别”,可找到鉴别宠物的选项。通过上传自家宠物的部位细节,就能收获拥有专业资质认证的得物鉴
  • iQOO Neo8 Pro抢先上架:首发天玑9200+ 安卓性能之王

    经过了一段时间的密集爆料,昨日iQOO官方如期对外宣布:将于5月23日推出全新的iQOO Neo8系列新品,官方称这是一款拥有旗舰级性能调校的作品。随着发布时
  • 朋友圈可以修改可见范围了 苹果用户可率先体验

    近日,iOS用户迎来微信8.0.27正式版更新,除了可更换二维码背景外,还新增了多项实用功能。在新版微信中,朋友圈终于可以修改可见范围,简单来说就是已发布的朋友圈
  • 2022爆款:ROG魔霸6 冰川散热系统持续护航

    喜逢开学季,各大商家开始推出自己的新产品,进行打折促销活动。对于忠实的端游爱好者来说,能够拥有一款梦寐以求的笔记本电脑是一件十分开心的事。但是现在的
Top