当前位置:首页 > 科技  > 数码

英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍

来源: 责编: 时间:2024-11-14 10:27:09 155观看
导读 11 月 14 日消息,科技媒体 WccfTech 昨日(11 月 13 日)发布博文,报道称英伟达首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 训练工作负载中的成绩,在训练 Llama 2 70B (Fine-Tuning)模型时比Hopper快2.2 倍。测试

11 月 14 日消息,科技媒体 WccfTech 昨日(11 月 13 日)发布博文,报道称英伟达首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 训练工作负载中的成绩,在训练 Llama 2 70B (Fine-Tuning)模型时比Hopper快2.2 倍。PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

测试简介

英伟达于今年 8 月,首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 推理方面的基准测试成绩,而今天首次公布了该 GPU 在 MLPerf v4.1 AI 训练工作负载方面的测试成绩。PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

NVIDIA 表示,随着新模型的推出,AI 领域对计算的需求正在以指数级增长,因此需要大幅提升训练和推理 AI 的能力,附上本次训练工作负载主要使用的模型如下:PTA28资讯网——每日最新资讯28at.com

Llama 2 70B(LLM 微调)PTA28资讯网——每日最新资讯28at.com

Stable Diffusion(文本到图像)PTA28资讯网——每日最新资讯28at.com

DLRMv2(推荐系统)PTA28资讯网——每日最新资讯28at.com

BERT(自然语言处理)PTA28资讯网——每日最新资讯28at.com

RetinaNet(目标检测)PTA28资讯网——每日最新资讯28at.com

GPT-3 175B(LLM 预训练)PTA28资讯网——每日最新资讯28at.com

R-GAT(图神经网络)PTA28资讯网——每日最新资讯28at.com

这些工作负载的基准测试为评估 AI 加速器的训练性能提供了准确的数据支持。PTA28资讯网——每日最新资讯28at.com

Hopper GPU 的持续优化

Hopper GPU 自发布以来,经过持续的软件优化,性能得到了显著提升。H100 GPU 在 LLM 预训练性能上比首次提交时快了 1.3 倍,并且在 GPT-3(175B 训练)中实现了 70% 的性能提升。PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

英伟达利用 11616 个 H100 GPU 进行了 MLPerf 的最大规模提交,进一步证明了其在数据中心级别的强大能力。PTA28资讯网——每日最新资讯28at.com

Blackwell 的技术优势

Blackwell GPU 的设计旨在提高每个 GPU 的计算吞吐量,配备更大更快的高带宽内存,不降低性能的前提下,能够在更少的 GPU 上运行 GPT-3 175B 基准测试。PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

根据测试结果,64 张 Blackwell GPU 的测试性能,可以达到 256 张 Hopper GPU 的水平。PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

PTA28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-127106-0.html英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 酷冷至尊针对 SFF 市场推出 Hyper 411 Nano 散热器,采用 92mm 风扇

下一篇: 红魔氘锋三合一能量魔方发布:智能数码屏、支持 65W 功率充电,售价 279 元

标签:
  • 热门焦点
  • K60至尊版狂暴引擎2.0加持:超177万跑分斩获性能第一

    Redmi的后性能时代战略发布会今天下午如期举办,在本次发布会上,Redmi公布了多项关于和联发科的深度合作,以及新机K60 Ultra在软件和硬件方面的特性,例如:“K60 至尊版,双芯旗舰
  • 5月iOS设备好评榜:iPhone 14仅排第43?

    来到新的一月,安兔兔的各个榜单又重新汇总了数据,像安卓阵营的榜单都有着比较大的变动,不过iOS由于设备的更新换代并没有那么快,所以相对来说变化并不大,特别是iOS好评榜,老款设
  • 三万字盘点 Spring 九大核心基础功能

    大家好,我是三友~~今天来跟大家聊一聊Spring的9大核心基础功能。话不多说,先上目录:图片友情提示,本文过长,建议收藏,嘿嘿嘿!一、资源管理资源管理是Spring的一个核心的基础功能,不
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • 共享单车的故事讲到哪了?

    来源丨海克财经与共享充电宝相差不多,共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称,成都、天津、郑州等地多个共享单
  • 腾讯VS网易,最卷游戏暑期档,谁能笑到最后?

    作者:无锈钵来源:财经无忌7月16日晚,上海1862时尚艺术中心。伴随着幻象的精准命中,硕大的荧幕之上,比分被定格在了14:12,被寄予厚望的EDG战队以绝对的优势战胜了BLG战队,拿下了总决
  • 8月见!小米MIX Fold 3获得3C认证:支持67W快充

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都得到了不少爆料,而小米新一代折叠屏旗舰——小米MIX Fold 3此前也屡屡被传
  • 消息称小米汽车开始筛选交付中心:需至少120个车位

    IT之家 7 月 7 日消息,日前,有微博简介为“汽车行业从业者、长三角一体化拥护者”的微博用户 @长三角行健者 发文表示,据经销商集团反馈,小米汽车目前
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
Top