当前位置:首页 > 科技  > 数码

英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍

来源: 责编: 时间:2024-11-14 10:27:09 177观看
导读 11 月 14 日消息,科技媒体 WccfTech 昨日(11 月 13 日)发布博文,报道称英伟达首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 训练工作负载中的成绩,在训练 Llama 2 70B (Fine-Tuning)模型时比Hopper快2.2 倍。测试

11 月 14 日消息,科技媒体 WccfTech 昨日(11 月 13 日)发布博文,报道称英伟达首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 训练工作负载中的成绩,在训练 Llama 2 70B (Fine-Tuning)模型时比Hopper快2.2 倍。UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

测试简介

英伟达于今年 8 月,首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 推理方面的基准测试成绩,而今天首次公布了该 GPU 在 MLPerf v4.1 AI 训练工作负载方面的测试成绩。UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

NVIDIA 表示,随着新模型的推出,AI 领域对计算的需求正在以指数级增长,因此需要大幅提升训练和推理 AI 的能力,附上本次训练工作负载主要使用的模型如下:UJk28资讯网——每日最新资讯28at.com

Llama 2 70B(LLM 微调)UJk28资讯网——每日最新资讯28at.com

Stable Diffusion(文本到图像)UJk28资讯网——每日最新资讯28at.com

DLRMv2(推荐系统)UJk28资讯网——每日最新资讯28at.com

BERT(自然语言处理)UJk28资讯网——每日最新资讯28at.com

RetinaNet(目标检测)UJk28资讯网——每日最新资讯28at.com

GPT-3 175B(LLM 预训练)UJk28资讯网——每日最新资讯28at.com

R-GAT(图神经网络)UJk28资讯网——每日最新资讯28at.com

这些工作负载的基准测试为评估 AI 加速器的训练性能提供了准确的数据支持。UJk28资讯网——每日最新资讯28at.com

Hopper GPU 的持续优化

Hopper GPU 自发布以来,经过持续的软件优化,性能得到了显著提升。H100 GPU 在 LLM 预训练性能上比首次提交时快了 1.3 倍,并且在 GPT-3(175B 训练)中实现了 70% 的性能提升。UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

英伟达利用 11616 个 H100 GPU 进行了 MLPerf 的最大规模提交,进一步证明了其在数据中心级别的强大能力。UJk28资讯网——每日最新资讯28at.com

Blackwell 的技术优势

Blackwell GPU 的设计旨在提高每个 GPU 的计算吞吐量,配备更大更快的高带宽内存,不降低性能的前提下,能够在更少的 GPU 上运行 GPT-3 175B 基准测试。UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

根据测试结果,64 张 Blackwell GPU 的测试性能,可以达到 256 张 Hopper GPU 的水平。UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

UJk28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-127106-0.html英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 酷冷至尊针对 SFF 市场推出 Hyper 411 Nano 散热器,采用 92mm 风扇

下一篇: 红魔氘锋三合一能量魔方发布:智能数码屏、支持 65W 功率充电,售价 279 元

标签:
  • 热门焦点
  • 影音体验是真的强 简单聊聊iQOO Pad

    大公司的好处就是产品线丰富,非常细分化的东西也能给你做出来,例如早先我们看到了新的vivo Pad2,之后我们又在iQOO Neo8 Pro的发布会上看到了iQOO的首款平板产品iQOO Pad。虽
  • 三言两语说透设计模式的艺术-简单工厂模式

    一、写在前面工厂模式是最常见的一种创建型设计模式,通常说的工厂模式指的是工厂方法模式,是使用频率最高的工厂模式。简单工厂模式又称为静态工厂方法模式,不属于GoF 23种设计
  • 线程通讯的三种方法!通俗易懂

    线程通信是指多个线程之间通过某种机制进行协调和交互,例如,线程等待和通知机制就是线程通讯的主要手段之一。 在 Java 中,线程等待和通知的实现手段有以下几种方式:Object 类下
  • Golang 中的 io 包详解:组合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是对Reader和Writer接口的组合,
  • 分布式系统中的CAP理论,面试必问,你理解了嘛?

    对于刚刚接触分布式系统的小伙伴们来说,一提起分布式系统,就感觉高大上,深不可测。而且看了很多书和视频还是一脸懵逼。这篇文章主要使用大白话的方式,带你理解一下分布式系统
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 一文掌握 Golang 模糊测试(Fuzz Testing)

    模糊测试(Fuzz Testing)模糊测试(Fuzz Testing)是通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法。可以用来发现应用程序、操作系统和网络协议等中的漏洞或
  • 梁柱接棒两年,腾讯音乐闯出新路子

    文丨田静 出品丨牛刀财经(niudaocaijing)7月5日,企鹅FM发布官方公告称由于业务调整,将于9月6日正式停止运营,这意味着腾讯音乐长音频业务走向消亡。腾讯在长音频领域还在摸索。为
  • 7月4日见!iQOO 11S官宣:“鸡血版”骁龙8 Gen2+200W快充加持

    上半年已接近尾声,截至目前各大品牌旗下的顶级旗舰都已悉数亮相,而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系
Top