当前位置:首页 > 科技  > 数码

英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍

来源: 责编: 时间:2024-11-14 10:27:09 142观看
导读 11 月 14 日消息,科技媒体 WccfTech 昨日(11 月 13 日)发布博文,报道称英伟达首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 训练工作负载中的成绩,在训练 Llama 2 70B (Fine-Tuning)模型时比Hopper快2.2 倍。测试

11 月 14 日消息,科技媒体 WccfTech 昨日(11 月 13 日)发布博文,报道称英伟达首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 训练工作负载中的成绩,在训练 Llama 2 70B (Fine-Tuning)模型时比Hopper快2.2 倍。gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

测试简介

英伟达于今年 8 月,首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 推理方面的基准测试成绩,而今天首次公布了该 GPU 在 MLPerf v4.1 AI 训练工作负载方面的测试成绩。gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

NVIDIA 表示,随着新模型的推出,AI 领域对计算的需求正在以指数级增长,因此需要大幅提升训练和推理 AI 的能力,附上本次训练工作负载主要使用的模型如下:gBn28资讯网——每日最新资讯28at.com

Llama 2 70B(LLM 微调)gBn28资讯网——每日最新资讯28at.com

Stable Diffusion(文本到图像)gBn28资讯网——每日最新资讯28at.com

DLRMv2(推荐系统)gBn28资讯网——每日最新资讯28at.com

BERT(自然语言处理)gBn28资讯网——每日最新资讯28at.com

RetinaNet(目标检测)gBn28资讯网——每日最新资讯28at.com

GPT-3 175B(LLM 预训练)gBn28资讯网——每日最新资讯28at.com

R-GAT(图神经网络)gBn28资讯网——每日最新资讯28at.com

这些工作负载的基准测试为评估 AI 加速器的训练性能提供了准确的数据支持。gBn28资讯网——每日最新资讯28at.com

Hopper GPU 的持续优化

Hopper GPU 自发布以来,经过持续的软件优化,性能得到了显著提升。H100 GPU 在 LLM 预训练性能上比首次提交时快了 1.3 倍,并且在 GPT-3(175B 训练)中实现了 70% 的性能提升。gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

英伟达利用 11616 个 H100 GPU 进行了 MLPerf 的最大规模提交,进一步证明了其在数据中心级别的强大能力。gBn28资讯网——每日最新资讯28at.com

Blackwell 的技术优势

Blackwell GPU 的设计旨在提高每个 GPU 的计算吞吐量,配备更大更快的高带宽内存,不降低性能的前提下,能够在更少的 GPU 上运行 GPT-3 175B 基准测试。gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

根据测试结果,64 张 Blackwell GPU 的测试性能,可以达到 256 张 Hopper GPU 的水平。gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

gBn28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-127106-0.html英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 酷冷至尊针对 SFF 市场推出 Hyper 411 Nano 散热器,采用 92mm 风扇

下一篇: 红魔氘锋三合一能量魔方发布:智能数码屏、支持 65W 功率充电,售价 279 元

标签:
  • 热门焦点
  • 官方承诺:K60至尊版将会首批升级MIUI 15

    全新的MIUI 15今天也有了消息,在官宣了K60至尊版将会搭载天玑9200+处理器和独显芯片X7的同时,Redmi给出了官方承诺,K60至尊重大更新首批升级,会首批推送MIUI 15。也就是说虽然
  • iPhone卖不动了!苹果股价创年内最大日跌幅:市值一夜蒸发万亿元

    8月5日消息,今天凌晨美股三大指数高开低走集体收跌,道指跌0.41%;纳指跌0.36%;标普500指数跌0.52%。热门科技股也都变化极大,其中苹果报181.99美元,跌4.8%,创
  • 2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • Automa-通过连接块来自动化你的浏览器

    1、前言通过浏览器插件可实现自动化脚本的录制与编写,具有代表性的工具就是:Selenium IDE、Katalon Recorder,对于简单的业务来说可快速实现自动化的上手工作。Selenium IDEKat
  • K8S | Service服务发现

    一、背景在微服务架构中,这里以开发环境「Dev」为基础来描述,在K8S集群中通常会开放:路由网关、注册中心、配置中心等相关服务,可以被集群外部访问;图片对于测试「Tes」环境或者
  • 分布式系统中的CAP理论,面试必问,你理解了嘛?

    对于刚刚接触分布式系统的小伙伴们来说,一提起分布式系统,就感觉高大上,深不可测。而且看了很多书和视频还是一脸懵逼。这篇文章主要使用大白话的方式,带你理解一下分布式系统
  • 分享六款相见恨晚的PPT模版网站, 祝你做出精美的PPT!

    1、OfficePLUSOfficePLUS网站旨在为全球Office用户提供丰富的高品质原创PPT模板、实用文档、数据图表及个性化定制服务。优点:OfficePLUS是微软官方网站,囊括PPT模板、Word模
  • 自动化在DevOps中的力量:简化软件开发和交付

    自动化在DevOps中扮演着重要角色,它提升了DevOps的效能。通过自动化工具和方法,DevOps团队可以实现以下目标:消除手动和重复性任务。简化流程。在整个软件开发生命周期中实现更
  • 英特尔Xe HPG游戏显卡:拥有512EU,单风扇版本

    据10 月 30 日外媒 TheVerge 消息报道,英特尔 Xe HPG Arc Alchemist 的正面实被曝光,不仅拥有 512 EU 版显卡,还拥有 128EU 的单风扇版本。另外,这款显卡 PCB
Top