当前位置:首页 > 科技  > 数码

摩尔线程发布大模型训练仿真工具SimuMax v1.0:显存误差仅1%

来源: 责编: 时间:2025-09-15 11:47:04 125观看
导读 快科技9月11日消息,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax v1.0,在显存和性能仿真精度上实现了突破性提升,同时引入多项关键功能,进一步增强了模型兼容性、灵活性。SimuMax是一款专为大语言模

快科技9月11日消息,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax v1.0,在显存和性能仿真精度上实现了突破性提升,同时引入多项关键功能,进一步增强了模型兼容性、灵活性。vcQ28资讯网——每日最新资讯28at.com

SimuMax是一款专为大语言模型(LLM)分布式训练负载设计的仿真模拟工具,可为从单卡到万卡集群提供仿真支持。vcQ28资讯网——每日最新资讯28at.com

它无需实际执行完整训练过程,即可高精度模拟训练中的显存使用和性能表现,帮助用户提前了解训练效率,优化计算效能。vcQ28资讯网——每日最新资讯28at.com

基于静态分析模型,摩尔线程自研的SimuMax通过结合成本模型、内存模型和屋顶模型,实现对训练过程的精准仿真。vcQ28资讯网——每日最新资讯28at.com

摩尔线程发布大模型训练仿真工具SimuMax v1.0:精度显著提升 显存误差仅1%vcQ28资讯网——每日最新资讯28at.com

该工具支持多种主流分布式并行策略与优化技术,适用于以下多种应用场景:vcQ28资讯网——每日最新资讯28at.com

1、并行策略:vcQ28资讯网——每日最新资讯28at.com

数据并行(DP)、张量并行(TP)、序列并行(SP)、流水线并行(PP)、专家并行(EP)vcQ28资讯网——每日最新资讯28at.com

2、优化技术:vcQ28资讯网——每日最新资讯28at.com

ZeRO-1、完整重计算、选择性重计算、融合内核等。vcQ28资讯网——每日最新资讯28at.com

3、适用对象:vcQ28资讯网——每日最新资讯28at.com

希望寻找优训练策略以提升效率的用户;vcQ28资讯网——每日最新资讯28at.com

从事框架或大模型算法开发的工程师,用于优化与调试;vcQ28资讯网——每日最新资讯28at.com

芯片制造商,用于性能预测与硬件设计辅助。vcQ28资讯网——每日最新资讯28at.com

SimuMax 1.0显著的更新在于其仿真精度的大幅提升,为用户提供更可靠的分析结果。vcQ28资讯网——每日最新资讯28at.com

针对Dense和MoE(混合专家)模型,显存估计误差稳定控制在1%以内。vcQ28资讯网——每日最新资讯28at.com

经测试,在多个主流GPU上,目前优性能估计误差持续低于4%。vcQ28资讯网——每日最新资讯28at.com

摩尔线程发布大模型训练仿真工具SimuMax v1.0:精度显著提升 显存误差仅1%vcQ28资讯网——每日最新资讯28at.com

此外,SimuMax 1.0还引入了多项新特性,支持更广泛的模型结构和高效率训练需求:vcQ28资讯网——每日最新资讯28at.com

MLA支持:vcQ28资讯网——每日最新资讯28at.com

新增对MLA模型架构的支持;vcQ28资讯网——每日最新资讯28at.com

流水线并行(PP)增强:vcQ28资讯网——每日最新资讯28at.com

支持对首阶段和末阶段层的细粒度控制,优化模型分片策略;vcQ28资讯网——每日最新资讯28at.com

MoE灵活性提升:vcQ28资讯网——每日最新资讯28at.com

在混合专家(MoE)模型中支持自定义Dense层,为模型设计提供了更大的灵活性。vcQ28资讯网——每日最新资讯28at.com

Megatron兼容:vcQ28资讯网——每日最新资讯28at.com

提供简化的模型迁移流程,可轻松转换和分析基于Megatron框架的模型,提升与现有生态的互操作性。vcQ28资讯网——每日最新资讯28at.com

重计算策略优化:vcQ28资讯网——每日最新资讯28at.com

实现更细粒度的选择性重计算,支持更精准的内存和计算资源权衡。vcQ28资讯网——每日最新资讯28at.com

全面的效率分析:vcQ28资讯网——每日最新资讯28at.com

新增对不同张量形状与内存布局下计算效率与利用率的评估功能。vcQ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-181767-0.html摩尔线程发布大模型训练仿真工具SimuMax v1.0:显存误差仅1%

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: RTX 5090/5080公版开始消失了!

下一篇: 突然!美国将23家中企列入实体清单 含13家集成电路企业:我国曾多次回应

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 线程通讯的三种方法!通俗易懂

    线程通信是指多个线程之间通过某种机制进行协调和交互,例如,线程等待和通知机制就是线程通讯的主要手段之一。 在 Java 中,线程等待和通知的实现手段有以下几种方式:Object 类下
  • Golang 中的 io 包详解:组合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是对Reader和Writer接口的组合,
  • 从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 得物效率前端微应用推进过程与思考

    一、背景效率工程随着业务的发展,组织规模的扩大,越来越多的企业开始意识到协作效率对于企业团队的重要性,甚至是决定其在某个行业竞争中突围的关键,是企业长久生存的根本。得物
  • 朋友圈可以修改可见范围了 苹果用户可率先体验

    近日,iOS用户迎来微信8.0.27正式版更新,除了可更换二维码背景外,还新增了多项实用功能。在新版微信中,朋友圈终于可以修改可见范围,简单来说就是已发布的朋友圈
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
  • 苹果140W USB-C充电器:采用氮化镓技术

    据10 月 30 日 9to5 Mac 消息报道,当苹果推出新的 MacBook Pro 2021 时,该公司还推出了新的 140W USB-C 充电器,附赠在 MacBook Pro 16 英寸机型的盒子里,也支
  • 苹果MacBook Pro 2021测试:仍不支持平滑滚动

    据10月30日9to5 Mac 消息报道,苹果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后获得了不错的评价,亮点包括行业领先的性能,令人印象深刻的电池续航,精美丰
Top