当前位置:首页 > 科技  > 数码

摩尔线程发布大模型训练仿真工具SimuMax v1.0:显存误差仅1%

来源: 责编: 时间:2025-09-15 11:47:04 110观看
导读 快科技9月11日消息,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax v1.0,在显存和性能仿真精度上实现了突破性提升,同时引入多项关键功能,进一步增强了模型兼容性、灵活性。SimuMax是一款专为大语言模

快科技9月11日消息,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax v1.0,在显存和性能仿真精度上实现了突破性提升,同时引入多项关键功能,进一步增强了模型兼容性、灵活性。p5028资讯网——每日最新资讯28at.com

SimuMax是一款专为大语言模型(LLM)分布式训练负载设计的仿真模拟工具,可为从单卡到万卡集群提供仿真支持。p5028资讯网——每日最新资讯28at.com

它无需实际执行完整训练过程,即可高精度模拟训练中的显存使用和性能表现,帮助用户提前了解训练效率,优化计算效能。p5028资讯网——每日最新资讯28at.com

基于静态分析模型,摩尔线程自研的SimuMax通过结合成本模型、内存模型和屋顶模型,实现对训练过程的精准仿真。p5028资讯网——每日最新资讯28at.com

摩尔线程发布大模型训练仿真工具SimuMax v1.0:精度显著提升 显存误差仅1%p5028资讯网——每日最新资讯28at.com

该工具支持多种主流分布式并行策略与优化技术,适用于以下多种应用场景:p5028资讯网——每日最新资讯28at.com

1、并行策略:p5028资讯网——每日最新资讯28at.com

数据并行(DP)、张量并行(TP)、序列并行(SP)、流水线并行(PP)、专家并行(EP)p5028资讯网——每日最新资讯28at.com

2、优化技术:p5028资讯网——每日最新资讯28at.com

ZeRO-1、完整重计算、选择性重计算、融合内核等。p5028资讯网——每日最新资讯28at.com

3、适用对象:p5028资讯网——每日最新资讯28at.com

希望寻找优训练策略以提升效率的用户;p5028资讯网——每日最新资讯28at.com

从事框架或大模型算法开发的工程师,用于优化与调试;p5028资讯网——每日最新资讯28at.com

芯片制造商,用于性能预测与硬件设计辅助。p5028资讯网——每日最新资讯28at.com

SimuMax 1.0显著的更新在于其仿真精度的大幅提升,为用户提供更可靠的分析结果。p5028资讯网——每日最新资讯28at.com

针对Dense和MoE(混合专家)模型,显存估计误差稳定控制在1%以内。p5028资讯网——每日最新资讯28at.com

经测试,在多个主流GPU上,目前优性能估计误差持续低于4%。p5028资讯网——每日最新资讯28at.com

摩尔线程发布大模型训练仿真工具SimuMax v1.0:精度显著提升 显存误差仅1%p5028资讯网——每日最新资讯28at.com

此外,SimuMax 1.0还引入了多项新特性,支持更广泛的模型结构和高效率训练需求:p5028资讯网——每日最新资讯28at.com

MLA支持:p5028资讯网——每日最新资讯28at.com

新增对MLA模型架构的支持;p5028资讯网——每日最新资讯28at.com

流水线并行(PP)增强:p5028资讯网——每日最新资讯28at.com

支持对首阶段和末阶段层的细粒度控制,优化模型分片策略;p5028资讯网——每日最新资讯28at.com

MoE灵活性提升:p5028资讯网——每日最新资讯28at.com

在混合专家(MoE)模型中支持自定义Dense层,为模型设计提供了更大的灵活性。p5028资讯网——每日最新资讯28at.com

Megatron兼容:p5028资讯网——每日最新资讯28at.com

提供简化的模型迁移流程,可轻松转换和分析基于Megatron框架的模型,提升与现有生态的互操作性。p5028资讯网——每日最新资讯28at.com

重计算策略优化:p5028资讯网——每日最新资讯28at.com

实现更细粒度的选择性重计算,支持更精准的内存和计算资源权衡。p5028资讯网——每日最新资讯28at.com

全面的效率分析:p5028资讯网——每日最新资讯28at.com

新增对不同张量形状与内存布局下计算效率与利用率的评估功能。p5028资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-181767-0.html摩尔线程发布大模型训练仿真工具SimuMax v1.0:显存误差仅1%

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: RTX 5090/5080公版开始消失了!

下一篇: 突然!美国将23家中企列入实体清单 含13家集成电路企业:我国曾多次回应

标签:
  • 热门焦点
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • 7月安卓手机性能榜:红魔8S Pro再夺榜首

    7月份的手机市场风平浪静,除了红魔和努比亚带来了两款搭载骁龙8Gen2领先版处理器的新机之外,别的也想不到有什么新品了,这也正常,通常6月7月都是手机厂商修整的时间,进入8月份之
  • 掘力计划第 20 期:Flutter 混合开发的混乱之治

    在掘力计划系列活动第20场,《Flutter 开发实战详解》作者,掘金优秀作者,Github GSY 系列目负责人恋猫的小郭分享了Flutter 混合开发的混乱之治。Flutter 基于自研的 Skia 引擎
  • K8S | Service服务发现

    一、背景在微服务架构中,这里以开发环境「Dev」为基础来描述,在K8S集群中通常会开放:路由网关、注册中心、配置中心等相关服务,可以被集群外部访问;图片对于测试「Tes」环境或者
  • 慕岩炮轰抖音,百合网今何在?

    来源:价值研究所 作者:Hernanderz“难道就因为自己的一个产品牛逼了,从客服到总裁,都不愿意正视自己产品和运营上的问题,选择逃避了吗?”这一番话,出自百合网联合创
  • 破圈是B站头上的紧箍咒

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之每年的暑期档都少不了瞄准追剧女孩们的古偶剧集,2021年有优酷的《山河令》,2022年有爱奇艺的《苍兰诀》,今年却轮到小破站抓住了追
  • 10天营收超1亿美元,《星铁》比《原神》差在哪?

    来源:伯虎财经作者:陈平安即便你没玩过《原神》,你一定听说过的它的大名。恨它的人把《原神》开服那天称作是中国游戏史上最黑暗的一天,有粉丝因为索尼在PS平台上线《原神》,怒而
  • onebot M24巧系列一体机采用轻薄机身设计,现已在各平台开售

    onebot M24 巧系列一体机目前已在线上线下各平台同步开售。onebot M24 巧系列采用一体化轻薄机身设计,最薄处为 10.15mm,拥有宝石红、午夜蓝、石墨绿、雅致
  • 亲历马斯克血洗Twitter,硅谷的苦日子在后头

    文/刘哲铭  编辑/李薇  马斯克再次挥下裁员大刀。  美国时间11月14日,Twitter约4400名外包员工遭解雇,此次被解雇的员工的主要工作为内容审核等。此前,T
Top