当前位置:首页 > 科技  > 数码

摩尔线程发布大模型训练仿真工具SimuMax v1.0:显存误差仅1%

来源: 责编: 时间:2025-09-15 11:47:04 61观看
导读 快科技9月11日消息,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax v1.0,在显存和性能仿真精度上实现了突破性提升,同时引入多项关键功能,进一步增强了模型兼容性、灵活性。SimuMax是一款专为大语言模

快科技9月11日消息,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax v1.0,在显存和性能仿真精度上实现了突破性提升,同时引入多项关键功能,进一步增强了模型兼容性、灵活性。lDt28资讯网——每日最新资讯28at.com

SimuMax是一款专为大语言模型(LLM)分布式训练负载设计的仿真模拟工具,可为从单卡到万卡集群提供仿真支持。lDt28资讯网——每日最新资讯28at.com

它无需实际执行完整训练过程,即可高精度模拟训练中的显存使用和性能表现,帮助用户提前了解训练效率,优化计算效能。lDt28资讯网——每日最新资讯28at.com

基于静态分析模型,摩尔线程自研的SimuMax通过结合成本模型、内存模型和屋顶模型,实现对训练过程的精准仿真。lDt28资讯网——每日最新资讯28at.com

摩尔线程发布大模型训练仿真工具SimuMax v1.0:精度显著提升 显存误差仅1%lDt28资讯网——每日最新资讯28at.com

该工具支持多种主流分布式并行策略与优化技术,适用于以下多种应用场景:lDt28资讯网——每日最新资讯28at.com

1、并行策略:lDt28资讯网——每日最新资讯28at.com

数据并行(DP)、张量并行(TP)、序列并行(SP)、流水线并行(PP)、专家并行(EP)lDt28资讯网——每日最新资讯28at.com

2、优化技术:lDt28资讯网——每日最新资讯28at.com

ZeRO-1、完整重计算、选择性重计算、融合内核等。lDt28资讯网——每日最新资讯28at.com

3、适用对象:lDt28资讯网——每日最新资讯28at.com

希望寻找优训练策略以提升效率的用户;lDt28资讯网——每日最新资讯28at.com

从事框架或大模型算法开发的工程师,用于优化与调试;lDt28资讯网——每日最新资讯28at.com

芯片制造商,用于性能预测与硬件设计辅助。lDt28资讯网——每日最新资讯28at.com

SimuMax 1.0显著的更新在于其仿真精度的大幅提升,为用户提供更可靠的分析结果。lDt28资讯网——每日最新资讯28at.com

针对Dense和MoE(混合专家)模型,显存估计误差稳定控制在1%以内。lDt28资讯网——每日最新资讯28at.com

经测试,在多个主流GPU上,目前优性能估计误差持续低于4%。lDt28资讯网——每日最新资讯28at.com

摩尔线程发布大模型训练仿真工具SimuMax v1.0:精度显著提升 显存误差仅1%lDt28资讯网——每日最新资讯28at.com

此外,SimuMax 1.0还引入了多项新特性,支持更广泛的模型结构和高效率训练需求:lDt28资讯网——每日最新资讯28at.com

MLA支持:lDt28资讯网——每日最新资讯28at.com

新增对MLA模型架构的支持;lDt28资讯网——每日最新资讯28at.com

流水线并行(PP)增强:lDt28资讯网——每日最新资讯28at.com

支持对首阶段和末阶段层的细粒度控制,优化模型分片策略;lDt28资讯网——每日最新资讯28at.com

MoE灵活性提升:lDt28资讯网——每日最新资讯28at.com

在混合专家(MoE)模型中支持自定义Dense层,为模型设计提供了更大的灵活性。lDt28资讯网——每日最新资讯28at.com

Megatron兼容:lDt28资讯网——每日最新资讯28at.com

提供简化的模型迁移流程,可轻松转换和分析基于Megatron框架的模型,提升与现有生态的互操作性。lDt28资讯网——每日最新资讯28at.com

重计算策略优化:lDt28资讯网——每日最新资讯28at.com

实现更细粒度的选择性重计算,支持更精准的内存和计算资源权衡。lDt28资讯网——每日最新资讯28at.com

全面的效率分析:lDt28资讯网——每日最新资讯28at.com

新增对不同张量形状与内存布局下计算效率与利用率的评估功能。lDt28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-181767-0.html摩尔线程发布大模型训练仿真工具SimuMax v1.0:显存误差仅1%

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: RTX 5090/5080公版开始消失了!

下一篇: 突然!美国将23家中企列入实体清单 含13家集成电路企业:我国曾多次回应

标签:
  • 热门焦点
  • MIX Fold3包装盒泄露 新机本月登场

    小米的全新折叠屏旗舰MIX Fold3将于本月发布,近日该机的真机包装盒在网上泄露。从图上来看,新的MIX Fold3包装盒在外观设计方面延续了之前的方案,变化不大,这也是目前小米旗舰
  • 一加Ace2 Pro真机揭晓 钛空灰配色质感拉满

    终于,在经过了几波预热之后,一加Ace2 Pro的外观真机图在网上出现了。还是博主数码闲聊站曝光的,这次的外观设计还是延续了一加11的方案,只是细节上有了调整,例如新加入了钛空灰
  • 小米官宣:2023年上半年出货量中国第一!

    今日早间,小米电视官方微博带来消息,称2023年小米电视上半年出货量达到了中国第一,同时还表示小米电视的巨屏风暴即将开始。“公布一个好消息2023年#小米电视上半年出货量中国
  • 7月安卓手机性价比榜:努比亚+红魔两款新机入榜

    7月登场的新机有努比亚Z50S Pro和红魔8S Pro,除了三星之外目前唯二的两款搭载超频版骁龙8Gen2处理器的产品,而且努比亚和红魔也一贯有着不错的性价比,所以在本次的性价比榜单
  • 分布式系统中的CAP理论,面试必问,你理解了嘛?

    对于刚刚接触分布式系统的小伙伴们来说,一提起分布式系统,就感觉高大上,深不可测。而且看了很多书和视频还是一脸懵逼。这篇文章主要使用大白话的方式,带你理解一下分布式系统
  • JavaScript学习 -AES加密算法

    引言在当今数字化时代,前端应用程序扮演着重要角色,用户的敏感数据经常在前端进行加密和解密操作。然而,这样的操作在网络传输和存储中可能会受到恶意攻击的威胁。为了确保数据
  • “又被陈思诚骗了”

    作者|张思齐 出品|众面(ID:ZhongMian_ZM)如今的国产悬疑电影,成了陈思诚的天下。最近大爆电影《消失的她》票房突破30亿断层夺魁暑期档,陈思诚再度风头无两。你可以说陈思诚的
  • iQOO Neo8 Pro抢先上架:首发天玑9200+ 安卓性能之王

    经过了一段时间的密集爆料,昨日iQOO官方如期对外宣布:将于5月23日推出全新的iQOO Neo8系列新品,官方称这是一款拥有旗舰级性能调校的作品。随着发布时
  • OPPO K11搭载高性能石墨散热系统:旗舰同款 性能凉爽释放

    日前OPPO官方宣布,将于7月25日14:30举办新品发布会,届时全新的OPPO K11将正式与大家见面,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼
Top