当前位置:首页 > 科技  > 数码

连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2

来源: 责编: 时间:2024-08-20 09:02:13 209观看
导读 快科技8月19日消息,摩尔线程正式发布了夸娥智算集群KUAE 1.2版本,通过软硬件层面的综合性优化,在功能、性能上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。夸娥1.2主要升级

快科技8月19日消息,摩尔线程正式发布了夸娥智算集群KUAE 1.2版本,通过软硬件层面的综合性优化,在功能、性能上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。dkv28资讯网——每日最新资讯28at.com

夸娥1.2主要升级点:dkv28资讯网——每日最新资讯28at.com

▼MFU提升10% 高可达55%dkv28资讯网——每日最新资讯28at.com

在新版本中,使用千卡集群训练千亿模型,MFU(模型算力利用率)提升10%。dkv28资讯网——每日最新资讯28at.com

稠密模型集群训练中,MFU高达到55%。dkv28资讯网——每日最新资讯28at.com

▼Flash Attention2优化dkv28资讯网——每日最新资讯28at.com

通过集成新的MUSA SDK平台与优化后的Flash Attention2技术,结合新版Torch MUSA和算子融合,显著提升了大模型训练的效率与资源利用率,大幅缩短训练周期,并降低了整体成本。dkv28资讯网——每日最新资讯28at.com

▼64K长文本支持dkv28资讯网——每日最新资讯28at.com

增强了对长文本大模型训练的支持,优化了处理长文本理解和生成任务的能力,能够更好地应对文档摘要、文章写作等复杂语言处理任务。dkv28资讯网——每日最新资讯28at.com

▼支持混合专家模型MoEdkv28资讯网——每日最新资讯28at.com

MCCL通信库完成了All2All优化,并针对muDNN算子在不同形状下的矩阵运算进行了优化,以更好地支持MoE(Mixture of Experts)大模型的训练。dkv28资讯网——每日最新资讯28at.com

这不仅提升了智算效率,还为更大规模参数的大模型训练提供了高度可扩展的基础。dkv28资讯网——每日最新资讯28at.com

▼断点续训dkv28资讯网——每日最新资讯28at.com

进一步提升了大模型训练的Checkpoint(检查点)读写性能,写入时间小于2秒,显著提高训练效率。dkv28资讯网——每日最新资讯28at.com

▼优化DeepSpeeddkv28资讯网——每日最新资讯28at.com

支持DeepSpeed、Ulysses的适配和性能优化,强化了长文本训练支持。dkv28资讯网——每日最新资讯28at.com

适配国内外多款大模型,在Hugging Face上支持训练和微调主要的开源大模型,创新型企业可以灵活选择不同的大模型开发智能应用。dkv28资讯网——每日最新资讯28at.com

▼稳定性提升dkv28资讯网——每日最新资讯28at.com

千卡集群软硬件进一步成熟,实现了连续无故障训练长达15天。dkv28资讯网——每日最新资讯28at.com

新版本引入了KUAE Aegis可靠性功能,加强了对GPU、显存、集合通信等方面的监控、自动诊断与故障恢复能力。dkv28资讯网——每日最新资讯28at.com

▼可视化/可观测dkv28资讯网——每日最新资讯28at.com

引入了PerfSight性能监控系统,可实时显示模型训练过程中的资源消耗与性能分析数据,有助于快速发现并恢复训练期间的故障,满足大模型上的性能调优需求。dkv28资讯网——每日最新资讯28at.com

▼内置模型库中新增大模型dkv28资讯网——每日最新资讯28at.com

KUAE内置模型库Model Zoo新增LLaMA2全系列大模型、百川、雅意、Qwen2、Mixtral(MoE 8x7B)等模型。dkv28资讯网——每日最新资讯28at.com

连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2dkv28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-108653-0.html连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: AOC推出新款24寸显示器:2K 120Hz屏首发仅749元

下一篇: 7月中国主板市场遇冷:华硕稳居首位 成唯一增长品牌

标签:
  • 热门焦点
  • Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • 在线图片编辑器,支持PSD解析、AI抠图等

    自从我上次分享一个人开发仿造稿定设计的图片编辑器到现在,不知不觉已过去一年时间了,期间我经历了裁员失业、面试找工作碰壁,寒冬下一直没有很好地履行计划.....这些就放在日
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 10天营收超1亿美元,《星铁》比《原神》差在哪?

    来源:伯虎财经作者:陈平安即便你没玩过《原神》,你一定听说过的它的大名。恨它的人把《原神》开服那天称作是中国游戏史上最黑暗的一天,有粉丝因为索尼在PS平台上线《原神》,怒而
  • 新电商三兄弟,“抖快红”成团!

    来源:价值研究所作 者:Hernanderz 随着内容电商的概念兴起,抖音、快手、小红书组成的“新电商三兄弟”成为业内一股不可忽视的势力,给阿里、京东、拼多多带去了巨大压
  • 大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
  • 认真聊聊东方甄选:如何告别低垂的果实

    来源:山核桃作者:财经无忌爆火一年后,俞敏洪和他的东方甄选依旧是颇受外界关心的“网红”。7月5日至9日,为期5天的东方甄选“甘肃行”首次在自有App内直播,
  • iQOO Neo8系列或定档5月23日:首发天玑9200+ 安卓跑分王者

    去年10月,iQOO推出了iQOO Neo7系列机型,不仅搭载了天玑9000+,而且是同价位唯一一款天玑9000+直屏旗舰,一经上市便受到了用户的广泛关注。在时隔半年后,
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
Top