当前位置:首页 > 科技  > 数码

努力替代CUDA!摩尔线程Torch-MUSA插件升级v1.3.0 完全开源

来源: 责编: 时间:2024-11-01 09:30:19 151观看
导读 快科技10月31日消息,摩尔线程宣布,针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”,迎来重大更新新版本v1.3.0,全面兼容PyTorch 2.2.0。新版进一步提升了PyTorch在摩尔线程GPU MUSA架构上的模型性

快科技10月31日消息,摩尔线程宣布,针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”,迎来重大更新新版本v1.3.0,全面兼容PyTorch 2.2.0。3qR28资讯网——每日最新资讯28at.com

新版进一步提升了PyTorch在摩尔线程GPU MUSA架构上的模型性能与覆盖度,能更友好地支持模型迁移到摩尔线程GPU。3qR28资讯网——每日最新资讯28at.com

PyTorch是全球广泛使用的深度学习框架,在自然语言处理、计算机视觉、推荐系统等多个领域展现出了强大的应用能力。3qR28资讯网——每日最新资讯28at.com

摩尔线程Torch-MUSA专为PyTorch提供MUSA后端加速支持,使得用户能够在MUSA架构上流畅运行深度学习模型,充分发挥国产全功能GPU的强大计算能力。3qR28资讯网——每日最新资讯28at.com

自发布以来,Torch-MUSA已历经多个版本的迭代,不断提升兼容性与性能。3qR28资讯网——每日最新资讯28at.com

Torch-MUSA v1.0.0版本开始,率先支持了PyTorch 2.0,带来了显著的计算加速和易用性。3qR28资讯网——每日最新资讯28at.com

经过持续的开发与优化,新发布的v1.3.0版本已全面支持PyTorch 2.2.0,极大提升了模型训练与推理的效率,满足了更多高性能深度学习任务的需求。3qR28资讯网——每日最新资讯28at.com

目前,Torch-MUSA已完全开源,开发者可通过访问GitHub获取源代码。3qR28资讯网——每日最新资讯28at.com

摩尔线程鼓励开发者积极参与该项目的开发与改进,通过提交问题报告(issue)或代码修改申请(pull request)等方式,共同促进Torch-MUSA以及MUSA软件生态的持续进步和发展。3qR28资讯网——每日最新资讯28at.com

努力替代CUDA!摩尔线程Torch-MUSA插件升级v1.3.0 完全开源3qR28资讯网——每日最新资讯28at.com

▼ Torch-MUSA开源地址:3qR28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/torch_musa3qR28资讯网——每日最新资讯28at.com

▼ 功能特性3qR28资讯网——每日最新资讯28at.com

在Torch-MUSA中,用户只需指定torch.device("musa"),即可轻松将现有的PyTorch模型迁移到MUSA架构的GPU上运行,无需大幅修改代码。3qR28资讯网——每日最新资讯28at.com

Torch-MUSA完全兼容PyTorch的自动微分和动态图机制,支持多种常用的神经网络模块及优化算法,并加速了关键深度学习算子的计算。3qR28资讯网——每日最新资讯28at.com

此外,Torch-MUSA还支持多种PyTorch特性,包括DDP、JIT、FSDP、Profiler、Extension等。3qR28资讯网——每日最新资讯28at.com

▼ 版本迭代3qR28资讯网——每日最新资讯28at.com

v1.1.0:3qR28资讯网——每日最新资讯28at.com

初次发布,支持PyTorch 2.0,提供基础张量操作和常见神经网络层的MUSA加速。3qR28资讯网——每日最新资讯28at.com

v1.2.0:3qR28资讯网——每日最新资讯28at.com

进一步扩展算子支持,支持了完整功能的Profiler、MUSA Extension,并增加了Torch-MUSA专有特性如compare_tool、musa_converter,帮助用户更快的定位模型精度问题。3qR28资讯网——每日最新资讯28at.com

v1.3.0:3qR28资讯网——每日最新资讯28at.com

支持PyTorch2.2.0,性能进一步提升,支持FSDP,支持更复杂的模型和更大规模的数据处理。3qR28资讯网——每日最新资讯28at.com

▼ 未来计划3qR28资讯网——每日最新资讯28at.com

Torch-MUSA将继续跟进PyTorch的版本更新,计划支持更高版本的PyTorch。3qR28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-123390-0.html努力替代CUDA!摩尔线程Torch-MUSA插件升级v1.3.0 完全开源

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: AMD首次公开确认!明年初发布RDNA4显卡:光追性能提升、新增AI功能

下一篇: AMD新一代Radeon显卡RDNA 4正式官宣:两大升级 一大遗憾!

标签:
  • 热门焦点
  • 一加Ace2 Pro官宣:普及16G内存 引领24G

    一加官方今天继续为本月发布的新机一加Ace2 Pro带来预热,公布了内存方面的信息。“淘汰 8GB ,12GB 起步,16GB 普及,24GB 引领,还有呢?#一加Ace2Pro#,2023 年 8 月,敬请期待。”同时
  • 一加首款折叠屏!一加Open渲染图出炉:罕见单手可握小尺寸

    8月5日消息,此前就有爆料称,一加首款折叠屏手机将会在第三季度上市,如今随着时间临近,新机的各种消息也开始浮出水面。据悉,这款新机将会被命名为“On
  • 2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • 从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 重估百度丨“晚熟”的百度云,能等到春天吗?

    ©自象限原创作者|程心排版|王喻可2016年7月13日,百度云计算战略发布会在北京举行,宣告着百度智能云的正式启程。彼时的会场座无虚席,甚至排队排到了门外,在场的所有人几乎都
  • 2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • 华为HarmonyOS 4升级计划公布:首批34款机型今日开启公测

    8月4日消息,今天下午华为正式发布了HarmonyOS 4系统,在更流畅的前提下,还带来了不少新功能,UI设计也有变化,会让手机焕然一新。华为宣布,首批机型将会在
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
  • 英特尔Xe HPG游戏显卡:拥有512EU,单风扇版本

    据10 月 30 日外媒 TheVerge 消息报道,英特尔 Xe HPG Arc Alchemist 的正面实被曝光,不仅拥有 512 EU 版显卡,还拥有 128EU 的单风扇版本。另外,这款显卡 PCB
Top