当前位置:首页 > 科技  > 芯片

蚂蚁集团用本土AI芯片训练大模型,成本降低20%

来源:icspec 责编: 时间:2025-03-26 11:01:22 185观看
导读据法新社报道,蚂蚁集团近日发布了一项重要研究成果,其研发团队利用中国本土AI芯片成功训练出参数规模达3000亿的混合专家(MoE)大模型,训练效能媲美采用NVIDIA H800芯片的方案,同时成本降低了20%。这一突破展现了中国在AI基
据法新社报道,蚂蚁集团近日发布了一项重要研究成果,其研发团队利用中国本土AI芯片成功训练出参数规模达3000亿的混合专家(MoE)大模型,训练效能媲美采用NVIDIA H800芯片的方案,同时成本降低了20%。这一突破展现了中国在AI基础设施领域的自主创新能力。
蚂蚁集团的Ling技术团队在预印本平台Arxiv上发表论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》,详细介绍了这一成果。由于高性能GPU供应受限且成本高昂,蚂蚁团队通过算法优化与硬件兼容结合的方式,使用中国本土低端芯片完成了大规模模型训练。
研究中,蚂蚁推出了两款不同规模的MoE模型:羽量级的“百灵Ling-Lite”(168亿参数)和高效能的“百灵Ling-Plus”(2900亿参数)。其中,Ling-Plus模型在9万亿token预训练中表现出色,花费仅508万元人民币,相比传统方案节省127万元,成本降低约20%。在多项基准测试中,该模型的表现与采用NVIDIA芯片训练的同类模型如阿里巴巴的通义Qwen2.5-72B和深度求索的DeepSeek-V2.5不相上下。
这一成果的核心在于通过动态路由优化、梯度压缩和计算架构重构等技术,克服了中国本土芯片在算力和带宽上的局限。这种方法“以算法补硬件不足”,为中国AI产业在外部限制下提供了新的可能性。
首先,该研究验证了中国本土AI芯片承载大模型训练的可行性,为华为升腾、阿里平头哥等芯片厂商提供了重要发展路径。其次,训练成本的降低将使更多中小企业得以参与大模型研发,推动AI应用的多元化发展。
蚂蚁集团还宣布将开源相关技术,优先应用于医疗、金融等民生领域,推动AI技术的普惠化。业内人士分析,若这一技术得到广泛应用,中国AI产业对NVIDIA等国际芯片厂商的依赖度有望显著下降,为中国AI技术在全球竞争中赢得更多主导权。

本文链接:http://www.28at.com/showinfo-27-138882-0.html蚂蚁集团用本土AI芯片训练大模型,成本降低20%

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 日本九州推动“分散式”半导体园区建设,各方资源加速整合

下一篇: 德仪发布全球最小MCU,称不惧市场竞争

标签:
  • 热门焦点
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • 官方承诺:K60至尊版将会首批升级MIUI 15

    全新的MIUI 15今天也有了消息,在官宣了K60至尊版将会搭载天玑9200+处理器和独显芯片X7的同时,Redmi给出了官方承诺,K60至尊重大更新首批升级,会首批推送MIUI 15。也就是说虽然
  • 对标苹果的灵动岛 华为带来实况窗功能

    继苹果的灵动岛之后,华为也在今天正式推出了“实况窗”功能。据今天鸿蒙OS 4.0的现场演示显示,华为的实况窗可以更高效的展现出实时通知,比如锁屏上就能看到外卖、打车、银行
  • 太卷!Redmi MAX 100英寸电视便宜了:12999元买Redmi史上最大屏

    8月5日消息,从小米商城了解到,Redmi MAX 100英寸巨屏电视日前迎来官方优惠,到手价12999元,比发布价便宜了7000元,在大屏电视市场开卷。据了解,Redmi MAX 100
  • 十个可以手动编写的 JavaScript 数组 API

    JavaScript 中有很多API,使用得当,会很方便,省力不少。 你知道它的原理吗? 今天这篇文章,我们将对它们进行一次小总结。现在开始吧。1.forEach()forEach()用于遍历数组接收一参
  • JavaScript学习 -AES加密算法

    引言在当今数字化时代,前端应用程序扮演着重要角色,用户的敏感数据经常在前端进行加密和解密操作。然而,这样的操作在网络传输和存储中可能会受到恶意攻击的威胁。为了确保数据
  • ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • onebot M24巧系列一体机采用轻薄机身设计,现已在各平台开售

    onebot M24 巧系列一体机目前已在线上线下各平台同步开售。onebot M24 巧系列采用一体化轻薄机身设计,最薄处为 10.15mm,拥有宝石红、午夜蓝、石墨绿、雅致
  • 微软发布Windows 11新版 引入全新任务栏状态

    近日,微软发布了Windows 11新版,而Build 22563更新主要引入了几周前曝光的平板模式任务栏等,系统更流畅了。更新中,Windows 11加入了专门针对平板优化的任务栏
Top