当前位置:首页 > 科技  > 数码

华为云Tokens服务接入384超节点,全栈创新引领AI算力新飞跃

来源: 责编: 时间:2025-08-29 08:49:42 180观看
导读在第四届828 B2B企业节盛大启幕之际,华为云传来了一则振奋人心的消息:其Tokens服务已成功接入CloudMatrix384超节点,标志着华为云在AI算力领域迈出了重要一步。借助xDeepServe架构的创新突破,华为云的单芯片性能实现了飞

在第四届828 B2B企业节盛大启幕之际,华为云传来了一则振奋人心的消息:其Tokens服务已成功接入CloudMatrix384超节点,标志着华为云在AI算力领域迈出了重要一步。Rbc28资讯网——每日最新资讯28at.com

借助xDeepServe架构的创新突破,华为云的单芯片性能实现了飞跃,达到了2400TPS的超高吞吐量和50ms的超低时延,这一表现远远超越了当前业界的平均水平。这一技术革新,无疑为AI应用的高效运行提供了强有力的支持。Rbc28资讯网——每日最新资讯28at.com

近年来,中国AI算力需求呈现出爆炸式增长。据统计,从2024年初到今年6月底,中国日均Token消耗量从1000亿激增到30万亿,短短一年半时间增长了300余倍。这一数据不仅反映了我国人工智能应用规模的迅速扩张,也对算力基础设施提出了前所未有的挑战。Rbc28资讯网——每日最新资讯28at.com

面对这一挑战,华为云于今年3月正式推出了基于MaaS的Tokens服务。该服务不仅提供了在线版、进线版、离线版及尊享版等多种规格,以满足不同应用和场景的性能需求,还通过灵活的计费方式,为用户带来了更为便捷、低成本的算力解决方案。Rbc28资讯网——每日最新资讯28at.com

此次Tokens服务接入CloudMatrix384超节点,更是将性能推向了新的高度。借助384原生的xDeepServe框架,吞吐量从年初的1920TPS跃升至2400TPS,TPOT也降低至50ms。这一提升,无疑为AI工具的高效运行提供了更为坚实的算力保障。Rbc28资讯网——每日最新资讯28at.com

Rbc28资讯网——每日最新资讯28at.com

华为云的这一成就,并非单点突破,而是从硬件到软件、从算子到存储、从推理框架到超节点的全方位创新。CloudMatrix384超节点以其全新的计算架构,突破了性能瓶颈,构筑了强大的算力基础。同时,CANN昇腾硬件使能、EMS弹性内存存储以及xDeepServe分布式推理框架等技术的协同作用,共同推动了算力的极致释放。Rbc28资讯网——每日最新资讯28at.com

作为CloudMatrix384超节点的原生服务,xDeepServe采用了Transformerless的极致分离架构,将MoE大模型拆分为可独立伸缩的微模块,实现了高效的算力分配和利用。通过这一架构,CloudMatrix384上的大模型被拆解成“积木”,并分配到不同的NPU上同步处理任务,从而构建了一条超高吞吐的LLM服务平台,即Tokens的“超高速流水线”。Rbc28资讯网——每日最新资讯28at.com

CANN作为硬件加速计算的中间层,包含了多个算子库和高性能通信库等组件,为AI模型的高效运行提供了有力支撑。其中,专为超节点上的大语言模型(LLM)服务打造的高性能通信库XCCL,充分发挥了CloudMatrix384扩展后的UB互联架构的潜力,为Transformerless的全面分离奠定了坚实的硬件基础。Rbc28资讯网——每日最新资讯28at.com

而FlowServe作为被重构的“去中心”式分布式引擎,则将CloudMatrix384切割成完全自治的DP小组,每个小组都具备Tokenizer、执行器、RTC缓存与网络栈等完整功能,实现了千卡并发也不拥堵的高效运行。Rbc28资讯网——每日最新资讯28at.com

目前,华为云MaaS服务已广泛支持DeepSeek、Kimi、Qwen等主流大模型及versatile、Dify等主流Agent平台。通过大量的模型性能优化和效果调优,华为云实现了“源于开源,高于开源”的目标,让更多大模型能够在昇腾云上实现更快更好的运行。Rbc28资讯网——每日最新资讯28at.com

以文生图大模型为例,在轻微损失画质的前提下,通过Int8量化、旋转位置编码融合算子等方式,华为云MaaS平台实现了出图速度的两倍提升,最大尺寸支持达到2K×2K。而在文生视频大模型上,通过量化提速和通算并行等方式,视频生成速度大幅提升,相较于友商实现了3.5倍的性能提升。Rbc28资讯网——每日最新资讯28at.com

在应用层面,华为云已与超过100家合作伙伴携手深入行业场景,共同推出了丰富的Agent解决方案。这些方案在调研分析、内容创作、智慧办公、智能运维等领域发挥了重要作用,帮助企业更便捷地拥抱AI创新,加速智能化转型。Rbc28资讯网——每日最新资讯28at.com

例如,基于MaaS平台推出的今日人才数智员工解决方案,集成了先进的自然语言处理、机器学习和深度学习技术,能够智能交互并处理任务,显著提升服务效率与客户满意度。而北京方寸无忧科技开发的无忧智慧公文解决方案,则通过智能化手段提升了公文处理效能,推动了政企办公的智能化转型。Rbc28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-179357-0.html华为云Tokens服务接入384超节点,全栈创新引领AI算力新飞跃

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 15000mAh超大电池手机问世,续航力惊人可达50小时视频播放

下一篇: 百度沈抖:一个企业可以只有一个官网,但一定会有大量的Agents

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • K60至尊版刚预热 一加Ace2 Pro正面硬刚

    Redmi这边刚如火如荼的宣传了K60 Ultra的各种技术和硬件配置,作为竞品的一加也坐不住了。一加中国区总裁李杰发布了两条微博,表示在自家的一加Ace2上早就已经采用了和PixelWo
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 消费结构调整丨巨头低价博弈,拼多多还卷得动吗?

    来源:征探财经作者:陈香羽随着流量红利的退潮,电商的存量博弈越来越明显。曾经主攻中高端与品质的淘宝天猫、京东重拾“低价”口号。而过去与他们错位竞争的拼多多,靠
  • 大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
  • 网红炒股不为了赚钱,那就是耍流氓!

    来源:首席商业评论6月26日高调宣布入市,网络名嘴大v胡锡进居然进军了股市。在一次财经媒体峰会上,几个财经圈媒体大佬就“胡锡进炒股是否知道认真报道”展开讨论。有
  • 中关村论坛11月25日开幕,15位诺奖级大咖将发表演讲

    11月18日,记者从2022中关村论坛新闻发布会上获悉,中关村论坛将于11月25至30日在京举行。本届中关村论坛由科学技术部、国家发展改革委、工业和信息化部、国务
Top