当前位置:首页 > 科技  > 数码

华为云Tokens服务接入384超节点,算力突破至2400TPS引领AI创新

来源: 责编: 时间:2025-09-03 16:51:14 75观看
导读在第四届828 B2B企业节盛大开幕之际,华为云宣布了一项重大技术进展:其Tokens服务已成功融入CloudMatrix384超节点,借助创新的xDeepServe架构,实现了单芯片2400TPS的超高吞吐量和50ms的极低时延,这一性能表现远超当前业界标

在第四届828 B2B企业节盛大开幕之际,华为云宣布了一项重大技术进展:其Tokens服务已成功融入CloudMatrix384超节点,借助创新的xDeepServe架构,实现了单芯片2400TPS的超高吞吐量和50ms的极低时延,这一性能表现远超当前业界标准。wHa28资讯网——每日最新资讯28at.com

面对中国AI算力需求的急剧增长,华为云积极应对挑战,推出了基于MaaS的Tokens服务。从最初按卡时计费的模式,到如今提供包括在线版、进线版、离线版及尊享版在内的多样化服务规格,这一转变不仅满足了不同应用和场景的性能需求,更为AI工具如大模型和Agent智能体等提供了更为灵活、高效且成本友好的算力支持。wHa28资讯网——每日最新资讯28at.com

此次Tokens服务与CloudMatrix384超节点的结合,是华为云算力构建策略的重要里程碑。通过384原生的xDeepServe框架,服务吞吐量实现了从年初的1920TPS到2400TPS的显著提升,同时保持了极低的时延。这一成就得益于华为在硬件、软件、算子、存储、推理框架及超节点等各个层面的全栈创新能力。wHa28资讯网——每日最新资讯28at.com

wHa28资讯网——每日最新资讯28at.com

CloudMatrix384超节点以其革新的计算架构,打破了性能瓶颈,为澎湃算力奠定了坚实基础。而CANN昇腾硬件使能则通过优化算子和高效通信策略,确保云端算力得以最高效地调用和组合。EMS弹性内存存储技术更是突破了AI内存墙,实现了“以存强算”,让每颗芯片的算力得到彻底释放。xDeepServe分布式推理框架则以其Transformerless的极致分离架构,进一步提升了超节点的算力效率。wHa28资讯网——每日最新资讯28at.com

xDeepServe通过将MoE大模型拆分为可独立伸缩的Attention、FFN、Expert微模块,实现了在CloudMatrix384上的高效并行处理。这些微模块被分配到不同的NPU上同步执行任务,并通过基于内存语义的微秒级XCCL通信库与FlowServe自研推理引擎重新组合,形成了一条超高吞吐量的LLM服务平台,即Tokens的“超高速流水线”。wHa28资讯网——每日最新资讯28at.com

作为专为超节点上的大语言模型服务设计的高性能通信库,XCCL充分发挥了CloudMatrix384扩展后的UB互联架构潜力,为Transformerless的全面分离提供了坚实的带宽与时延基础。而FlowServe作为被重构的“去中心”式分布式引擎,则将CloudMatrix384划分为完全自治的DP小组,每个小组都能自给自足,确保了即使千卡并发也不会出现拥堵现象。wHa28资讯网——每日最新资讯28at.com

华为云MaaS服务目前已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型及versatile、Dify等主流Agent平台。通过积累的大量模型性能优化和效果调优技术,华为云实现了“源于开源,高于开源”,让更多大模型在昇腾云上展现出更快的运行速度和更好的性能表现。以文生图大模型为例,在轻微损失画质的情况下,通过Int8量化和旋转位置编码融合算子等方式,华为云MaaS平台实现了出图速度的两倍提升,最大尺寸支持达到2K×2K。而在文生视频大模型上,通过量化提速和通算并行等方式,视频生成速度相较于友商实现了3.5倍的性能提升。wHa28资讯网——每日最新资讯28at.com

在应用层面,华为云已与超过100家合作伙伴携手,深入行业场景,共同构建了丰富的Agent,广泛应用于调研分析、内容创作、智慧办公、智能运维等领域,解决了众多产业难题。例如,基于MaaS平台推出的今日人才数智员工解决方案,集成了先进的自然语言处理、机器学习和深度学习技术,能够智能交互并处理任务,显著提升了服务效率与客户满意度。而北京方寸无忧科技开发的无忧智慧公文解决方案,则有效提升了公文处理效能,推动了政企办公的智能化转型。wHa28资讯网——每日最新资讯28at.com

随着以Token为动力的智能社会的到来,华为云凭借其系统级创新能力和全新的Tokens服务,正构筑起先进算力,助力各行各业加速落地AI,推动智能化进程。wHa28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-180128-0.html华为云Tokens服务接入384超节点,算力突破至2400TPS引领AI创新

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: vivo Y500千元新机9月5日开售:续航、防水全面升级

下一篇: 6G标准化研究正式起航:全球科技巨头共探近场通信技术新方向

标签:
  • 热门焦点
  • MIX Fold3包装盒泄露 新机本月登场

    小米的全新折叠屏旗舰MIX Fold3将于本月发布,近日该机的真机包装盒在网上泄露。从图上来看,新的MIX Fold3包装盒在外观设计方面延续了之前的方案,变化不大,这也是目前小米旗舰
  • Redmi Buds 4开箱简评:才199还有降噪 可以无脑入

    在上个月举办的Redmi Note11T Pro系列新机发布会上,除了两款手机新品之外,Redmi还带来了两款TWS真无线蓝牙耳机产品,Redmi Buds 4和Redmi Buds 4 Pro,此前我们在Redmi Note11T
  • 2023年Q2用户偏好榜:12+256G版本成新主流

    3月份的性能榜、性价比榜和好评榜之后,就要轮到2023年的第二季度偏好榜了,上半年的新机潮已经过去,最明显的肯定就是大内存和存储的机型了,另外部分中端机也取消了屏幕塑料支架
  • 三言两语说透设计模式的艺术-简单工厂模式

    一、写在前面工厂模式是最常见的一种创建型设计模式,通常说的工厂模式指的是工厂方法模式,是使用频率最高的工厂模式。简单工厂模式又称为静态工厂方法模式,不属于GoF 23种设计
  • K8S | Service服务发现

    一、背景在微服务架构中,这里以开发环境「Dev」为基础来描述,在K8S集群中通常会开放:路由网关、注册中心、配置中心等相关服务,可以被集群外部访问;图片对于测试「Tes」环境或者
  • 让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • iQOO 11S评测:行业唯一的200W标准版旗舰

    【Techweb评测】去年底,iQOO推出了“电竞旗舰”iQOO 11系列,作为一款性能强机,该机不仅全球首发2K 144Hz E6全感屏,搭载了第二代骁龙8平台及144Hz电竞
  • OPPO K11采用全方位护眼屏:三大护眼能力减轻视觉疲劳

    日前OPPO官方宣布,全新的OPPO K11将于7月25日正式发布,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼IMX890主摄,堪称是2000档位影像表
  • 2021中国国际消费电子博览会与青岛国际软件融合创新博览会新闻发布会隆重举行

    9月18日,2021中国国际消费电子博览会与青岛国际软件融合创新博览会新闻发布会在青岛国际新闻中心隆重举行。发布会上青岛市政府领导联袂出席,对本次双展会情
Top