当前位置:首页 > 科技  > 手机

华为云Tokens服务接入384超节点,突破AI算力增长瓶颈

来源: 责编: 时间:2025-09-01 09:32:20 84观看
导读在第四届828 B2B企业节盛大开幕的当天下午,华为云传来了一则令人瞩目的消息:其Tokens服务已成功全面融入CloudMatrix384超节点,这一融合标志着华为云在AI算力领域的又一次重大突破。得益于xDeepServe架构的创新应用,华为

在第四届828 B2B企业节盛大开幕的当天下午,华为云传来了一则令人瞩目的消息:其Tokens服务已成功全面融入CloudMatrix384超节点,这一融合标志着华为云在AI算力领域的又一次重大突破。qgE28资讯网——每日最新资讯28at.com

得益于xDeepServe架构的创新应用,华为云Tokens服务的性能得到了显著提升。具体而言,该服务在单芯片上实现了2400TPS的吞吐量,同时保持了50ms的TPOT(Token处理时延),这一成绩无疑为AI算力的应用树立了新的标杆。qgE28资讯网——每日最新资讯28at.com

近年来,中国AI算力需求呈现出爆炸式增长。数据显示,从2024年初至2025年6月底,中国的日均Token消耗量从1000亿激增到30万亿,短短一年半时间内增长了300多倍。这一趋势对算力基础设施提出了前所未有的挑战。为了满足这一需求,华为云在2025年3月推出了基于MaaS(模型即服务)的Tokens服务,提供了多种规格以满足不同应用场景的需求。qgE28资讯网——每日最新资讯28at.com

qgE28资讯网——每日最新资讯28at.com

此次Tokens服务与CloudMatrix384超节点的结合,更是将这一服务的性能推向了新的高度。依托超节点的xDeepServe框架,Tokens服务的吞吐量从年初的1920TPS跃升至2400TPS。这一提升的背后,是华为云对于大算力构建全栈创新的深刻理解,包括硬件、软件、算子、存储、推理框架及超节点等各个环节的协同优化。qgE28资讯网——每日最新资讯28at.com

xDeepServe架构作为CloudMatrix384超节点的原生服务,其创新之处在于采用了Transformerless极致分离架构。这一架构将MoE大模型拆解为Attention、FFN、Expert三个可独立伸缩的微模块,并通过微秒级XCCL通信库与FlowServe自研推理引擎进行高效整合。经过这样的优化,单卡的吞吐量从非超节点的600tokens/s大幅提升至2400tokens/s。qgE28资讯网——每日最新资讯28at.com

qgE28资讯网——每日最新资讯28at.com

华为云还透露了xDeepServe架构的未来发展计划。目前,该架构已经实现了MA分离,未来还将进一步将Attention、MoE、Decode改造为数据流,并扩展至多台超节点,以实现推理吞吐的线性提升。qgE28资讯网——每日最新资讯28at.com

在应用层面,华为云Tokens服务已经支持了包括DeepSeek、Kimi、Qwen等在内的主流大模型,以及versatile、Dify等主流Agent平台。同时,华为云还与超过100家合作伙伴携手,在多个领域开发AI Agent,如调研分析、内容创作、智慧办公、智能运维等。这些应用不仅提升了服务效率与客户满意度,还推动了政企办公的智能化转型。qgE28资讯网——每日最新资讯28at.com

例如,基于MaaS平台的今日人才数智员工解决方案,通过集成自然语言处理、机器学习等技术,为企业提供了智能化的人才管理服务。而北京方寸无忧科技开发的无忧智慧公文解决方案,则利用AI技术实现了公文的自动化处理,大大提高了办公效率。qgE28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-179644-0.html华为云Tokens服务接入384超节点,突破AI算力增长瓶颈

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 小米澎湃OS3大升级:加入超级岛功能,实现与苹果设备深度互联

下一篇: OPPO Find X6系列屏幕无可挑剔 将有望支持高2160Hz的PWM调光

标签:
  • 热门焦点
  • 官方承诺:K60至尊版将会首批升级MIUI 15

    全新的MIUI 15今天也有了消息,在官宣了K60至尊版将会搭载天玑9200+处理器和独显芯片X7的同时,Redmi给出了官方承诺,K60至尊重大更新首批升级,会首批推送MIUI 15。也就是说虽然
  • 7月安卓手机好评榜:三星S23Ultra好评率第一

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年7月1日至7月31日,仅限国内市场。第一名:三星Galaxy S23 Ultra好评率:95.71%在即将迎来新
  • 2023年Q2用户偏好榜:12+256G版本成新主流

    3月份的性能榜、性价比榜和好评榜之后,就要轮到2023年的第二季度偏好榜了,上半年的新机潮已经过去,最明显的肯定就是大内存和存储的机型了,另外部分中端机也取消了屏幕塑料支架
  • 6月iOS设备好评榜:第一蝉联榜首近一年

    作为安兔兔各种榜单里变化最小的那个,2023年6月的iOS好评榜和上个月相比没有任何排名上的变化,仅仅是部分设备好评率的下降,长年累月的用户评价和逐渐退出市场的老款机器让这
  • 摸鱼心法第一章——和配置文件说拜拜

    为了能摸鱼我们团队做了容器化,但是带来的问题是服务配置文件很麻烦,然后大家在群里进行了“亲切友好”的沟通图片图片图片图片对比就对比,简单对比下独立配置中心和k8s作为配
  • 三言两语说透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术,可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
  • 一个注解实现接口幂等,这样才优雅!

    场景码猿慢病云管理系统中其实高并发的场景不是很多,没有必要每个接口都去考虑并发高的场景,比如添加住院患者的这个接口,具体的业务代码就不贴了,业务伪代码如下:图片上述代码有
  • 机构称Q2全球智能手机出货量同比下滑11% 苹果份额依旧第2

    7月20日消息,据外媒报道,研究机构的报告显示,由于需求下滑,今年二季度全球智能手机的出货量,同比下滑了11%,三星、苹果等主要厂商的销量,较去年同期均有下
  • 外交部:美方应停止在网络安全问题上不负责任地指责他国

      中国外交部今天(16日)举行例行记者会。会上,有记者问,美国情报官员称,他们正在阻拦来自中国以及其他国家的黑客获取相关科研成果。 中方对此有何评论?对此
Top