当前位置:首页 > 元宇宙 > AI

阿里云通义千问 Qwen 3 旗舰版模型宣布更新:性能全面提升,超越 Kimi、DeepSeek 等行业顶尖水平

来源: 责编: 时间:2025-07-24 09:16:08 110观看
导读 7 月 22 日消息,阿里云今天更新了旗舰版 Qwen3 模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。阿里云表示,在经过与社区沟通和深思熟虑后,决定停止

7 月 22 日消息,阿里云今天更新了旗舰版 Qwen3 模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。CK628资讯网——每日最新资讯28at.com

阿里云表示,在经过与社区沟通和深思熟虑后,决定停止使用混合思考模式,转为分别训练 Instruct 和 Thinking 模型,以获得最佳质量。CK628资讯网——每日最新资讯28at.com

据介绍,新的 Qwen3 模型通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在 GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等众多测评中表现出色,超过 Kimi-K2、DeepSeek-V3 等顶级开源模型以及 Claude-Opus4-Non-thinking 等领先闭源模型。CK628资讯网——每日最新资讯28at.com

CK628资讯网——每日最新资讯28at.com

模型概述

FP8 版本的 Qwen3-235B-A22B-Instruct-2507 具有以下功能特点:CK628资讯网——每日最新资讯28at.com

类型:因果语言模型 / 自回归语言模型CK628资讯网——每日最新资讯28at.com

训练阶段:预训练与后训练CK628资讯网——每日最新资讯28at.com

参数量:总共 235B,激活 22BCK628资讯网——每日最新资讯28at.com

参数量(非嵌入):234BCK628资讯网——每日最新资讯28at.com

层数:94CK628资讯网——每日最新资讯28at.com

注意头数(GQA): Q 为 64,KV 为 4CK628资讯网——每日最新资讯28at.com

专家数:128CK628资讯网——每日最新资讯28at.com

激活专家数:8CK628资讯网——每日最新资讯28at.com

上下文长度:原生支持 262,144。CK628资讯网——每日最新资讯28at.com

阿里云表示,本次更新的 Qwen3 模型,还增强了以下关键性能:CK628资讯网——每日最新资讯28at.com

在多语言的长尾知识覆盖方面,模型取得显著进步。CK628资讯网——每日最新资讯28at.com

在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。CK628资讯网——每日最新资讯28at.com

长文本提升到 256K,上下文理解能力进一步增强。CK628资讯网——每日最新资讯28at.com

CK628资讯网——每日最新资讯28at.com

目前,Qwen3 新模型已在魔搭社区和 HuggingFace 上开源更新,附官方地址:CK628资讯网——每日最新资讯28at.com

官网地址:https://chat.qwen.ai/CK628资讯网——每日最新资讯28at.com

HuggingFace:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8CK628资讯网——每日最新资讯28at.com

魔塔社区:https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8CK628资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-14799-0.html阿里云通义千问 Qwen 3 旗舰版模型宣布更新:性能全面提升,超越 Kimi、DeepSeek 等行业顶尖水平

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI:ChatGPT 平均每天要收到用户 25 亿条提示词

下一篇: 奥尔特曼:DeepSeek 团队很有才华,但他们没找到比 OpenAI 更高效的方法

标签:
  • 热门焦点
  • 欧盟人工智能法案:四种AI系统风险类型的划分及监管措施

    作者:赵志东 蔡佳雯来源:区块链日报该法案采用风险分级的规制路径,将人工智能系统的风险划分成不可接受的风险、高风险、有限风险和轻微风险四种类型,并针对不同类型施加了不同
  • 关于ChatGPT的10点思考

    作者:晏涛三寿近日ChatGPT又有大动作。5月19日,OpenAI在官网宣布正式发布App应用,并登录苹果应用商店。与网页版的聊天机器人相比,iOS应用程序的发布有望让更多人接触到ChatGPT
  • 上、中、下游加深融合,搭建元宇宙产业全景

    元宇宙产业链涉及多种技术和多个领域。在上游,聚集着大量的技术厂商,提供元宇宙相关的硬件和软件支持;在中游,内容运营与分发领域也吸引着越来越多的企业以VR内容
  • 如何对一款 NFT 项目进行价值评估?

    原文作者 | Othmane Senhaji Rhazi,Web 3 企业家.编译整理 | 黑米@白泽研究院我之所以成为一位大力倡导 Web3 和 NFT 领域的企业家,因为我相信我们正在见证社会
  • 2022 区块链 50 强榜单;垃圾NFT项目的十三个特性

    本期关键字TerraZero在Decentraland完成元宇宙住房抵押贷款;腾讯发行齐白石画作数字藏品;Ripple成为数字欧元协会成员;Gem上线稀有度排名功能;2022 区块链 50 强榜
  • 智能人机交互技术的春晚大考

    1月初的一个早晨,京东智能客户服务产品部紧急开会,进行关于尚未对外公布的“X项目”的初讨论。1月5日,这个神秘的X项目对外公布,京东成为央视2022年春晚独家互动合
  • NFT Insider #47:YGG发布2021Q4社区报告,GameFi领域1月份获超10亿美元融资

    引言:NFT Insider由WHALE社区、BeepCrypto联合出品,浓缩每周NFT新闻,为大家带来关于NFT最全面、最新鲜、最有价值的讯息。每期周报将从NFT市场数据,艺术新闻类,游戏
  • 这场虚拟发布会,当面“造假”!

    英伟达去年4月份那场发布会,你曾看出什么不对劲的地方吗?你品,你细品——在计算机图形学顶会SIGGRAPH 2021上,英伟达通过一部纪录片自曝:那场发布会内藏玄机~你看到
  • 从概念到落地 Web3.0初具雏形

    加密资产热潮催生出的链上应用中,除了DeFi、NFT、链游GameFi等场景外,还有一个热词叫「Web3.0」。Web3.0的概念最早出现在2014年,由以太坊联合创始人及波卡创建者
Top