当前位置:首页 > 元宇宙 > AI

阿里云通义千问 Qwen 3 旗舰版模型宣布更新:性能全面提升,超越 Kimi、DeepSeek 等行业顶尖水平

来源: 责编: 时间:2025-07-24 09:16:08 98观看
导读 7 月 22 日消息,阿里云今天更新了旗舰版 Qwen3 模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。阿里云表示,在经过与社区沟通和深思熟虑后,决定停止

7 月 22 日消息,阿里云今天更新了旗舰版 Qwen3 模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。Aw028资讯网——每日最新资讯28at.com

阿里云表示,在经过与社区沟通和深思熟虑后,决定停止使用混合思考模式,转为分别训练 Instruct 和 Thinking 模型,以获得最佳质量。Aw028资讯网——每日最新资讯28at.com

据介绍,新的 Qwen3 模型通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在 GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等众多测评中表现出色,超过 Kimi-K2、DeepSeek-V3 等顶级开源模型以及 Claude-Opus4-Non-thinking 等领先闭源模型。Aw028资讯网——每日最新资讯28at.com

Aw028资讯网——每日最新资讯28at.com

模型概述

FP8 版本的 Qwen3-235B-A22B-Instruct-2507 具有以下功能特点:Aw028资讯网——每日最新资讯28at.com

类型:因果语言模型 / 自回归语言模型Aw028资讯网——每日最新资讯28at.com

训练阶段:预训练与后训练Aw028资讯网——每日最新资讯28at.com

参数量:总共 235B,激活 22BAw028资讯网——每日最新资讯28at.com

参数量(非嵌入):234BAw028资讯网——每日最新资讯28at.com

层数:94Aw028资讯网——每日最新资讯28at.com

注意头数(GQA): Q 为 64,KV 为 4Aw028资讯网——每日最新资讯28at.com

专家数:128Aw028资讯网——每日最新资讯28at.com

激活专家数:8Aw028资讯网——每日最新资讯28at.com

上下文长度:原生支持 262,144。Aw028资讯网——每日最新资讯28at.com

阿里云表示,本次更新的 Qwen3 模型,还增强了以下关键性能:Aw028资讯网——每日最新资讯28at.com

在多语言的长尾知识覆盖方面,模型取得显著进步。Aw028资讯网——每日最新资讯28at.com

在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。Aw028资讯网——每日最新资讯28at.com

长文本提升到 256K,上下文理解能力进一步增强。Aw028资讯网——每日最新资讯28at.com

Aw028资讯网——每日最新资讯28at.com

目前,Qwen3 新模型已在魔搭社区和 HuggingFace 上开源更新,附官方地址:Aw028资讯网——每日最新资讯28at.com

官网地址:https://chat.qwen.ai/Aw028资讯网——每日最新资讯28at.com

HuggingFace:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8Aw028资讯网——每日最新资讯28at.com

魔塔社区:https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8Aw028资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-14799-0.html阿里云通义千问 Qwen 3 旗舰版模型宣布更新:性能全面提升,超越 Kimi、DeepSeek 等行业顶尖水平

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI:ChatGPT 平均每天要收到用户 25 亿条提示词

下一篇: 奥尔特曼:DeepSeek 团队很有才华,但他们没找到比 OpenAI 更高效的方法

标签:
  • 热门焦点
  • 数字人的新革命,BAT的“冲高”战场

    来源:刘旷ChatGPT横空出世,让人们看到了数字人的另一种可能,将ChatGPT与虚拟数字人融合,研发出更加智能化、拟人化的虚拟数字人成为数字人厂商的新命题、新方向。2月份,岭南股份
  • 上海虹口成立10亿元元宇宙基金,香港首只元宇宙ETF拟上市

    区块链日报17日讯 今日《元宇宙新鲜事》有:上海虹口将成立总额约10亿元的元宇宙产业基金;香港市场首只元宇宙主题ETF拟于2月21日上市;元宇宙平台Roblox出现违禁游
  • 8个最适合艺术家发行NFT的交易市场

    近年来,加密风靡全球。加密圈最令人兴奋的方面之一是它能够用于创建称为NFT 的数字资产。从 CyberKitties 到 Cyber Galleries,NFT 已成为艺术家和艺术鉴赏家的
  • Terra链上TVL跃升至第二

    据DefiLlama数据显示,当前,Terra链上应用锁仓的加密资产价值(TVL)为172.1亿美元,在公链板块中已跃升至第二,超越了币安智能链TVL的118亿美元,TVL排名居首的仍为以太
  • 纽约证券交易所母公司ICE收购tZero股份以探索代币化股票

    2 月 22 日,纽约证券交易所 (NYSE) 的母公司洲际交易所 (ICE) 宣布,它将持有私人数字证券市场 tZERO 的所有权。根据公告,ICE 将成为 tZero 的“重要”少数股东,但
  • NFT:新骗局的狩猎场

    骗局的自动化需要更好的防御,从数字身份开始。前几天我在OpenSea上购买了一个NFT,是才华横溢的艺术家海伦·福尔摩斯 (Helen Holmes) 的漫画,来自她的 "原作 "收
  • 以用户为中心,Web3和区块链如何将用户放在首位

    竞争优势正在改变竞争优势是每个企业都在努力争取的,由谷歌、Facebook和Netflix等大型科技公司主导的市场中,两大重要类别的竞争优势十分突出。第一个竞争优势来
  • 参加元宇宙里的招聘会是什么样一种体验?

    求职者可以在活动中走动,就像他们在现实生活中一样。长话短说看亮点:招聘公司Hirect为Y-combinator支持的初创公司举办了一场元宇宙招聘会。这里有一个大厅、一
  • 为什么元宇宙将永远改变体育和你的生活?

    自从Facebook更名为Meta以来,Metaverse这个词已经被大家所熟知。但是当Metaverse仍然被许多人视为一个虚拟的平行世界时,一些项目已经显示出Metaverse将如何永远
Top