当前位置：首页 > 元宇宙 > AI

支持 100 万 Tokens 上下文，阿里通义千问推出 Qwen2.5-1M 开源模型

来源：责编：时间：2025-01-29 18:59:45 185观看

导读 1 月 27 日消息，阿里通义千问今日宣布，正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。从官方介绍获悉，通义千问本次发布了两个新的开源模型，分别是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M，这

1 月 27 日消息，阿里通义千问今日宣布，正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。

从官方介绍获悉，通义千问本次发布了两个新的开源模型，分别是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M，这是通义千问首次将开源的 Qwen 模型的上下文扩展到 1M 长度。

为了帮助开发者更高效地部署 Qwen2.5-1M 系列模型，Qwen 团队完全开源了基于 vLLM 的推理框架，并集成了稀疏注意力方法，使得该框架在处理 1M 标记输入时的速度提升了 3 倍到 7 倍。

长上下文任务

在上下文长度为 100 万 Tokens 的大海捞针（Passkey Retrieval）任务中，Qwen2.5-1M 系列模型能够准确地从 1M 长度的文档中检索出隐藏信息，其中仅有 7B 模型出现了少量错误。

对于更复杂的长上下文理解任务，选择了 RULER、LV-Eval 和 LongbenchChat 测试集。

从这些结果中，Qwen 得出以下几点关键结论：

显著超越 128K 版本：Qwen2.5-1M 系列模型在大多数长上下文任务中显著优于之前的 128K 版本，特别是在处理超过 64K 长度的任务时表现出色。

性能优势明显：Qwen2.5-14B-Instruct-1M 模型不仅击败了 Qwen2.5-Turbo，还在多个数据集上稳定超越 GPT-4o-mini，为长上下文任务提供了开源模型的选择。

短序列任务

可以发现：

Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M 在短文本任务上的表现与其 128K 版本相当，确保了基本能力没有因为增加了长序列处理能力而受到影响。

与 GPT-4o-mini 相比，Qwen2.5-14B-Instruct-1M 和 Qwen2.5-Turbo 在短文本任务上实现了相近的性能，同时上下文长度是 GPT-4o-mini 的八倍。

模型链接：https://www.modelscope.cn/collections/Qwen25-1M-d6cf9fd33f0a40

技术报告：https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen2.5-1M/Qwen2_5_1M_Technical_Report.pdf

体验链接：https://modelscope.cn/studios/Qwen/Qwen2.5-1M-Demo

本文链接：http://www.28at.com/showinfo-45-10254-0.html支持 100 万 Tokens 上下文，阿里通义千问推出 Qwen2.5-1M 开源模型

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：全球首个港口服务类大模型方舟 TaaS 开启公测，支持智能规划路线并估算费用

下一篇：小米SU7车模春晚亮相成焦点，碳纤维后视镜版卖断货！

标签：

热门焦点

B端难做：留给魔珐科技的时间不多了

来源：零态LT元宇宙泡沫正在碎裂，进入2023年后这一赛道热度一直在递减。今年2月，微软解散了成立仅四个月的工业元宇宙部门；今年3月，该公司2017年收购的虚拟现实社交平台AltspaceVR
时尚领域进军元宇宙，2022年会带来哪些颠覆性的全新体验？

想象一个你的数字身份与现实身份同样重要的世界。想象一个你需要为虚拟自我准备资产和物资的地方——你需要金钱（Crypto）、房屋（可能建在Minecraft上）和衣物。随着
NFT的未来：传统企业与去中心化机构之间的竞赛

传统企业和去中心化机构一直存在分歧，但最近NFT的爆炸式增长让他们产生了共同的兴趣，双方都在竞相让用户更轻松、更方便地使用NFT。毫无疑问，NFT 市场正在增长。
传腾讯已推出全新XR业务；摩托罗拉正打造5GXR颈戴式计算组件

今日热点：传腾讯已推出全新XR业务；摩托罗拉与Verizon合作打造5G XR颈戴式计算组件；小米AR购物导航专利获授权；VR一体机Simula One放弃众筹并开放直接预订；VR游戏《
城市数字孪生标准化白皮书（2022版）

当前，城市数字孪生已经发展成为支撑智慧城市的重要技术手段。城市数字孪生通过在数字空间对城市物理空间和社会空间进行全要素表达、全过程呈现、全周期可溯，实
虚拟数字人：元宇宙的主角破圈而来

虚拟数字人市场逐步进入成熟期，商业化进程加速。1982年世界第一位虚拟歌姬林明美诞生，虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破，制
量子计算在未来能否提高区块链技术的效率

区块链技术的主要成功之处在于对不透明的金融流程进行了去中心化的访问量子计算机的内在目标是解决传统计算机不可能解决的问题随着区块链技术的使用案例逐渐
NFT行业周报：NBA巨星勒布朗·詹姆斯申请NFT相关商标

1. “无聊猿”BAYC交易总额突破14亿美元3月10日，据DappRader最新数据显示，“无聊猿”Bored Ape Yacht Club（BAYC）交易总额已突破14亿美元，创下历史新高，本文撰写时为

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

支持 100 万 Tokens 上下文，阿里通义千问推出 Qwen2.5-1M 开源模型

B端难做：留给魔珐科技的时间不多了

10亿基金，李彦宏呼唤下一个AI独角兽

时尚领域进军元宇宙，2022年会带来哪些颠覆性的全新体验？

NFT的未来：传统企业与去中心化机构之间的竞赛

传腾讯已推出全新XR业务；摩托罗拉正打造5GXR颈戴式计算组件

城市数字孪生标准化白皮书（2022版）

虚拟数字人：元宇宙的主角破圈而来

量子计算在未来能否提高区块链技术的效率

NFT行业周报：NBA巨星勒布朗·詹姆斯申请NFT相关商标

最新推荐

一份全面清单：Web3行业高薪酬的13种工作

元宇宙里卖酸奶，好炸裂的操作！

抢先推出“元宇宙”饮料，可口可乐赢麻了

元宇宙将会如何塑造未来的工作方式？

“我没搞懂元宇宙，但一天能赚9w块”

电影工业巨头好莱坞计划进军元宇宙，将会对行业带来什么影响？

猜你喜欢

热门推荐

相关资讯