当前位置:首页 > 元宇宙 > AI

支持 100 万 Tokens 上下文,阿里通义千问推出 Qwen2.5-1M 开源模型

来源: 责编: 时间:2025-01-29 18:59:45 159观看
导读 1 月 27 日消息,阿里通义千问今日宣布,正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。从官方介绍获悉,通义千问本次发布了两个新的开源模型,分别是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M,这

1 月 27 日消息,阿里通义千问今日宣布,正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。WCy28资讯网——每日最新资讯28at.com

从官方介绍获悉,通义千问本次发布了两个新的开源模型,分别是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M,这是通义千问首次将开源的 Qwen 模型的上下文扩展到 1M 长度。WCy28资讯网——每日最新资讯28at.com

为了帮助开发者更高效地部署 Qwen2.5-1M 系列模型,Qwen 团队完全开源了基于 vLLM 的推理框架,并集成了稀疏注意力方法,使得该框架在处理 1M 标记输入时的速度提升了 3 倍到 7 倍。WCy28资讯网——每日最新资讯28at.com

长上下文任务

在上下文长度为 100 万 Tokens 的大海捞针(Passkey Retrieval)任务中,Qwen2.5-1M 系列模型能够准确地从 1M 长度的文档中检索出隐藏信息,其中仅有 7B 模型出现了少量错误。WCy28资讯网——每日最新资讯28at.com

WCy28资讯网——每日最新资讯28at.com

对于更复杂的长上下文理解任务,选择了 RULER、LV-Eval 和 LongbenchChat 测试集。WCy28资讯网——每日最新资讯28at.com

WCy28资讯网——每日最新资讯28at.com

WCy28资讯网——每日最新资讯28at.com

从这些结果中,Qwen 得出以下几点关键结论:WCy28资讯网——每日最新资讯28at.com

显著超越 128K 版本:Qwen2.5-1M 系列模型在大多数长上下文任务中显著优于之前的 128K 版本,特别是在处理超过 64K 长度的任务时表现出色。WCy28资讯网——每日最新资讯28at.com

性能优势明显:Qwen2.5-14B-Instruct-1M 模型不仅击败了 Qwen2.5-Turbo,还在多个数据集上稳定超越 GPT-4o-mini,为长上下文任务提供了开源模型的选择。WCy28资讯网——每日最新资讯28at.com

短序列任务

WCy28资讯网——每日最新资讯28at.com

可以发现:WCy28资讯网——每日最新资讯28at.com

Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M 在短文本任务上的表现与其 128K 版本相当,确保了基本能力没有因为增加了长序列处理能力而受到影响。WCy28资讯网——每日最新资讯28at.com

与 GPT-4o-mini 相比,Qwen2.5-14B-Instruct-1M 和 Qwen2.5-Turbo 在短文本任务上实现了相近的性能,同时上下文长度是 GPT-4o-mini 的八倍。WCy28资讯网——每日最新资讯28at.com

模型链接:https://www.modelscope.cn/collections/Qwen25-1M-d6cf9fd33f0a40WCy28资讯网——每日最新资讯28at.com

技术报告:https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen2.5-1M/Qwen2_5_1M_Technical_Report.pdfWCy28资讯网——每日最新资讯28at.com

体验链接:https://modelscope.cn/studios/Qwen/Qwen2.5-1M-DemoWCy28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-10254-0.html支持 100 万 Tokens 上下文,阿里通义千问推出 Qwen2.5-1M 开源模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 全球首个港口服务类大模型方舟 TaaS 开启公测,支持智能规划路线并估算费用

下一篇: 小米SU7车模春晚亮相成焦点,碳纤维后视镜版卖断货!

标签:
  • 热门焦点
  • 这一超级富豪“逆袭”,身价大增4330亿

    来源:侃见财经互联网的突围没有“终点”。在快节奏的商业环境下,不断的试错成了互联网企业的标配,一年一个风口,一个风口造就一个热点,但是回头来看,最终受益的还是身处
  • “虚拟人”角斗场,基于“硬实力”下的人性平衡法则?

    在打工人“反内卷”的当下,一众虚拟人却“内卷”了起来。从北京春晚虚拟人苏小妹与刘宇演绎歌舞《星河入梦》,央美毕业的虚拟人夏语冰登上央视节目《对话》,湖南
  • 冰墩墩还能火多久?

    作者:田巧云题图源自北京2022年冬奥会官方微博如果要问2022年的开年明星是谁,冰墩墩当仁不让。几乎所有人都被那个抖雪的动作实力圈粉。在社交媒体的助推,以及日
  • 上海虹口成立10亿元元宇宙基金,香港首只元宇宙ETF拟上市

    区块链日报17日讯 今日《元宇宙新鲜事》有:上海虹口将成立总额约10亿元的元宇宙产业基金;香港市场首只元宇宙主题ETF拟于2月21日上市;元宇宙平台Roblox出现违禁游
  • 2022年中国元宇宙产业系列研究报告-基础设施篇(5)

    传感器是由敏感元件和转换元件构成,能够感受规定的检测量(物理量、化学量、生物量等),并按照一定规律将检测量转化成可用的输出信号的器件和装置,进而满足信息的
  • 扎克伯格演示了一种“造物主”式的元宇宙语音机器人工具

    前身为Facebook的Meta公司今天展示了一个人工智能系统的Demo,该系统使人们能够通过语音命令生成或导入虚拟世界中的事物。该公司认为这个被称为 "Builder Bot "
  • GameFi 深度解析,元宇宙内容雏形显现

    GameFi=Game(游戏)+Defi(去中心化金融),核心特点为“Play to Earn”。通过技术与去中心化价值观赋能,GameFi 游戏资产化身为NFT 和代币上链,具备了可验证性和流通性;开
  • MR——元宇宙平台的下一代入口

    作为“元宇宙”的领头羊,Meta的一举一动都受到业内的高度关注。华尔街见闻提及,2月17日周四,Facebook母公司Meta在透露,其混合现实技术(MR)将在几年后实现,让人们对元
  • 元宇宙收割了谁

    作者:晓宇资本将元宇宙看作下一代互联网的门票,画大饼、割韭菜就成了一大选项。2021年被称为元宇宙元年。在这一年里,先是号称元宇宙第一股的沙盒游戏Roblox盛装
Top