当前位置:首页 > 元宇宙 > AI

支持 100 万 Tokens 上下文,阿里通义千问推出 Qwen2.5-1M 开源模型

来源: 责编: 时间:2025-01-29 18:59:45 177观看
导读 1 月 27 日消息,阿里通义千问今日宣布,正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。从官方介绍获悉,通义千问本次发布了两个新的开源模型,分别是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M,这

1 月 27 日消息,阿里通义千问今日宣布,正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。Xly28资讯网——每日最新资讯28at.com

从官方介绍获悉,通义千问本次发布了两个新的开源模型,分别是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M,这是通义千问首次将开源的 Qwen 模型的上下文扩展到 1M 长度。Xly28资讯网——每日最新资讯28at.com

为了帮助开发者更高效地部署 Qwen2.5-1M 系列模型,Qwen 团队完全开源了基于 vLLM 的推理框架,并集成了稀疏注意力方法,使得该框架在处理 1M 标记输入时的速度提升了 3 倍到 7 倍。Xly28资讯网——每日最新资讯28at.com

长上下文任务

在上下文长度为 100 万 Tokens 的大海捞针(Passkey Retrieval)任务中,Qwen2.5-1M 系列模型能够准确地从 1M 长度的文档中检索出隐藏信息,其中仅有 7B 模型出现了少量错误。Xly28资讯网——每日最新资讯28at.com

Xly28资讯网——每日最新资讯28at.com

对于更复杂的长上下文理解任务,选择了 RULER、LV-Eval 和 LongbenchChat 测试集。Xly28资讯网——每日最新资讯28at.com

Xly28资讯网——每日最新资讯28at.com

Xly28资讯网——每日最新资讯28at.com

从这些结果中,Qwen 得出以下几点关键结论:Xly28资讯网——每日最新资讯28at.com

显著超越 128K 版本:Qwen2.5-1M 系列模型在大多数长上下文任务中显著优于之前的 128K 版本,特别是在处理超过 64K 长度的任务时表现出色。Xly28资讯网——每日最新资讯28at.com

性能优势明显:Qwen2.5-14B-Instruct-1M 模型不仅击败了 Qwen2.5-Turbo,还在多个数据集上稳定超越 GPT-4o-mini,为长上下文任务提供了开源模型的选择。Xly28资讯网——每日最新资讯28at.com

短序列任务

Xly28资讯网——每日最新资讯28at.com

可以发现:Xly28资讯网——每日最新资讯28at.com

Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M 在短文本任务上的表现与其 128K 版本相当,确保了基本能力没有因为增加了长序列处理能力而受到影响。Xly28资讯网——每日最新资讯28at.com

与 GPT-4o-mini 相比,Qwen2.5-14B-Instruct-1M 和 Qwen2.5-Turbo 在短文本任务上实现了相近的性能,同时上下文长度是 GPT-4o-mini 的八倍。Xly28资讯网——每日最新资讯28at.com

模型链接:https://www.modelscope.cn/collections/Qwen25-1M-d6cf9fd33f0a40Xly28资讯网——每日最新资讯28at.com

技术报告:https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen2.5-1M/Qwen2_5_1M_Technical_Report.pdfXly28资讯网——每日最新资讯28at.com

体验链接:https://modelscope.cn/studios/Qwen/Qwen2.5-1M-DemoXly28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-10254-0.html支持 100 万 Tokens 上下文,阿里通义千问推出 Qwen2.5-1M 开源模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 全球首个港口服务类大模型方舟 TaaS 开启公测,支持智能规划路线并估算费用

下一篇: 小米SU7车模春晚亮相成焦点,碳纤维后视镜版卖断货!

标签:
  • 热门焦点
  • 元娲2.7上线:虚拟人视频制作速度疯狂翻倍!

    来源:清元宇宙 炎炎夏日努力工作的Q仔的电脑都冒烟儿啦~今天要给大家介绍两个新小伙伴——小元和小娲,他们将给大家解读元娲2.7版本重磅更新内容~大家掌声欢迎~~~本次更
  • 关于ChatGPT的10点思考

    作者:晏涛三寿近日ChatGPT又有大动作。5月19日,OpenAI在官网宣布正式发布App应用,并登录苹果应用商店。与网页版的聊天机器人相比,iOS应用程序的发布有望让更多人接触到ChatGPT
  • 游戏玩家才是最“元宇宙”的

    01元宇宙的概念,最早由科幻作家尼尔·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一个脱胎于现实世界,又与现实世界平行、相互影响,并且始终在线的虚拟世
  • NFT的未来:传统企业与去中心化机构之间的竞赛

    传统企业和去中心化机构一直存在分歧,但最近NFT的爆炸式增长让他们产生了共同的兴趣,双方都在竞相让用户更轻松、更方便地使用NFT。毫无疑问,NFT 市场正在增长。
  • 2022年去中心化交易所会崛起吗?

    “在某个时候,去中心化衍生品的交易量可能会超过去中心化现货交易所。”DEX 越来越多地转向第二层解决方案。“数字化金融市场的概念以及如何沿着以用户为中心
  • NFT教育要从娃娃抓起!这些青少年艺术家已经赚取了几千万美金

    一些艺术家通过将他们的创作作为NFT出售而获得了巨大收益。令人惊讶的是,许多赚取了数百万美元的艺术家们仍在读高中。这可能有点让人难以置信。然而,请记住,在短
  • 美国单曲排行榜Billboard和World of Women合作推出NFT杂志封面

    今天,Billboard宣布与流行的NFT头像集World of Women(WoW)建立新的伙伴关系,向NFT生态系统又迈进了一步。在这次合作中,WoW的创建者Yam Karkai将帮助这个音乐行业巨
  • 花旗集团前高管加入Provenance区块链,担任CEO

    No.1 花旗集团前高管加入Provenance区块链,担任CEO3月1日消息,Provenance区块链基金会已任命花旗集团前高管摩根·麦肯尼(Morgan McKenney)为新任首席执行官。麦肯
  • NFT高玩必备:NFT分析工具大盘点

    NFT市场的火热让越来越多的投资者投身其中,但当前的 NFT 生态系统存在几个问题却困扰了大多数人,如难以准确评估 NFT 项目的资产价格、缺乏 NFT 市场动态信息、
Top