当前位置：首页 > 元宇宙 > AI

阿里通义千问Qwen2.5-1M模型开源，长上下文处理能力大幅提升！

来源：责编：时间：2025-01-27 09:28:56 189观看

导读阿里通义千问于近日正式宣布，开源了其最新的Qwen2.5-1M模型及其配套的推理框架。这一举措标志着通义千问在人工智能领域迈出了重要一步。据悉，通义千问此次发布的开源模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Inst

阿里通义千问于近日正式宣布，开源了其最新的Qwen2.5-1M模型及其配套的推理框架。这一举措标志着通义千问在人工智能领域迈出了重要一步。

据悉，通义千问此次发布的开源模型包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M两个版本。尤为引人注目的是，这两个版本首次将Qwen模型的上下文长度扩展到了1M（即100万标记），这在业界尚属首次。

为了帮助开发者更好地部署和应用这些模型，Qwen团队还开源了基于vLLM的推理框架。该框架集成了稀疏注意力方法，使得在处理长达1M标记的输入时，推理速度有了显著提升，达到了3倍至7倍的增长。

在长上下文任务方面，Qwen2.5-1M系列模型展现出了强大的能力。在一项名为“大海捞针”的任务中，这些模型能够准确地从1M长度的文档中检索出隐藏信息。尽管7B版本的模型在极少数情况下出现了错误，但整体上，其表现仍然令人瞩目。

为了全面评估Qwen2.5-1M系列模型在长上下文任务中的表现，研究团队还选择了RULER、LV-eval和LongbenchChat等多个测试集进行测试。测试结果显示，这些模型在大多数任务中都显著优于之前的128K版本，特别是在处理超过64K长度的任务时，其优势更加明显。

Qwen2.5-14B-Instruct-1M模型不仅在性能上击败了Qwen2.5-Turbo，还在多个数据集上稳定超越了GPT-4o-mini。这一结果无疑为长上下文任务提供了更多开源模型的选择。

除了长上下文任务外，Qwen2.5-1M系列模型在短序列任务上的表现同样出色。测试结果显示，Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M在短文本任务上的表现与其128K版本相当，这意味着增加长序列处理能力并没有牺牲其基本能力。

与GPT-4o-mini相比，Qwen2.5-14B-Instruct-1M和Qwen2.5-Turbo在短文本任务上实现了相近的性能，但它们的上下文长度却是GPT-4o-mini的八倍。这一结果进一步证明了Qwen2.5-1M系列模型在短序列任务上的强大实力。

举报 0收藏 0打赏 0评论 0

更多>同类资讯

DeepSeek开源AI模型崛起，Meta科学家杨立昆：这就是开源的魅力？

01-26

扎克伯格豪掷650亿美元！Meta加速构建AI帝国，能否超越OpenAI和谷歌？

01-26

万通发展重大资产重组告吹，转型高端光模块之路何去何从？

01-26

DeepSeek短时闪崩后回应，已冲进美区苹果App Store免费榜前三

三言科技 1月26日消息，今日DeepSeek出现短时闪崩，对此，DeepSeek回应称，当天下午确实出现了局部服务波动，但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后，用户访问量激增，服务器一…

01-26

AI狂潮背后的隐形富豪：SK海力士利润暴涨22倍

01-26

DeepSeek突发“闪崩”？官方回应：局部服务波动，已迅速恢复

1月26日，有网友反应，DeepSeek崩了，提示服务器繁忙。就此事询问DeepSeek今天下午是否有闪崩时，DeepSeek回应称：今天下午（1月26日）DeepSeek确实出现了局部服务波动，但问题在…

01-26

DeepSeek突发故障引关注，官方回应：局部服务波动已迅速恢复

01-26

刘庆峰揭秘百模大战：科大讯飞如何在巨头夹击下坚守AI初心？

豆包2023年还不及格，2024年大家说满分了，因为它投了800亿，十几万张H100的卡；阿里有几万张英伟达的H卡，百亿美金买进，他们在硅谷有相关基金，有大量海外数据，也做得非常好，开源模型进步很快；2024…

01-26

锦秋基金硅谷归来：揭秘AI领域二十五条前沿认知与趋势

01-26

百川智能全模态模型Baichuan-Omni-1.5发布，能否引领AI新潮流？

综上，Baichuan-Omni-1.5不仅在通用能力上整体超越GPT4o-mini，并且实现了全模态理解、生成的统一。百川智能一方面提升了模型在语言、视觉、音频等多模态信息处理上的能力，使其能够应对更复…

01-26

百度iRAG技术：萌宠拜年图也能生成，AI生图走向实用新时代

这项技术给大模型装上了一个亿级的“视觉外挂知识库”，在生成图片时根据提示词等信息给大模型查找相关图片资源，作为参考数据，进而提升图像生成的准确性，还可降低制作成本。 iRAG技术就仿佛给大模型加装了一个“视觉…

01-26

DeepSeek崛起挑战AI巨头，开源低成本模式或颠覆英伟达市场地位？

01-26

中美大厂竞逐AI智能体，万亿赛道谁将领跑？

智谱推出了AutoGLM、GLM-PC等多个AI智能体应用产品；字节跳动推出的AI应用开发平台扣子已发布了超过200万个智能体，在国内处于领先；今年CES上，英伟达CEO黄仁勋也表示，AI Agent应用…

01-26

AI软件市场2024年将膨胀32%至970亿美元，未来五年将持续高涨

01-26

英伟达宣布：Maxwell、Pascal、Volta架构GPU CUDA支持即将冻结

01-26

点击查看更多 +

全站最新

智慧电子产业园冲刺：未来两年总产值目标十亿元！

“天关”卫星探测：宇宙早期爆发软X射线信号首现！

家中谜团：我每月寄回4000，母亲仍喊穷，弟弟却开上了20万新车

比亚迪日本市场高歌猛进，插电混动技术能否再掀浪潮？

苹果AirPods未来大升级：将配红外摄像头，听歌同时还能“感知”世界？

苹果2025年大动作：HomePod变身7英寸智能家居控制中枢？

热门内容

95后AI天才少女罗福莉跳槽小米，DeepSeek-V3模型已上线并开源
三星Galaxy S25系列真机曝光，明日发布会将有何惊喜？
95后AI天才少女罗福莉，弃幻方量化投小米，雷军千万年薪有何吸引力？
支付宝集五福新升级，2025年1月20日活动盛大启幕！
扫地机器人进化新形态，追觅机械手引领家庭服务智能革命
三星Galaxy S25系列评测：AI大升级，Ultra版全面领跑
CES 2025：Aria机器人亮相，高度拟人可换脸，专为陪伴而生
DeepSeek实测：低成本AI大模型能否媲美行业巨头？
三星S25系列发布会前瞻：手机迭代温和，OneUI 7与AI硬件成亮点？
英伟达CES发布Project Digits：3000美元迷你AI超算实拍亮相
字节跳动自建数据中心，2025年计划投资1600亿打造大规模集群
2025杰出雇主榜单发布：企业如何应对市场挑战，人才战略是关键
DeepSeek团队揭秘：清北应届生领衔，年轻力量如何撑起AI大模型新篇章？
中部最大智算中心“河南空港”正式投产，算力规模将达10万P！
CES现场直击：萌友智能Ropet，让大白式陪伴机器人走进现实？

本栏最新

万通发展重大资产重组告吹，转型高端光模块之路何去何从？

DeepSeek短时闪崩后回应，已冲进美区苹果App Store免费榜前三

AI狂潮背后的隐形富豪：SK海力士利润暴涨22倍

刘庆峰揭秘百模大战：科大讯飞如何在巨头夹击下坚守AI初心？

百川智能全模态模型Baichuan-Omni-1.5发布，能否引领AI新潮流？

百度iRAG技术：萌宠拜年图也能生成，AI生图走向实用新时代

本文链接：http://www.28at.com/showinfo-45-10196-0.html阿里通义千问Qwen2.5-1M模型开源，长上下文处理能力大幅提升！

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：全球首发的港口服务大模型方舟TaaS，公测正式启动！

下一篇： DeepSeek开源AI模型崛起，Meta科学家杨立昆：这就是开源的魅力？

标签：

热门焦点

ChatGPT访问量增速下滑，AI真的是一场泡沫吗？

来源：首席商业评论2023年，最火的莫过于ChatGPT，席卷全球的同时也引发了生成式AI（人工智能）的投资热潮。在美股，ChatGPT相关概念股飙涨，以AI算力龙头英伟达为例，其股价年内一度累计上
这一超级富豪“逆袭”，身价大增4330亿

来源：侃见财经互联网的突围没有“终点”。在快节奏的商业环境下，不断的试错成了互联网企业的标配，一年一个风口，一个风口造就一个热点，但是回头来看，最终受益的还是身处
有人狂赚千倍，资金盘游戏日进上亿，元宇宙泡沫还能吹多久？

你还不知道元宇宙？没关系。看看微软、Meta、英伟达的雄心壮志，便可领略元宇宙的辽阔。1月18日，微软宣布将以687亿美元收购动视暴雪，这是有史以来互联网领域最大的
星展银行(DBS)计划推出零售数字资产交易服务

2月14日消息，新加坡星展银行CEO Piyush Gupta在财报会议上表示，计划于2022年年底前推出零售数字资产交易服务。据悉，DBS于2021年初开设了机构数字资产交易平台，全
超跑与NFT的首次结合，兰博基尼能否破局？

兰博基尼公司近日称即将推出它的首款NFT，并且将加速进军区块链领域。这家闻名遐迩的意大利汽车厂商野心勃勃地将目光投向混合动力和电动跑车，并宣布将拍卖与瑞士
冰墩墩还能火多久？

作者：田巧云题图源自北京2022年冬奥会官方微博如果要问2022年的开年明星是谁，冰墩墩当仁不让。几乎所有人都被那个抖雪的动作实力圈粉。在社交媒体的助推，以及日
餐桌上怎么变出元宇宙？

作者：星影“元宇宙让餐饮业脱胎换骨。”实体的餐饮与虚拟的元宇宙，看起来风马牛不相及，但最近全世界的餐饮企业都掀起了一股注册元宇宙商标的热潮。2月初，全球最大
以太坊伦敦升级后，随之生效的以太坊EIP-1559是什么？

作者：三黎过去的一年里，除了 BTC 一如既往稳坐王位，DEFI 则是贯穿一整年的狂欢热点。 DeFi 在让 ETH 实现价值增长的同时，也使得其网络日渐拥堵、交易费用增高，成为
大厂打造元宇宙平台的业务重心是什么？

知名市场研究机构IDC发布《2022年中国元宇宙市场十大预测》报告，其中提出互联网大厂各自独立布局元宇宙平台。事实上，在2021年的最后一个季度，包括Meta、英伟达、

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

阿里通义千问Qwen2.5-1M模型开源，长上下文处理能力大幅提升！

ChatGPT访问量增速下滑，AI真的是一场泡沫吗？

这一超级富豪“逆袭”，身价大增4330亿

有人狂赚千倍，资金盘游戏日进上亿，元宇宙泡沫还能吹多久？

星展银行(DBS)计划推出零售数字资产交易服务

超跑与NFT的首次结合，兰博基尼能否破局？

冰墩墩还能火多久？

餐桌上怎么变出元宇宙？

以太坊伦敦升级后，随之生效的以太坊EIP-1559是什么？

大厂打造元宇宙平台的业务重心是什么？

最新推荐

元宇宙是数字共识生态的集成逻辑表达

NFT教育要从娃娃抓起！这些青少年艺术家已经赚取了几千万美金

NFT行业的三大区块链之一引起了Snoop Dogg的强烈兴趣，究竟有何潜力？

盘点9个主流元宇宙平台，你都知道哪些？

Staking 收益翻倍？

元宇宙+剧本杀：“在异世界里当演员”

猜你喜欢

热门推荐

相关资讯