当前位置:首页 > 元宇宙 > AI

业界首个:腾讯混元-A13B 模型发布并开源,极端条件 1 张中低端 GPU 卡即可部署

来源: 责编: 时间:2025-06-29 17:20:33 116观看
导读 6 月 27 日消息,腾讯混元大模型家族今日宣布迎来新成员 —— 混元-A13B 模型发布并开源,号称是“业界首个 13B 级别的 MoE 开源混合推理模型”。混元-A13B 作为基于专家混合(MoE)架构的大模型,总参数 800 亿、激活

6 月 27 日消息,腾讯混元大模型家族今日宣布迎来新成员 —— 混元-A13B 模型发布并开源,号称是“业界首个 13B 级别的 MoE 开源混合推理模型”。YM428资讯网——每日最新资讯28at.com

混元-A13B 作为基于专家混合(MoE)架构的大模型,总参数 800 亿、激活参数 130 亿,号称“在效果比肩顶尖开源模型的同时,大幅降低推理延迟与计算开销”。YM428资讯网——每日最新资讯28at.com

YM428资讯网——每日最新资讯28at.com

腾讯混元表示,这对个人开发者和中小企业来说,无疑是个好消息,极端条件下仅需 1 张中低端 GPU 卡即可部署。用户可以在 Github、HuggingFace 等技术社区下载使用,模型 API 已在腾讯云官网上线。YM428资讯网——每日最新资讯28at.com

混元-A13B 模型通过 MoE 架构,为每个输入选择性地激活相关模型组件,号称与同等规模的密集模型相比“又快又省”,而且为个人开发者和中小企业提供了一个“可扩展且高效的替代方案”。YM428资讯网——每日最新资讯28at.com

预训练中,模型用了 20 万亿高质量网络词元语料库,提升了模型推理能力的上限;完善了 MoE 架构的 Scaling Law(即规模定律)理论体系,为 MoE 架构设计提供了可量化的工程化指导,提升了模型预训练效果。YM428资讯网——每日最新资讯28at.com

用户可以按需选择思考模式,快思考模式提供简洁、高效的输出,适合追求速度和最小计算开销的简单任务;慢思考模式涉及更深、更全面的推理步骤。这优化了计算资源分配,兼顾效率和准确性。YM428资讯网——每日最新资讯28at.com

混元还开源了两个新数据集,以填补行业内相关评估标准的空白。其中,ArtifactsBench 主要用于代码评估,构建了一个包含 1825 个任务的新基准;C3-Bench 针对 Agent 场景模型评估,设计了 1024 条测试数据,以发现模型能力的不足。YM428资讯网——每日最新资讯28at.com

从具体效果来看,数学推理方面,例如输入“9.11 和 9.9 谁大”,模型可准确完成小数比较,并展现分步解析能力。YM428资讯网——每日最新资讯28at.com

YM428资讯网——每日最新资讯28at.com

对于时下热门的智能体(Agent)应用,模型可调用工具,生成出行攻略、数据文件分析等复杂指令响应。YM428资讯网——每日最新资讯28at.com

YM428资讯网——每日最新资讯28at.com

再看数据和效果。在多个公开数据测试集上,模型在数学、科学和逻辑推理任务上表现出“领先效果”。YM428资讯网——每日最新资讯28at.com

YM428资讯网——每日最新资讯28at.com

附开源地址:YM428资讯网——每日最新资讯28at.com

https://github.com/Tencent-Hunyuan/Hunyuan-A13BYM428资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-14212-0.html业界首个:腾讯混元-A13B 模型发布并开源,极端条件 1 张中低端 GPU 卡即可部署

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌正式发布 Gemma 3n 小钢炮模型:2GB 内存本地玩转 AI 多模态

下一篇: Anthropic 报告:仅 3% 用户会向 AI 寻求“情感陪伴”

标签:
  • 热门焦点
  • 错过了BRC20还有eths,eth铭文协议

    来源:三头鸟NFT大家好,我是鸟哥,了解鸟哥的人都知道鸟哥擅撸空投,说实话撸毛虽然回报大但周期还是有点长的,所以除了撸毛我们自己也在研究早期项目,打新,比如BRC20协议ordi当时就有
  • 元宇宙步入暗夜

    撰文 | 文烨豪元宇宙的故事,似乎讲不通了。 当下,刮起元宇宙热潮的Roblox股价已跌去大半,带头大哥Meta也正因元宇宙亏损深陷泥潭。 再看国内,从字节“派对岛&
  • 避坑指南:远离具有这些特性的NFT

    关于NFT,在我们的文章中一直以来都是常驻嘉宾,不止因为NFT背后隐藏的潜力,更因为在这个NFT世界里冥冥之中仿佛有一双幕后的手,OpenSea、库里、ERC115、视觉中国、
  • 冰墩墩NFT遇冷,价格跌80%,日成交仅3笔。

    “两日上涨千倍”并不存在,且冰墩墩NFT的市场热度远不及社交媒体所称的那样高。2月11日,获得国际奥委会授权的2022冬奥会吉祥物冰墩墩相关NFT产品在nWayPlay上线
  • 2022年中国元宇宙产业系列研究报告-基础设施篇(5)

    传感器是由敏感元件和转换元件构成,能够感受规定的检测量(物理量、化学量、生物量等),并按照一定规律将检测量转化成可用的输出信号的器件和装置,进而满足信息的
  • 冰墩墩的NFT暴涨千倍?真相则是价格暴跌、成交遇冷

    《区块链日报》记者查证,近日来冰墩墩数字藏品交易数量出现大幅下滑,而所谓的暴涨千倍更是有价无市的自嗨。昨日,北京冬奥会正式闭幕。在这届冬奥会上,吉祥物“冰
  • NFT盗窃案:为什么NFT市场被盗窃和黑客所困扰?

    Block-806NFT的增长值得关注。许多人愿意为数字艺术支付数百万美元,世界正在走向数字化。报告显示,NFT市场和NFT收藏从2020年的1.06亿美元增加到了2021年的442亿
  • 费城艺术家使用区块链,在数字艺术中狠狠捞一笔

    ‍你也想赚钱发财走上人生巅峰吗?老雅痞给你指条路,现在也许是时候创建或购买或出售 NFT的好时机。费城地区的许多企业家都在这样做。但投资需谨慎,入行有风险,在
  • 超级账本Julian Gordon:联盟链与公链的竞争不是非此即彼

    在2021年《福布斯》区块链50强榜单中,29家企业使用Hyperledger超级账本技术,占比近60%。同年,研究机构Blockdata发布了的调查报告显示,访问Top100上市公司中,有 81
Top