当前位置：首页 > 元宇宙 > AI

智谱发布新一代开源 AI 模型 GLM-4-32B-0414 系列，效果比肩 GPT 系列和 DeepSeek-V3 R1

来源：责编：时间：2025-04-17 06:44:23 230观看

导读 4 月 15 日消息，智谱昨日（4 月 14 日）发布博文，宣布推出新一代 GLM-4-32B-0414 系列模型，320 亿参数，效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列，且支持非常友好的本地部署特性。该系列模型共有 GLM-4

4 月 15 日消息，智谱昨日（4 月 14 日）发布博文，宣布推出新一代 GLM-4-32B-0414 系列模型，320 亿参数，效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列，且支持非常友好的本地部署特性。

该系列模型共有 GLM-4-32B-Base-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414 和 GLM-Z1-9B-0414 四款模型。

GLM-4-32B-Base-0414

在预训练阶段，该模型采用 15T 高质量数据，其中包含大量推理类的合成数据，这为后续的强化学习扩展打下了基础。

在后训练阶段，除了针对对话场景进行了人类偏好对齐外，团队还通过拒绝采样和强化学习等技术强化了模型在指令遵循、工程代码、函数调用方面的效果，加强了智能体任务所需的原子能力。

GLM-4-32B-0414 在工程代码、Artifacts 生成、函数调用、搜索问答及报告等方面都取得了不错的效果，部分 Benchmark 甚至可以媲美更大规模的 GPT-4o、DeepSeek-V3-0324（671B）等模型。

GLM-Z1-32B-0414

该模型是具有深度思考能力的推理模型，在 GLM-4-32B-0414 的基础上，通过冷启动和扩展强化学习，以及在数学、代码和逻辑等任务上对模型的进一步训练得到的。

相对于基础模型，GLM-Z1-32B-0414 显著提升了数理能力和解决复杂任务的能力。在训练的过程中，该团队还引入了基于堆栈排序反馈的通用强化学习，进一步增强了模型的通用能力。

GLM-Z1-Rumination-32B-0414

该模型是具有沉思能力的深度推理模型（对标 Open AI 的 Deep Research）。

沉思模型通过更长时间的深度思考来解决更开放和复杂的问题（例如：撰写两个城市 AI 发展对比情况，以及未来的发展规划），结合搜索工具处理复杂任务，并经过利用多种规则型奖励来指导和扩展端到端强化学习训练得到。

GLM-Z1-9B-0414

这是一个开源 9B 小尺寸模型，在数学推理和通用任务中依然展现出极为优秀的能力，其整体表现已处于同尺寸开源模型中的领先水平。

测试结果

GLM-4 系列在多项基准测试中表现优异。例如，在 IFEval 指令遵循测试中得分 87.6；在 TAU-Bench 任务自动化测试中，零售场景得分 68.7，航空场景得分 51.2；在 SimpleQA 搜索增强问答测试中得分 88.1。

模型IFEvalBFCL-v3 (Overall)BFCL-v3 (MultiTurn)TAU-Bench (Retail)TAU-Bench (Airline)SimpleQAHotpotQAQwen2.5-Max85.650.930.558.322.079.052.8GPT-4o-112081.969.641.062.846.082.863.9DeepSeek-V3-032483.466.235.860.732.482.654.6DeepSeek-R184.357.512.433.037.383.963.1GLM-4-32B-041487.669.641.568.751.288.163.8

代码修复方面，GLM-4 在 SWE-bench 测试中的成功率达 33.8%。采用 MIT 许可的 GLM-4 降低了计算成本，为研究和企业提供了高性能 AI 解决方案。

模型框架SWE-bench VerifiedSWE-bench Verified miniGLM-4-32B-0414Moatless[1]33.838.0GLM-4-32B-0414Agentless[2]30.734.0GLM-4-32B-0414OpenHands[3]27.228.0

附上参考地址

GLM-4-0414 系列模型

THUDM Releases GLM 4: A 32B Parameter Model Competing Head-to-Head with GPT-4o and DeepSeek-V3

本文链接：http://www.28at.com/showinfo-45-12317-0.html智谱发布新一代开源 AI 模型 GLM-4-32B-0414 系列，效果比肩 GPT 系列和 DeepSeek-V3 R1

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：人工智能开发平台 Hugging Face 收购 Pollen Robotics，进军人形机器人市场

下一篇：真·质之选：北京现代OE四驱，让安全与舒适超越配置堆砌

标签：

热门焦点

元宇宙是投资中国的第五次重大机遇

作者为凯思博投资董事长导语：投资逻辑要来自于人性在社会发展过程中的普遍规律，由第一性原理出发找出重大的投资机会来。1978年的改革开放到今天，中国总共经历了
元宇宙将会如何塑造未来的工作方式？

科幻小说家尼尔·斯蒂芬森 (Neal Stephenson) 在1992年就创造了“元宇宙”一词，但事实上，在Facebook将其更名为Meta以反映其将这一科幻愿景变为现实的战略重点之
冰墩墩还能火多久？

作者：田巧云题图源自北京2022年冬奥会官方微博如果要问2022年的开年明星是谁，冰墩墩当仁不让。几乎所有人都被那个抖雪的动作实力圈粉。在社交媒体的助推，以及日
摩根大通：元宇宙市场预计每年收入超1万亿美元

今日《元宇宙新鲜事》有：香港首届元宇宙艺博会将于5月举办；NH-Amundi Asset Management上市其第二支元宇宙ETF；Meta虚拟现实平台Horizon Worlds月活跃用户在三个
顶流IP“冰墩墩”带着中国元素NFT进入全球视野

一场被国际奥委会主席评价堪称独具匠心、非凡卓越的2022年北京冬季奥运会，在这个“双奥之城”经历了16个令人难忘的精彩日夜，最终圆满闭幕。让我们印象深刻的不
NFT自动售货机来啦！

“纽约市有一台售卖 Solana NFT 的自动售货机，用信用卡就能买”Solana NFT 市场 Neon 可让您使用信用卡亲自购买 NFT，无需使用加密货币。由于基于 Solana 链的 N
Steam 禁止NFT和加密货币原因曝光

近日，Valve（V社）总裁Gabe Newell接受PC Gamer采访时解释了该平台禁止NFT和加密货币的原因。早在2021年10月18日，PC Gamer就报道Steam推出的新规：使用区块链或允许交
3月份值得关注的5个NFT项目

2021年，我们见证了一个新的创造者经济的诞生。它是在区块链上诞生的。自从NFT成为流行文化的中心舞台以来，有些艺术家们已经成为了NFT的超级明星，在几个月的时间
PayPal CEO 的加密语录：加密货币将重新定义金融世界

PayPal 近年来一直是加密行业的倡导者。这个本身拥有超过 3.5 亿名活跃用户的支付巨头，已经允许美国和英国的用户交易或持有比特币（BTC）、以太坊（ETH）、比特现金（BCH

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

智谱发布新一代开源 AI 模型 GLM-4-32B-0414 系列，效果比肩 GPT 系列和 DeepSeek-V3 R1

元宇宙是投资中国的第五次重大机遇

元宇宙将会如何塑造未来的工作方式？

冰墩墩还能火多久？

摩根大通：元宇宙市场预计每年收入超1万亿美元

顶流IP“冰墩墩”带着中国元素NFT进入全球视野

NFT自动售货机来啦！

Steam 禁止NFT和加密货币原因曝光

3月份值得关注的5个NFT项目

PayPal CEO 的加密语录：加密货币将重新定义金融世界

最新推荐

虚拟人再升级，企业可以解放双手了？

数字人的新革命，BAT的“冲高”战场

元宇宙火热的当下，我们该如何“身临其境”的体验元宇宙？

“任何国产元宇宙都是假元宇宙”

传统互联网与区块链场景下数据权利法律分析

用户可以把自己的医疗健康数据做成NFT出售给医药公司挣钱

猜你喜欢

热门推荐

相关资讯