当前位置:首页 > 元宇宙 > AI

AI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型,刷新 AIME 准确率纪录

来源: 责编: 时间:2025-04-28 07:33:09 179观看
导读 4 月 25 日消息,科技媒体 marktechpost 今天(4 月 25 日)发布博文,报道称英伟达专为数学推理设计,发布 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款先进 AI 模型。数学推理一直是 AI 领域的巨大

4 月 25 日消息,科技媒体 marktechpost 今天(4 月 25 日)发布博文,报道称英伟达专为数学推理设计,发布 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款先进 AI 模型。AgV28资讯网——每日最新资讯28at.com

数学推理一直是 AI 领域的巨大挑战。传统的语言模型擅长生成流畅文本,却在解决复杂数学问题时显得力不从心,这些问题不仅需要理解抽象概念,还要求多步骤的逻辑推导。AgV28资讯网——每日最新资讯28at.com

援引博文介绍,英伟达针对这一难题,推出了 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款模型,基于 Qwen 系列 transformer 模型,通过在 OpenMathReasoning 数据集上的深度微调,显著提升了数学推理能力。AgV28资讯网——每日最新资讯28at.com

OpenMath-Nemotron-32B 是系列中的旗舰产品,拥有 328 亿参数,采用 BF16 张量运算优化硬件效率。该模型在 AIME 2024、AIME 2025、HMMT 2024-25 等多项基准测试中取得领先成绩。AgV28资讯网——每日最新资讯28at.com

以工具集成推理(TIR)模式为例,其在 AIME24 上的 pass@1 准确率达到 78.4%,通过多数投票机制更是提升至 93.3%。AgV28资讯网——每日最新资讯28at.com

AgV28资讯网——每日最新资讯28at.com

此外,模型支持链式思维(CoT)、工具集成推理(TIR)和生成式选择(GenSelect)三种模式,用户可根据需求平衡推理透明度和答案精确度,满足科研和生产环境的不同场景。AgV28资讯网——每日最新资讯28at.com

OpenMath-Nemotron-14B-Kaggle 是一款 148 亿参数的轻量模型,针对 AIMO-2 Kaggle 竞赛优化设计,通过精选 OpenMathReasoning 数据集子集进行微调,成功夺得竞赛第一名。AgV28资讯网——每日最新资讯28at.com

在 AIME24 测试中,其 CoT 模式下 pass@1 准确率为 73.7%,GenSelect 模式下提升至 86.7%。这款模型参数更少,保持高质量的数学解题能力的同时,适合资源受限或低延迟需求的场景。AgV28资讯网——每日最新资讯28at.com

英伟达为两款模型提供了开源管道,集成于 NeMo-Skills 框架中,支持数据生成、训练和评估的全流程复现。开发者可通过示例代码快速构建应用,获取逐步解答或简洁答案。AgV28资讯网——每日最新资讯28at.com

模型针对 NVIDIA GPU(如 Ampere 和 Hopper 架构)深度优化,利用 CUDA 库和 TensorRT 技术,确保高效运行。同时,采用 Triton Inference Server 支持低延迟、高吞吐量的部署,BF16 格式则在内存占用与性能间取得平衡,助力大规模应用落地。AgV28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12649-0.htmlAI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型,刷新 AIME 准确率纪录

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌确认:Gemini 聊天机器人今年将登陆智能手表、Android Auto

下一篇: Adobe 发布 Firefly Image Model 4 模型:AI 生图再升级

标签:
  • 热门焦点
  • Meta元宇宙女性安全问题频发,元宇宙中相关问题该如何解决?

    在女性遭受性骚扰甚至被攻击的事件相继被报道之后,仍处于萌芽状态的虚拟现实空间成为人们关注的焦点。许多女性发声表示在使用Meta旗下的Horizon Worlds及其姊
  • 冰墩墩还能火多久?

    作者:田巧云题图源自北京2022年冬奥会官方微博如果要问2022年的开年明星是谁,冰墩墩当仁不让。几乎所有人都被那个抖雪的动作实力圈粉。在社交媒体的助推,以及日
  • 中国区块链产业生态地图报告(2021)

    区块链是技术整合创新、金融创新、组织方式创新、产业应用创新的多维度创新,以服务实体经济、政务民生以及公共服务等领域为落脚点,以期实现整个地区和产业的资
  • 美国一区块链风投公司宣布成立2.5亿美元web3投资新基金

    No.1 俄罗斯财政部长: 在俄罗斯禁止比特币就如禁止互联网一样2月16日消息,俄罗斯财政部长安东·西卢安诺夫(Anton Siluanov)表示,在俄罗斯禁止加密货币就跟禁止互
  • Meta展示AI系统Builder Bot;《Pistol Whip》增加派对模式

    今日热点:Meta展示AI系统Builder Bot;招聘信息显示Meta正在探索具有蜂窝连接功能的VR/AR头显;英国VR工作室Coatsink Games正在为PSVR 2开发新游戏;VR节奏射击游戏
  • Kitten Coup社区反转Cool Kittens NFT骗局

    当狂热的加密爱好者将金钱投入到NFT图片时,浑水摸鱼的骗局随之而来,Cool Kittens NFT便是其中一个作恶者,该项目于去年11月在Sonala链上启动小猫形象的NFT铸造及
  • 权限风波过后 X2Y2如何挑战OpenSea?

    继LooksRare之后,又一个OpenSea挑战者X2Y2来了。上周,X2Y2宣布向超过86万个OpenSea交易用户发放X2Y2通证空投,并启动了「挂单挖矿」的奖励机制。这场早期激励活动
  • 新闻业在元宇宙的现状和未来

    “美联社有毛病吧,这真的过分了!”,一位媒体编辑在推特中愤怒地表示。这是针对一款视频NFT的批评言论之一,之后取消了此次销售,因为该视频呈现了移民穿越地中海的苦
  • 大厂打造元宇宙平台的业务重心是什么?

    知名市场研究机构IDC发布《2022年中国元宇宙市场十大预测》报告,其中提出互联网大厂各自独立布局元宇宙平台。事实上,在2021年的最后一个季度,包括Meta、英伟达、
Top