当前位置:首页 > 元宇宙 > AI

英伟达新突破:ProRL方法助力打造顶级1.5B参数推理AI模型

来源: 责编: 时间:2025-06-05 19:07:41 191观看
导读近期,科技界传来一则引人注目的消息,英伟达研究团队在人工智能领域取得了重要突破。据科技媒体marktechpost报道,英伟达不仅推出了一种名为ProRL的强化学习方法,还成功开发出了目前全球顶尖的1.5B参数推理模型——Nemotro

近期,科技界传来一则引人注目的消息,英伟达研究团队在人工智能领域取得了重要突破。据科技媒体marktechpost报道,英伟达不仅推出了一种名为ProRL的强化学习方法,还成功开发出了目前全球顶尖的1.5B参数推理模型——Nemotron-Research-Reasoning-Qwen-1.5B。ijD28资讯网——每日最新资讯28at.com

推理模型,作为专门设计的人工智能系统,其核心在于通过复杂的长链推理过程,得出最终的答案。这一技术在近年来备受关注,而强化学习在这一过程中的作用更是不可忽视。此前,DeepSeek和Kimi等团队已采用可验证奖励的强化学习方法(RLVR),推动了GRPO、Mirror Descent和RLOO等算法的发展。ijD28资讯网——每日最新资讯28at.com

然而,尽管强化学习在理论上被认为能够提升大型语言模型(LLM)的推理能力,但实际应用中却面临诸多挑战。现有研究表明,RLVR在pass@k指标上并未显著优于基础模型,这显示出推理能力的扩展存在局限性。当前的研究大多聚焦于数学等特定领域,导致模型过度训练,限制了其探索新领域的潜力。同时,强化学习的训练步数通常较短,往往仅数百步,这使得模型难以充分发展新的能力。ijD28资讯网——每日最新资讯28at.com

为了克服这些难题,英伟达研究团队推出了ProRL方法。他们不仅将强化学习的训练时间延长至超过2000步,还大大扩展了训练数据的范围,涵盖了数学、编程、STEM、逻辑谜题和指令遵循等多个领域,共计13.6万个样本。这一举措旨在提升模型的泛化能力,使其能够在不同领域都表现出色。ijD28资讯网——每日最新资讯28at.com

在ProRL方法的基础上,英伟达团队采用了verl框架和改进的GRPO方法,成功开发出了Nemotron-Research-Reasoning-Qwen-1.5B模型。这一模型在多项基准测试中均表现出色,超越了基础模型DeepSeek-R1-1.5B,甚至在某些方面优于更大的DeepSeek-R1-7B模型。ijD28资讯网——每日最新资讯28at.com

ijD28资讯网——每日最新资讯28at.com

测试结果显示,Nemotron-Research-Reasoning-Qwen-1.5B模型在数学领域实现了平均15.7%的提升,编程任务的pass@1准确率提高了14.4%,在STEM推理和指令遵循方面分别提升了25.9%和22.0%,逻辑谜题的奖励值更是提升了惊人的54.8%。这一系列数据充分展示了该模型在不同领域中的强大推理能力和泛化性能。ijD28资讯网——每日最新资讯28at.com

英伟达的这一突破无疑为人工智能领域带来了新的希望和可能。随着技术的不断进步和应用的不断拓展,我们有理由相信,未来将有更多像Nemotron-Research-Reasoning-Qwen-1.5B这样的优秀模型涌现出来,为人类社会带来更多的便利和价值。ijD28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
三星高管详解Galaxy S25 Edge:超薄设计下电池续航仍可用一整天
三星高管详解Galaxy S25 Edge:超薄设计下电池续航仍可用一整天
微软博客预告片新称谓“Xbox PC”,或预示Xbox生态系统融合趋势?
微软博客预告片新称谓“Xbox PC”,或预示Xbox生态系统融合趋势?
Skullcandy新款Aviator 900 ANC头戴耳机:复古设计融合THX空间音频技术
Skullcandy新款Aviator 900 ANC头戴耳机:复古设计融合THX空间音频技术
尔英HX770-NAS主板亮相,支持多至12个SATA接口,专为NAS打造
尔英HX770-NAS主板亮相,支持多至12个SATA接口,专为NAS打造
宝马X5/X6/X7车型全面升级,动力多样化布局未来出行
宝马X5/X6/X7车型全面升级,动力多样化布局未来出行
《逆水寒》手游牵手可灵AI,图片秒变动图,游戏记录新玩法来袭!
《逆水寒》手游牵手可灵AI,图片秒变动图,游戏记录新玩法来袭!
热门内容
  • 夸克AI新升级:深度搜索赋能,信息获取更高效智能
  • 荣耀“鲲鹏”照片事件真相大白,造谣者道歉遭刑拘
  • 夸克AI新升级“深度搜索”,解锁高效获取信息新技能
  • 腾讯阿里AI to C战场“双吴”争霸,谁将问鼎AI搜索之巅?
  • 英伟达全球总部或将落户中国台湾,黄仁勋下周宣布这一重大决定?
  • 教育部新规:学生禁直接复制AI作业,强化独立思考与批判性思维
  • 联发科天玑9400e发布:天玑9300+升级版,蓝牙升级至6.0
  • TIOBE 5月编程语言榜:Python强势领跑,占比创历史新高
  • 中国GPU市场竞争激烈,英伟达独占7成,华为昇腾紧追其后!
  • 华为nova 14系列震撼登场!鸿蒙5直板机领衔,nova 14仅售2699元起
  • 华为Mate 40系列(5G)已支持5G-A网络,性能再升级!
  • 苹果高管预警:AI发展迅猛,iPhone未来十年或被淘汰?
  • 教育部新规:中小学分阶段用AI,严禁复制答案强化独立思考
  • 华为nova14 Ultra震撼登场!鸿蒙5系统加持,售价4199元起
  • vivo领跑!2025第18周中国手机份额华为小米紧追其后
本栏最新
2025年7月,天翼云息壤杯高校AI大赛,谁将问鼎AI巅峰?
2025年7月,天翼云息壤杯高校AI大赛,谁将问鼎AI巅峰?
Meta豪掷数十亿助力伊利诺伊核电站,延续至2047年运营
Meta豪掷数十亿助力伊利诺伊核电站,延续至2047年运营
TAE获1.5亿融资,谷歌等巨头助力,核聚变发电技术迎新突破?
TAE获1.5亿融资,谷歌等巨头助力,核聚变发电技术迎新突破?
谷歌CEO皮查伊:AI加大投入,工程师团队将持续扩招至2026年
谷歌CEO皮查伊:AI加大投入,工程师团队将持续扩招至2026年
AI押题高考,是备考神器还是心理安慰?
AI押题高考,是备考神器还是心理安慰?
中国移动基金携手中科类脑,共探类脑智能技术新蓝海
中国移动基金携手中科类脑,共探类脑智能技术新蓝海

本文链接:http://www.28at.com/showinfo-45-13486-0.html英伟达新突破:ProRL方法助力打造顶级1.5B参数推理AI模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 6月5日A股收盘:沪指微涨,成交额破万亿,数字哨兵领涨市场!

下一篇: 2025年7月,天翼云息壤杯高校AI大赛,谁将问鼎AI巅峰?

标签:
  • 热门焦点
  • 人间诚实周鸿祎:360 All in 大模型的六个解读

    主笔 / 村口有牛文章架构师 / 毛自聪出品 / 巨头财经5月至今,人间躁动,各路大模型你方唱罢我登场,VC圈互联网圈媒体圈已近癫狂。谁也没想到,今日,360再度刷屏,老牌互联网巨头展现
  • 虚拟人再升级,企业可以解放双手了?

    来源:伯虎财经今天想跟大家来唠唠AI,其实聊到这个话题很多人都不陌生了。在ChatGPT和AIGC大热背后,还有一位低调的“大佬”——虚拟人。比如咱们熟知的虚
  • 避坑指南:远离具有这些特性的NFT

    关于NFT,在我们的文章中一直以来都是常驻嘉宾,不止因为NFT背后隐藏的潜力,更因为在这个NFT世界里冥冥之中仿佛有一双幕后的手,OpenSea、库里、ERC115、视觉中国、
  • 星展银行(DBS)计划推出零售数字资产交易服务

    2月14日消息,新加坡星展银行CEO Piyush Gupta在财报会议上表示,计划于2022年年底前推出零售数字资产交易服务。据悉,DBS于2021年初开设了机构数字资产交易平台,全
  • 字节觅《原神》,腾讯元宇宙,游戏新王战旧神?

    文 | 陈桥辉陈奕迅的《红玫瑰》中有一句歌词,“得不到的永远在骚动”,这句话用到如今国内头部游戏平台再合适不过。随着《原神》的异军突起,使得头部游戏大厂感受
  • 国内涌现70余家数字藏品平台:合规、流量与利润在博弈

    作者:杨郑君2月16日,迅雷链企业数字藏品服务平台正式上线,继阿里、腾讯、京东、百度、网易等之后,又一家互联网企业正式加入到火热的数字藏品平台的竞争中。除互联
  • NFT:新骗局的狩猎场

    骗局的自动化需要更好的防御,从数字身份开始。前几天我在OpenSea上购买了一个NFT,是才华横溢的艺术家海伦·福尔摩斯 (Helen Holmes) 的漫画,来自她的 "原作 "收
  • 利用元宇宙平台10天收入160万,风口还是虎口?

    美国Meta平台有限公司,也就是原来的脸书公司,9日宣布,公司旗下的虚拟现实应用《地平线世界》正式向美国和加拿大的18岁以上人群开放。这也是目前Meta推出的最具象
  • 从概念到落地 Web3.0初具雏形

    加密资产热潮催生出的链上应用中,除了DeFi、NFT、链游GameFi等场景外,还有一个热词叫「Web3.0」。Web3.0的概念最早出现在2014年,由以太坊联合创始人及波卡创建者

最新推荐

猜你喜欢

热门推荐

相关资讯

Top