当前位置:首页 > 科技  > 芯片

DeepSeek联合清华大学推出AI模型训练新技术,将开源发布

来源:icspec 责编: 时间:2025-04-09 07:29:59 226观看
导读据南华早报和彭博(Bloomberg)报道,深度求索(DeepSeek)与清华大学研究人员合作,开发出一种新的强化学习技术。该技术能够降低AI模型的训练成本,同时提升其性能。研究人员发布了一篇论文,详细探讨了如何通过延长推理时间来改善
据南华早报和彭博(Bloomberg)报道,深度求索(DeepSeek)与清华大学研究人员合作,开发出一种新的强化学习技术。该技术能够降低AI模型的训练成本,同时提升其性能。
研究人员发布了一篇论文,详细探讨了如何通过延长推理时间来改善大型语言模型(LLM)的回答准确度。在减少运算资源消耗的同时,这一技术能够提供更加贴近人类需求的答案。目前,大多数主流AI模型采用强化学习方法,通过模型与环境的交互以及奖励机制来完成学习。
在此次研究中,DeepSeek和清华大学设计出一种名为DeepSeek-GRM(生成式奖励模型;Generative Reward Modeling)的技术。该技术基于点状生成式奖励模型(pointwise generative reward modeling),能够以统一的方式评估模型的回应。此外,研究人员还提出了一种名为SPCT(Self-Principled Critique Tuning)的训练方法,使DeepSeek-GRM能够针对特定查询和回应自动提出相应原则,并依据这些原则进行评估。
研究结果显示,DeepSeek-GRM在多项基准测试中表现出色,相较于传统奖励模型,其偏差更小。DeepSeek表示,DeepSeek-GRM模型将进行开源发布。
值得一提的是,DeepSeek此前推出的基础模型V3和推理模型R1曾引发科技界的广泛关注。据路透(Reuters)援引知情人士的消息,下一代推理模型R2可能会比原定的5月更早发布,其程序设计能力将大幅提升。

本文链接:http://www.28at.com/showinfo-27-142479-0.htmlDeepSeek联合清华大学推出AI模型训练新技术,将开源发布

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Cassava计划在非洲部署1.2万颗GPU,携手NVIDIA共建AI工厂

下一篇: 汉翔首季接单超85亿,积极开拓民用航空市场

标签:
  • 热门焦点
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • 小米官宣:2023年上半年出货量中国第一!

    今日早间,小米电视官方微博带来消息,称2023年小米电视上半年出货量达到了中国第一,同时还表示小米电视的巨屏风暴即将开始。“公布一个好消息2023年#小米电视上半年出货量中国
  • Automa-通过连接块来自动化你的浏览器

    1、前言通过浏览器插件可实现自动化脚本的录制与编写,具有代表性的工具就是:Selenium IDE、Katalon Recorder,对于简单的业务来说可快速实现自动化的上手工作。Selenium IDEKat
  • 拼多多APP上线本地生活入口,群雄逐鹿万亿市场

    Tech星球(微信ID:tech618)文 | 陈桥辉 Tech星球独家获悉,拼多多在其APP内上线了“本地生活”入口,位置较深,位于首页的“充值中心”内,目前主要售卖美食相关的
  • 微博大门常打开,迎接海外画师漂洋东渡

    作者:互联网那些事“起猛了,我能看得懂日语了”。“为什么日本人说话我能听懂?”“中文不像中文,日语不像日语,但是我竟然看懂了”…&hell
  • 三星显示已开始为AR设备研发硅基LED微显示屏

    7月18日消息,据外媒报道,随着苹果首款头显产品Vision Pro在6月份正式推出,AR/VR/MR等头显产品也就将成为各大公司下一个重要的竞争领域,对显示屏这一关
  • SN570 NVMe SSD固态硬盘 价格与性能兼具

    SN570 NVMe SSD固态硬盘是西部数据发布的最新一代WD Blue系列的固态硬盘,不仅闪存技术更为精进,性能也得到了进一步的跃升。WD Blue SN570 NVMe SSD的包装外
  • 电博会与软博会实现"线下+云端"的双线融合

    在本次“电博会”与“软博会”双展会利好条件的加持下,既可以发挥展会拉动人流、信息流、资金流实现快速交互流动的作用,继而推动区域经济良性发展;又可以聚
  • 北京:科技教育体验基地开始登记

      北京“科技馆之城”科技教育体验基地登记和认证工作日前启动。首批北京科技教育体验基地拟于2023年全国科普日期间挂牌,后续还将开展常态化登记。  北京科技教育体验基
Top