当前位置:首页 > 科技  > 芯片

DeepSeek联合清华大学推出AI模型训练新技术,将开源发布

来源:icspec 责编: 时间:2025-04-09 07:29:59 203观看
导读据南华早报和彭博(Bloomberg)报道,深度求索(DeepSeek)与清华大学研究人员合作,开发出一种新的强化学习技术。该技术能够降低AI模型的训练成本,同时提升其性能。研究人员发布了一篇论文,详细探讨了如何通过延长推理时间来改善
据南华早报和彭博(Bloomberg)报道,深度求索(DeepSeek)与清华大学研究人员合作,开发出一种新的强化学习技术。该技术能够降低AI模型的训练成本,同时提升其性能。
研究人员发布了一篇论文,详细探讨了如何通过延长推理时间来改善大型语言模型(LLM)的回答准确度。在减少运算资源消耗的同时,这一技术能够提供更加贴近人类需求的答案。目前,大多数主流AI模型采用强化学习方法,通过模型与环境的交互以及奖励机制来完成学习。
在此次研究中,DeepSeek和清华大学设计出一种名为DeepSeek-GRM(生成式奖励模型;Generative Reward Modeling)的技术。该技术基于点状生成式奖励模型(pointwise generative reward modeling),能够以统一的方式评估模型的回应。此外,研究人员还提出了一种名为SPCT(Self-Principled Critique Tuning)的训练方法,使DeepSeek-GRM能够针对特定查询和回应自动提出相应原则,并依据这些原则进行评估。
研究结果显示,DeepSeek-GRM在多项基准测试中表现出色,相较于传统奖励模型,其偏差更小。DeepSeek表示,DeepSeek-GRM模型将进行开源发布。
值得一提的是,DeepSeek此前推出的基础模型V3和推理模型R1曾引发科技界的广泛关注。据路透(Reuters)援引知情人士的消息,下一代推理模型R2可能会比原定的5月更早发布,其程序设计能力将大幅提升。

本文链接:http://www.28at.com/showinfo-27-142479-0.htmlDeepSeek联合清华大学推出AI模型训练新技术,将开源发布

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Cassava计划在非洲部署1.2万颗GPU,携手NVIDIA共建AI工厂

下一篇: 汉翔首季接单超85亿,积极开拓民用航空市场

标签:
  • 热门焦点
  • 直屏旗舰来了 iQOO 12和K70 Pro同台竞技

    旗舰机基本上使用的都是双曲面屏幕,这就让很多喜欢直屏的爱好者在苦等一款直屏旗舰,这次,你们等到了。据博主数码闲聊站带来的最新爆料称,Redmi下代旗舰K70 Pro和iQOO 12两款手
  • 5月iOS设备好评榜:iPhone 14仅排第43?

    来到新的一月,安兔兔的各个榜单又重新汇总了数据,像安卓阵营的榜单都有着比较大的变动,不过iOS由于设备的更新换代并没有那么快,所以相对来说变化并不大,特别是iOS好评榜,老款设
  • 六大权益!华为8月服务日开启:手机免费贴膜、维修免人工费

    8月5日消息,一年一度的华为开发者大会2023(Together)日前在松山湖拉开帷幕,与此同时,华为8月服务日也式开启,到店可享六大专属权益。华为用户可在华为商城Ap
  • 2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • 服务存储设计模式:Cache-Aside模式

    Cache-Aside模式一种常用的缓存方式,通常是把数据从主存储加载到KV缓存中,加速后续的访问。在存在重复度的场景,Cache-Aside可以提升服务性能,降低底层存储的压力,缺点是缓存和底
  • 企业采用CRM系统的11个好处

    客户关系管理(CRM)软件可以为企业提供很多的好处,从客户保留到提高生产力。  CRM软件用于企业收集客户互动,以改善客户体验和满意度。  CRM软件市场规模如今超过580
  • 这款新兴工具平台,让你的电脑效率翻倍

    随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
  • 共享单车的故事讲到哪了?

    来源丨海克财经与共享充电宝相差不多,共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称,成都、天津、郑州等地多个共享单
  • 华为和江淮汽车合作开发百万元问界MPV?双方回应来了

    8月1日消息,郭明錤今天在社交平台发文称,华为正在和江淮汽车合作,开发售价在100万元的问界MPV,预计在2024年第2季度量产,销量目标为上市首年交付5万辆。
Top