当前位置:首页 > 元宇宙 > AI

谷歌研究:合成数据使大模型数学推理能力提升八倍

来源: 责编: 时间:2025-04-09 07:26:12 169观看
导读 4 月 7 日消息,最近,来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。据专注于人工智能发展的研究机构 Epoch AI 报告显示,目前全球约有 300 万亿个公

4 月 7 日消息,最近,来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。C0K28资讯网——每日最新资讯28at.com

C0K28资讯网——每日最新资讯28at.com

据专注于人工智能发展的研究机构 Epoch AI 报告显示,目前全球约有 300 万亿个公开可用的高质量文本训练标记。然而,随着类似 ChatGPT 这样的大模型的迅猛发展,对训练数据的需求呈指数级增长,预计到 2026 年之前,这些数据将被耗尽。因此,合成数据成为了至关重要的替代方案。C0K28资讯网——每日最新资讯28at.com

据了解,研究人员主要探索了两种合成数据类型:正向数据和负向数据。正向数据是指由高性能大模型(如 GPT-4 和 Gemini 1.5 Pro)生成的正确问题解决方案,为模型提供解决数学问题的示例。但仅依靠正向数据进行训练存在局限性。一方面,这种方法可能无法完全揭示问题解决过程背后的逻辑,模型可能会通过模式匹配来学习,而缺乏真正的理解;另一方面,随着训练数据量的增加,模型可能会学到虚假的相关性,导致在处理新问题时泛化能力下降。C0K28资讯网——每日最新资讯28at.com

C0K28资讯网——每日最新资讯28at.com

鉴于此,研究人员引入了负向数据,即经过验证为错误的问题解决步骤。这有助于模型识别并避免错误,从而增强其逻辑推理能力。尽管使用负向数据存在挑战,因为错误的步骤可能包含误导性信息,但研究人员通过直接偏好优化(DPO)方法成功地使模型能够从错误中学习,强调了每个问题解决步骤的重要性。C0K28资讯网——每日最新资讯28at.com

DPO 方法为每个问题解决步骤分配一个优势值,反映其相对于理想解决方案的价值。研究表明,高优势步骤是正确解决方案的关键,而低优势步骤可能表明模型推理中存在问题。利用这些优势值,模型可以在强化学习框架内动态调整其策略,从而更高效地从合成数据中学习和改进。C0K28资讯网——每日最新资讯28at.com

为了验证合成数据的有效性,研究团队使用 DeepSeek-Math-7B 和 LLaMa2-7B 等模型,在 GSM8K 和 MATH 数据集上进行了全面测试。结果显示,经过正向和负向合成数据预训练的大模型在数学推理任务上的性能实现了八倍的提升。这一研究充分展示了合成数据在增强大模型逻辑推理能力方面的巨大潜力。C0K28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12052-0.html谷歌研究:合成数据使大模型数学推理能力提升八倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 非法获取学生信息并用 AI 技术发送骚扰短信,在校大学生被抓

下一篇: 中国自主量子计算机“本源悟空”全球首次运行十亿级 AI 微调大模型

标签:
  • 热门焦点
  • B端难做:留给魔珐科技的时间不多了

    来源:零态LT元宇宙泡沫正在碎裂,进入2023年后这一赛道热度一直在递减。今年2月,微软解散了成立仅四个月的工业元宇宙部门;今年3月,该公司2017年收购的虚拟现实社交平台AltspaceVR
  • 聚焦虚拟数字人技术,这三大商机要抓住!

    关于虚拟数字人,企业可以从三个方面入局,分别是ToG(To Government,面向政府),即为数字政府和数字城市提供支持服务;ToB(To Business,面向企业),即为企业提供虚拟员工解决方案;ToC(To Cons
  • 刷完一场元宇宙世界杯音乐盛典,我爽了

    作者|刘小土编辑|李春晖你有多久没完整追过一场音乐盛典了?三刷都不嫌多的那种。按照惯例,每逢年底,直播、长短视频、音乐平台便会抢着端上来几场音乐盛典。搁以
  • 【量子位】虚拟数字人深度产业报告 | 元宇宙Meta洞见

    虚拟数字人行业未来的主要驱动力包括:用户代际变化,新一代消费者对内容消费和虚拟世界更为渴求;虚拟数字人相关技术门槛相对降低,成本有所回落;资本热度上升,受Metav
  • 字节觅《原神》,腾讯元宇宙,游戏新王战旧神?

    文 | 陈桥辉陈奕迅的《红玫瑰》中有一句歌词,“得不到的永远在骚动”,这句话用到如今国内头部游戏平台再合适不过。随着《原神》的异军突起,使得头部游戏大厂感受
  • 2022年元宇宙系列报告:UGC当道,XR带来新交互体验

    UGC作为元宇宙的主要内容创作模式,已经越来越多的呈现于游戏、娱乐、社交、传媒等方面,UGC模式勾勒了元宇宙的边界,现今元宇宙UGC模式的主要呈现方式以元宇宙概念
  • NFT 技术将传世之作带入博物馆

    意大利四大博物馆已与一个项目合作,该项目将展示和销售达芬奇、卡拉瓦乔、拉斐尔和莫迪利亚尼等人的杰作的 NFT复制品。该计划采用了 科技公司Cincello的国际专
  • 元宇宙风归何处?

    元宇宙持续大火,在过去一段时间内,其屡次登上热点,吸引了一波又一波投资者。近期,在“2022中国·金鱼嘴元宇宙生态赋能大会”上,南京建邺区金鱼嘴基金街区宣布计划
  • 花旗集团前高管加入Provenance区块链,担任CEO

    No.1 花旗集团前高管加入Provenance区块链,担任CEO3月1日消息,Provenance区块链基金会已任命花旗集团前高管摩根·麦肯尼(Morgan McKenney)为新任首席执行官。麦肯
Top