当前位置:首页 > 元宇宙 > AI

腾讯携手创新“无监督前缀微调”技术:训练 tokens 最多减少 95%,提升 AI 推理效率

来源: 责编: 时间:2025-03-04 15:06:33 222观看
导读 3 月 2 日消息,科技媒体 marktechpost 昨日(3 月 1 日)发布博文,报道称腾讯 AI Lab 携手香港中文大学,提出名为“无监督前缀微调”(UPFT)的创新方法,显著提升了大型语言模型的推理效率。该方法无需处理完整的推理过程

3 月 2 日消息,科技媒体 marktechpost 昨日(3 月 1 日)发布博文,报道称腾讯 AI Lab 携手香港中文大学,提出名为“无监督前缀微调”(UPFT)的创新方法,显著提升了大型语言模型的推理效率。DYl28资讯网——每日最新资讯28at.com

该方法无需处理完整的推理过程,只需关注模型输出的前 8 至 32 个词元(token),即可有效改进模型的推理能力。UPFT 抓住了不同推理路径中共同的关键早期步骤,在降低计算开销的同时,实现了推理性能的提升。DYl28资讯网——每日最新资讯28at.com

大型语言模型在语言理解和生成方面表现出色,但提升其推理能力仍然是一项挑战。传统微调方法依赖大量标注数据或复杂的拒绝采样,资源消耗巨大。UPFT 则另辟蹊径,通过聚焦模型输出的初始 tokens,解决了效率和对昂贵监督的依赖问题。DYl28资讯网——每日最新资讯28at.com

研究发现,针对同一问题,模型生成的各种推理路径的初始步骤往往高度相似,UPFT 正是基于这种“前缀自洽性”,无需完整推理轨迹或大量标注数据,仅使用这些初始标记进行训练。DYl28资讯网——每日最新资讯28at.com

DYl28资讯网——每日最新资讯28at.com

UPFT 采用贝叶斯推理原理,将正确推理的概率分解为“覆盖率”和“准确性”两部分。通过训练早期 tokens,UPFT 在探索多样化推理路径的同时,确保了结果的可靠性。实验表明,UPFT 可将训练中处理的 tokens 数量减少高达 95%,并显著降低时间和内存需求。DYl28资讯网——每日最新资讯28at.com

UPFT 在 GSM8K、MATH500、AIME2024 和 GPQA 等推理基准测试中表现优异。例如,在 Qwen2.5-Math-7B-Instruct 模型上,UPFT 在减少训练和推理 tokens 的同时,提升了平均准确率。在复杂推理任务中,UPFT 的性能提升尤为显著,表明早期推理步骤包含解决问题的关键信息。DYl28资讯网——每日最新资讯28at.com

DYl28资讯网——每日最新资讯28at.com

附上参考地址DYl28资讯网——每日最新资讯28at.com

The First Few Tokens Are All You Need: An Efficient and Effective Unsupervised Prefix Fine-Tuning Method for Reasoning ModelsDYl28资讯网——每日最新资讯28at.com

Tencent AI Lab Introduces Unsupervised Prefix Fine-Tuning (UPFT): An Efficient Method that Trains Models on only the First 8-32 Tokens of Single Self-Generated SolutionsDYl28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11338-0.html腾讯携手创新“无监督前缀微调”技术:训练 tokens 最多减少 95%,提升 AI 推理效率

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 清华大学 2025 年将适度扩招本科生,重点培养“AI+”拔尖创新人才

下一篇: GPT-4.5 性能提升有限、成本却激增 30 倍,OpenAI 面临性价比质疑

标签:
  • 热门焦点
  • 亚马逊AIGC全家桶来袭,巨头AI大乱战都有什么杀手锏

    此前,亚马逊云科技发布多款AIGC产品,其中包括AI大模型服务Amazon Bedrock、人工智能计算实例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”(Titan)AI大模型、软件
  • 元宇宙是投资中国的第五次重大机遇

    作者为凯思博投资董事长导语:投资逻辑要来自于人性在社会发展过程中的普遍规律,由第一性原理出发找出重大的投资机会来。1978年的改革开放到今天,中国总共经历了
  • 关于年度热词NFT,除了钱,我们还可以聊点啥?

    每到年底,社交媒体总少不了年度盘点、年度总结、年度热词。如果让你来总结2021年度热词,你会想到什么?柯林斯词典将年度热词颁给了“NFT”,而其理由是:一个缩写词的
  • 避坑指南:远离具有这些特性的NFT

    关于NFT,在我们的文章中一直以来都是常驻嘉宾,不止因为NFT背后隐藏的潜力,更因为在这个NFT世界里冥冥之中仿佛有一双幕后的手,OpenSea、库里、ERC115、视觉中国、
  • 冰墩墩的NFT暴涨千倍?真相则是价格暴跌、成交遇冷

    《区块链日报》记者查证,近日来冰墩墩数字藏品交易数量出现大幅下滑,而所谓的暴涨千倍更是有价无市的自嗨。昨日,北京冬奥会正式闭幕。在这届冬奥会上,吉祥物“冰
  • Meta正在研发元宇宙语音助手;广东省462家企业申请元宇宙商标

    今日《元宇宙新鲜事》有:扎克伯格透露正在为元宇宙研发语音助手;完美世界声明称不会以“元宇宙投资项目”等名义吸收资金。广东省申请元宇宙商标的企业达462家位
  • Kitten Coup社区反转Cool Kittens NFT骗局

    当狂热的加密爱好者将金钱投入到NFT图片时,浑水摸鱼的骗局随之而来,Cool Kittens NFT便是其中一个作恶者,该项目于去年11月在Sonala链上启动小猫形象的NFT铸造及
  • NFT领域,我们是否应该遵守版权法

    NFTs中最有争议的因素之一是你是否真的 "拥有 "你所购买的艺术品。除此之外,围绕着NFT行业内的版权和知识产权盗窃的问题也同样重要,因为人们很容易误解这些事情
  • MR——元宇宙平台的下一代入口

    作为“元宇宙”的领头羊,Meta的一举一动都受到业内的高度关注。华尔街见闻提及,2月17日周四,Facebook母公司Meta在透露,其混合现实技术(MR)将在几年后实现,让人们对元
Top