当前位置：首页 > 科技 > 知识百科

谷歌：性能不佳的微调模型不要扔，求一下平均权重就能提升性能

来源：责编：时间：2023-08-07 16:30:02 407观看

导读本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。如何最大限度地提升模型精度？最近，谷歌等机构发现：性能不好的微调模型先不要扔，求一下平均权重！就能在不增加推理

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

如何最大限度地提升模型精度？

最近，谷歌等机构发现：

性能不好的微调模型先不要扔，求一下平均权重！

就能在不增加推理时间以及内存开销的情况下，提高模型的准确性和鲁棒性。

比如，研究人员就使用该方法创造了ImageNet1K的新纪录：90.94%。

将它扩展到多个图像分类以及自然语言处理任务中，也能提高模型的分布外性能，并改善新下游任务的零样本性能。

而这个方法还有一个有趣的名字，叫Module soup——

是不是让人一下子就让人联想到了斐波那契汤的笑话？（昨天的汤+前天的汤=今天的新汤）

△ 知乎网友@hzwer，已授权

一共三种配方

回想一下在此之前，大家是如何给模型涨点的呢？

是不是先用各种超参数训练出多个微调模型，然后再挑出验证集上表现最好的那一个留下，其余丢掉？

由于神经网络是非线性的，在不同的loss basin中可能有许多解，因此Module soup这一采用保留所有微调模型的权重，对其进行平均的方法就可以提高性能，还是让人有点惊讶的。

不过，最近就已有研究发现，从相同的初始化配置中中独立优化的微调模型，位于相同的误差范围内（lie in the same basin of the error landscape）。

之前也有研究证明，沿单个训练轨迹进行权重平均，可以提高随机初始化训练模型的性能。

作者正是从这些结论中受到启发。

Module soup一共有三种“配方”（实现）：统一汤（uniform soup）、贪婪汤（greedy soup）和学习汤（learned soup）。

其中greedy soup是最主要采用的实现，因为它的性能比直接均匀地平均所有权重更高。

具体来说，Greedy soup通过顺序添加每个模型作为“汤”中的潜在成分构建而成，并且只有在保持验证集上的性能有所提高时才将相应模型保留在“汤”中。

排序按验证集精度的降序排列。

性能超越单个最佳微调模型

作者进行了全面的微调实验来确定Module soup的有效性。

首先是微调CLIP和ALIGN，这两个模型在图像-文本对上进行了对比损失预训练。

结果经过module soup操作后，两者在分布内和自然分布转移（distribution shifts）测试集上的表现都比最佳的单个微调模型性能更佳。

△ 左为CLIP，右为ALIGN

然后是在JFT数据集上预训练的ViT-G模型。

也就是它在ImageNet1K数据集实现了90.94%的精度，打破了此前CoAtNet保持的90.88%，同时在推理阶段还减少了25%的FLOPs。

在图像分类任务以外，作者在NLP领域也对module soup进行了验证。

下表是BERT和T5模型在GLUE benchmark的四个文本分类任务上的结果：

可以发现，虽然改进不如图像分类中的效果明显，但在多数任务下，greedy soup都可以相较最好的单个模型提高性能。

当然，作者也指出，module soup在适用性等方面存在局限，比如现在测试的都是在大型异构数据集上预先训练的模型，在这些模型之外，效果并不是非常明显。

最后，知乎网友@宫酱手艺人表示，其实这样的模型参数平均是一个经典trick，transformer原始论文就用了。

你发现了吗？

论文地址：
https://arxiv.org/abs/2203.0548

本文链接：http://www.28at.com/showinfo-119-2219-0.html谷歌：性能不佳的微调模型不要扔，求一下平均权重就能提升性能

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：云安全日报220317：红帽OpenShift云应用平台发现执行任意代码漏洞，需要尽快升级

下一篇：终于不瞎编了！AI学会“谷歌一下”，Q&amp;A正确率达90%

标签：

热门焦点

红魔电竞平板评测：大屏幕硬实力

前言：三年的疫情因为要上网课的原因激活了平板市场，如今网课的时代已经过去，大家的生活都恢复到了正轨，这也就意味着，真正考验平板电脑生存的环境来了。也就是面对着这种残酷的
5月iOS设备性能榜：M1 M2依旧是榜单前五

和上个月一样，没有新品发布的iOS设备性能榜的上榜设备并没有什么更替，仅仅只有跑分变化而产生的排名变动，刚刚开始的苹果WWDC2023，推出的产品也依旧是新款Mac Pro、新款Mac Stu
5月iOS设备好评榜：iPhone 14仅排第43？

来到新的一月，安兔兔的各个榜单又重新汇总了数据，像安卓阵营的榜单都有着比较大的变动，不过iOS由于设备的更新换代并没有那么快，所以相对来说变化并不大，特别是iOS好评榜，老款设
Raft算法：保障分布式系统共识的稳健之道

1. 什么是Raft算法？Raft 是英文”Reliable、Replicated、Redundant、And Fault-Tolerant”（“可靠、可复制、可冗余、可容错”）的首字母缩写。Raft算法是一种用于在分布式系统
摸鱼心法第一章——和配置文件说拜拜

为了能摸鱼我们团队做了容器化，但是带来的问题是服务配置文件很麻烦，然后大家在群里进行了“亲切友好”的沟通图片图片图片图片对比就对比，简单对比下独立配置中心和k8s作为配
让我们一起聊聊文件的操作

文件【1】文件是什么？文件是保存数据的地方，是数据源的一种，比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据，它既可以保
使用Webdriver-manager解决浏览器与驱动不匹配所带来自动化无法执行的问题

1、前言在我们使用 Selenium 进行 UI 自动化测试时，常常会因为浏览器驱动与浏览器版本不匹配，而导致自动化测试无法执行，需要手动去下载对应的驱动版本，并替换原有的驱动，可能还
签约井川里予、何丹彤，单视频点赞近千万，MCN黑马永恒文希快速崛起！

来源：视听观察永恒文希传媒作为一家MCN公司，说起它的名字来，可能大家会觉得有点儿陌生，但是说出来下面一串的名字之后，或许大家就会感到震惊，原来这么多网红，都签约这家公司了。根
华为Mate 60系列用上可变灵动岛：正式版体验将会更出色

这段时间以来，关于华为新旗舰的爆料日渐密集。据此前多方爆料，今年华为将开始恢复一年双旗舰战略，除上半年推出的P60系列外，往年下半年的Mate系列也将

谷歌：性能不佳的微调模型不要扔，求一下平均权重就能提升性能

红魔电竞平板评测：大屏幕硬实力

5月iOS设备性能榜：M1 M2依旧是榜单前五

5月iOS设备好评榜：iPhone 14仅排第43？

Raft算法：保障分布式系统共识的稳健之道

摸鱼心法第一章——和配置文件说拜拜

让我们一起聊聊文件的操作

使用Webdriver-manager解决浏览器与驱动不匹配所带来自动化无法执行的问题

签约井川里予、何丹彤，单视频点赞近千万，MCN黑马永恒文希快速崛起！

华为Mate 60系列用上可变灵动岛：正式版体验将会更出色

最新推荐

猜你喜欢

热门推荐

相关资讯