当前位置:首页 > 科技  > 测评

Nature封面:AI训AI 越训越傻

来源: 责编: 时间:2024-07-28 07:50:30 293观看
导读 AI训练AI,可能会让AI变傻?!来自牛津、剑桥等学校机构的研究人员最新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为最新的Nature封面。直接一个:GARBAGE OUT!要知道,现在绝大部分科技公司的

AI训练AI,可能会让AI变傻?!b5y28资讯网——每日最新资讯28at.com

来自牛津、剑桥等学校机构的研究人员最新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为最新的Nature封面b5y28资讯网——每日最新资讯28at.com

直接一个:GARBAGE OUT!b5y28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻b5y28资讯网——每日最新资讯28at.com

要知道,现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个行业浇了一波冷水。b5y28资讯网——每日最新资讯28at.com

研究团队给了这样一个例子。b5y28资讯网——每日最新资讯28at.com

他们测试了Meta的OPT-125m模型,询问了关于中世纪建筑的相关信息。b5y28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻b5y28资讯网——每日最新资讯28at.com

每一次微调都是由上一次生成的数据来训练。结果前面几轮回答还好。结果就在第九次,就开始胡说八道……b5y28资讯网——每日最新资讯28at.com

扯到兔子是什么鬼?!b5y28资讯网——每日最新资讯28at.com

该论文主要作者表示,他们曾考虑过合成数据可能对大模型造成误差,但未曾预料到模型的恶化速度会如此迅速。b5y28资讯网——每日最新资讯28at.com

三个误差导致模型崩溃b5y28资讯网——每日最新资讯28at.com

首先,团队定义了什么是模型崩溃。b5y28资讯网——每日最新资讯28at.com

模型崩溃是一个退化过程,模型生成的内容会污染下一代的训练数据集。而在被污染的数据上训练之后,新一代模型就容易误解现实。b5y28资讯网——每日最新资讯28at.com

以此循环往复,一代更比一代差。b5y28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻b5y28资讯网——每日最新资讯28at.com

按照时间推移,主要分为两种情况:早期模型崩溃和晚期模型崩溃。b5y28资讯网——每日最新资讯28at.com

早期模型崩溃中,模型开始丢失一些尾部信息。(类似概率分布中一些低概率事件) 而在晚期模型崩溃,模型将收敛到同原始分布几乎没有任何相似之处。b5y28资讯网——每日最新资讯28at.com

这一过程的发生,同模型设计、学习过程和所用数据质量有关。b5y28资讯网——每日最新资讯28at.com

具体到理论中,主要包括了这三个误差导致大模型同原始模型的偏离。b5y28资讯网——每日最新资讯28at.com

统计近似误差。这是主要类型的误差,由于样本数量有限而产生,并随着样本数量趋于无穷大而消失。这是因为在重新采样的每一步中信息都有可能丢失,这种概率不为零。函数表达性误差。这种误差是由于函数近似表达能力有限而产生的。特别是,神经网络只有在其规模达到无穷大时才是通用近似值。不过,在没有其他两种误差的情况下,这种误差只会发生在第一代。函数近似误差。主要由学习过程局限性引起,例如随机梯度下降的结构偏差或目标的选择。这种误差可以看作是在无限数据和每一代都具有完美表达能力的情况下产生的误差。b5y28资讯网——每日最新资讯28at.com

对语言模型的影响b5y28资讯网——每日最新资讯28at.com

随后研究人员评估了模型崩溃对语言模型的影响。由于从头开始训练大模型成本非常高,他们选择评估语言模型最常见的设置:微调设置b5y28资讯网——每日最新资讯28at.com

每个训练周期都从具有最新数据的预训练模型开始。训练数据来自另一个经过微调的预训练模型。b5y28资讯网——每日最新资讯28at.com

他们用Meta因果语言模型OPT-125m,在wikitext2上进行了微调。b5y28资讯网——每日最新资讯28at.com

为了从训练好的模型中生成数据,团队使用了five-way波束搜索。他们将训练序列设为 64 个token长度;然后对于训练集中的每个token序列,要求模型预测下一个64个token。b5y28资讯网——每日最新资讯28at.com

他们会浏览所有原始训练数据集,并生成一个相同大小的人工数据集。如果模型的误差为0,它就会生成原始的wikitext2数据集。b5y28资讯网——每日最新资讯28at.com

为了进一步感受区别,他们采用两种不同的设置:一组是除了最开始训练,后续过程没有任何原始训练数据;另一组则是保留10%的原始数据。b5y28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻b5y28资讯网——每日最新资讯28at.com

结果显示,随着时间推移,模型产生的错误会增加。在模型完全崩溃之前,它还会导致模型遗忘数据集中低概率事件,他们的输出也变得更加同质化。最终也就出现了开头这一现象。b5y28资讯网——每日最新资讯28at.com

另外在VAE、GMM模型中看到了类似模型崩溃的现象。b5y28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻b5y28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻b5y28资讯网——每日最新资讯28at.com

来自杜克大学的Emily Wenger教授表示,到目前为止,要缓解这一问题并非易事。b5y28资讯网——每日最新资讯28at.com

有领先的科技公司已经部署了一项技术,即嵌入“水印”——b5y28资讯网——每日最新资讯28at.com

标记AI生成的内容,让其在训练数据中排除。但困难在于,这需要科技公司之间的协调,因此不太具有商业可行性。b5y28资讯网——每日最新资讯28at.com

这样一来,那从之前互联网获取数据的公司,他们训练的模型更能代表现实世界。所以,最开始那一波大模型算是有了先发优势。b5y28资讯网——每日最新资讯28at.com

对于这一观点,你怎么看呢?b5y28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-25-104032-0.htmlNature封面:AI训AI 越训越傻

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 暴雪全面回归!《炉石传说》国服消息今日公布

下一篇: 168万元 比亚迪首款超跑来了!仰望U9 8月开始交付

标签:
  • 热门焦点
  • K6:面向开发人员的现代负载测试工具

    K6 是一个开源负载测试工具,可以轻松编写、运行和分析性能测试。它建立在 Go 和 JavaScript 之上,它被设计为功能强大、可扩展且易于使用。k6 可用于测试各种应用程序,包括 Web
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 为什么你不应该使用Div作为可点击元素

    按钮是为任何网络应用程序提供交互性的最常见方式。但我们经常倾向于使用其他HTML元素,如 div span 等作为 clickable 元素。但通过这样做,我们错过了许多内置浏览器的功能。
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人员可能会涉及各种各样的安全任务,包括但不限于:开发某些安全工具的插件,满足自己特定的安全需求;自定义github搜索工具,快速查找所需的安全资料、漏洞poc、exp
  • 品牌洞察丨服务本地,美团直播成效几何?

    来源:17PR7月11日,美团App首页推荐位出现“美团直播”的固定入口。在直播聚合页面,外卖“神枪手”直播间、美团旅行直播间、美团买菜直播间等均已上线,同时
  • 网红炒股不为了赚钱,那就是耍流氓!

    来源:首席商业评论6月26日高调宣布入市,网络名嘴大v胡锡进居然进军了股市。在一次财经媒体峰会上,几个财经圈媒体大佬就“胡锡进炒股是否知道认真报道”展开讨论。有
  • 小米公益基金会捐赠2500万元驰援北京、河北暴雨救灾

    8月2日消息,今日小米科技创始人雷军在其微博上发布消息称,小米公益基金会宣布捐赠2500万元驰援北京、河北暴雨救灾。携手抗灾,京冀安康!以下为公告原文
  • OPPO K11采用全方位护眼屏:三大护眼能力减轻视觉疲劳

    日前OPPO官方宣布,全新的OPPO K11将于7月25日正式发布,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼IMX890主摄,堪称是2000档位影像表
  • 中关村论坛11月25日开幕,15位诺奖级大咖将发表演讲

    11月18日,记者从2022中关村论坛新闻发布会上获悉,中关村论坛将于11月25至30日在京举行。本届中关村论坛由科学技术部、国家发展改革委、工业和信息化部、国务
Top