当前位置:首页 > 科技  > 网络

Nature封面:AI训AI 越训越傻

来源: 责编: 时间:2024-07-28 07:49:44 61观看
导读 AI训练AI,可能会让AI变傻?!来自牛津、剑桥等学校机构的研究人员新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为新的Nature封面。直接一个:GARBAGE OUT!要知道,现在绝大部分科技公司的大模型都在用合

AI训练AI,可能会让AI变傻?!sN828资讯网——每日最新资讯28at.com

来自牛津、剑桥等学校机构的研究人员新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为新的Nature封面sN828资讯网——每日最新资讯28at.com

直接一个:GARBAGE OUT!sN828资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻sN828资讯网——每日最新资讯28at.com

要知道,现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个行业浇了一波冷水。sN828资讯网——每日最新资讯28at.com

研究团队给了这样一个例子。sN828资讯网——每日最新资讯28at.com

他们测试了Meta的OPT-125m模型,询问了关于中世纪建筑的相关信息。sN828资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻sN828资讯网——每日最新资讯28at.com

每一次微调都是由上一次生成的数据来训练。结果前面几轮回答还好。结果就在第九次,就开始胡说八道……sN828资讯网——每日最新资讯28at.com

扯到兔子是什么鬼?!sN828资讯网——每日最新资讯28at.com

该论文主要作者表示,他们曾考虑过合成数据可能对大模型造成误差,但未曾预料到模型的恶化速度会如此迅速。sN828资讯网——每日最新资讯28at.com

三个误差导致模型崩溃sN828资讯网——每日最新资讯28at.com

首先,团队定义了什么是模型崩溃。sN828资讯网——每日最新资讯28at.com

模型崩溃是一个退化过程,模型生成的内容会污染下一代的训练数据集。而在被污染的数据上训练之后,新一代模型就容易误解现实。sN828资讯网——每日最新资讯28at.com

以此循环往复,一代更比一代差。sN828资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻sN828资讯网——每日最新资讯28at.com

按照时间推移,主要分为两种情况:早期模型崩溃和晚期模型崩溃。sN828资讯网——每日最新资讯28at.com

早期模型崩溃中,模型开始丢失一些尾部信息。(类似概率分布中一些低概率事件) 而在晚期模型崩溃,模型将收敛到同原始分布几乎没有任何相似之处。sN828资讯网——每日最新资讯28at.com

这一过程的发生,同模型设计、学习过程和所用数据质量有关。sN828资讯网——每日最新资讯28at.com

具体到理论中,主要包括了这三个误差导致大模型同原始模型的偏离。sN828资讯网——每日最新资讯28at.com

统计近似误差。这是主要类型的误差,由于样本数量有限而产生,并随着样本数量趋于无穷大而消失。这是因为在重新采样的每一步中信息都有可能丢失,这种概率不为零。函数表达性误差。这种误差是由于函数近似表达能力有限而产生的。特别是,神经网络只有在其规模达到无穷大时才是通用近似值。不过,在没有其他两种误差的情况下,这种误差只会发生在第一代。函数近似误差。主要由学习过程局限性引起,例如随机梯度下降的结构偏差或目标的选择。这种误差可以看作是在无限数据和每一代都具有完美表达能力的情况下产生的误差。sN828资讯网——每日最新资讯28at.com

对语言模型的影响sN828资讯网——每日最新资讯28at.com

随后研究人员评估了模型崩溃对语言模型的影响。由于从头开始训练大模型成本非常高,他们选择评估语言模型常见的设置:微调设置sN828资讯网——每日最新资讯28at.com

每个训练周期都从具有新数据的预训练模型开始。训练数据来自另一个经过微调的预训练模型。sN828资讯网——每日最新资讯28at.com

他们用Meta因果语言模型OPT-125m,在wikitext2上进行了微调。sN828资讯网——每日最新资讯28at.com

为了从训练好的模型中生成数据,团队使用了five-way波束搜索。他们将训练序列设为 64 个token长度;然后对于训练集中的每个token序列,要求模型预测下一个64个token。sN828资讯网——每日最新资讯28at.com

他们会浏览所有原始训练数据集,并生成一个相同大小的人工数据集。如果模型的误差为0,它就会生成原始的wikitext2数据集。sN828资讯网——每日最新资讯28at.com

为了进一步感受区别,他们采用两种不同的设置:一组是除了开始训练,后续过程没有任何原始训练数据;另一组则是保留10%的原始数据。sN828资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻sN828资讯网——每日最新资讯28at.com

结果显示,随着时间推移,模型产生的错误会增加。在模型完全崩溃之前,它还会导致模型遗忘数据集中低概率事件,他们的输出也变得更加同质化。终也就出现了开头这一现象。sN828资讯网——每日最新资讯28at.com

另外在VAE、GMM模型中看到了类似模型崩溃的现象。sN828资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻sN828资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻sN828资讯网——每日最新资讯28at.com

来自杜克大学的Emily Wenger教授表示,到目前为止,要缓解这一问题并非易事。sN828资讯网——每日最新资讯28at.com

有领先的科技公司已经部署了一项技术,即嵌入“水印”——sN828资讯网——每日最新资讯28at.com

标记AI生成的内容,让其在训练数据中排除。但困难在于,这需要科技公司之间的协调,因此不太具有商业可行性。sN828资讯网——每日最新资讯28at.com

这样一来,那从之前互联网获取数据的公司,他们训练的模型更能代表现实世界。所以,开始那一波大模型算是有了先发优势。sN828资讯网——每日最新资讯28at.com

对于这一观点,你怎么看呢?sN828资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-104051-0.htmlNature封面:AI训AI 越训越傻

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 雷军身披雨衣现身巴黎奥运开幕式:一个难忘的夜晚

下一篇: 跳水首金观众席上的中国人沸腾了:祝贺陈艺文/昌雅妮

标签:
  • 热门焦点
  • K60至尊版刚预热 一加Ace2 Pro正面硬刚

    K60至尊版刚预热 一加Ace2 Pro正面硬刚

    Redmi这边刚如火如荼的宣传了K60 Ultra的各种技术和硬件配置,作为竞品的一加也坐不住了。一加中国区总裁李杰发布了两条微博,表示在自家的一加Ace2上早就已经采用了和PixelWo
  • 如何正确使用:Has和:Nth-Last-Child

    如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • 使用LLM插件从命令行访问Llama 2

    使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • 中国家电海外掘金正当时|出海专题

    中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • iQOO 11S屏幕细节公布:首发三星2K E6全感屏 安卓最好的直屏手机

    iQOO 11S屏幕细节公布:首发三星2K E6全感屏 安卓最好的直屏手机

    日前iQOO手机官方宣布,新一代电竞旗舰iQOO 11S将会在7月4日19:00正式与大家见面。随着发布时间的日益临近,官方关于该机的预热也更加密集,截至目前已
  • 2299元起!iQOO Pad明晚首销:性能最强天玑平板

    2299元起!iQOO Pad明晚首销:性能最强天玑平板

    5月23日,iQOO如期举行了新品发布会,除了首发安卓最强旗舰处理器的iQOO Neo8系列新机外,还在发布会上推出了旗下首款平板电脑——iQOO Pad,其最大的卖点
  •  首发天玑9200+ iQOO Neo8系列发布首销售价2299元起

    首发天玑9200+ iQOO Neo8系列发布首销售价2299元起

    2023年5月23日晚,iQOO Neo8系列正式发布。其中,Neo系列首款Pro之作——iQOO Neo8 Pro强悍登场,限时售价3099元起;价位段最强性能手机iQOO Neo8同期上市
  • 朋友圈可以修改可见范围了 苹果用户可率先体验

    朋友圈可以修改可见范围了 苹果用户可率先体验

    近日,iOS用户迎来微信8.0.27正式版更新,除了可更换二维码背景外,还新增了多项实用功能。在新版微信中,朋友圈终于可以修改可见范围,简单来说就是已发布的朋友圈
  • 苹果140W USB-C充电器:采用氮化镓技术

    苹果140W USB-C充电器:采用氮化镓技术

    据10 月 30 日 9to5 Mac 消息报道,当苹果推出新的 MacBook Pro 2021 时,该公司还推出了新的 140W USB-C 充电器,附赠在 MacBook Pro 16 英寸机型的盒子里,也支
Top