当前位置:首页 > 科技  > 网络

Nature封面:AI训AI 越训越傻

来源: 责编: 时间:2024-07-28 07:49:44 187观看
导读 AI训练AI,可能会让AI变傻?!来自牛津、剑桥等学校机构的研究人员新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为新的Nature封面。直接一个:GARBAGE OUT!要知道,现在绝大部分科技公司的大模型都在用合

AI训练AI,可能会让AI变傻?!ool28资讯网——每日最新资讯28at.com

来自牛津、剑桥等学校机构的研究人员新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为新的Nature封面ool28资讯网——每日最新资讯28at.com

直接一个:GARBAGE OUT!ool28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻ool28资讯网——每日最新资讯28at.com

要知道,现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个行业浇了一波冷水。ool28资讯网——每日最新资讯28at.com

研究团队给了这样一个例子。ool28资讯网——每日最新资讯28at.com

他们测试了Meta的OPT-125m模型,询问了关于中世纪建筑的相关信息。ool28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻ool28资讯网——每日最新资讯28at.com

每一次微调都是由上一次生成的数据来训练。结果前面几轮回答还好。结果就在第九次,就开始胡说八道……ool28资讯网——每日最新资讯28at.com

扯到兔子是什么鬼?!ool28资讯网——每日最新资讯28at.com

该论文主要作者表示,他们曾考虑过合成数据可能对大模型造成误差,但未曾预料到模型的恶化速度会如此迅速。ool28资讯网——每日最新资讯28at.com

三个误差导致模型崩溃ool28资讯网——每日最新资讯28at.com

首先,团队定义了什么是模型崩溃。ool28资讯网——每日最新资讯28at.com

模型崩溃是一个退化过程,模型生成的内容会污染下一代的训练数据集。而在被污染的数据上训练之后,新一代模型就容易误解现实。ool28资讯网——每日最新资讯28at.com

以此循环往复,一代更比一代差。ool28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻ool28资讯网——每日最新资讯28at.com

按照时间推移,主要分为两种情况:早期模型崩溃和晚期模型崩溃。ool28资讯网——每日最新资讯28at.com

早期模型崩溃中,模型开始丢失一些尾部信息。(类似概率分布中一些低概率事件) 而在晚期模型崩溃,模型将收敛到同原始分布几乎没有任何相似之处。ool28资讯网——每日最新资讯28at.com

这一过程的发生,同模型设计、学习过程和所用数据质量有关。ool28资讯网——每日最新资讯28at.com

具体到理论中,主要包括了这三个误差导致大模型同原始模型的偏离。ool28资讯网——每日最新资讯28at.com

统计近似误差。这是主要类型的误差,由于样本数量有限而产生,并随着样本数量趋于无穷大而消失。这是因为在重新采样的每一步中信息都有可能丢失,这种概率不为零。函数表达性误差。这种误差是由于函数近似表达能力有限而产生的。特别是,神经网络只有在其规模达到无穷大时才是通用近似值。不过,在没有其他两种误差的情况下,这种误差只会发生在第一代。函数近似误差。主要由学习过程局限性引起,例如随机梯度下降的结构偏差或目标的选择。这种误差可以看作是在无限数据和每一代都具有完美表达能力的情况下产生的误差。ool28资讯网——每日最新资讯28at.com

对语言模型的影响ool28资讯网——每日最新资讯28at.com

随后研究人员评估了模型崩溃对语言模型的影响。由于从头开始训练大模型成本非常高,他们选择评估语言模型常见的设置:微调设置ool28资讯网——每日最新资讯28at.com

每个训练周期都从具有新数据的预训练模型开始。训练数据来自另一个经过微调的预训练模型。ool28资讯网——每日最新资讯28at.com

他们用Meta因果语言模型OPT-125m,在wikitext2上进行了微调。ool28资讯网——每日最新资讯28at.com

为了从训练好的模型中生成数据,团队使用了five-way波束搜索。他们将训练序列设为 64 个token长度;然后对于训练集中的每个token序列,要求模型预测下一个64个token。ool28资讯网——每日最新资讯28at.com

他们会浏览所有原始训练数据集,并生成一个相同大小的人工数据集。如果模型的误差为0,它就会生成原始的wikitext2数据集。ool28资讯网——每日最新资讯28at.com

为了进一步感受区别,他们采用两种不同的设置:一组是除了开始训练,后续过程没有任何原始训练数据;另一组则是保留10%的原始数据。ool28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻ool28资讯网——每日最新资讯28at.com

结果显示,随着时间推移,模型产生的错误会增加。在模型完全崩溃之前,它还会导致模型遗忘数据集中低概率事件,他们的输出也变得更加同质化。终也就出现了开头这一现象。ool28资讯网——每日最新资讯28at.com

另外在VAE、GMM模型中看到了类似模型崩溃的现象。ool28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻ool28资讯网——每日最新资讯28at.com

Nature封面:AI训AI 越训越傻ool28资讯网——每日最新资讯28at.com

来自杜克大学的Emily Wenger教授表示,到目前为止,要缓解这一问题并非易事。ool28资讯网——每日最新资讯28at.com

有领先的科技公司已经部署了一项技术,即嵌入“水印”——ool28资讯网——每日最新资讯28at.com

标记AI生成的内容,让其在训练数据中排除。但困难在于,这需要科技公司之间的协调,因此不太具有商业可行性。ool28资讯网——每日最新资讯28at.com

这样一来,那从之前互联网获取数据的公司,他们训练的模型更能代表现实世界。所以,开始那一波大模型算是有了先发优势。ool28资讯网——每日最新资讯28at.com

对于这一观点,你怎么看呢?ool28资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-104051-0.htmlNature封面:AI训AI 越训越傻

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 雷军身披雨衣现身巴黎奥运开幕式:一个难忘的夜晚

下一篇: 跳水首金观众席上的中国人沸腾了:祝贺陈艺文/昌雅妮

标签:
  • 热门焦点
  • 石头自清洁扫拖机器人G10S评测:多年黑科技集大成之作 懒人终极福音

    科技圈经常能看到一个词叫“缝合怪”,用来形容那些把好多功能或者外观结合在一起的产品,通常这样的词是贬义词,但如果真的是产品缝合的好、缝合的实用的话,那它就成了中性词,今
  • 容量越大越不坏?24万块硬盘故障率报告公布 这些产品零故障

    8月5日消息,云存储服务商Backblaze发布了最新的硬盘故障率报告,年故障率有所上升。Backblaze发布的硬盘季度统计数据,其中包括故障率等重要方面。这些结
  • 线程通讯的三种方法!通俗易懂

    线程通信是指多个线程之间通过某种机制进行协调和交互,例如,线程等待和通知机制就是线程通讯的主要手段之一。 在 Java 中,线程等待和通知的实现手段有以下几种方式:Object 类下
  • 学习JavaScript的10个理由...

    作者 | Simplilearn编译 | 王瑞平当你决心学习一门语言的时候,很难选择到底应该学习哪一门,常用的语言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
  • 之家push系统迭代之路

    前言在这个信息爆炸的互联网时代,能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大,传统的靠"主动拉"获取信息的方式已不能满足用
  • 最“俊美”淘宝卖家,靠直播和短视频圈粉,上架秒光,年销3000万

    来源 | 电商在线文|易琬玉编辑|斯问受访店铺:Ringdoll戒之人形图源:微博@御座的黄山、“Ringdoll戒之人形”淘宝店铺有关外貌的评价,黄山已经听累了。生于1985年的他,哪
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • 年轻人的“职场羞耻感”,无处不在

    作者:冯晓亭 陶 淘 李 欣 张 琳 马舒叶来源:燃次元“人在职场,应该选择什么样的着装?”近日,在网络上,一个与着装相关的帖子引发关注,在该帖子里,一位在高级写字楼亚洲金
  • 超级标准版旗舰!iQOO 11S全球首发iQOO超算独显芯片

    上半年已接近尾声,截至目前各大品牌旗下的顶级旗舰都已悉数亮相,而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系
Top