当前位置:首页 > 元宇宙 > AI

OpenAI 遭实锤:研究称其 AI 模型“记住”了受版权保护的内容

来源: 责编: 时间:2025-04-08 10:04:37 178观看
导读 4 月 6 日消息,一项新研究似乎为 OpenAI 至少使用部分受版权保护内容来训练其人工智能模型的指控提供了依据。注意到,OpenAI 正面临由作家、程序员以及其他版权持有者提起的诉讼,这些原告指责该公司在未经许可的

4 月 6 日消息,一项新研究似乎为 OpenAI 至少使用部分受版权保护内容来训练其人工智能模型的指控提供了依据。h6728资讯网——每日最新资讯28at.com

h6728资讯网——每日最新资讯28at.com

注意到,OpenAI 正面临由作家、程序员以及其他版权持有者提起的诉讼,这些原告指责该公司在未经许可的情况下,使用他们的作品 —— 包括书籍、代码库等,来开发其模型。尽管 OpenAI 一直声称其享有合理使用的抗辩理由,但原告方则认为美国版权法中并无针对训练数据的豁免条款。h6728资讯网——每日最新资讯28at.com

该研究由华盛顿大学、哥本哈根大学和斯坦福大学的研究人员共同撰写,提出了一种新方法,用于识别像 OpenAI 这样通过应用程序接口(API)提供服务的模型所“记忆”的训练数据。h6728资讯网——每日最新资讯28at.com

AI 模型本质上是预测引擎,通过大量数据训练,它们能够学习各种模式,从而生成文章、照片等。虽然大多数输出并非训练数据的逐字复制,但由于模型的“学习”方式,部分内容不可避免地会被模型记忆下来。此前已有研究发现,图像模型会重复生成其训练数据中电影的截图,而语言模型则被观察到存在剽窃新闻文章的行为。h6728资讯网——每日最新资讯28at.com

该研究的核心方法依赖于研究人员提出的“高意外性”词汇,即在大量作品中显得不常见的词汇。例如,在句子“Jack and I sat perfectly still with the radar humming”中,“radar”(雷达)一词被认为是高意外性的,因为从统计学角度来看,它出现在“humming”(嗡嗡作响)之前的可能性比“engine”(引擎)或“radio”(收音机)等词要低。h6728资讯网——每日最新资讯28at.com

共同作者对包括 GPT-4 和 GPT-3.5 在内的几种 OpenAI 模型进行了测试,通过从虚构小说片段和《纽约时报》文章中移除高意外性词汇,然后让模型尝试“猜测”被屏蔽的词汇,来寻找记忆迹象。研究人员认为,如果模型能够成功猜出这些词语,则很可能表明该模型在训练过程中记忆了这些片段。h6728资讯网——每日最新资讯28at.com

根据测试结果,GPT-4 显示出记住了流行小说书籍的部分内容,包括一个包含受版权保护电子书样本的数据集 BookMIA 中的书籍。结果还表明,该模型记住了《纽约时报》文章的部分内容,尽管比例相对较低。h6728资讯网——每日最新资讯28at.com

华盛顿大学的博士生、该研究的共同作者阿比拉沙・拉维奇汉德(Abhilasha Ravichander)对 TechCrunch 表示,这些发现揭示了模型可能接受训练的“有争议的数据”。h6728资讯网——每日最新资讯28at.com

长期以来,OpenAI 一直倡导放宽对使用受版权保护数据开发模型的限制。尽管该公司已经达成了一些内容许可协议,并提供了允许版权所有者标记不希望其用于训练的内容的退出机制,但该公司一直在游说多个政府将围绕人工智能训练方法的“合理使用”规则编入法典。h6728资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12015-0.htmlOpenAI 遭实锤:研究称其 AI 模型“记住”了受版权保护的内容

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 清明假期广西高速公路启用 AI 治理拥堵:可提前 30 分钟预测堵点

下一篇: Meta 发布 Llama 4 系列 AI 模型,引入“混合专家架构”提升效率

标签:
  • 热门焦点
  • 一份全面清单:Web3行业高薪酬的13种工作

    来源:区块链骑士这可能会让许多人感到震惊,但除了成为开发人员之外,Web3还有其他高薪工作。Web3可能是现代就业市场中跨学科最多的领域,换句话说,它由许多个在不同领域中具有不同
  • 三院士三教授热聊元宇宙&——AIGC,学术界怎么看?

    来源:清元宇宙在近日举办的中国江宁2023元宇宙产业·人才高峰论坛暨AIGC发展大会上,中国工程院院士谭建荣、刘韵洁、郑纬民出席并发表了主旨演讲。除了三
  • 抢先推出“元宇宙”饮料,可口可乐赢麻了

    试图傍上元宇宙的品牌千千万,但像可口可乐玩得这么花的,属实不多。01 可口可乐盯上元宇宙1886年,可口可乐诞生于美国乔治亚州亚特兰大市,至今已拥有136年的悠久历
  • 【量子位】虚拟数字人深度产业报告 | 元宇宙Meta洞见

    虚拟数字人行业未来的主要驱动力包括:用户代际变化,新一代消费者对内容消费和虚拟世界更为渴求;虚拟数字人相关技术门槛相对降低,成本有所回落;资本热度上升,受Metav
  • 智能人机交互技术的春晚大考

    1月初的一个早晨,京东智能客户服务产品部紧急开会,进行关于尚未对外公布的“X项目”的初讨论。1月5日,这个神秘的X项目对外公布,京东成为央视2022年春晚独家互动合
  • 对讽刺无动于衷,Nori将碳市场放在区块链上

    当我们聊气候问题的解决方案时,以太坊区块链应该不是最首想到的,但这正是Nori所选择的方案,它建立了一个引擎,鼓励农民使用负碳耕作方法,将空气中的碳抽出并放回地
  • 虚拟人的3大纪律和6种品牌孵化模式

    作者:陈格雷(老小格)及团队虚拟人很热,我们最近广泛收集和研究了、各种消费品牌企业在虚拟人开发上的一些主要特点,整理出6种最主要的品牌虚拟人模式,后面一一介绍。
  • 虚拟偶像行业的商用价值逐渐凸显,IP生态圈也逐渐成型

    六月的第一个周六,一场虚拟偶像七海Nana7mi的个人3D演唱会在万代南梦宫上海文化中心举行,相较于洛天依、百大UP主泠鸢yousa等,这位虚拟Up主在B站上的粉丝数43.6万
  • 全球十大元宇宙概念游戏

    A股市场中,不少游戏公司早早搭上了元宇宙概念。举例,中青宝宣称将发布一款元宇宙概念的模拟经营类游戏,尽管游戏尚在研发中,这一消息已经让中青宝的股价在51个交易
Top