当前位置:首页 > 元宇宙 > AI

研究:近一半热门新闻网站屏蔽了 OpenAI 爬虫

来源: 责编: 时间:2024-02-29 14:33:18 316观看
导读 2 月 27 日消息,一项由路透社研究所进行的研究表明,截至 2023 年底,全球 10 个国家的热门新闻网站中,近一半 (48%) 屏蔽了 OpenAI 的爬虫(Crawler),而近四分之一 (24%) 屏蔽了谷歌的 AI 爬虫。图源 Pexels据了解,该研

2 月 27 日消息,一项由路透社研究所进行的研究表明,截至 2023 年底,全球 10 个国家的热门新闻网站中,近一半 (48%) 屏蔽了 OpenAI 的爬虫(Crawler),而近四分之一 (24%) 屏蔽了谷歌的 AI 爬虫。FYM28资讯网——每日最新资讯28at.com

FYM28资讯网——每日最新资讯28at.com

图源 Pexels

据了解,该研究所分析了包括纽约时报、BuzzFeed 新闻、华尔街日报、华盛顿邮报、CNN 和 NPR 在内的 15 家覆盖面最广的网络新闻来源的 robots.txt 文件。这些新闻机构来自德国、印度、西班牙、英国和美国等国家,涵盖传统印刷媒体、电视广播公司和数字原生媒体等三种类型。FYM28资讯网——每日最新资讯28at.com

研究发现,截至 2023 年底,超过一半 (57%) 的传统印刷媒体网站,例如《纽约时报》,屏蔽了 OpenAI 的爬虫,相比之下,电视和广播公司为 48%,数字原生媒体为 31%。同样,32% 的印刷媒体网站屏蔽了谷歌的爬虫,而广播公司和数字原生媒体的比例分别为 19% 和 17%。FYM28资讯网——每日最新资讯28at.com

与此同时,康奈尔大学最近的一项研究发现,当新型人工智能模型仅使用先前模型而非人类输入的数据进行训练时,它们往往会陷入“模型崩溃”或退化,导致生成内容出现更多错误和误导信息。FYM28资讯网——每日最新资讯28at.com

网站爬虫被用于多种目的。例如,谷歌的 Googlebot 会抓取发布商网站,将其收录到搜索结果中。而 OpenAI 的爬虫 GPTBot 则会在互联网上收集数据,用于训练其大型语言模型,例如 ChatGPT。这使人工智能工具能够生成准确、实时的内容,而新闻发布商尤其擅长提供此类内容:大型语言模型对优质出版商内容的重视程度是其他来源内容的 5 到 100 倍。FYM28资讯网——每日最新资讯28at.com

该研究还指出,全球北方(Global North,指大多位于北美、欧洲和其他地区的更富裕国家)国家的新闻机构比全球南方(Global South,一般是指包括非洲、拉丁美洲和加勒比地区、太平洋岛屿以及亚洲的发展中国家)国家更倾向于屏蔽人工智能爬虫。例如,在美国,79% 的热门在线新闻网站屏蔽了 OpenAI,而在墨西哥和波兰,这一比例仅为 20%。与此同时,德国 60% 的新闻网站屏蔽了谷歌的爬虫,而在波兰和西班牙,这一比例仅为 7%。FYM28资讯网——每日最新资讯28at.com

研究发现,几乎所有屏蔽谷歌爬虫的网站也屏蔽了 OpenAI (97%)。虽然该研究没有提供确切解释,但这可能表明 OpenAI 比谷歌更早发布爬虫有关。FYM28资讯网——每日最新资讯28at.com

值得注意的是,在大多数国家,一些发布商在爬虫刚发布时就立即屏蔽了它们。OpenAI 于去年 8 月初启动了其人工智能爬虫,谷歌随后于 9 月份效仿。研究还表明,一旦做出屏蔽决定后,没有一家网站撤销对 OpenAI 或谷歌人工智能爬虫的屏蔽。FYM28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-3502-0.html研究:近一半热门新闻网站屏蔽了 OpenAI 爬虫

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Sora 无法替代人类,亚马逊工程师断言:实际工作冲突不可能靠 AI 解决

下一篇: 法国 AI 公司 Mistral 获微软投资,推出聊天机器人 Le Chat 挑战 ChatGPT

标签:
  • 热门焦点
  • ChatGPT访问量增速下滑,AI真的是一场泡沫吗?

    来源:首席商业评论2023年,最火的莫过于ChatGPT,席卷全球的同时也引发了生成式AI(人工智能)的投资热潮。在美股,ChatGPT相关概念股飙涨,以AI算力龙头英伟达为例,其股价年内一度累计上
  • 汽车元宇宙,是概念还是未来?

    作者|何文 元宇宙是未来趋势已经无需验证。 从概念上来看,元宇宙是两种存在多年的概念的融合:虚拟现实和数字第二人生。这也就意味着,元宇宙所代表的是一种新的数
  • 抢先推出“元宇宙”饮料,可口可乐赢麻了

    试图傍上元宇宙的品牌千千万,但像可口可乐玩得这么花的,属实不多。01 可口可乐盯上元宇宙1886年,可口可乐诞生于美国乔治亚州亚特兰大市,至今已拥有136年的悠久历
  • 英特尔首款加密芯片将于今年上市|国际动态

    No.1 英特尔首款加密芯片将于今年上市2月13日消息,英特尔首款名为“区块链加速器”的加密芯片将于今年晚些时候上市。目前,已经有两家公司预订了这项技术,分别是G
  • NFT自动售货机来啦!

    “纽约市有一台售卖 Solana NFT 的自动售货机,用信用卡就能买”Solana NFT 市场 Neon 可让您使用信用卡亲自购买 NFT,无需使用加密货币。由于基于 Solana 链的 N
  • 解决NFT流动性问题:一文了解Floor DAO

    流动性是证券市场上的一个术语,流动性是指资产在不影响其市场价格的情况下可以转换为现成现金的效率,流动性最强的资产是现金本身。现在让我们试着从流动性的角
  • 用户可以把自己的医疗健康数据做成NFT出售给医药公司挣钱

    你可能听说过不可伪造的代币,或NFTs。NFTs是数字代币,代表完全独特的项目的所有权;存储在区块链中并可追踪,它们不能被修改、替换或复制。作为NFT铸造的资产在数字
  • Snoop Dogg 计划推出致力于数字媒体NFT的专业公司

    雅痞哥不知道这人是谁还上新闻,问了助理,解释,相当于美版刘欢的地位吧。Snoop Dogg 在 NFT 领域已经有一段时间了,尤其是在最近有消息称人们在元宇宙中购买房地产
  • Steam 禁止NFT和加密货币原因曝光

    近日,Valve(V社)总裁Gabe Newell接受PC Gamer采访时解释了该平台禁止NFT和加密货币的原因。早在2021年10月18日,PC Gamer就报道Steam推出的新规:使用区块链或允许交
Top