当前位置:首页 > 科技  > 软件

gSASRec : 利用负采样降低序列推荐中的过度自信问题

来源: 责编: 时间:2024-04-03 09:11:17 313观看
导读编译 | 汪昊审校 | 重楼推荐系统能够给亚马逊和 TikTok 每年带来 30% - 40% 的流量或者销售额增量,因此毫无疑问,推荐系统是互联网和科技公司的摇钱树。许多懵懂青年在上大学或者刚工作的时候,非常向往从事互联网推荐行

编译 | 汪昊Ulr28资讯网——每日最新资讯28at.com

审校 | 重楼Ulr28资讯网——每日最新资讯28at.com

推荐系统能够给亚马逊和 TikTok 每年带来 30% - 40% 的流量或者销售额增量,因此毫无疑问,推荐系统是互联网和科技公司的摇钱树。许多懵懂青年在上大学或者刚工作的时候,非常向往从事互联网推荐行业。一方面,趋之若鹜的人才极大地推动了领域的发展;另一方面,该领域的发展给相关人才带来了丰厚的回报。Ulr28资讯网——每日最新资讯28at.com

Ulr28资讯网——每日最新资讯28at.com

在刚刚过去的2023 年的推荐系统领域权威会议 RecSys 2023 上,一篇题为 gSASRec: Reducing Overconfidence in Sequential Recommendation Trained with Negative Sampling 的论文(下载地址:https://arxiv.org/pdf/2308.07192.pdf)获得了最佳论文奖。Ulr28资讯网——每日最新资讯28at.com

作者首先回顾了过度自信问题的由来:在负采样的过程中,推荐系统中的正样本的比例通常会增加。这一现象,就是所谓的过度自信问题。过度自信问题会带来如下隐患:1. 推荐系统偏重区分特别好和特别差的推荐,而差别不那么大的推荐结果得不到重视;2. 在某些情况下会导致严重的数值错误。我们在实际中发现,SASRec 算法会出现过度自信问题。并且常见的解决方案很难在深度学习的场景下适用。Ulr28资讯网——每日最新资讯28at.com

基于 Transformer 的推荐算法通常在序列推荐的场景下表现更优。在这一领域,BERT4rec 和 SASRec 是两款经典算法。Ulr28资讯网——每日最新资讯28at.com

两个最常用的序列推荐的损失函数是 BCE (Binary Cross Entropy) 和 Softmax Loss。BCE 的损失函数定义如下:Ulr28资讯网——每日最新资讯28at.com

Ulr28资讯网——每日最新资讯28at.com

其中:Ulr28资讯网——每日最新资讯28at.com

Ulr28资讯网——每日最新资讯28at.com

Softmax Loss 的定义如下:Ulr28资讯网——每日最新资讯28at.com

Ulr28资讯网——每日最新资讯28at.com

其中:Ulr28资讯网——每日最新资讯28at.com

Ulr28资讯网——每日最新资讯28at.com

Softmax Loss 不适合负采样场景下的推荐系统。因此有学者提出了 Sampled Softmax Loss :Ulr28资讯网——每日最新资讯28at.com

Ulr28资讯网——每日最新资讯28at.com

过度自信是指预测中物品出现的概率高于其先验分布。下图对比了几种算法的过度自信程度:Ulr28资讯网——每日最新资讯28at.com

Ulr28资讯网——每日最新资讯28at.com

通过观察,可以发现 SASRec 算法有严重的过度自信问题。Ulr28资讯网——每日最新资讯28at.com

因为高频率的物品会导致 BCE 数值计算发生错误,因此作者定义了新的gBCE (generalized BCE)指标:Ulr28资讯网——每日最新资讯28at.com

Ulr28资讯网——每日最新资讯28at.com

作者证明了一列 gBCE 防止过度自信的定理,此处因为篇幅原因,不再罗列相关的定理。感兴趣的读者可以自行查阅原始论文。作者基于新的损失函数设计了推荐系统,被命名为 gSASRec 算法。作者随后进行了对照实验,该算法取得了优异的效果:Ulr28资讯网——每日最新资讯28at.com

Ulr28资讯网——每日最新资讯28at.com

这篇论文的核心在于证明了利用新的损失函数,可以得到缓解过度自信问题的若干定理,因此可以保证我们在使用新的损失函数设计算法之后,取得了远远优于先前推荐的效果。Ulr28资讯网——每日最新资讯28at.com

这篇论文看似简单,但是作者在数学理论基础推导方面下足了功夫,是难得一见的好文章。值得读者认真收藏,细细品味。Ulr28资讯网——每日最新资讯28at.com

作者介绍

汪昊,前 Funplus 人工智能实验室负责人。曾在 ThoughtWorks、豆瓣、百度、新浪等公司担任技术和技术高管职务。在互联网公司和金融科技、游戏等公司任职 13 年,对于人工智能、计算机图形学区块链和数字博物馆等领域有着深刻的见解和丰富的经验。在国际学术会议和期刊发表论文39 篇,获得IEEE SMI 2008 最佳论文奖、ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 / ICSIM 2024最佳论文报告奖。Ulr28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-81065-0.htmlgSASRec : 利用负采样降低序列推荐中的过度自信问题

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 实战Spring Cloud Gateway自定义谓词及网关过滤器

下一篇: Python Reduce函数解密:优雅处理复杂数据聚合

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 7月安卓手机性能榜:红魔8S Pro再夺榜首

    7月份的手机市场风平浪静,除了红魔和努比亚带来了两款搭载骁龙8Gen2领先版处理器的新机之外,别的也想不到有什么新品了,这也正常,通常6月7月都是手机厂商修整的时间,进入8月份之
  • 三言两语说透设计模式的艺术-简单工厂模式

    一、写在前面工厂模式是最常见的一种创建型设计模式,通常说的工厂模式指的是工厂方法模式,是使用频率最高的工厂模式。简单工厂模式又称为静态工厂方法模式,不属于GoF 23种设计
  • 不容错过的MSBuild技巧,必备用法详解和实践指南

    一、MSBuild简介MSBuild是一种基于XML的构建引擎,用于在.NET Framework和.NET Core应用程序中自动化构建过程。它是Visual Studio的构建引擎,可在命令行或其他构建工具中使用
  • 谷歌KDD'23工作:如何提升推荐系统Ranking模型训练稳定性

    谷歌在KDD 2023发表了一篇工作,探索了推荐系统ranking模型的训练稳定性问题,分析了造成训练稳定性存在问题的潜在原因,以及现有的一些提升模型稳定性方法的不足,并提出了一种新
  • 一文掌握 Golang 模糊测试(Fuzz Testing)

    模糊测试(Fuzz Testing)模糊测试(Fuzz Testing)是通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法。可以用来发现应用程序、操作系统和网络协议等中的漏洞或
  • 破圈是B站头上的紧箍咒

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之每年的暑期档都少不了瞄准追剧女孩们的古偶剧集,2021年有优酷的《山河令》,2022年有爱奇艺的《苍兰诀》,今年却轮到小破站抓住了追
  • 消费结构调整丨巨头低价博弈,拼多多还卷得动吗?

    来源:征探财经作者:陈香羽随着流量红利的退潮,电商的存量博弈越来越明显。曾经主攻中高端与品质的淘宝天猫、京东重拾“低价”口号。而过去与他们错位竞争的拼多多,靠
  • 7月4日见!iQOO 11S官宣:“鸡血版”骁龙8 Gen2+200W快充加持

    上半年已接近尾声,截至目前各大品牌旗下的顶级旗舰都已悉数亮相,而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系
Top