当前位置:首页 > 科技  > 软件

查电影评分上互联网?别逗了!

来源: 责编: 时间:2024-01-23 08:43:52 332观看
导读作者 | 汪昊审校 | 重楼自互联网诞生以来,互联网上的评分网站层出不穷。美国的 IMDB 和烂番茄等网站都有大量的电影评分和影评。许多人在观影之前都要上类似的网站搜索电影评分以决定自己是否要看某一部电影。可以说,在

作者 | 汪昊IyV28资讯网——每日最新资讯28at.com

审校 | 重楼IyV28资讯网——每日最新资讯28at.com

自互联网诞生以来,互联网上的评分网站层出不穷。美国的 IMDB 和烂番茄等网站都有大量的电影评分和影评。许多人在观影之前都要上类似的网站搜索电影评分以决定自己是否要看某一部电影。可以说,在过去 10 年的人类文明发展过程中,无数的人已经养成了这一习惯。今天,我们要给大家泼一盆冷水:以后还是别上电影评分网站搜电影了。电影评分网站的评分根本就不可靠。IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

在说服大家之前,我们先来介绍一下什么是博尔达计数法。博尔达计数法是1770 年法国科学家提出的评选法国科学院院士的投票方法。虽然博尔达计数法的发明时间可能远远早于 1770 年,但是该方法还是以博尔达的名字命名了。博尔达计数法的投票方式如下:假设现在有 N 个候选人竞选某个职位,观众给他们投票,每个人给心中的第一名打 N 分,给第二名 N-1 分…… 最后统计所有分数的总和,得分最高的候选人获选。博尔达计数法被用在金球奖评分等活动中,时至今日仍然影响着我们。IyV28资讯网——每日最新资讯28at.com

或许我们对博尔达计数法没有那么熟悉,但我们一定见过博尔达计数法的变种——区间评分法。所谓区间评分法,举个例子,在 IMDB 上,我们看一部电影,最高分给 5 分,差一些的给 4 分,…… 这就是所谓的区间评分法。因为我们给的分数是一个区间内的整数,所以叫区间评分法。下面,我们将要告诉读者,所有基于区间评分法的评分系统都是无效评分系统。IyV28资讯网——每日最新资讯28at.com

在国际学术会议 ICHESS 2023 上,研究者发表了一篇题为 The Fallacy of Borda Count Method -- Why it is Useless with Group Intelligence and Shouldn't be Used with Big Data including Banking Customer Services 的论文,否定了大数据场景下区间评分法的合理性。因为区间评分法广泛应用于文化评分网站、电商商品和客服评价系统、银行柜员评价系统、移动通讯客服评价系统等,因此这篇论文意义深远,值得每一个人认真阅读。IyV28资讯网——每日最新资讯28at.com

这篇论文首先回顾了作者在过去 3 年发表的若干篇论文。这些论文介绍了若干零样本学习算法:ZeroMat、DotMat、RankMat、PoissonMat、PowerMat、LogitMat 等。这些论文有一个共同特点:在不借助迁移学习/元学习和预训练模型的前提下,可以不利用任何用户评分数据,极为准确的预测用户物品评分值,是人工智能历史上第一批真正意义的零样本学习算法。这些算法,可以在推荐系统领域完美的解决冷启动问题,并且效果丝毫不逊于有完整数据的非零样本学习算法。这些颠覆性的成果迫使我们重新思考整个推荐系统领域和在线评分网站评分体系的有效性。这些算法都有一个共同特点,就是充分利用了推荐系统输入数据的幂律特性,使用评分本身近似评分分布,来替代最大似然函数中的相关公式,从而达到不需要任何实际数据就能完成推荐的目的。IyV28资讯网——每日最新资讯28at.com

要想理解这些算法,就必须先理解矩阵分解算法。所谓矩阵分解算法,就是利用用户特征向量和物品特征向量的点乘来最大程度的近似用户物品评分。矩阵分解的损失函数如下:IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

损失函数 L 可以通过随机梯度下降法进行求解。关于矩阵分解的最精确的数学解释是 2007 年的推荐系统里程碑论文 Probabilistic Matrix Factorization。这篇论文将矩阵分解重构成了最大似然函数求解问题。ZeroMat 将评分的高斯分布假设改成了真实的幂律分布,得到了如下的最大似然函数求解公式:IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

这个公式可以利用随机梯度下降进行求解。求解过程如下(标准差设定为 1):IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

这个算法在 MovieLens 和 LDOS-CoMoDa 数据集合上进行测试,都取得了和利用全部用户评分数据进行运算的矩阵分解算法比肩的效果。IyV28资讯网——每日最新资讯28at.com

DotMat 算法的损失函数公式如下:IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

利用随机梯度下降公式对该损失函数进行求解,得到如下公式:IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

为了省略文章篇幅,下面我们只讨论 PoissonMat 和 LogitMat 这两个算法。PoissonMat 算法的最大似然函数公式如下:IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

利用随机梯度下降对最大似然函数进行求解,得到如下公式:IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

下面我们看一下 LogitMat 算法。这个算法的损失函数结合了逻辑回归和矩阵分解:IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

利用随机梯度下降对损失函数进行求解,得到了如下公式:IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

通过观察这些函数的求解公式,我们发现这些算法无一例外的都不需要任何用户评分数据。我们可以在不借助任何数据的情况下完成推荐算法的设计。下面我们从这些算法的原始论文中找出一些原始图片来分析一下算法的结果:IyV28资讯网——每日最新资讯28at.com

IyV28资讯网——每日最新资讯28at.com

图 1 和图 2 展示的是 ZeroMat、DotMat、PoissonMat 和 LogitMat 与经典的矩阵分解模型的对比结果。可以看到,许多不需要任何数据的算法在准确性和公平性指标上都击败了经典的矩阵分解模型,而该模型利用了所有的用户评分矩阵数据。IyV28资讯网——每日最新资讯28at.com

这一系列的结果让我们有了充足的理由推翻区间评分法:因为幂律效应的原因,我们可以使用评分本身代替评分的概率分布对最大似然函数进行建模,这样可以得到零样本学习算法,并且零样本学习算法可以精确预测用户评分喜好,在 [1, 5] 评分区间上评分误差可以不超过 0.8 。这一发现在很大程度上冲击了我们对于推荐系统领域的认知。因为用户评分数据,特别是电影评分数据中的幂律效应不可避免,所以零样本算法永远成立。既然一个人给电影打多少分可以不用任何数据进行预测,这样的评分系统还有何用?因此电影评分网站的评分系统都是无效的评分系统。而这一结论可以轻易的扩展到其他区间评分的系统中去:只要该系统的输入存在幂律效应,区间评分法就是无效的。IyV28资讯网——每日最新资讯28at.com

查电影评分上互联网?别逗了!你给电影打多少分,不用查你的历史数据就能猜的很准。而这仅仅是因为电影评分的幂律效应。这样的影评评分系统,你敢用吗?IyV28资讯网——每日最新资讯28at.com

作者简介

汪昊,前 Funplus 人工智能实验室负责人。曾在 ThoughtWorks、豆瓣、百度、新浪等公司担任技术和技术高管职务。在互联网公司和金融科技、游戏等公司任职 12 年,对于人工智能、计算机图形学和区块链等领域有着深刻的见解和丰富的经验。在国际学术会议和期刊发表论文 42 篇,获得IEEE SMI 2008 最佳论文奖、ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 最佳论文报告奖。IyV28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-66351-0.html查电影评分上互联网?别逗了!

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: JDK19推出新特性虚拟线程是什么?

下一篇: VS Code 内置神器,五个必备功能助你高效编程!

标签:
  • 热门焦点
  • 6月iOS设备好评榜:第一蝉联榜首近一年

    作为安兔兔各种榜单里变化最小的那个,2023年6月的iOS好评榜和上个月相比没有任何排名上的变化,仅仅是部分设备好评率的下降,长年累月的用户评价和逐渐退出市场的老款机器让这
  • 得物效率前端微应用推进过程与思考

    一、背景效率工程随着业务的发展,组织规模的扩大,越来越多的企业开始意识到协作效率对于企业团队的重要性,甚至是决定其在某个行业竞争中突围的关键,是企业长久生存的根本。得物
  • 之家push系统迭代之路

    前言在这个信息爆炸的互联网时代,能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大,传统的靠"主动拉"获取信息的方式已不能满足用
  • 19个 JavaScript 单行代码技巧,让你看起来像个专业人士

    今天这篇文章跟大家分享18个JS单行代码,你只需花几分钟时间,即可帮助您了解一些您可能不知道的 JS 知识,如果您已经知道了,就当作复习一下,古人云,温故而知新嘛。现在,我们就开始今
  • 一文掌握 Golang 模糊测试(Fuzz Testing)

    模糊测试(Fuzz Testing)模糊测试(Fuzz Testing)是通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法。可以用来发现应用程序、操作系统和网络协议等中的漏洞或
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • 微博大门常打开,迎接海外画师漂洋东渡

    作者:互联网那些事“起猛了,我能看得懂日语了”。“为什么日本人说话我能听懂?”“中文不像中文,日语不像日语,但是我竟然看懂了”…&hell
  • 荣耀Magicbook V 14 2021曙光蓝版本正式开售,拥有触摸屏

    荣耀 Magicbook V 14 2021 曙光蓝版本正式开售,搭载 i7-11390H 处理器与 MX450 显卡,配备 16GB 内存与 512GB SSD,重 1.48kg,厚 14.5mm,具有 1.5mm 键盘键程、
  • 英特尔Xe HPG游戏显卡:拥有512EU,单风扇版本

    据10 月 30 日外媒 TheVerge 消息报道,英特尔 Xe HPG Arc Alchemist 的正面实被曝光,不仅拥有 512 EU 版显卡,还拥有 128EU 的单风扇版本。另外,这款显卡 PCB
Top