当前位置:首页 > 科技  > 资讯

LeCun团队新突破,自监督学习再进化,MMCR如何更进一步?

来源: 责编: 时间:2024-10-17 09:17:18 132观看
导读【ITBEAR】近日,来自斯坦福大学、麻省理工学院(MIT)、纽约大学以及meta-FAIR等机构的研究团队,通过全新研究对最大流形容量表示法(MMCR)的可能性进行了重新定义。这一成果为多视图自监督学习(MVSSL)领域带来了新的突破。MVSSL

【ITBEAR】近日,来自斯坦福大学、麻省理工学院(MIT)、纽约大学以及meta-FAIR等机构的研究团队,通过全新研究对最大流形容量表示法(MMCR)的可能性进行了重新定义。这一成果为多视图自监督学习(MVSSL)领域带来了新的突破。99p28资讯网——每日最新资讯28at.com

MVSSL作为一种强大的无监督学习方法,通过创建多个数据视图并以类似监督的方式学习表示。而MMCR作为一种与众不同的方法,在不明确使用对比、不执行聚类、不利用蒸馏、也不明确减少冗余的情况下,其效果却能媲美甚至超越其他领先的MVSSL方法。99p28资讯网——每日最新资讯28at.com

研究人员在这项新研究中,对MMCR进行了深入探索,并将其与信息论原理联系起来,进一步揭示了其深层次机制。他们证明了MMCR可以激励学习嵌入的对齐和均匀性,同时最大化视图之间的互信息下界,从而将MMCR的几何视角与MVSSL中的信息论视角紧密结合。99p28资讯网——每日最新资讯28at.com

论文地址示意图99p28资讯网——每日最新资讯28at.com

为了更好地利用MMCR,研究人员还对预训练损失的非单调变化进行了数学预测和实验确认,发现了类似于双下降的行为,并揭示了计算上的scaling law。这些发现使得研究人员能够更准确地预测预训练损失,并将其作为梯度步长、批量大小、嵌入维度和视图数量的函数。99p28资讯网——每日最新资讯28at.com

值得注意的是,这项研究还证明了MMCR不仅适用于图像数据,在多模态图像文本数据上同样表现出色。这一成果为MMCR的应用拓展了新的领域,也为多模态学习提供了新的思路和方法。99p28资讯网——每日最新资讯28at.com

MMCR最初由纽约大学数据科学中心的研究人员于2023年提出,该方法源于神经科学中的有效编码假说。最初的MMCR框架通过调整“流形容量”将这一想法扩展到了人工神经网络。而此次研究则将MMCR的几何基础与信息论原理相结合,进一步探索了其更深层次机制。99p28资讯网——每日最新资讯28at.com

通过高维概率分析,研究人员发现MMCR可以激励表示的最大化,对应于同一数据的两个视图的两个嵌入共享的互信息的下限。这一发现为理解MMCR的嵌入分布提供了新的视角。99p28资讯网——每日最新资讯28at.com

研究人员还在实验中观察到了MMCR的双下降现象,即预测最大流形容量表示的预训练损失在其预训练过程中表现出非单调的双下降样行为。这一发现为MMCR的优化和应用提供了新的指导。99p28资讯网——每日最新资讯28at.com

在计算scaling laws方面,研究人员发现MMCR预训练百分比误差与点数、嵌入维度和视图数量之间存在幂律缩放关系。这一发现为不同超参数下的MMCR训练提供了可比较的基准,也为优化MMCR的计算效率提供了新的思路。99p28资讯网——每日最新资讯28at.com

在多模态数据应用方面,研究人员将MMCR应用于图像文本对的学习,取得了显著的效果。这一成果为多模态学习提供了新的方法和技术支持,也为MMCR的应用拓展了新的领域。99p28资讯网——每日最新资讯28at.com

总的来说,这项研究对MMCR进行了全面的探索和重新定义,揭示了其深层次机制和应用潜力。未来,随着对MMCR的进一步研究和应用拓展,我们有望在更多领域看到其出色的表现。99p28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-126255-0.htmlLeCun团队新突破,自监督学习再进化,MMCR如何更进一步?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 字节跳动涉足印刷出版,纸质媒体体验新动向?

下一篇: 华为WATCH GT4升级,新增健康趋势分析,智能手表再进化?

标签:
  • 热门焦点
  • 8月总票房已突破10亿!《封神》第一:口碑已经成了

    8月5日消息,据灯塔专业版数据,截至8月5日9时35分,8月总票房(含预售)已突破10亿。其中,《封神》以大比分的优势领先。根据官方消息,目前该片总票房已经超过14.
  • K8S | Service服务发现

    一、背景在微服务架构中,这里以开发环境「Dev」为基础来描述,在K8S集群中通常会开放:路由网关、注册中心、配置中心等相关服务,可以被集群外部访问;图片对于测试「Tes」环境或者
  • SpringBoot中使用Cache提升接口性能详解

    环境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架从 3.1 开始,对 Spring 应用程序提供了透明式添加缓存的支持。和事务支持一样,抽象缓存允许一致地使用各
  • 量化指标是与非:挽救被量化指标扼杀的技术团队

    作者 | 刘新翠整理 | 徐杰承本文整理自快狗打车技术总监刘新翠在WOT2023大会上的主题分享,更多精彩内容及现场PPT,请关注51CTO技术栈公众号,发消息【WOT2023PPT】即可直接领取
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • Python异步IO编程的进程/线程通信实现

    这篇文章再讲3种方式,同时讲4中进程间通信的方式一、 Python 中线程间通信的实现方式共享变量共享变量是多个线程可以共同访问的变量。在Python中,可以使用threading模块中的L
  • 腾讯盖楼,字节拆墙

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之“想重温暴刷深渊、30+技能搭配暴搓到爽的游戏体验吗?一起上晶核,即刻暴打!”曾凭借直播腾讯旗下代理格斗游戏《DNF》一
  • 国行版三星Galaxy Z Fold5/Z Flip5发布 售价7499元起

    2023年8月3日,三星电子举行Galaxy新品中国发布会,正式在国内推出了新一代折叠屏智能手机三星Galaxy Z Fold5与Galaxy Z Flip5,以及三星Galaxy Tab S9
  • OPPO K11搭载高性能石墨散热系统:旗舰同款 性能凉爽释放

    日前OPPO官方宣布,将于7月25日14:30举办新品发布会,届时全新的OPPO K11将正式与大家见面,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼
Top