当前位置:首页 > 科技  > 软件

「陶哲轩×GPT-4」合写数学论文!数学大佬齐惊呼,LLM推理神助证明不等式定理

来源: 责编: 时间:2023-10-10 18:30:32 344观看
导读今年6月,陶哲轩曾在博客中预言,2026年,AI将与搜索和符号数学工具相结合,成为数学研究中值得信赖的合著者。这个预言,如今已经愈发成真。就在6月底,加州理工、英伟达、MIT等机构的学者,曾构建了一个基于开源LLM的定理证明器。

今年6月,陶哲轩曾在博客中预言,2026年,AI将与搜索和符号数学工具相结合,成为数学研究中值得信赖的合著者。FO128资讯网——每日最新资讯28at.com

这个预言,如今已经愈发成真。FO128资讯网——每日最新资讯28at.com

就在6月底,加州理工、英伟达、MIT等机构的学者,曾构建了一个基于开源LLM的定理证明器。FO128资讯网——每日最新资讯28at.com

最近,陶哲轩又发现,在使用Lean进行自然数游戏研究时,GPT-4竟然也起到一些作用。FO128资讯网——每日最新资讯28at.com

在AI的辅助下,他得到了关于有限多个实变量不等式理论的成果,论文很快就会发在arXiv上。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

如何用GPT-4研究自然数游戏

什么是自然数游戏?FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

这个游戏,神奇地展示了归纳的力量。FO128资讯网——每日最新资讯28at.com

如图所示,我们从蓝色节点上输入,而灰色节点上方的所有结点都完成时,灰色节点将变为蓝色。FO128资讯网——每日最新资讯28at.com

在这个过程中,我们当然可以随时尝试任何级别的节点,但如果它是灰色的,我们可能就没有足够的知识来完成这个节点。FO128资讯网——每日最新资讯28at.com

引理:对于所有自然数x、y和z都有xy+z=xy+z。证明开始!引理:对于所有自然数x、y和z都有xy+z=xy+z。证明开始!FO128资讯网——每日最新资讯28at.com

在自然数游戏中,我们就会在定理证明器Lean中,得到自己的一个自然数版本——mynat。这个自然数满足了数学归纳定理,以及其他原理(比如皮亚诺公理)。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

不过,问题在于,目前还没有人证明这些关于自然数的定理,比如,你可以定义加法,但还没有人证明x + y = y + x。FO128资讯网——每日最新资讯28at.com

皮亚诺公理皮亚诺公理FO128资讯网——每日最新资讯28at.com

而自然数游戏,就需要你解决游戏中的关卡,用Lean定理证明器来证明数学定理。FO128资讯网——每日最新资讯28at.com

图片FO128资讯网——每日最新资讯28at.com

我们证明了n+0=n,这个证明被称为add_zero。但并不能证明zero_add,0+n=n。这两个定理不是一样吗?并非如此!事实上x + y = y + x,这是加法世界的BOSS级难题。FO128资讯网——每日最新资讯28at.com

陶哲轩是出于怎样的机缘巧合,开始玩自然数游戏的呢?FO128资讯网——每日最新资讯28at.com

原来,他是在IPAM机器辅助证明研讨会上看到过几次Lean的演示,并且被建议玩一玩自然数游戏,来熟悉Lean中用于证明定理的基本语法和策略。FO128资讯网——每日最新资讯28at.com

让陶哲轩感到惊喜的是,这个游戏越玩越熟悉,因为它证明的结果和自己写的本科实分教材前几章的结果分成相似。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

比如,从皮亚诺公理建立基本的算术事实,例如乘法的交换性和结合性。FO128资讯网——每日最新资讯28at.com

另外,自然数游戏还让他想起了自己编码的逻辑游戏。FO128资讯网——每日最新资讯28at.com

才玩了三个小时,陶哲轩就已经到达了「高级乘法」世界。他表示,在以后的空闲时间里他会继续玩这个游戏。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

高级乘法世界:证明两个非零自然数的乘积为非零:a≠0 → b≠0 → a*b≠0FO128资讯网——每日最新资讯28at.com

当然,GPT-4也知道Lean,它可以提供一些有用的回答。FO128资讯网——每日最新资讯28at.com

不过,因为自然数游戏中可用的工具集很有限,所以GPT-4对于这个游戏没有直接的帮助,因为它提出的解决方案中涉及的方法,通常还没有被纳入游戏中。FO128资讯网——每日最新资讯28at.com

不过,当他开始使用Lean的时候,GPT-4就变得非常有帮助了。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

随着关卡变得越来越难,GPT的作用开始逐渐显现出来。FO128资讯网——每日最新资讯28at.com

在Z显而易见是X和Y的结果的情况下,如果向GPT提问——FO128资讯网——每日最新资讯28at.com

如果我已经知道X和Y,该如何证明Z呢?FO128资讯网——每日最新资讯28at.com

这个过程就解决了各种微妙的语法问题,否则这些问题会十分令人沮丧。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

而且,陶哲轩发现,自然数游戏中包含的Lean库,似乎比文件中宣称的要多得多。FO128资讯网——每日最新资讯28at.com

GitHub Copilot,让我不安

总之,AI工具辅助研究数学的奇迹,一次次让陶哲轩称赞不已,甚至发展到了让他「不安」。FO128资讯网——每日最新资讯28at.com

前不久陶哲轩发现,GitHub Copilot已经能够预测到自己文章中数学论证的步骤了。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

在10月初,陶哲轩表示,Github Copilot的能力惊艳到他了。FO128资讯网——每日最新资讯28at.com

而且他强调,并不是它的编码能力,而是它编码之外的补充其他内容的能力,经常能让他喜出望外。FO128资讯网——每日最新资讯28at.com

最近,他又称赞到——FO128资讯网——每日最新资讯28at.com

我发现Github Copilot在我最近撰写博客文章的过程中出奇地有帮助。它能够正确预测该帖子中数学论证的几个步骤;在下面给出的示例中,我将积分分成三部分,并描述了如何估计第一部分,然后copilot正确地说明了如何估计其余两部分。FO128资讯网——每日最新资讯28at.com

陶哲轩给出的例证陶哲轩给出的例证FO128资讯网——每日最新资讯28at.com

只要简单说明一下如何对第一部分进行估计,剩下的工作GitHub Copilot就能完成了,这也太惊艳了!FO128资讯网——每日最新资讯28at.com

对此,陶哲轩的评价是:「Copilot的性能给我留下了深刻的印象(并且让我有点不安)」。FO128资讯网——每日最新资讯28at.com

他补充说「虽然其中的许多建议并不那么合适,我估计Copilot可能建议了十几句话,最终以某种形式出现在我的博客文章中。」FO128资讯网——每日最新资讯28at.com

而他说的博客文章就是这篇关于「非负量的和或积分的上界」。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

博文地址:https://terrytao.wordpress.com/2023/09/30/bounding-sums-or-integrals-of-non-negative-quantities/FO128资讯网——每日最新资讯28at.com

估计某个量的大小,是数分、概率论、组合学等领域中的常见问题,如估计函数、序列、结合等的和或积分。FO128资讯网——每日最新资讯28at.com

因此陶哲轩这篇估计非负量的和或积分上界,探讨的正是数学领域的重要问题。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

陶哲轩在博客中总结了3种估算大量非负量和以及积分的方法,如算术平均值-几何平均值不等式、Holder不等式、Markov不等式等。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

其中的内容和代码没有关系,但是Github Copilot依然给出了让陶哲轩都感到惊叹的内容建议。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

能让陶哲轩都感到有点不安的Github Copilot,源于Github和OpenAI的合作。FO128资讯网——每日最新资讯28at.com

它主要功能是利用生成式AI的能力为程序提供编码的建议,自动补充等编码功能。而之所以它有如此强大的功能,和背后微软,OpenAI的大量投入是分不开的。FO128资讯网——每日最新资讯28at.com

最近外媒报道,微软提供的Github Copilot每月10刀的订阅服务,在算力成本上,每个用户要让微软亏损20美元/月。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

文章地址:https://www.wsj.com/tech/ai/ais-costly-buildup-could-make-early-products-a-hard-sell-bdd29b9f?mod=followamazonFO128资讯网——每日最新资讯28at.com

这些服务成本如此高昂的原因之一,是使用了最强大的AI模型,与普通的软件或云服务相比,这些模型需要更多的电力,并对处理器的运行造成更大的压力。FO128资讯网——每日最新资讯28at.com

文章中甚至将现在的AI工具的能力和成本做了一个让人绷不住的比喻:FO128资讯网——每日最新资讯28at.com

「用AI去做文章总结就像开着兰博基尼去送披萨一样」。FO128资讯网——每日最新资讯28at.com

足见现在科技巨头们,为了让用户充分享受AI带来的便利,真的是下了血本!FO128资讯网——每日最新资讯28at.com

所以让陶哲轩惊叹的Github Copilot能在编码之外还有如此强大的能力,也似乎不那么奇怪了。FO128资讯网——每日最新资讯28at.com

AI如何辅助数学研究

显然,现在所有人都已经意识到:AI具有巨大潜力,它可以通过指导猜想生成、协助形式化数学等方式为数学发展做出贡献。FO128资讯网——每日最新资讯28at.com

在9月26日举行的一场关于使用AI辅助数学推理的网络研讨会上,众数学大咖云集,一起讨论了人工智能技术如何用于推进数学科学,跨学科合作如何开辟新的机会。FO128资讯网——每日最新资讯28at.com

陶哲轩也参与了会议,并结合自己与AI合作的经历谈了自己的观点。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

大会对于AI辅助数学研究,AI专家和数学家协作配合的新机会和新挑战,都展开了充分地讨论,可谓是干货满满:FO128资讯网——每日最新资讯28at.com

尝试应用机器学习方法来辅助或完成形式数学论证,现在已经是人工智能应用的一个独特领域FO128资讯网——每日最新资讯28at.com

AI在辅助数学研究中的独特之处在于,数学具有一种自我验证的方法,可以用来检查AI产生的结果,而其他AI任务通常需要人类参与来评估反馈的质量。FO128资讯网——每日最新资讯28at.com

数学表达本身具有一种内在的准确性,因此机器学习在数学领域能够在数据相对稀缺的情况下有效地推进工作,这使得AI在数学领域具备明显的优势。FO128资讯网——每日最新资讯28at.com

在研讨会上,多位数学领域专家进行了知识分享和交流。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

在使用机器学习协助数学发现方面,会议中数学家Heather提到了具体的几个例子:FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

(1) DeepMind和数学家合作,利用机器学习从大量数据中寻找模式,形成了关于模形的新猜想。FO128资讯网——每日最新资讯28at.com

(2) Sutherland等数学家也使用机器学习在模形式的工作中找到了新公式。FO128资讯网——每日最新资讯28at.com

(3) Adam Wagner使用机器学习来寻找图论问题的反例。FO128资讯网——每日最新资讯28at.com

(4) Javier Pena利用机器学习找到偏微分方程近似的数值解,以方便后续的严格数值方法的推进。FO128资讯网——每日最新资讯28at.com

在使用AI辅助证明方面,会议提到形式化证明可以将一个大证明分解成小块,不同人可以负责不同部分。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

这可能会开启新的科研协作模式——计算机可以自动化证明中的某些步骤,已经有许多前沿的数学领域使用了这种模式。FO128资讯网——每日最新资讯28at.com

这种形式化证明的过程有利于数学家以新方式与AI进行创造性的互动。FO128资讯网——每日最新资讯28at.com

这也体现了AI协助数学发现和传统数学研究的不同:既有大公司提供计算资源的大规模合作,也有小规模的个人之间的合作探索。FO128资讯网——每日最新资讯28at.com

学界需要对这些不同的合作模式保持开放。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

会议中,还有多位学者讨论了AI在数学翻译中的应用FO128资讯网——每日最新资讯28at.com

数学翻译是指将一个数学问题从一个领域翻译到另一个领域的等价表达,这是数学家解决问题的基本工具之一。FO128资讯网——每日最新资讯28at.com

数学家以一个图论问题为例。图论问题可以翻译成代数问题,两者逻辑上是等价的,但表达上的术语和形式明显不同。FO128资讯网——每日最新资讯28at.com

AI转换工具可以将一个看似毫无头绪的问题,转化成一个可以用已有技术来解决的问题。FO128资讯网——每日最新资讯28at.com

还有学者进一步指出,证明思路到形式证明的转换,以及形式证明到实际算法的转换,也是一种翻译过程。FO128资讯网——每日最新资讯28at.com

鉴于AI在不同语言之间的翻译上取得了巨大进展,未来可以研究如何应用机器学习来实现数学领域内的翻译。FO128资讯网——每日最新资讯28at.com

例如将不完整的证明草图自动翻译成可证明的形式表达。这是当前一个非常有前景的研究方向。FO128资讯网——每日最新资讯28at.com

会议中多位数学家也强调了。由于数学翻译能显著拓展问题解决的视角,应用机器学习来实现数学翻译将可能大大推进数学研究。FO128资讯网——每日最新资讯28at.com

图片图片FO128资讯网——每日最新资讯28at.com

AI专家和数学家进行跨界合作,需要面对的差异和挑战FO128资讯网——每日最新资讯28at.com

AI界和数学界,存在着诸多差异。FO128资讯网——每日最新资讯28at.com

比如,机器学习研究者习惯处理大规模数据集,而数学家习惯于处理相对较少的数据。机器学习研究者注重在一类任务上的平均表现,而数学家则更关注单个案例的解释。FO128资讯网——每日最新资讯28at.com

另外,两者的出版文化不同,机器学习界会公开发表绝大部分研究内容,数学界则不然。机器学习界普遍第一作者为主要贡献者,数学界作者顺序就比较随机。FO128资讯网——每日最新资讯28at.com

大规模合作项目的学术贡献认定上,二者也存在差异。形式化研究使得每个参与者只负责一小块,如何评价贡献是一个新问题。FO128资讯网——每日最新资讯28at.com

还有一个差异,是资源获取方式。FO128资讯网——每日最新资讯28at.com

机器学习需要大数据集和计算资源,数学家对这方面的需求就相对较少。如何使各界研究者公平获取资源也会是一个问题。开源文化不同。机器学习界更看重开源共享,而数学界不一定。如何处理二者关系需要考量。FO128资讯网——每日最新资讯28at.com

由于这是一个全新的交叉领域,双方在一些根本理念和工作方式上存在差异,需要在合作中加以认识和调适,以实现更好的协同效果。FO128资讯网——每日最新资讯28at.com

参考资料:FO128资讯网——每日最新资讯28at.com

https://mathstodon.xyz/@tao/111206761117553482FO128资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-12685-0.html「陶哲轩×GPT-4」合写数学论文!数学大佬齐惊呼,LLM推理神助证明不等式定理

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: C技巧:结构体初始赋值

下一篇: 福利来啦,一键部署:轻松掌握Docker及Docker-Compose的安装方法

标签:
  • 热门焦点
  • 分布式系统中的CAP理论,面试必问,你理解了嘛?

    对于刚刚接触分布式系统的小伙伴们来说,一提起分布式系统,就感觉高大上,深不可测。而且看了很多书和视频还是一脸懵逼。这篇文章主要使用大白话的方式,带你理解一下分布式系统
  • 微信语音大揭秘:为什么禁止转发?

    大家好,我是你们的小米。今天,我要和大家聊一个有趣的话题:为什么微信语音不可以转发?这是一个我们经常在日常使用中遇到的问题,也是一个让很多人好奇的问题。让我们一起来揭开这
  • 只需五步,使用start.spring.io快速入门Spring编程

    步骤1打开https://start.spring.io/,按照屏幕截图中的内容创建项目,添加 Spring Web 依赖项,并单击“生成”按钮下载 .zip 文件,为下一步做准备。请在进入步骤2之前进行解压。图
  • 一文搞定Java NIO,以及各种奇葩流

    大家好,我是哪吒。很多朋友问我,如何才能学好IO流,对各种流的概念,云里雾里的,不求甚解。用到的时候,现百度,功能虽然实现了,但是为什么用这个?不知道。更别说效率问题了~下次再遇到,
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 腾讯VS网易,最卷游戏暑期档,谁能笑到最后?

    作者:无锈钵来源:财经无忌7月16日晚,上海1862时尚艺术中心。伴随着幻象的精准命中,硕大的荧幕之上,比分被定格在了14:12,被寄予厚望的EDG战队以绝对的优势战胜了BLG战队,拿下了总决
  • 机构称Q2国内智能手机销量同比下滑4% vivo份额重回第1

    7月29日消息,根据市场调查机构Counterpoint Research公布的最新报告,2023年第2季度中国智能手机销量同比下降4%,创新自2014年以来第2季度销量新低。报
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
  • 电博会上海尔智家模拟500平大平层,还原生活空间沉浸式体验

    电博会为了更好地让参展观众真正感受到智能家居的绝妙之处,海尔智家的程传岭先生同样介绍了展会上海尔智家的模拟500平大平层,还原生活空间沉浸式体验。程传
Top