当前位置:首页 > 元宇宙 > AI

DeepMind AI破解数学奥赛几何题,金牌水平不在话下?

来源: 责编: 时间:2025-02-08 08:26:23 173观看
导读近期,科技界迎来了一项令人瞩目的成就:谷歌DeepMind实验室的人工智能系统AlphaGeometry2,在攻克国际数学奥林匹克竞赛(IMO)中的几何难题上,取得了前所未有的突破,其解题能力甚至超越了历年的金牌平均水平。AlphaGeometry2是D

近期,科技界迎来了一项令人瞩目的成就:谷歌DeepMind实验室的人工智能系统AlphaGeometry2,在攻克国际数学奥林匹克竞赛(IMO)中的几何难题上,取得了前所未有的突破,其解题能力甚至超越了历年的金牌平均水平。itf28资讯网——每日最新资讯28at.com

AlphaGeometry2是DeepMind在今年早些时候推出的AlphaGeometry系统的升级版。据DeepMind团队最新发布的论文显示,这一AI系统能够解答过去25年间国际数学奥林匹克竞赛中出现的84%的几何题目。国际数学奥林匹克竞赛作为面向全球高中生的顶级数学赛事,其难度与挑战性不言而喻。而DeepMind认为,探索解决复杂几何问题,尤其是欧几里得几何问题的新方法,或许能够为开发更强大的人工智能提供关键线索。itf28资讯网——每日最新资讯28at.com

itf28资讯网——每日最新资讯28at.com

在数学领域,证明定理或解释定理为何成立,不仅需要严密的逻辑推理能力,还需要从众多可能的解题路径中做出正确选择。如果DeepMind的见解正确,那么这些解题技巧将是未来构建通用人工智能模型不可或缺的要素。itf28资讯网——每日最新资讯28at.com

去年夏天,DeepMind曾展示过一个结合AlphaGeometry2与AlphaProof(一个专注于形式化数学推理的AI模型)的系统,该系统成功解答了2024年国际数学奥林匹克竞赛中的4道题目,占总数6题的2/3。这一成果预示着,类似的方法不仅限于几何问题,还有望拓展至数学乃至科学的其他领域,比如辅助复杂的工程计算。itf28资讯网——每日最新资讯28at.com

itf28资讯网——每日最新资讯28at.com

AlphaGeometry2的核心组件包括谷歌Gemini系列AI模型中的语言模型,以及一个强大的“符号引擎”。Gemini模型与符号引擎协同工作,符号引擎利用数学规则推导出问题的解决方案,并为给定的几何定理提供有效的证明。itf28资讯网——每日最新资讯28at.com

然而,将证明转化为AI可理解的格式并非易事,加之可用的几何训练数据稀缺,给研究带来了不小的挑战。为此,DeepMind为AlphaGeometry2的语言模型专门生成了合成数据,这些数据涵盖了超过3亿个不同复杂度的定理和证明,为AI的训练提供了坚实的基础。itf28资讯网——每日最新资讯28at.com

为了验证AlphaGeometry2的解题能力,研究团队从过去25年的国际数学奥林匹克竞赛中精选了45道几何题目,这些题目涉及线性方程和需要在平面上操作的几何对象。随后,他们将这些题目“转化”为一个包含50道题目的更大集合(部分题目因技术原因被拆分为两题)。据论文所述,AlphaGeometry2成功解答了其中的42题,得分超过了平均金牌得主的40.9分。itf28资讯网——每日最新资讯28at.com

尽管如此,AlphaGeometry2仍存在一定的局限性。例如,它无法处理涉及可变数量点、非线性方程和不等式的问题。尽管AlphaGeometry2并非首个达到几何问题金牌水平的AI系统,但它是首个在如此广泛的问题集上实现这一成就的系统。itf28资讯网——每日最新资讯28at.com

在另一组更具挑战性的题目测试中,AlphaGeometry2的表现略显不足。DeepMind团队额外选取了29道由数学专家提名但尚未出现在竞赛中的题目,AlphaGeometry2仅成功解答了其中的20题。itf28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
DeepSeek融资传闻引发热议,阿里股价大涨,AI新贵能否再创辉煌?
02-07
点击查看更多 +
全站最新
《哪吒之魔童闹海》上映11天,预测票房直冲110亿大关!
《哪吒之魔童闹海》上映11天,预测票房直冲110亿大关!
小米汽车提速上市,雷军亲自督战!金车标引发热议
小米汽车提速上市,雷军亲自督战!金车标引发热议
以旧换新政策升级,2300万辆乘用车迎来车市新机遇!
以旧换新政策升级,2300万辆乘用车迎来车市新机遇!
《神奇女侠》游戏重启耗资过亿,华纳游戏部门去年巨亏3亿
《神奇女侠》游戏重启耗资过亿,华纳游戏部门去年巨亏3亿
《怪物猎人:荒野》二测火爆开启,Steam在线人数已超25万!
《怪物猎人:荒野》二测火爆开启,Steam在线人数已超25万!
腾讯游戏全球领跑!2025年1月收入榜《王者荣耀》等再创佳绩
腾讯游戏全球领跑!2025年1月收入榜《王者荣耀》等再创佳绩
热门内容
  • DeepSeek两日连崩,官方回应:技术服务稳定性受多重因素挑战
  • 硅基流动携华为云首发DeepSeek R1&V3大模型推理服务,性能媲美高端GPU
  • DeepSeek大规模招聘,年薪百万岗位等你来,AI人才你准备好了吗?
  • DeepSeek出故障:深度思考与联网搜索功能齐“罢工”?
  • DeepSeek背后商业网络揭秘:梁文锋关联15家企业,商标申请竞争激烈
  • 硅基流动携手华为云昇腾,首发DeepSeek R1&V3推理服务,赋能开发者
  • 梁文峰:从对冲基金经理到DeepSeek创始人,如何改写AI版图?
  • DeepSeek故障再现,用户对话受阻,官方尚未回应
  • 三星Galaxy S25系列真机曝光,明日发布会将有何惊喜?
  • DeepSeek注册难,官方:遭大规模恶意攻击,稍后再试
  • DeepSeek走红全球,高薪招聘实习生,日薪最高可达千元!
  • DeepSeek凌晨发布Janus-Pro,多模态大模型性能超越OpenAI DALL-E 3
  • 三星Galaxy S25系列评测:AI大升级,Ultra版全面领跑
  • DeepSeek深夜发布Janus-Pro,性能超越OpenAI DALL-E 3引关注
  • 深度求索北京大招聘,核心研发岗高薪,实习生日薪可达千元
本栏最新
DeepMind AI破解数学奥赛几何题,金牌水平不在话下?
DeepMind AI破解数学奥赛几何题,金牌水平不在话下?
2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?
2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?
努比亚Z60 Ultra新系统内测:流畅性提升,这些故障终得修复!
努比亚Z60 Ultra新系统内测:流畅性提升,这些故障终得修复!
软银400亿美金大手笔!即将成为OpenAI最大投资方
软银400亿美金大手笔!即将成为OpenAI最大投资方
紫光新华三拥抱DeepSeek大模型,灵犀使能平台已纳管上架V3与R1版本
紫光新华三拥抱DeepSeek大模型,灵犀使能平台已纳管上架V3与R1版本
小米相册AI写真功能即将下线,你体验过吗?
小米相册AI写真功能即将下线,你体验过吗?

本文链接:http://www.28at.com/showinfo-45-10533-0.htmlDeepMind AI破解数学奥赛几何题,金牌水平不在话下?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI德国设新办,加速欧盟布局步伐

下一篇: 2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?

标签:
  • 热门焦点
  • 元宇宙终究没火过两年

    来源:传播体操在ChatGPT快速破圈的同时,元宇宙的热度却一泻千里。虽然互联网大厂们都没有否认元宇宙的长期想象力,但在行动上却都纷纷表示了对元宇宙短期前景的悲观。号称改变
  • 字节、腾讯、网易鏖战元宇宙背后,大厂究竟在争夺什么?

    正当互联网商业踌躇不前,互联网大厂为了在存量中的增长挤破头皮之时,元宇宙的概念被资本点燃。先是Facebook更名Meta正式进军元宇宙,然后字节跳动收购了一家VR硬
  • 如何对一款 NFT 项目进行价值评估?

    原文作者 | Othmane Senhaji Rhazi,Web 3 企业家.编译整理 | 黑米@白泽研究院我之所以成为一位大力倡导 Web3 和 NFT 领域的企业家,因为我相信我们正在见证社会
  • 冰墩墩NFT遇冷,价格跌80%,日成交仅3笔。

    “两日上涨千倍”并不存在,且冰墩墩NFT的市场热度远不及社交媒体所称的那样高。2月11日,获得国际奥委会授权的2022冬奥会吉祥物冰墩墩相关NFT产品在nWayPlay上线
  • 以太坊升级将会带来的5个改变

    以太坊自2015年诞生以来就广受欢迎,但最近其昂贵的交易费用和低可扩展性对执行复杂的应用程序产生了负面作用,用户对以太坊改进的需求也日益急迫。以太坊2.0已进
  • Meta正在研发元宇宙语音助手;广东省462家企业申请元宇宙商标

    今日《元宇宙新鲜事》有:扎克伯格透露正在为元宇宙研发语音助手;完美世界声明称不会以“元宇宙投资项目”等名义吸收资金。广东省申请元宇宙商标的企业达462家位
  • 元宇宙风归何处?

    元宇宙持续大火,在过去一段时间内,其屡次登上热点,吸引了一波又一波投资者。近期,在“2022中国·金鱼嘴元宇宙生态赋能大会”上,南京建邺区金鱼嘴基金街区宣布计划
  • 从4个方面解析2022年加密行业趋势

    作者:去月球基础设施瓶颈仍然存在尽管2021年公链基础设施之间的竞争显著升温,但关键瓶颈仍需解决。例如,以太坊作为DApp开发的顶级公链,仍然遭受网络拥塞和高额交
  • 利用元宇宙平台10天收入160万,风口还是虎口?

    美国Meta平台有限公司,也就是原来的脸书公司,9日宣布,公司旗下的虚拟现实应用《地平线世界》正式向美国和加拿大的18岁以上人群开放。这也是目前Meta推出的最具象
Top