当前位置:首页 > 元宇宙 > AI

DeepMind AI破解数学奥赛几何题,金牌水平不在话下?

来源: 责编: 时间:2025-02-08 08:26:23 152观看
导读近期,科技界迎来了一项令人瞩目的成就:谷歌DeepMind实验室的人工智能系统AlphaGeometry2,在攻克国际数学奥林匹克竞赛(IMO)中的几何难题上,取得了前所未有的突破,其解题能力甚至超越了历年的金牌平均水平。AlphaGeometry2是D

近期,科技界迎来了一项令人瞩目的成就:谷歌DeepMind实验室的人工智能系统AlphaGeometry2,在攻克国际数学奥林匹克竞赛(IMO)中的几何难题上,取得了前所未有的突破,其解题能力甚至超越了历年的金牌平均水平。UuX28资讯网——每日最新资讯28at.com

AlphaGeometry2是DeepMind在今年早些时候推出的AlphaGeometry系统的升级版。据DeepMind团队最新发布的论文显示,这一AI系统能够解答过去25年间国际数学奥林匹克竞赛中出现的84%的几何题目。国际数学奥林匹克竞赛作为面向全球高中生的顶级数学赛事,其难度与挑战性不言而喻。而DeepMind认为,探索解决复杂几何问题,尤其是欧几里得几何问题的新方法,或许能够为开发更强大的人工智能提供关键线索。UuX28资讯网——每日最新资讯28at.com

UuX28资讯网——每日最新资讯28at.com

在数学领域,证明定理或解释定理为何成立,不仅需要严密的逻辑推理能力,还需要从众多可能的解题路径中做出正确选择。如果DeepMind的见解正确,那么这些解题技巧将是未来构建通用人工智能模型不可或缺的要素。UuX28资讯网——每日最新资讯28at.com

去年夏天,DeepMind曾展示过一个结合AlphaGeometry2与AlphaProof(一个专注于形式化数学推理的AI模型)的系统,该系统成功解答了2024年国际数学奥林匹克竞赛中的4道题目,占总数6题的2/3。这一成果预示着,类似的方法不仅限于几何问题,还有望拓展至数学乃至科学的其他领域,比如辅助复杂的工程计算。UuX28资讯网——每日最新资讯28at.com

UuX28资讯网——每日最新资讯28at.com

AlphaGeometry2的核心组件包括谷歌Gemini系列AI模型中的语言模型,以及一个强大的“符号引擎”。Gemini模型与符号引擎协同工作,符号引擎利用数学规则推导出问题的解决方案,并为给定的几何定理提供有效的证明。UuX28资讯网——每日最新资讯28at.com

然而,将证明转化为AI可理解的格式并非易事,加之可用的几何训练数据稀缺,给研究带来了不小的挑战。为此,DeepMind为AlphaGeometry2的语言模型专门生成了合成数据,这些数据涵盖了超过3亿个不同复杂度的定理和证明,为AI的训练提供了坚实的基础。UuX28资讯网——每日最新资讯28at.com

为了验证AlphaGeometry2的解题能力,研究团队从过去25年的国际数学奥林匹克竞赛中精选了45道几何题目,这些题目涉及线性方程和需要在平面上操作的几何对象。随后,他们将这些题目“转化”为一个包含50道题目的更大集合(部分题目因技术原因被拆分为两题)。据论文所述,AlphaGeometry2成功解答了其中的42题,得分超过了平均金牌得主的40.9分。UuX28资讯网——每日最新资讯28at.com

尽管如此,AlphaGeometry2仍存在一定的局限性。例如,它无法处理涉及可变数量点、非线性方程和不等式的问题。尽管AlphaGeometry2并非首个达到几何问题金牌水平的AI系统,但它是首个在如此广泛的问题集上实现这一成就的系统。UuX28资讯网——每日最新资讯28at.com

在另一组更具挑战性的题目测试中,AlphaGeometry2的表现略显不足。DeepMind团队额外选取了29道由数学专家提名但尚未出现在竞赛中的题目,AlphaGeometry2仅成功解答了其中的20题。UuX28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
DeepSeek融资传闻引发热议,阿里股价大涨,AI新贵能否再创辉煌?
02-07
点击查看更多 +
全站最新
《哪吒之魔童闹海》上映11天,预测票房直冲110亿大关!
《哪吒之魔童闹海》上映11天,预测票房直冲110亿大关!
小米汽车提速上市,雷军亲自督战!金车标引发热议
小米汽车提速上市,雷军亲自督战!金车标引发热议
以旧换新政策升级,2300万辆乘用车迎来车市新机遇!
以旧换新政策升级,2300万辆乘用车迎来车市新机遇!
《神奇女侠》游戏重启耗资过亿,华纳游戏部门去年巨亏3亿
《神奇女侠》游戏重启耗资过亿,华纳游戏部门去年巨亏3亿
《怪物猎人:荒野》二测火爆开启,Steam在线人数已超25万!
《怪物猎人:荒野》二测火爆开启,Steam在线人数已超25万!
腾讯游戏全球领跑!2025年1月收入榜《王者荣耀》等再创佳绩
腾讯游戏全球领跑!2025年1月收入榜《王者荣耀》等再创佳绩
热门内容
  • DeepSeek两日连崩,官方回应:技术服务稳定性受多重因素挑战
  • 硅基流动携华为云首发DeepSeek R1&V3大模型推理服务,性能媲美高端GPU
  • DeepSeek大规模招聘,年薪百万岗位等你来,AI人才你准备好了吗?
  • DeepSeek出故障:深度思考与联网搜索功能齐“罢工”?
  • DeepSeek背后商业网络揭秘:梁文锋关联15家企业,商标申请竞争激烈
  • 硅基流动携手华为云昇腾,首发DeepSeek R1&V3推理服务,赋能开发者
  • 梁文峰:从对冲基金经理到DeepSeek创始人,如何改写AI版图?
  • DeepSeek故障再现,用户对话受阻,官方尚未回应
  • 三星Galaxy S25系列真机曝光,明日发布会将有何惊喜?
  • DeepSeek注册难,官方:遭大规模恶意攻击,稍后再试
  • DeepSeek走红全球,高薪招聘实习生,日薪最高可达千元!
  • DeepSeek凌晨发布Janus-Pro,多模态大模型性能超越OpenAI DALL-E 3
  • 三星Galaxy S25系列评测:AI大升级,Ultra版全面领跑
  • DeepSeek深夜发布Janus-Pro,性能超越OpenAI DALL-E 3引关注
  • 深度求索北京大招聘,核心研发岗高薪,实习生日薪可达千元
本栏最新
DeepMind AI破解数学奥赛几何题,金牌水平不在话下?
DeepMind AI破解数学奥赛几何题,金牌水平不在话下?
2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?
2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?
努比亚Z60 Ultra新系统内测:流畅性提升,这些故障终得修复!
努比亚Z60 Ultra新系统内测:流畅性提升,这些故障终得修复!
软银400亿美金大手笔!即将成为OpenAI最大投资方
软银400亿美金大手笔!即将成为OpenAI最大投资方
紫光新华三拥抱DeepSeek大模型,灵犀使能平台已纳管上架V3与R1版本
紫光新华三拥抱DeepSeek大模型,灵犀使能平台已纳管上架V3与R1版本
小米相册AI写真功能即将下线,你体验过吗?
小米相册AI写真功能即将下线,你体验过吗?

本文链接:http://www.28at.com/showinfo-45-10533-0.htmlDeepMind AI破解数学奥赛几何题,金牌水平不在话下?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI德国设新办,加速欧盟布局步伐

下一篇: 2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?

标签:
  • 热门焦点
  • 元宇宙的文旅赛道,还能如何发力?

    来源:X增强现实苹果推出Vision Pro,为XR行业注入一剂强心针。而在苹果开发者大会上迪士尼CEO鲍勃·艾格在宣布迪士尼与苹果达成合作,其Disney+流媒体服务将于Vision Pro
  • 元宇宙是投资中国的第五次重大机遇

    作者为凯思博投资董事长导语:投资逻辑要来自于人性在社会发展过程中的普遍规律,由第一性原理出发找出重大的投资机会来。1978年的改革开放到今天,中国总共经历了
  • 现在的元宇宙:一款低配版的科幻游戏

    在2021年的岁末之际,不禁感叹元宇宙元年之热闹,从元宇宙NFT头像,到元宇宙数字地产,再到元宇宙旅游景区等等,仿佛科幻感十足的元宇宙眨眼间就从人们的概念认知中完全
  • 冰墩墩NFT遇冷,价格跌80%,日成交仅3笔。

    “两日上涨千倍”并不存在,且冰墩墩NFT的市场热度远不及社交媒体所称的那样高。2月11日,获得国际奥委会授权的2022冬奥会吉祥物冰墩墩相关NFT产品在nWayPlay上线
  • 权限风波过后 X2Y2如何挑战OpenSea?

    继LooksRare之后,又一个OpenSea挑战者X2Y2来了。上周,X2Y2宣布向超过86万个OpenSea交易用户发放X2Y2通证空投,并启动了「挂单挖矿」的奖励机制。这场早期激励活动
  • 量子计算在未来能否提高区块链技术的效率

    区块链技术的主要成功之处在于对不透明的金融流程进行了去中心化的访问量子计算机的内在目标是解决传统计算机不可能解决的问题随着区块链技术的使用案例逐渐
  • NFTs正迎来数十亿美元的繁荣--NFT零工经济从业者开始暴赚

    当Stefan Prodanovic在13岁时开始尝试平面设计,与一位从事编程工作的学校朋友共同创作数字游戏时,他从未料到这个爱好会在他成年后变成一个相当有利可图的生意。
  • 头像类NFTs的统治能持续多久?

    在过去的一两年里,NFTs在互联网世界中掀起了一场风暴。今天,当我们想到NFTs时,我们主要想到的是那些充斥着我们的社交媒体屏幕的数字卡通--无聊猿、punks 和介于
  • TX加入的NFT数字收藏品,元宇宙的破圈之路?

    3月7日,澳大利亚 NFT 初创公司 Immutable 在新加坡淡马锡牵头的R资中以估值 25 亿美元完成2亿美元R资,腾讯参投。想必国人最熟知的应该就是TX,作为国内四大互联网

猜你喜欢

    SQL Error: select * from ***_ecms_news13 where id in(89,103,130,240,192,) limit 6
Top