当前位置:首页 > 元宇宙 > AI

地表最强编程 AI:Claude 4 系列登场,自动写代码 7 小时刷新世界纪录

来源: 责编: 时间:2025-05-26 14:57:54 122观看
导读 5 月 23 日消息,Anthropic 公司在北京时间今天(5 月 23 日) 0 点 30 分举办的活动中,推出了 Claude Opus 4 和 Claude Sonnet 4 新一代语言模型,在结构化推理、软件工程和自主代理行为等领域实现重大进步。Claude

5 月 23 日消息,Anthropic 公司在北京时间今天(5 月 23 日) 0 点 30 分举办的活动中,推出了 Claude Opus 4 和 Claude Sonnet 4 新一代语言模型,在结构化推理、软件工程和自主代理行为等领域实现重大进步。RfS28资讯网——每日最新资讯28at.com

RfS28资讯网——每日最新资讯28at.com

Claude Opus 4:复杂推理与软件开发的巅峰之作RfS28资讯网——每日最新资讯28at.com

援引博文介绍,Claude Opus 4 被定位为 Anthropic 迄今最强大的模型,专为处理复杂的推理流程和软件开发场景设计。RfS28资讯网——每日最新资讯28at.com

测试数据显示,该模型在 SWE-bench 基准测试(评估模型解决真实 GitHub 问题的能力)中准确率达到 72.5%;在 TerminalBench 测试(在多步骤终端代码生成任务中验证模型表现)中准确率为 43.2%。RfS28资讯网——每日最新资讯28at.com

更令人瞩目的是,Opus 4 在软件环境中展现出强大的自主行为,得益于改进的内存管理、更广泛的上下文保留以及更强大的内部规划机制,据 Rakuten 测试数据,可连续进行近 7 小时的代码生成和任务执行,刷新AI世界纪录,远超前代 Claude 3 Opus(不到 1 小时)。RfS28资讯网——每日最新资讯28at.com

RfS28资讯网——每日最新资讯28at.com

Anthropic 声称,其 AI 模型不是为了消除工作岗位,而是一种将日常工作自动化的工具。不过 marktechpost媒体认为,Claude 4系列问世后,将改变AI的使用方式,让AI从完成单一任务的辅助工具,转换为具备更强、更广泛功能的“AI同事”,可以自动工作几乎一个完整的工作班次。RfS28资讯网——每日最新资讯28at.com

Claude Sonnet 4:平衡性能与成本的通用选择RfS28资讯网——每日最新资讯28at.com

Claude Sonnet 4 取代了前代 Claude 3.5 Sonnet,以更稳定的架构提升速度与质量,同时未显著增加计算成本。该模型针对中规模部署优化,适合需要在成本与性能间权衡的场景。RfS28资讯网——每日最新资讯28at.com

尽管推理能力不及 Opus 4,但 Sonnet 4 继承了许多架构升级,支持多文件代码导航、中间工具使用和结构化文本处理,延迟表现更佳。它成为 Claude.ai 免费用户的默认模型,并通过 API 提供服务,适用于轻量开发工具、用户助手和分析流程。RfS28资讯网——每日最新资讯28at.com

技术亮点与部署方式RfS28资讯网——每日最新资讯28at.com

两款模型均具备混合推理能力,提供“快速模式”(Fast Mode)用于低延迟的简短对话任务,以及“扩展思考模式”(Extended Thinking Mode)用于需要深度推理和多轮代理行为的复杂任务。RfS28资讯网——每日最新资讯28at.com

这种双模式策略让用户能根据任务复杂度灵活分配计算资源。此外,Claude Opus 4 和 Sonnet 4 可通过 Anthropic 的 Claude API、Amazon Bedrock 和 Google Cloud Vertex AI 等多个云平台访问,支持从自主代理到代码分析等多种企业应用场景。RfS28资讯网——每日最新资讯28at.com

RfS28资讯网——每日最新资讯28at.com

RfS28资讯网——每日最新资讯28at.com

RfS28资讯网——每日最新资讯28at.com

RfS28资讯网——每日最新资讯28at.com

RfS28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-13153-0.html地表最强编程 AI:Claude 4 系列登场,自动写代码 7 小时刷新世界纪录

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 京东发布行业首个以供应链为核心的工业大模型 Joy industrial

下一篇: OpenAI 宣布“星际之门”首个国际部署项目落户阿联酋,并考虑扩张至亚太地区

标签:
  • 热门焦点
  • 元宇宙步入暗夜

    撰文 | 文烨豪元宇宙的故事,似乎讲不通了。 当下,刮起元宇宙热潮的Roblox股价已跌去大半,带头大哥Meta也正因元宇宙亏损深陷泥潭。 再看国内,从字节“派对岛&
  • 元宇宙火热的当下,我们该如何“身临其境”的体验元宇宙?

    元宇宙的余热依然没有过去,甚至大有星星之火开启燎原之势,元宇宙本身也从殿堂走向了民间,我们可以看到一些企业开始了元宇宙的探索,诸如中国电信全资控股子公司天
  • 现在的元宇宙:一款低配版的科幻游戏

    在2021年的岁末之际,不禁感叹元宇宙元年之热闹,从元宇宙NFT头像,到元宇宙数字地产,再到元宇宙旅游景区等等,仿佛科幻感十足的元宇宙眨眼间就从人们的概念认知中完全
  • 有人狂赚千倍,资金盘游戏日进上亿,元宇宙泡沫还能吹多久?

    你还不知道元宇宙?没关系。看看微软、Meta、英伟达的雄心壮志,便可领略元宇宙的辽阔。1月18日,微软宣布将以687亿美元收购动视暴雪,这是有史以来互联网领域最大的
  • 本周NFT领域重要资讯回顾

    NFT在苏富比拍卖是一波三折的吗?其实不完全如此,但本周在苏富比拍卖行发生了一系列有趣的事。与此同时,美联社因其最新的NFT销售被推到了风口浪尖,而Opensea正面临
  • 2022年去中心化交易所会崛起吗?

    “在某个时候,去中心化衍生品的交易量可能会超过去中心化现货交易所。”DEX 越来越多地转向第二层解决方案。“数字化金融市场的概念以及如何沿着以用户为中心
  • Web 3如何改变传统HR

    互联网自诞生以来,经历了三次迭代。Web1是第一阶段,包括ISP服务器上的个人网页或免费的虚拟主机服务。然后Web2出现了,它引入了动态的用户生成内容、互操作性、增
  • 下一个黄金赛道?NFT的碎片化!

    碎片化可能是我们一生中最重要的一个投资趋势,碎片化本身并不新鲜。它已经存在了400年之久。早在1602年,荷兰东印度公司是历史上第一家在公共证券交易所上市的公
  • 赵长鹏预测SoicalFi为今年主要驱动力,新的机会在哪里?

    作者:五火球教主前不久,赵长鹏在《财富》杂志印度版块刊登评论。他表示:“DeFi 在 2021 年出现了快速创新,我们可能会在 2022 年看到蓬勃发展的兴趣和创新,其中 Soc
Top