人工智能领域迎来新一轮技术突破,Anthropic公司近日正式推出Claude Sonnet 4.5模型,该产品被官方定义为全球最强的代码生成模型、复杂智能体构建工具及计算机交互系统。这款新一代模型不仅在核心能力上实现突破,更配套推出完整的开发者工具链,引发行业广泛关注。
在专业评测中,Claude Sonnet 4.5展现出显著优势。SWE-bench Verified基准测试显示,其真实世界软件编码能力达到77.2%的准确率,较前代提升近20个百分点。在OSWorld计算机操作基准测试中,该模型以61.4%的完成率领先行业,相比四个月前42.2%的纪录实现跨越式进步。金融、法律、医学等领域的专家验证表明,模型在专业领域推理能力较Opus 4.1提升30%以上。
技术团队重点突破了智能体系统的三大难题:长期任务记忆管理、自主性与用户控制的平衡机制、多智能体协同框架。配套发布的Claude Agent SDK开放了这些核心技术,开发者可基于该工具包构建自定义智能体。这套曾用于内部开发Claude Code的基础设施,现已向全球开发者全面开放。
产品生态迎来全面升级。Claude Code 2.0版本重构用户界面,新增VS Code扩展插件及检查点功能,用户可通过双按Esc键或输入/rewind指令快速回滚代码修改。API服务新增上下文编辑器和记忆工具,支持智能体完成更复杂的持续任务。Chrome扩展程序已向等待列表用户开放,代码执行和文件创建功能直接嵌入对话界面。
安全体系构建了多重防护机制。模型通过AI安全等级3(ASL-3)认证,配备化学、生物、放射性及核武器相关内容的分类检测系统。误报率较初代系统降低90%,当检测到潜在风险时,用户可无缝切换至Sonnet 4模型继续对话。安全训练显著减少了模型迎合性回答、虚假信息及权力寻求等异常行为。
创新功能"Imagine with Claude"开启限时预览,该实验性功能允许模型实时动态生成软件。在五天试用期内,Max订阅用户可体验无预设代码的交互式开发过程,观察系统根据用户指令即时创建并调整软件功能。这项突破性尝试为AI软件工程开辟了新路径。
性能实测引发技术社区讨论。开发者使用物理模拟测试用例进行验证时发现,模型在复杂系统建模方面仍有改进空间。测试案例要求模拟弹力球正方体的分层塌方过程,实际运行中出现两层后停止下落的异常情况。官方同时公布了标准化测试方法,SWE-bench Verified采用10次试验平均值,OSWorld进行4次运行取均值,多语言测试覆盖14种非英语语言。
商业策略保持价格竞争力,API调用费用与前代持平,每百万token输入3美元、输出15美元。开发者可通过claude-sonnet-4-5接口直接调用最新模型。配套发布的工具链和安全机制,使这款模型在专业开发场景中展现出独特价值。
更多>同类资讯“悟空”类脑计算机:模拟猕猴大脑 开启神经拟态计算新篇章09-30Anthropic发布Claude Sonnet 4.5:编码性能跃升,安全与自主性全面升级09-30张宏院士深圳讲堂:以AI赋能机器人 开启开放世界“生活”新篇近日,第五十四期院士讲堂在深圳开讲,加拿大工程院院士、南方科技大学电子与电气工程系讲席教授张宏院士带来了《人工智能与机器人——导航与操作任务中的应用》的精彩演讲,吸引了来自人工智能、机器人等领域的专家学者、高…09-30青春筑梦智慧城:以专业之力绘就高效便捷现代生活新画卷智慧城市运用大数据、人工智能、物联网等前沿技术,让交通、医疗、教育、政务、能源等系统更加智能、高效和人性化。智能红绿灯能缓解拥堵,手机APP可一键办理政务,智慧社区提升居住安全与便利。着力建设便捷高效的智慧城…09-30国产AI服务器新突破:8.9毫秒响应+百万token仅1元,智能体产业化加速你问一句话、它生成一段代码,背后都是成千上万个token在燃烧,都是真金白银。 浪潮这次的双重突破,给咱们提了个醒:AI竞争的焦点,正在从过去一味地“卷参数”、“拼大模型”,转向更务实、更硬核的“速度”和“成…09-30华为亮相2025青岛国际城轨展,携全栈方案共绘城轨智能化新蓝图作为全球领先的ICT(信息与通信技术)解决方案供应商,华为以“跃升城轨行业智能化”为主题,携城轨智能化、数智平台、运营通信、自主创新、服务、伙伴联合创新等领域的方案及行业实践成果重磅亮相,全面展示了在城轨领域…09-30成都发布具身智能攻坚方案:2027年产业规模超500亿 实施五大行动23项举措9月29日,成都市经信局市新经济委在成都市民营经济发展促进中心举办“进解优促”面对面·供需对接“攻坚周”——人工智能产业链企业系列活动。 在工作举措上,此次方案提出要实施优势赛道攻坚、关键技术攻关、公共平台…09-30AI成年轻人旅行“智囊”:从攻略制定到旅途应急,让出行更轻松09-30华为人事新动态:余承东出任产品投资评审委员会主任,聚焦AI核心战略09-30国家邮政局通过新规:强化技术供给与创新赋能 推动产业协同发展09-30DeepSeek新模型DeepSeek-V3.2-Exp上线,引入DSA机制,开源双版本算子还降价09-30华为云率先适配DeepSeek-V3.2-Exp模型,ModelArts平台提供高效推理服务09-30DeepSeek与寒武纪同步发力:新模型发布与适配优化共启AI新篇09-30国际支付巨头Visa迎新帅:张文翊接棒大中华区总裁,多元履历赋能支付新未来09-30DeepSeek-V3.2-Exp模型开源发布,华为云MaaS平台部署采用长序列亲和并行策略09-30点击查看更多 +全站最新
中高考冲刺利器!科大讯飞T30 Lite学习机AI助力,精准提分更高效
长安马自达EZ-60全球首秀:携王心凌共赴电动之约,以魂动美学重塑新能源出行
长安马自达EZ-60上市,11.99万起售!王心凌代言,共启电动出行新旅程
雷军年度演讲揭秘:玄戒芯片与小米汽车背后,五年蜕变铸就硬核科技路
《小米17系列市场探访:Pro Max售罄与标准版滞销的冷热交织》
从背屏创新到“人车家全生态”,高端化后的小米开启硬核科技新征程热门内容
第22届东博会AI元素亮眼:数字智能体引路 机器人炫技展风采
AI云竞争下半场:华为以超节点、企业Agent等破局,谁能领跑产业?
2025网安周:每日互动刘宇谈AI时代,知识安全成关键,共筑数字新未来
中国大模型DeepSeek首登Nature封面,R1训练成本仅约208万引关注
华为全联接大会2025启幕,发布全球最强算力超节点与集群
有鹿机器人+连合直租:以智能租赁模式,开启高端场景清洁新未来
本文链接:http://www.28at.com/showinfo-45-28412-0.htmlAnthropic发布Claude Sonnet 4.5:代码与智能体构建能力飙升,构建工具同步开放
声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com