Anthropic正式发布Claude Sonnet 5：中端定位解锁旗舰级Agent能力

0 0 420

近日，Anthropic正式推出新一代中端大模型Claude Sonnet 5（代号Fennec），主打“旗舰级思考能力、中端成本效率”，成为该系列迄今Agent能力最强的版本，大幅缩小与旗舰Opus 4.8的性能差距。
性能层面，Sonnet 5实现跨越式升级。其SWE-bench Pro编程基准得分达63.2%，较前代提升5.1个百分点；OSWorld终端操作测试准确率飙升至80.4%，涨幅近20%。在GDPval-AA v2知识工作评测中，该模型以1618分小幅超越Opus 4.8，专业文书、数据分析能力达到旗舰水准。
该模型核心亮点为原生强化的Agent智能体能力。依托训练阶段海量工具调用、浏览器及终端操作轨迹数据，可自主规划任务、调用外设工具、闭环迭代执行，支持长时间无人值守自动化作业，补齐了中端模型复杂任务自主执行短板。同时，模型优化推理逻辑，幻觉率与迎合性回答比例显著降低，内置增强安全护栏，输出稳定性大幅提升。
成本方面，Sonnet 5定价仅为Opus 4.8的六成，标准定价输入每百万token 3美元、输出15美元，8月31日前限时优惠低至输入2美元、输出10美元。依托全新分词器，同等文本token占用更少，进一步降低实际使用成本。目前该模型已成为Claude免费及Pro用户默认模型，全面赋能企业自动化、编程开发、长文档分析等场景。