近日,Anthropic正式推出新一代中端大模型Claude Sonnet 5(代号Fennec),主打“旗舰级思考能力、中端成本效率”,成为该系列迄今Agent能力最强的版本,大幅缩小与旗舰Opus 4.8的性能差距。
性能层面,Sonnet 5实现跨越式升级。其SWE-bench Pro编程基准得分达63.2%,较前代提升5.1个百分点;OSWorld终端操作测试准确率飙升至80.4%,涨幅近20%。在GDPval-AA v2知识工作评测中,该模型以1618分小幅超越Opus 4.8,专业文书、数据分析能力达到旗舰水准。
该模型核心亮点为原生强化的Agent智能体能力。依托训练阶段海量工具调用、浏览器及终端操作轨迹数据,可自主规划任务、调用外设工具、闭环迭代执行,支持长时间无人值守自动化作业,补齐了中端模型复杂任务自主执行短板。同时,模型优化推理逻辑,幻觉率与迎合性回答比例显著降低,内置增强安全护栏,输出稳定性大幅提升。
成本方面,Sonnet 5定价仅为Opus 4.8的六成,标准定价输入每百万token 3美元、输出15美元,8月31日前限时优惠低至输入2美元、输出10美元。依托全新分词器,同等文本token占用更少,进一步降低实际使用成本。目前该模型已成为Claude免费及Pro用户默认模型,全面赋能企业自动化、编程开发、长文档分析等场景。
© 版权声明
文章收集自互联网,如有侵权,请联系删除