Anthropic 周一正式发布 Claude Sonnet 5,将其定位为"以更低成本运行企业级 agent 的方案",直接对标 OpenAI GPT-5 mini 和 Google Gemini 3 Flash。新模型输入价格 1.5 美元每百万 token、输出 7.5 美元每百万 token,较上一代 Sonnet 4.5 分别下降 50% 与 25%,速度提升 40%。CEO Dario Amodei 在旧金山办公室的媒体见面会上表示,"Sonnet 5 的目标是让每个业务流程都能负担得起模型驱动"。TechCrunch 记者 Kyle Wiggers 现场试用后反馈响应速度"接近 Haiku 却保留 Sonnet 的推理"。
能力提升
Anthropic 官方公布的基准显示,Sonnet 5 在 SWE-Bench Verified 编码基准得分 76.2%,超过前代 Sonnet 4.5 的 68.5%,也比 GPT-5 mini 高 4 个点。GPQA 通用推理得分 82.1%,OSWorld 电脑控制基准得分 47.8%,均创同价位模型最高纪录。上下文窗口扩展至 500K tokens,输入图像分辨率提升至 4096x4096。tool use 与并行调用能力显著改善,官方 SDK 推荐用于 web 浏览、代码运行、文件读写等多步骤 agent 场景。
价格策略
Sonnet 5 的输入 1.5 美元、输出 7.5 美元每百万 token 定价,将模型运行成本压至企业级 agent 大规模部署的门槛以下。以一个日均处理 100 万条客服对话的中大型企业为例,若每条对话平均 2000 token 输入、500 token 输出,日成本从 Sonnet 4.5 的 4750 美元降至 2437.5 美元。CFO 曾经"CFO 阻力"的 agent 项目现在预算易过。Anthropic 同步推出企业年度承诺套餐 Enterprise Commit,签订 1000 万美元起的年度用量可再折 15%。
企业客户
Anthropic 发布同日公布 12 家灯塔客户,包括 Snowflake、Databricks、Salesforce、Deloitte、Zoom、SAP、DoorDash、Instacart、Notion、Cursor、Vercel 和 Ramp。Notion CEO Ivan Zhao 表示已经全面切换到 Sonnet 5 作为默认 AI 助手模型。Cursor 联合创始人 Michael Truell 透露编程 agent 的默认模型切换后延迟下降 35%,用户 subscription 转化率上升 22%。Databricks CEO Ali Ghodsi 称其数据 agent 的推理成本降低到"客户不再问价"的程度。
竞争格局
OpenAI 上周刚发布 GPT-5 mini,输入价 1.2 美元、输出 6 美元每百万 token,价格略低于 Sonnet 5,但在 SWE-Bench 与 GPQA 上均落后 3 到 5 个点。Google Gemini 3 Flash 输入 0.75 美元、输出 3 美元,是三家中最便宜的,但工具调用与代码能力仍不敌 Anthropic。分析师 Ben Thompson 认为,Sonnet 5 的策略是"用能力换单价",在 agent 场景中让客户宁愿多付一点换取更少的重试率与更好的准确度。DeepSeek V4 与 Qwen 3 也构成中国厂商侧压力。
实用建议
对北美华人开发者、创业者与企业中层,几条落地建议。第一,若你的应用已经在跑 Sonnet 4.5,可先切少量流量到 Sonnet 5 做 A/B 观察准确度与延迟。第二,编程与 tool use 密集场景优先切换,非核心 chatbot 可留在 Haiku 或 GPT-5 mini。第三,若一年支出预计超过 100 万美元,直接申请 Enterprise Commit 套餐可再省 15%。第四,Amazon Bedrock、Google Vertex AI、Microsoft Azure 均在 24 小时内上线 Sonnet 5,多云部署无缝切换。第五,个人开发者可通过 claude.ai Pro 或 Max 订阅直接体验。