Anthropic 发布 Claude Sonnet 5 主打廉价 Agent 场景 API 价格砍半直逼企业用户

Anthropic 周一正式发布 Claude Sonnet 5，将其定位为"以更低成本运行企业级 agent 的方案"，直接对标 OpenAI GPT-5 mini 和 Google Gemini 3 Flash。新模型输入价格 1.5 美元每百万 token、输出 7.5 美元每百万 token，较上一代 Sonnet 4.5 分别下降 50% 与 25%，速度提升 40%。CEO Dario Amodei 在旧金山办公室的媒体见面会上表示，"Sonnet 5 的目标是让每个业务流程都能负担得起模型驱动"。TechCrunch 记者 Kyle Wiggers 现场试用后反馈响应速度"接近 Haiku 却保留 Sonnet 的推理"。

能力提升

Anthropic 官方公布的基准显示，Sonnet 5 在 SWE-Bench Verified 编码基准得分 76.2%，超过前代 Sonnet 4.5 的 68.5%，也比 GPT-5 mini 高 4 个点。GPQA 通用推理得分 82.1%，OSWorld 电脑控制基准得分 47.8%，均创同价位模型最高纪录。上下文窗口扩展至 500K tokens，输入图像分辨率提升至 4096x4096。tool use 与并行调用能力显著改善，官方 SDK 推荐用于 web 浏览、代码运行、文件读写等多步骤 agent 场景。

价格策略

Sonnet 5 的输入 1.5 美元、输出 7.5 美元每百万 token 定价，将模型运行成本压至企业级 agent 大规模部署的门槛以下。以一个日均处理 100 万条客服对话的中大型企业为例，若每条对话平均 2000 token 输入、500 token 输出，日成本从 Sonnet 4.5 的 4750 美元降至 2437.5 美元。CFO 曾经"CFO 阻力"的 agent 项目现在预算易过。Anthropic 同步推出企业年度承诺套餐 Enterprise Commit，签订 1000 万美元起的年度用量可再折 15%。

企业客户

Anthropic 发布同日公布 12 家灯塔客户，包括 Snowflake、Databricks、Salesforce、Deloitte、Zoom、SAP、DoorDash、Instacart、Notion、Cursor、Vercel 和 Ramp。Notion CEO Ivan Zhao 表示已经全面切换到 Sonnet 5 作为默认 AI 助手模型。Cursor 联合创始人 Michael Truell 透露编程 agent 的默认模型切换后延迟下降 35%，用户 subscription 转化率上升 22%。Databricks CEO Ali Ghodsi 称其数据 agent 的推理成本降低到"客户不再问价"的程度。

竞争格局

OpenAI 上周刚发布 GPT-5 mini，输入价 1.2 美元、输出 6 美元每百万 token，价格略低于 Sonnet 5，但在 SWE-Bench 与 GPQA 上均落后 3 到 5 个点。Google Gemini 3 Flash 输入 0.75 美元、输出 3 美元，是三家中最便宜的，但工具调用与代码能力仍不敌 Anthropic。分析师 Ben Thompson 认为，Sonnet 5 的策略是"用能力换单价"，在 agent 场景中让客户宁愿多付一点换取更少的重试率与更好的准确度。DeepSeek V4 与 Qwen 3 也构成中国厂商侧压力。

实用建议

对北美华人开发者、创业者与企业中层，几条落地建议。第一，若你的应用已经在跑 Sonnet 4.5，可先切少量流量到 Sonnet 5 做 A/B 观察准确度与延迟。第二，编程与 tool use 密集场景优先切换，非核心 chatbot 可留在 Haiku 或 GPT-5 mini。第三，若一年支出预计超过 100 万美元，直接申请 Enterprise Commit 套餐可再省 15%。第四，Amazon Bedrock、Google Vertex AI、Microsoft Azure 均在 24 小时内上线 Sonnet 5，多云部署无缝切换。第五，个人开发者可通过 claude.ai Pro 或 Max 订阅直接体验。