Anthropic 快报：Sonnet 5 上线，Science 工作台同步开放 (2026)

6 月 30 日，Anthropic 同时给出两条产品信号：Claude Sonnet 5 正式上线，主打把接近 Opus 4.8 的代理、编码和专业工作能力放到更低价格层；同日开放 Claude Science，把 Claude 包成面向科研流程的工作台。前者影响开发者和企业的模型采购成本，后者说明 Anthropic 正在把 Claude 从通用模型推向垂直工作流。1 2

先看 Sonnet 5：能力下沉到默认档

Anthropic 称 Sonnet 5 是目前「最具代理能力」的 Sonnet 模型，可以制定计划、调用浏览器和终端等工具，并以几个月前更大、更贵模型才有的水平自主运行；它已面向所有套餐开放，并成为 Free 和 Pro 用户的默认模型，也进入 Claude Code 和 Claude Platform。1

Claude Sonnet 5 基准对比表 — Sonnet 5 在 Anthropic 公布的多项评测中缩小了与 Opus 4.8 的差距，图中数值来自 Anthropic 官方发布。1

关键不是「又多一个模型名」，而是 Sonnet 档位的角色变了。Anthropic 公布的表格显示，Sonnet 5 在 SWE-bench Pro 上为 63.2%，高于 Sonnet 4.6 的 58.1%；在 Terminal-Bench 2.1 上为 80.4%，接近 Opus 4.8 的 82.7%；在 GDPval-AA v2 上为 1618，略高于 Opus 4.8 的 1615。1

对企业用户来说，这意味着以前需要用 Opus 级模型试跑的部分代理任务，可能开始转向 Sonnet 层做规模化部署。VentureBeat 的解读也把这次发布归纳为「接近旗舰性能、中档价格」，并指出 Anthropic 正在用更便宜的代理能力争取更广的企业开发者采用。3

成本看起来更低，但账要自己重算

Sonnet 5 的 API 首发价到 2026 年 8 月 31 日为每百万输入 tokens 2 美元、每百万输出 tokens 10 美元；之后标准价变为 3 美元和 15 美元。作为参照，Anthropic 在同一篇公告中列出的 Opus 4.8 价格为每百万输入 tokens 5 美元、每百万输出 tokens 25 美元。1

但预算团队不能只看单价。Anthropic 在脚注中说明，Sonnet 5 使用更新后的 tokenizer，同一输入可能映射为原来的 1.0 到 1.35 倍 tokens，具体取决于内容类型；官方称首发价的设计目标是让迁移期大致成本中性。1

所以，短期判断可以这样做：如果你的工作流主要是代码代理、浏览器/终端工具调用、多步办公自动化，Sonnet 5 值得立刻跑一轮 A/B；如果你的成本主要由超长上下文、批量文档或高重复输入驱动，迁移前要用真实日志重新计算 token 数，而不是直接按单价降幅估预算。

安全口径：比上一代稳，但不是无边界放开

Anthropic 的安全评估称，Sonnet 5 相比 Sonnet 4.6 的不良行为率更低，在代理场景中更能拒绝恶意请求和抵抗 prompt injection；不过它在部分错位行为评估上仍高于 Opus 4.8 和 Claude Mythos Preview。1

这也是为什么 Anthropic 给 Sonnet 5 默认启用了实时网络安全防护。官方说，这些防护会实时检测并阻断危险网络安全用途；同时，Sonnet 5 在危险网络能力评估上明显弱于 Opus 4.8 和 Mythos 5。1

企业采购时要把这点拆成两件事：一方面，Sonnet 5 可能降低代理工作流的成本门槛；另一方面，高风险网络安全、合规审查和自主执行权限仍需要单独的使用边界，不能因为模型更便宜就放松审批。

Claude Science：不是新模型，而是行业工作台

同日发布的 Claude Science 方向不同。Anthropic 把它定义为面向科学家的 AI 工作台：整合科研常用工具和软件包，产出可审计 artifacts，并提供灵活计算资源；beta 版本面向 Pro、Max、Team 和 Enterprise 用户开放。2

它的产品重点不是「生物学更强的新模型」。TechCrunch 援引 Anthropic 的说明称，Claude Science 运行的是现有 Claude 模型，包括 Claude Opus 4.8，没有特殊模型访问或额外 gating；真正新增的是科研流程入口。4

具体能力包括：面向基因组学、单细胞、蛋白质组学、结构生物学和化学信息学的 60 多个预配置技能与连接器；主协调 agent 可以派生 specialist agents；reviewer agent 会检查引用和计算，标记并修正错误。2

计算层也有明确合作信号。Anthropic 称 Claude Science 可在本地 macOS/Linux、远程机器、SSH 或 HPC 登录节点运行，并可连接 Modal 做按需计算；Modal 的公告进一步说明，研究者连接自己的 Modal workspace 后，需要 GPU 或大量并发 CPU 的任务可自动路由到 Modal sandboxes。2 5

接下来该盯什么

第一，Sonnet 5 会不会替代一部分 Opus 用量。 Anthropic 已经把它放到默认档，并用价格把开发者推向规模化测试；接下来要看 Claude Code、企业 API 和云市场里的真实迁移速度。

第二，8 月 31 日之后的价格与 token 膨胀。 如果首发期后单价回到 3/15 美元，而 tokenizer 又让某些工作负载 token 数上升，实际账单可能不像发布页看起来那么直观。1

第三，Claude Science 能否复制 Claude Code 的垂直路径。 TechCrunch 的判断是，Anthropic 正在押注行业工作流产品，而不仅是原始模型能力；科学、法律、金融、工程这类专业场景，可能会成为下一轮模型公司的分发战场。4

一句话结论：Sonnet 5 是 Anthropic 把代理能力推向更便宜、更广入口的动作；Claude Science 则是把同一套 Claude 能力包进科研工作流。前者影响模型采购和开发者迁移，后者影响 Anthropic 能否在垂直行业里拿到更深的使用场景。

Anthropic 快报：Sonnet 5 上线，Science 工作台同步开放

先看 Sonnet 5：能力下沉到默认档

成本看起来更低，但账要自己重算

安全口径：比上一代稳，但不是无边界放开

Claude Science：不是新模型，而是行业工作台

接下来该盯什么

참고 출처

관련 콘텐츠