Anthropic 快报:Sonnet 5 上线,Science 工作台同步开放
2026. 7. 1. · 04:02

Anthropic 快报:Sonnet 5 上线,Science 工作台同步开放

Anthropic 发布 Claude Sonnet 5,把接近 Opus 4.8 的代理、编码和专业工作能力推向更低价格层;同日推出 Claude Science,开始把 Claude 包进科研工作流。本文梳理可用范围、价格、安全边界和企业采购需要复算的成本点。

6 月 30 日,Anthropic 同时给出两条产品信号:Claude Sonnet 5 正式上线,主打把接近 Opus 4.8 的代理、编码和专业工作能力放到更低价格层;同日开放 Claude Science,把 Claude 包成面向科研流程的工作台。前者影响开发者和企业的模型采购成本,后者说明 Anthropic 正在把 Claude 从通用模型推向垂直工作流。12

先看 Sonnet 5:能力下沉到默认档

Anthropic 称 Sonnet 5 是目前「最具代理能力」的 Sonnet 模型,可以制定计划、调用浏览器和终端等工具,并以几个月前更大、更贵模型才有的水平自主运行;它已面向所有套餐开放,并成为 Free 和 Pro 用户的默认模型,也进入 Claude Code 和 Claude Platform。1
Claude Sonnet 5 基准对比表
Sonnet 5 在 Anthropic 公布的多项评测中缩小了与 Opus 4.8 的差距,图中数值来自 Anthropic 官方发布。1
关键不是「又多一个模型名」,而是 Sonnet 档位的角色变了。Anthropic 公布的表格显示,Sonnet 5 在 SWE-bench Pro 上为 63.2%,高于 Sonnet 4.6 的 58.1%;在 Terminal-Bench 2.1 上为 80.4%,接近 Opus 4.8 的 82.7%;在 GDPval-AA v2 上为 1618,略高于 Opus 4.8 的 1615。1
对企业用户来说,这意味着以前需要用 Opus 级模型试跑的部分代理任务,可能开始转向 Sonnet 层做规模化部署。VentureBeat 的解读也把这次发布归纳为「接近旗舰性能、中档价格」,并指出 Anthropic 正在用更便宜的代理能力争取更广的企业开发者采用。3

成本看起来更低,但账要自己重算

Sonnet 5 的 API 首发价到 2026 年 8 月 31 日为每百万输入 tokens 2 美元、每百万输出 tokens 10 美元;之后标准价变为 3 美元和 15 美元。作为参照,Anthropic 在同一篇公告中列出的 Opus 4.8 价格为每百万输入 tokens 5 美元、每百万输出 tokens 25 美元。1
但预算团队不能只看单价。Anthropic 在脚注中说明,Sonnet 5 使用更新后的 tokenizer,同一输入可能映射为原来的 1.0 到 1.35 倍 tokens,具体取决于内容类型;官方称首发价的设计目标是让迁移期大致成本中性。1
所以,短期判断可以这样做:如果你的工作流主要是代码代理、浏览器/终端工具调用、多步办公自动化,Sonnet 5 值得立刻跑一轮 A/B;如果你的成本主要由超长上下文、批量文档或高重复输入驱动,迁移前要用真实日志重新计算 token 数,而不是直接按单价降幅估预算。

安全口径:比上一代稳,但不是无边界放开

Anthropic 的安全评估称,Sonnet 5 相比 Sonnet 4.6 的不良行为率更低,在代理场景中更能拒绝恶意请求和抵抗 prompt injection;不过它在部分错位行为评估上仍高于 Opus 4.8 和 Claude Mythos Preview。1
这也是为什么 Anthropic 给 Sonnet 5 默认启用了实时网络安全防护。官方说,这些防护会实时检测并阻断危险网络安全用途;同时,Sonnet 5 在危险网络能力评估上明显弱于 Opus 4.8 和 Mythos 5。1
企业采购时要把这点拆成两件事:一方面,Sonnet 5 可能降低代理工作流的成本门槛;另一方面,高风险网络安全、合规审查和自主执行权限仍需要单独的使用边界,不能因为模型更便宜就放松审批。

Claude Science:不是新模型,而是行业工作台

同日发布的 Claude Science 方向不同。Anthropic 把它定义为面向科学家的 AI 工作台:整合科研常用工具和软件包,产出可审计 artifacts,并提供灵活计算资源;beta 版本面向 Pro、Max、Team 和 Enterprise 用户开放。2
它的产品重点不是「生物学更强的新模型」。TechCrunch 援引 Anthropic 的说明称,Claude Science 运行的是现有 Claude 模型,包括 Claude Opus 4.8,没有特殊模型访问或额外 gating;真正新增的是科研流程入口。4
具体能力包括:面向基因组学、单细胞、蛋白质组学、结构生物学和化学信息学的 60 多个预配置技能与连接器;主协调 agent 可以派生 specialist agents;reviewer agent 会检查引用和计算,标记并修正错误。2
计算层也有明确合作信号。Anthropic 称 Claude Science 可在本地 macOS/Linux、远程机器、SSH 或 HPC 登录节点运行,并可连接 Modal 做按需计算;Modal 的公告进一步说明,研究者连接自己的 Modal workspace 后,需要 GPU 或大量并发 CPU 的任务可自动路由到 Modal sandboxes。25

接下来该盯什么

第一,Sonnet 5 会不会替代一部分 Opus 用量。 Anthropic 已经把它放到默认档,并用价格把开发者推向规模化测试;接下来要看 Claude Code、企业 API 和云市场里的真实迁移速度。
第二,8 月 31 日之后的价格与 token 膨胀。 如果首发期后单价回到 3/15 美元,而 tokenizer 又让某些工作负载 token 数上升,实际账单可能不像发布页看起来那么直观。1
第三,Claude Science 能否复制 Claude Code 的垂直路径。 TechCrunch 的判断是,Anthropic 正在押注行业工作流产品,而不仅是原始模型能力;科学、法律、金融、工程这类专业场景,可能会成为下一轮模型公司的分发战场。4
一句话结论:Sonnet 5 是 Anthropic 把代理能力推向更便宜、更广入口的动作;Claude Science 则是把同一套 Claude 能力包进科研工作流。前者影响模型采购和开发者迁移,后者影响 Anthropic 能否在垂直行业里拿到更深的使用场景。

관련 콘텐츠

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.

  • 로그인하면 댓글을 작성할 수 있습니다.