Sonnet 5:Anthropic 把代理能力下放到中端模型1×0:005:500:08开场0:42核心变化1:46努力程度2:54评测背景3:59安全边界5:08结尾0:08主播六月三十日,Anthropic 发布 Claude Sonnet 五。按 Anthropic 自己的说法,这是目前最有代理能力的 Sonnet 模型:会制定计划,会用浏览器和终端这类工具,也能在更长的任务里自己往前推进。听起来像常规升级,但这次真正要看的,是 Anthropic 正在把以前更接近 Opus 档位的能力,放进一个更便宜、更常用的模型层级里。0:42主播Anthropic 在发布稿里给出的定位很直接:Sonnet 五在代理搜索和计算机使用这类任务上,比 Sonnet 四点六明显更强;在部分高努力程度设置下,可以接近 Opus 四点八。价格也被放在同一张表里比较:Sonnet 五标准价格是每百万输入三美元、每百万输出十五美元,八月三十一日前还有每百万输入两美元、输出十美元的过渡价。Opus 四点八则是每百万输入五美元、输出二十五美元。1:23主播这意味着 Sonnet 五不是单纯追求最高能力。它更像是在回答一个更实际的问题:如果一个模型要跑在 Claude Code、企业自动化、数据分析和日常知识工作里,它能不能在成本还说得过去的时候,把任务做完,而不是中途停下来等人接手。1:46主播这次发布里还有一个容易被忽略的控制项:effort,也就是努力程度。Claude 平台文档说,Sonnet 五默认使用 high effort,用户还可以调到 low、medium、xhigh 或 max。这个参数不是硬性的 token 预算,而是一个行为信号,会影响模型愿意花多少计算和步骤来完成任务。文档还特别写到,medium effort 更像是从默认档降一档来省成本,xhigh 则面向更难的编码和长程代理任务。2:26主播把这个放回 Sonnet 五,就能看出 Anthropic 的产品意图。用户不只是选择一个模型名,还要在同一个模型里选工作强度。简单任务用低努力程度省钱,复杂任务调高,让模型多试几步。对于企业来说,这比「永远用最强模型」更接近真实部署:预算、延迟和可靠性要一起算。2:54主播Anthropic 用了两个背景评测来说明这种变化。一个是 BrowseComp。BrowseComp 论文把它描述成面向浏览代理的基准,包含一千二百六十六个问题,要求模型持续浏览网页,找到不好直接检索的信息。另一个是 OSWorld-Verified,XLANG Lab 的博客说,这个版本修复了三百多个任务和环境问题,目标是让计算机使用代理的评测更稳定、更可比。3:30主播这两类评测共同指向一件事:代理能力不只是会不会答题,而是能不能在信息分散、界面变化、路径不确定的时候继续推进。Anthropic 说 Sonnet 五在这些任务上比前代 Sonnet 覆盖了更宽的成本和性能区间。这个表述保守,但它透露的方向很清楚:Sonnet 档位正在承担更多真实执行层的工作。3:59主播安全部分同样不能跳过。Anthropic 在发布稿里说,Sonnet 五相对 Sonnet 四点六,整体不良行为率更低,在拒绝恶意请求、抵抗提示注入、幻觉和迎合性方面都有改善。不过它也承认,在自动行为审计里,Sonnet 五的不良行为率仍高于更强的 Opus 四点八和 Mythos Preview。4:27主播网络安全评估更微妙。Anthropic 说它没有刻意训练 Sonnet 五做网络安全任务;在 Firefox 漏洞利用评测里,两个 Sonnet 模型都没有做出完整可用的利用,成功率是零,但 Sonnet 五的部分成功率略高于 Sonnet 四点六。Claude Help Center 对实时网络安全护栏的说明也能接上这一点:Opus 和 Sonnet 会默认拦截明显禁止的用途,以及部分高风险双用途网络安全活动,防守方需要通过 Cyber Verification Program 申请调整。5:08主播所以,Sonnet 五的看点不在一句「更强」上。它把三个东西绑在一起:更接近 Opus 的代理能力,更细的努力程度控制,以及默认开启的安全护栏。对开发者和企业用户来说,问题会从「哪个模型最聪明」变成「哪一档模型、哪一种努力程度、在哪些护栏下,能稳定完成这类工作」。这也是 Anthropic 这次更新最值得继续观察的地方。