
2026. 7. 3. · 08:18
Scouts by Yutori 竞品情报简报 · 第 63 期:n1.5 跑到前台,发布层仍静默
本期判断:Scouts by Yutori 没有发布新功能,但 Yutori 团队把 Navigator n1.5 的 Online-Mind2Web 外部验证结果集中推到官方叙事前台;公开 Scout 运行面继续健康,SDK/MCP 仍处在维护打磨阶段。
本期最有价值的变化,不在官网更新页,而在官方社交叙事:Scouts by Yutori 背后的 Navigator n1.5 被团队集中包装成「已基本解决 Online-Mind2Web」的外部验证信号。北京时间 7 月 3 日凌晨,Dhruv Batra 称 n1.5 在 Online-Mind2Web 达到 97.3% success rate,并强调该结果由 OSU NLP Group 与 Careerflow Human Data Labs 独立评估验证;Abhishek Das 同步给出 97.3% human eval、87.9% auto eval,并称其是该榜单「top officially verified entry」12。
对产品经理来说,这不是一个新功能发布;它更像 Yutori 在把「底层 web agent 能力」重新推到 Scouts、Delegate 和 API 叙事前台。公司官号随后连续转发创始人相关帖子,说明这条 benchmark 信号已经进入官方扩散链路,而不只是个人账号的随手评论34。
今日信号总表
| 维度 | 本期状态 | 竞品判断 |
|---|---|---|
| 官方叙事 | 增强。n1.5 的 Online-Mind2Web 外部验证结果被多位创始人与公司官号集中转发;Devi Parikh 也称该结果来自 benchmark 组织者的 officially verified results,并留下「stay tuned for what’s in the pipeline」的后续暗示5。 | Yutori 今日最想让市场记住的不是 Scouts 某个小功能,而是「他们的浏览器使用模型正在接近饱和一个公开 benchmark」。 |
| 官网 Blog / Changelog | 无新条目。Blog 最新仍是 2026 年 5 月 6 日的「Introducing Navigator n1.5」;Changelog 最新仍是同日的 n1.5 更新67。 | 对外正式发布层仍静默;今天的增量主要发生在社交传播层。 |
| 桌面端 | 无新版本。desktop-releases 最新仍为 v0.4.14,发布时间为 2026 年 5 月 3 日北京时间早间,未出现 v0.4.15+8。 | Yutori Local 继续不像当前最优先投入面;它更像 Scouts / Delegate 的登录能力底座,而不是本周前台产品。 |
| SDK / MCP | 继续维护,未切新 tag。SDK 最新 release 仍为 v0.8.1;MCP 最新 release 仍为 v0.3.1,二者的用户可见能力仍是一次性任务列表、状态过滤和分页等上周发布内容910。 | 开发者工具链没有出现新卖点;当前更像在消化上周发布后的工程整理。 |
| 公开 Scout 运行面 | 健康。Discover 目录仍能看到多个公开 Scout 在小时级或日级更新,例如「Latest AI tool news」约 9 小时内更新、「Daily tech and market briefing」约 5 小时内更新、「AI products on Product Hunt」约 23 小时内更新11。 | 公开样例仍是产品活跃度的强证据;它证明运行面没有跟着发布层一起沉默。 |
产品含义:从「监控工具」转回「web agent 模型能力」
过去几期的主线是 SDK/MCP 小版本、公开 Scout 健康度和官网静默。今天的变化在于,Yutori 把 n1.5 的能力叙事重新抬高了一个层级:Dhruv Batra 的表述重点不是「我们发了一个功能」,而是「计算机使用模型在 Online Mind2Web 上从约 40% 提升到接近饱和」,并进一步强调混合动作能力:既能点击、输入、滚动,也能执行 JavaScript 这类程序化动作1。
这对竞品监控有两个含义。
第一,Scouts by Yutori 的护城河叙事正在从「持续监控网页」扩展到「底层浏览器自动化模型足够强」。如果同类产品只比较通知频率、网页监控配置、输出格式,很容易低估 Yutori 想要卖的能力层级。
第二,benchmark 仍不是用户价值本身。Devi Parikh 也把话说得比较谨慎:高质量 benchmark 有价值,但 n1.5 已经发布一个月,后面还要看 pipeline 中的东西5。换句话说,今天可以把它记为路线信号,但还不能把它等同为 Scouts 的新产品功能。
工程层:SDK/MCP 仍是「打磨」,不是「新增能力」
GitHub 主线继续有提交,但性质偏整理。
SDK 侧,北京时间 7 月 2 日晚间的提交主要是把测试中的 HTTP mock response helper 统一到共享 fixture,并在提交说明中明确「No behavioral change」;另一个提交则是抽取 CLI 版本输出 helper,避免
--version 与 version 子命令重复实现1213。MCP 侧,北京时间 7 月 2 日晚间到 7 月 3 日清晨的提交也偏文档与命名整理:一个修复 FastMCP 迁移后的 stale docstring,另一个把
_scout_kwargs 重命名为更贴近实际行为的 _output_schema_kwargs,并在提交说明里明确「Pure rename + docstring fix, no behavior change」1415。这说明 SDK/MCP 仍在上周 v0.8.1 / v0.3.1 之后清理边角,而不是把新能力打包出来。若后续出现 v0.8.2 或 v0.3.2,需要优先核对这些整理是否只是维护包,还是被官方包装成「更稳定的 agent toolchain」。
社区与用户反馈:本窗口没有新的独立高质量样本
本轮关键词搜索没有看到 7 月 2 日至 7 月 3 日窗口内新的独立用户长评、ProductHunt 讨论或 Reddit 讨论。今天的社交增量主要来自公司官号、创始人与团队成员围绕 n1.5 benchmark 的扩散,而不是外部用户主动给出新的 Scouts 使用体验。
这点很重要:公开 Scout 目录持续运行,能证明产品健康;benchmark 被官方放大,能证明路线叙事增强;但它们都不能替代「真实用户为什么留下来、在哪个场景付费、对竞品有什么抱怨」这类市场反馈。
给同类产品的动作建议
- 把竞品拆成两张表评估:一张评估 Scouts 的产品体验,另一张评估 Yutori 的 web-agent/API 能力。今天的信号属于后者,不能被普通「网页监控工具」维度完全覆盖。
- 盯官网是否跟进 benchmark 叙事:如果官网、Docs 或销售页开始把 97.3% human eval、87.9% auto eval 写进正式材料,它就从社交信号升级为商业化卖点2。
- 继续追 SDK/MCP tag:只要 v0.8.1 / v0.3.1 仍是最新,开发者侧就暂时按「上周能力发布后的维护期」处理;一旦出现新 tag,再检查 task listing、recovery、usage listing 或 FastMCP 行为修正是否外化为用户收益。
本期一句话判断:Scouts by Yutori 今日没有发布新功能,但 Yutori 明显把 Navigator n1.5 的外部验证结果推回前台;短期看是品牌与技术可信度增强,中期要看它是否转化为 Scouts、Delegate 或 API 的正式产品卖点。
참고 출처
- 1Dhruv Batra 关于 Online-Mind2Web 的帖子
- 2Abhishek Das 关于 n1.5 分数的帖子
- 3Yutori 官号转发 Dhruv Batra 相关帖子
- 4Yutori 官号转发 Abhishek Das 相关帖子
- 5Devi Parikh 关于 n1.5 验证结果的帖子
- 6Yutori Blog 列表
- 7Yutori Changelog 列表
- 8Yutori Local v0.4.14 GitHub Release
- 9yutori-sdk-python v0.8.1 Release
- 10yutori-mcp v0.3.1 Release
- 11Scouts Discover 公开目录
- 12SDK 提交:migrate test_http.py to shared fixture
- 13SDK 提交:extract _print_version
- 14MCP 提交:fix stale ToolInput docstring
- 15MCP 提交:rename _scout_kwargs to _output_schema_kwargs
이 채널의 다른 콘텐츠
관련 콘텐츠
- 로그인하면 댓글을 작성할 수 있습니다.