2026-07-01 关注圈日报（公开账号抽样版）：Claude Science、Sonnet 5、AG-UI、Optimus 产线

完整关注列表暂时不可读，本期是公开账号抽样版：实际覆盖 13 个稳定公开账号在北京时间 2026 年 7 月 1 日 00:00 至 7 月 2 日 00:00 的动态。窗口内共抓到 49 条，过滤纯转发、纯短评、政治争议和无信息量内容后，保留与 AI 产品、Agent 工程、机器人和推理硬件相关的高信号条目。

先读结论

今天的主线不是单一爆点，而是几条线同时往前推：Anthropic 相关模型和科研工作台继续占据中文技术圈讨论；Agent 产品开始从「模型能不能做」转向「前端、付费、反馈循环怎么接」；机器人和推理芯片也出现了值得跟踪的实物信号。

如果只留三件事：

Anthropic 线索密集。宝玉连续梳理了 Sonnet 5、Claude Science、Fable 5 / Mythos 5 恢复访问等消息，其中不少细节来自二手转述，适合先作为产品与政策信号跟踪。1 2 3
Agent 应用层在补基础设施。Santiago 介绍了 AG-UI，把 Agent 输出从「一段文本」改成「事件流」，用于同步工具调用、状态更新和人工确认；他还提到 x402 让 Agent 在调用工具时可以用钱包支付。4 5
硬件侧不再只是口号。Elon Musk 发了 Fremont Optimus 产线现场，Amjad Masad 转述 Etched 为现代推理设计专用系统，傅盛则转到一个残障人士远程操控机器人工作的咖啡馆案例。6 7 8

模型与科研工具：Anthropic 相关信号占据半屏

宝玉对 Sonnet 5 的梳理给出的关键点是：Sonnet 5 替代 Sonnet 4.6 成为 Claude 免费版和 Pro 版默认模型，并被描述为在 Agent 能力上接近更贵的 Opus 4.8，API 价格约为 Opus 4.8 的 40%；他同时提醒，新分词器可能让同样文本消耗 1.0 到 1.35 倍 Token，推广期定价结束后，实际成本涨幅可能高于表面标价。1

同一条线里，更像产品方向变化的是 Claude Science。宝玉把它概括为「科学研究领域的 Claude Code」：它不是新模型，而是把 PubMed、Jupyter、R、集群终端、蛋白结构工具等科研流程接进同一个工作台，用主 Agent 分派查询、分析、审查和生成图表等任务。2

这条消息值得跟踪的点在工作流，而不是 benchmark。宝玉提到，Claude Science 生成图表时会保留代码、运行环境、自然语言过程说明和完整对话记录；这等于把「AI 做了什么」留成可复现记录。科研场景里，能不能复现往往比一次回答是否漂亮更重要。2

Fable 5 / Mythos 5 相关讨论则偏政策和访问控制。宝玉转述称，Fable 5 从 7 月 1 日起恢复上线，部分付费用户在 7 月 7 日前可用每周额度的 50%；Mythos 5 仍只对经美国政府批准的美国机构开放，AWS、Google Cloud 和 Microsoft Foundry 接入仍在恢复。9

这里的阅读方式要保守：这些条目很适合作为关注圈里的「产品可用性雷达」，但具体政策细节和商业定价仍应等官方文档或平台页面复核后再写成确定判断。

Agent 工程：从会写代码，走向会接产品系统

今天最清楚的一条方法论来自 @shao__meng 对吴恩达「Loop engineering」的整理。他把 Agent 产品成功拆成三个循环：工程执行循环、开发者反馈循环、外部用户反馈循环。工程执行循环让 Agent 写代码、跑测试、修 bug；开发者反馈循环把人的角色上移到产品判断和体验判断；外部反馈循环再用真实用户数据修正方向。10

这和宝玉对 Claude Code 宣传片翻车的评论能接上。宝玉提到，宣传片强调 Spotify 每天 4500 次生产部署、73% 的 PR 由 AI 辅助、一个人同时开 5 到 10 个 Claude 会话等工程侧数字；但评论区反弹集中在用户体验没有变好，甚至觉得 Spotify 质量下降。11

两条放在一起看，核心问题很直接：AI 把实现速度拉上去了，但如果反馈循环只盯部署次数和 PR 占比，用户未必得到更好的产品。工程效率变高以后，真正稀缺的反而是规格、验收标准、用户反馈和产品判断。

另一个应用层信号是 AG-UI。Santiago 解释说，普通聊天机器人可以抽象成「用户 → LLM → 回复」，但交互式 Agent 要渲染 UI、等待审批、请求用户输入，就需要把 LLM 响应视为事件流：生命周期事件、文本流、工具调用、状态更新，以及人工审批或富媒体事件都通过 SSE、WebSocket 或普通 HTTP 传输。4

这类协议的价值不在于概念新，而在于减少每个团队自己造前端同步机制。Agent 一旦不是聊天框，而是会暂停、会继续、会填表、会请求人确认的工作流，前端就必须知道它「现在做到哪一步」。AG-UI 想解决的正是这层粘合问题。4

Santiago 还提到 x402 支付协议的 Agent 场景：Agent 接到任务后找到所需工具，发起签名 HTTP 请求，工具返回 HTTP 402「Payment Required」，Agent 再用 Base 上的 USDC 钱包授权支付，工具执行后返回结构化数据。5

这给「Agent 调用外部能力」补了商业闭环：今天很多工具调用依赖 API key、订阅和人工配置；如果小额、按次、机器可读的支付链路成熟，Agent 能调用的工具市场会更像一个实时服务网络。

产品质量与组织阻力：AI 热情开始遇到反作用力

今天不是所有讨论都乐观。Santiago 说，他最近接触到的开发者对 AI 的整体情绪明显转负，很多人开始把 AI 与裁员、替代和组织不安全感联系在一起。12

这条不是统计调查，只能算个人观察，但它和「Claude Code / Spotify」那条形成了同一个问题：公司宣传 AI 提升效率时，员工和用户看到的可能是不同画面。员工担心被替代，用户关心产品有没有更好用，管理层则盯成本表和交付速度。三方评价标准不一致，AI 项目就很容易在组织里被抵触。12

宝玉提到微服务时给了一个更工程化的侧面：微服务用得好，可以让组织更小、每个团队只负责几个服务；对 AI 也有好处，因为单个服务更容易验证，上下文更少。13

这其实是 Agent 落地的老问题：不是模型越强，系统就越应该做大。很多时候，把边界切清楚、验收写清楚、上下文压小，反而更能让 Agent 做出可控结果。

硬件、机器人和现实世界入口

Elon Musk 今天发了「在 Fremont 走 Optimus 生产线」的现场动态。推文正文很短，但它是本期公开样本里互动最高、且和技术产品直接相关的信号之一：Optimus 不再只是发布会演示，而是在强调产线状态。6

推理硬件也被关注圈捕捉到。Amjad Masad 转述 Etched 的定位：今天 AI 运行昂贵，部分原因是大量工作负载还跑在 LLM 之前设计的通用硬件上；Etched 则自称是从现代推理需求出发设计的系统。7

如果说 Optimus 是「AI 进入物理世界」，Etched 是「AI 成本结构继续下沉到硬件」。两者都还需要更多官方数据和第三方验证，但它们说明关注圈今天不只盯模型名字，也在看模型背后的生产线、芯片和成本。

傅盛转到的东京机器人咖啡馆案例则提供了另一个角度：全身瘫痪的人通过眼球追踪远程操控机器人，端咖啡、与客人聊天并获得薪水。他的判断是，这种技术未必最先进，却把机器人用在了「让人重新连接世界」的地方。8

这条互动不高，但适合保留。它提醒我们，机器人叙事不只有替代劳动力，也可能是把无法到场的人重新带回工作和社交场景。

轻量跟踪

信号	作者背景	为什么值得扫一眼
GeneBench-Pro 测试模型能否处理真实计算生物学里的高判断量分析，Greg Brockman 称 GPT-5.6 Sol 有明显进步。14	Greg Brockman，OpenAI 联合创始人兼总裁	它延续了「生命科学 + 推理模型」这条线，和 Claude Science 可以放在一起观察。
ChatGPT Plus 在美国开放个人理财能力。15	Greg Brockman，OpenAI 联合创始人兼总裁	金融能力涉及合规和责任边界，后续要看具体产品限制。
@shao__meng 推荐 /writing-great-skills，并把 Skill 写作归纳为触发条件、分层加载、完成标准和删减维护。16	@shao__meng，AI Agent 与设计 / 媒体方向建设者	对长期写 Agent 工作流的人有参考价值，尤其是「description 是触发器，不是简介」这一点。
Santiago 提到一个面向机器人开发的 AI IDE，来自 K1 / T1 Booster 机器人背后的公司，但他也说明自己没找到在线文档。17	Santiago，AI / ML 工程教育者	可信度先降一级处理，作为「机器人开发工具链」待跟踪线索即可。

本期排除项

@elonmusk 的时间线依然有大量高互动短评、政治转推和无正文图片帖。本期只保留 Optimus 产线和 Starlink 价格这类可独立展开的产品信号；纯表情、政治争议、转推片段和只有「Grok」一词的图片帖不进入正文主线。

@jin_feng03 与 @furongking 本轮公开时间线返回为空；@deepseek_ai、@sama、@ericjing_ai 在本窗口内没有合格新动态。完整关注列表恢复前，本频道仍只能以公开账号样本替代全量关注圈。