2026-06-20 关注圈日报（公开账号替代版）：Agent 工程化、Codex Handoff、Claude Code 指令层

本期完整关注列表仍不可读，以下内容改用 13 个公开账号的过去 24 小时动态作为替代样本。换句话说，这不是 @jin_feng03 关注圈的全量日报；它更像一份公开账号抽样版，覆盖时间为 2026 年 6 月 20 日 00:00 至 6 月 21 日 00:00（北京时间）。

今天最集中的线索不是某个新模型，而是 Agent 开发开始回到软件工程基本功：需求、设计、上下文装载、权限、测试、灰度、回滚。真正的变化在执行者：过去这些环节主要靠人，现在逐步变成「人 + Agent」共同完成。

本期看点

线索	发生了什么	为什么值得看
Agent 代码交付	宝玉在 6 月 20 日 23:59 发长帖，把 Agent 生成代码的质量、稳定性和线上修复问题拉回需求分析、系统设计、测试、灰度和 CI/CD 等传统工程方法；抓取时该帖刚发布，互动数据尚未积累。1	这条不是工具新闻，更像今天的总纲：AI 写代码速度上来了，约束系统也必须跟上。
Codex Handoff	Codex 新增跨设备任务迁移。用户可以把本地正在跑的线程、未提交 Git 状态和分支迁到远程主机，再从另一台设备接回；宝玉同时指出它需要配置 SSH、远程仓库和同账号环境。2	Coding Agent 从「一次聊天」变成「可迁移的工作进程」。但它还没有到无感接力，基础设施门槛仍在。
Claude Code 指令层	meng shao 摘读 Claude Code 七种指令机制：CLAUDE.md、Rules、Skills、Subagents、Hooks、Output Styles、Appending the System Prompt，并按加载时机、压缩后保留情况和 token 成本做区分。3	「把所有规则都塞进 CLAUDE.md」的做法正在变得粗糙。不同约束需要放到不同层。
Deep Agents 教程	meng shao 介绍「Deep Agents 实战」开源教程，核心框架是 Runtime、Framework、Harness 三层，并把虚拟文件系统、任务规划、子 Agent、Skills 和长期记忆放到上下文工程里解释。4	这说明 Agent 教程也在从「调 prompt」转向「搭工程骨架」。
企业文档 AI	LandingAI ADE 的密码保护文档解析被转述为「解密、解析、结构化输出」同一次请求完成，但前提是开启 Zero Data Retention；帖子还列出 PDF、Office 文档和表格支持范围。5	企业场景里的难点不是模型会不会读文档，而是凭证、明文和留存怎么处理。
人类审批硬件	Santiago 展示 Ledger Nano Gen5 与 Agent 工作流结合：Agent 可以查询账户、准备交易，但私钥不进电脑，交易执行必须由人用设备确认；抓取时该帖有 136 个点赞、30 条回复。6	权限扩大后，安全边界不能只靠提示词。硬件签名器提供了另一种「人类兜底」入口。

Agent 编程开始补工程债

宝玉那条接近午夜发布的长帖，把今天几条工具消息串成了一条线：Agent 写代码不是魔法，还是要吃软件工程那套老规矩。需求要说清楚，设计要拆里程碑，审查要让人兜底，测试要覆盖关键路径，发布要有灰度和回滚。差别在于，过去人自己写、自己测、自己修；现在人要设计一套让 Agent 能工作、也能被限制的流程。1

这条的意义在于反直觉。很多人讨论 AI 编程时盯着模型能力，宝玉把焦点拉回工程管理：Agent 不怕你啰嗦，怕你不说；它可以审查格式、命名和明显逻辑错误，但业务逻辑、边界条件和涉及钱的流程仍要人判断。

同一方向上，Codex Handoff 更像一块基础设施拼图。宝玉转述的用法是：在办公室让 Codex 写到一半，可以通过自然语言把线程迁到远程主机继续跑，迁移内容包括对话上下文和完整 Git 状态。问题也很现实：远程机器要装好 Codex，要有同一仓库的克隆，同一子目录路径还要匹配。2

这条 Codex Handoff 的原帖值得直接看，因为它把「任务迁移」的使用前提讲得很细：

コンテンツカードを読み込んでいます…

指令、Skills、Hooks：上下文不是垃圾桶

meng shao 对 Claude Code 七种指令机制的拆解，今天可以和宝玉的工程化判断放在一起读。他提到的核心区别很实用：CLAUDE.md 会常驻上下文；带路径作用域的 Rules 只在触碰特定文件时加载；Skills 开始只加载名称和描述，完整内容在调用时才进来；Subagents 有独立上下文；Hooks 则在工具调用、文件编辑等生命周期事件上提供确定性控制。3

这里最有用的判断是：不要把「永远不要做某事」写进 CLAUDE.md 当硬约束。长会话、上下文压缩、提示词注入都会削弱这种软约束。危险操作、自动跑 linter、部署流程、只对某目录生效的规则，应该分别放到 Hooks、Skills 或有路径范围的 Rules 里。

这条推文适合当作 Claude Code 项目配置的速查入口：

コンテンツカードを読み込んでいます…

另一条 Deep Agents 教程线索也指向同一个问题：Agent 要长期工作，不能把所有东西堆进对话框。meng shao 转述的教程把 LangGraph 作为运行时，LangChain 作为模型和工具接口层，Deep Agents 作为 Harness；关键设计是虚拟文件系统，让 Agent 需要时再读取文件，中间结果落盘，大文件按 offset 和 limit 局部读取。4

宝玉自己的 Skill 迭代帖则提供了一个小样本：用户反馈 PPTX 导出样式和渐变色有问题后，他在本地复现，让 Agent 分析原因、提出方案、补测试，再更新 Skill。帖子里那条循环很朴素：自己用，发现问题，让 Agent 分析，确认方案，更新 Skill，再继续用。7

企业落地：文档解析与资金权限都在谈「边界」

LandingAI ADE 的密码保护文档解析是今天比较企业化的一条。按照 meng shao 的转述，Parse 或 Parse Jobs 调用里传入 password 后，可以在同一次请求里完成解密、解析和结构化输出；但能力只对开启 ZDR 的组织开放，文档在内存中处理，完成后丢弃，不落盘、不用于训练。5

这类功能看上去不酷，却很接近企业 Agent 的真实摩擦。公司内部文档经常有密码，里面还可能有合同、财务、PII 或医疗信息。模型能读懂并不够，系统还要回答：密码在哪里传、明文存不存、谁能审计、失败时返回什么错误。

Santiago 的 Ledger 演示把同一个问题放到资金权限里。他说 Agent 可以查询 Ethereum 账户、检查余额、发起交易流程，但密钥永远不进入电脑，真正执行交易前必须有人在 Ledger Nano Gen5 上批准。6

这条演示本身比一句「human-in-the-loop」更具体：

コンテンツカードを読み込んでいます…

其他值得扫一眼的信号

Greg Brockman 转发了 OpenAI 帮助罕见遗传病家庭的案例，并提到使用的是一年多前的 o3；这条适合当作能力边界信号看，不能从一条帖推导医学结论。抓取时该帖有 589 个点赞和 78 条回复。8

智谱 GLM 5.2 开源后的讨论也进入样本。meng shao 的判断比较谨慎：他还没亲自体验，但看到国外 AI 博主称赞，认为这不只是 PR；同时他把模型能力和资本市场反馈放在一起看，认为模型足够强时，早期运营的粗糙会被用户和资本短期容忍。9

Amjad Masad 只发了 Vibecon recap 和一句会议信息，信息量不足以展开成完整条目；Elon Musk 的 Starlink in Lesotho 互动很高，抓取时有 8.2 万以上点赞，但它与本频道今天的 AI 工程主线关系弱，只作为补充信号记录。10 11

今天的合并判断

如果只看标题，今天像是几条分散的产品与教程更新；放在一起看，它们都在处理同一个问题：Agent 获得更多执行权之后，系统要怎么让它持续、可控、可审计地工作。

Codex Handoff 解决的是任务不中断；Claude Code 的 Rules、Skills、Subagents 和 Hooks 解决的是指令放哪、何时生效；Deep Agents 教程把文件系统、规划和长期记忆做成工程结构；LandingAI 与 Ledger 的两条则提醒我们，企业数据和资金权限不能靠模型自觉。

这也是今天最值得带走的一句话：AI 编程的下一步，不是让 Agent 少受限制，而是把限制设计得足够清楚，让它能放心地多做一点。

本期看点

Agent 编程开始补工程债

指令、Skills、Hooks：上下文不是垃圾桶

企业落地：文档解析与资金权限都在谈「边界」

其他值得扫一眼的信号

今天的合并判断

参考ソース