2026-06-28 关注圈日报（公开账号抽样版）：Grok 4.5、Agent 技能图、Codex 上下文

完整关注列表暂时不可读，本期是公开账号抽样版：实际查询 13 个公开账号，时间窗为北京时间 2026-06-28 00:00–24:00；筛选后保留 5 条实质推文。读这期时请把它当作关注圈信号样本，不要当成 @jin_feng03 完整关注列表的全量结论。

今天最值得看的 5 条

信号	作者背景	为什么值得看
Grok 4.5 进入 SpaceX 与 Tesla 私测	Elon Musk，高关注科技创业者	这条把模型训练规模、Cursor 数据补充训练、企业内测和发布节奏放在同一条推文里：Grok 4.5 基于 1.5T V9 foundation model，正在 SpaceX 与 Tesla 私测；Musk 称早期评测接近、甚至可能超过 Opus，并称 SpaceX 今年会每月发布从零训练的新模型 1。
Codex / Claude Code 的长会话成本压力下降	宝玉，AI 工程与工程管理内容创作者	宝玉提到上下文压缩与 Prompt Caching 让一个 Session 内持续推进任务的成本压力下降；他同时点出 fork、/btw 或 /side 这类分支与旁路提问功能，说明 coding agent 的体验竞争正在从「能不能写代码」转向「能不能管理上下文」2。
浏览器操作可被录制、清洗并沉淀成技能图	Santiago，AI/ML 工程教育者	Santiago 描述了一条自动化链路：先录制浏览器操作，再删除重试、死路和页面特异步骤，保留可复用逻辑，最后把技能组织进 skill graph 供 agent 检索；他称这套方向已经开源 3。
中国 AI 公司一边竞争 SOTA，一边倾向开源	Santiago，AI/ML 工程教育者	这条不是产品发布，而是生态观察：Santiago 认为中国 AI 生态的差异在于「每家公司都想发自己的 SOTA 模型，但它们都在开源」，竞争与开放共享同时发生 4。
AI 审贷系统开始强调可追溯结构化证据，而非普通 OCR	meng shao，AI agent 与设计媒体方向创作者	shao__meng 梳理的 LoanLens 案例把 AI 审贷拆成六类文档、ADE 结构化抽取、KPI、欺诈检测、评分决策与案件 RAG；关键点不是「把文档转成文本」，而是抽取能接入业务逻辑、可回溯源文档的证据 5。

主线一：模型竞争进入「内测场景 + 训练数据 + 发布节奏」叙事

今天热度最高的实质推文来自 Elon Musk。他说 Grok 4.5 已在 SpaceX 和 Tesla 私测，并把三件事放在一起讲：底座是 1.5T V9 foundation model，补充训练加入 Cursor 数据，RL 与 Grok Build harness 仍在继续改进 1。

这条的看点不只是「又一个新模型」。更值得留意的是，Musk 把企业内部场景、开发工具数据和高频发布节奏连在一起：模型能力来自训练，能力验证发生在 SpaceX、Tesla 这类复杂组织，下一轮迭代又被安排成月度节奏。对关注 AI 工程的人来说，这比单独公布 benchmark 更接近真实工作流。

原帖如下，适合直接看原文语气：

コンテンツカードを読み込んでいます…

Santiago 的中国 AI 生态观察可以放在同一条主线里。他的判断是：中国公司都想发布自己的 SOTA 模型，但又普遍选择开源；它们在竞争，同时也把成果拿出来给世界使用 4。这与 Musk 推文里的「私测 + 高频发布」形成对照：一个强调组织内闭环，另一个强调生态开放扩散。

コンテンツカードを読み込んでいます…

主线二：Agent 工程从「单次对话」转向「上下文治理」

宝玉的推文更贴近日常使用。他提到，Codex / Claude Code 的上下文压缩已经做得不错，再加上 Prompt Caching，一个 Session 里持续推进任务没那么有成本压力 2。

真正有用的是后半段。他点名两个配套功能：fork 可以从某个对话位置开分支，只保留前面的历史；/btw 或 /side 可以在当前会话里问一个旁路问题，不把无关内容塞回主上下文 2。这说明 coding agent 的产品细节正在变得更像 IDE：重要的不是把所有内容都塞进同一个窗口，而是让用户能维护上下文边界。

コンテンツカードを読み込んでいます…

这条和近期多期反复出现的 Agent 成本、长任务委托、Codex 组织内使用经验是一条线。今天的新信息不是又出现了一个 Agent，而是用户开始讨论怎样让一个 Agent Session 更长、更干净、更可分叉。

主线三：可复用技能正在成为自动化单位

Santiago 的另一条推文把浏览器自动化讲成一个四步流程：录制人类使用浏览器完成任务的过程，清洗掉重试、死路和页面特异动作，只留下可迁移的任务逻辑，再把这些技能组织成 skill graph，让 agent 面对相关任务时可以检索调用 3。

这条值得看，是因为它把「RPA」「浏览器 agent」「操作录制」这些容易混在一起的概念拆开了。录屏不是终点，抽象出可复用逻辑才是重点；单个脚本也不是终点，让 agent 能从技能图里找对技能，才更接近规模化自动化。

コンテンツカードを読み込んでいます…

主线四：AI 文档处理开始往业务证据链走

shao__meng 的 LoanLens 案例是今天最具体的业务落地信号。按他的描述，这套 AI 审贷初筛系统会从六类借款人文档中抽取结构化字段，做欺诈检测和可解释评分，并提供只限当前案件的 RAG 问答 5。

这里的重点不是 OCR。审贷场景需要的是可接入业务逻辑的结构化证据：字段按 schema 抽取，证据能回溯到源文档，视觉层还要捕捉文本抓不到的布局或篡改信号 5。

他还列了两个风控例子：六类文档姓名用 TF-IDF 比对，相似度低于 0.95 触发告警；护照篡改则看核心组件相对位置与参考几何，严重视觉欺诈可直接否决 5。这类案例说明，企业场景里的 AI 价值常常不在「生成答案」，而在把证据链整理到能被人审核、能被规则接住。

コンテンツカードを読み込んでいます…

被过滤掉的内容

本期也抓到一些高互动但不适合进入主线的内容。Elon Musk 的「Yes」「Good point」互动量很高，但原文本身没有足够信息量；几条生日祝福、政治梗、纯转发和短句也被排除。这样做会牺牲一点热度覆盖，但更符合这份简报的用途：把能展开的技术、产品和生态信号留下来。

如果只看今天的样本，AI 圈的关注点很明确：模型发布不再只看榜单分数，Agent 产品开始比拼上下文管理和技能复用，企业落地则继续往「可追溯、可审核、能接规则」的证据链靠近。

2026-06-28 关注圈日报（公开账号抽样版）：Grok 4.5、Agent 技能图、Codex 上下文

今天最值得看的 5 条

主线一：模型竞争进入「内测场景 + 训练数据 + 发布节奏」叙事

主线二：Agent 工程从「单次对话」转向「上下文治理」

主线三：可复用技能正在成为自动化单位

主线四：AI 文档处理开始往业务证据链走

被过滤掉的内容

参考ソース

関連コンテンツ