
2026/6/29 · 0:19
2026-06-28 关注圈日报(公开账号抽样版):Grok 4.5、Agent 技能图、Codex 上下文
完整关注列表暂时不可读,本期实际覆盖 13 个公开账号的北京时间 6 月 28 日动态,筛出 5 条实质推文:Grok 4.5 私测、Codex / Claude Code 上下文管理、浏览器自动化技能图、中国 AI 开源生态和 AI 审贷系统。
リサーチノート
完整关注列表暂时不可读,本期是公开账号抽样版:实际查询 13 个公开账号,时间窗为北京时间 2026-06-28 00:00–24:00;筛选后保留 5 条实质推文。读这期时请把它当作关注圈信号样本,不要当成 @jin_feng03 完整关注列表的全量结论。
今天最值得看的 5 条
| 信号 | 作者背景 | 为什么值得看 |
|---|---|---|
| Grok 4.5 进入 SpaceX 与 Tesla 私测 | Elon Musk,高关注科技创业者 | 这条把模型训练规模、Cursor 数据补充训练、企业内测和发布节奏放在同一条推文里:Grok 4.5 基于 1.5T V9 foundation model,正在 SpaceX 与 Tesla 私测;Musk 称早期评测接近、甚至可能超过 Opus,并称 SpaceX 今年会每月发布从零训练的新模型 1。 |
| Codex / Claude Code 的长会话成本压力下降 | 宝玉,AI 工程与工程管理内容创作者 | 宝玉提到上下文压缩与 Prompt Caching 让一个 Session 内持续推进任务的成本压力下降;他同时点出 fork、/btw 或 /side 这类分支与旁路提问功能,说明 coding agent 的体验竞争正在从「能不能写代码」转向「能不能管理上下文」2。 |
| 浏览器操作可被录制、清洗并沉淀成技能图 | Santiago,AI/ML 工程教育者 | Santiago 描述了一条自动化链路:先录制浏览器操作,再删除重试、死路和页面特异步骤,保留可复用逻辑,最后把技能组织进 skill graph 供 agent 检索;他称这套方向已经开源 3。 |
| 中国 AI 公司一边竞争 SOTA,一边倾向开源 | Santiago,AI/ML 工程教育者 | 这条不是产品发布,而是生态观察:Santiago 认为中国 AI 生态的差异在于「每家公司都想发自己的 SOTA 模型,但它们都在开源」,竞争与开放共享同时发生 4。 |
| AI 审贷系统开始强调可追溯结构化证据,而非普通 OCR | meng shao,AI agent 与设计媒体方向创作者 | shao__meng 梳理的 LoanLens 案例把 AI 审贷拆成六类文档、ADE 结构化抽取、KPI、欺诈检测、评分决策与案件 RAG;关键点不是「把文档转成文本」,而是抽取能接入业务逻辑、可回溯源文档的证据 5。 |
主线一:模型竞争进入「内测场景 + 训练数据 + 发布节奏」叙事
今天热度最高的实质推文来自 Elon Musk。他说 Grok 4.5 已在 SpaceX 和 Tesla 私测,并把三件事放在一起讲:底座是 1.5T V9 foundation model,补充训练加入 Cursor 数据,RL 与 Grok Build harness 仍在继续改进 1。
这条的看点不只是「又一个新模型」。更值得留意的是,Musk 把企业内部场景、开发工具数据和高频发布节奏连在一起:模型能力来自训练,能力验证发生在 SpaceX、Tesla 这类复杂组织,下一轮迭代又被安排成月度节奏。对关注 AI 工程的人来说,这比单独公布 benchmark 更接近真实工作流。
原帖如下,适合直接看原文语气:
コンテンツカードを読み込んでいます…
Santiago 的中国 AI 生态观察可以放在同一条主线里。他的判断是:中国公司都想发布自己的 SOTA 模型,但又普遍选择开源;它们在竞争,同时也把成果拿出来给世界使用 4。这与 Musk 推文里的「私测 + 高频发布」形成对照:一个强调组织内闭环,另一个强调生态开放扩散。
コンテンツカードを読み込んでいます…
主线二:Agent 工程从「单次对话」转向「上下文治理」
宝玉的推文更贴近日常使用。他提到,Codex / Claude Code 的上下文压缩已经做得不错,再加上 Prompt Caching,一个 Session 里持续推进任务没那么有成本压力 2。
真正有用的是后半段。他点名两个配套功能:fork 可以从某个对话位置开分支,只保留前面的历史;/btw 或 /side 可以在当前会话里问一个旁路问题,不把无关内容塞回主上下文 2。这说明 coding agent 的产品细节正在变得更像 IDE:重要的不是把所有内容都塞进同一个窗口,而是让用户能维护上下文边界。
コンテンツカードを読み込んでいます…
这条和近期多期反复出现的 Agent 成本、长任务委托、Codex 组织内使用经验是一条线。今天的新信息不是又出现了一个 Agent,而是用户开始讨论怎样让一个 Agent Session 更长、更干净、更可分叉。
主线三:可复用技能正在成为自动化单位
Santiago 的另一条推文把浏览器自动化讲成一个四步流程:录制人类使用浏览器完成任务的过程,清洗掉重试、死路和页面特异动作,只留下可迁移的任务逻辑,再把这些技能组织成 skill graph,让 agent 面对相关任务时可以检索调用 3。
这条值得看,是因为它把「RPA」「浏览器 agent」「操作录制」这些容易混在一起的概念拆开了。录屏不是终点,抽象出可复用逻辑才是重点;单个脚本也不是终点,让 agent 能从技能图里找对技能,才更接近规模化自动化。
コンテンツカードを読み込んでいます…
主线四:AI 文档处理开始往业务证据链走
shao__meng 的 LoanLens 案例是今天最具体的业务落地信号。按他的描述,这套 AI 审贷初筛系统会从六类借款人文档中抽取结构化字段,做欺诈检测和可解释评分,并提供只限当前案件的 RAG 问答 5。
这里的重点不是 OCR。审贷场景需要的是可接入业务逻辑的结构化证据:字段按 schema 抽取,证据能回溯到源文档,视觉层还要捕捉文本抓不到的布局或篡改信号 5。
他还列了两个风控例子:六类文档姓名用 TF-IDF 比对,相似度低于 0.95 触发告警;护照篡改则看核心组件相对位置与参考几何,严重视觉欺诈可直接否决 5。这类案例说明,企业场景里的 AI 价值常常不在「生成答案」,而在把证据链整理到能被人审核、能被规则接住。
コンテンツカードを読み込んでいます…
被过滤掉的内容
本期也抓到一些高互动但不适合进入主线的内容。Elon Musk 的「Yes」「Good point」互动量很高,但原文本身没有足够信息量;几条生日祝福、政治梗、纯转发和短句也被排除。这样做会牺牲一点热度覆盖,但更符合这份简报的用途:把能展开的技术、产品和生态信号留下来。
如果只看今天的样本,AI 圈的关注点很明确:模型发布不再只看榜单分数,Agent 产品开始比拼上下文管理和技能复用,企业落地则继续往「可追溯、可审核、能接规则」的证据链靠近。

このコンテンツについて、さらに観点や背景を補足しましょう。