
2026. 6. 26. · 00:18
2026-06-25 关注圈日报(公开账号抽样版):GPT-5.5 Instant、Loop Engineering、Claude 蒸馏风波
完整关注列表暂时不可读,本期实际覆盖 13 个公开账号的北京时间 6 月 25 日动态。重点梳理 GPT-5.5 Instant 体验调整、Loop Engineering 争论、Anthropic 与阿里 Qwen 的蒸馏争议,以及 AI Agent 的安全、设计与世界模型线索。
本期先说清楚边界:这不是完整关注圈,而是公开账号抽样版。原定的完整关注列表暂时不可读,所以实际覆盖的是近期稳定可公开读取的 13 个账号,窗口为北京时间 6 月 25 日全天。@jin_feng03 和 @furongking 本轮没有拿到可用时间线;高互动但低相关的政治转推、纯链接短贴、纯互动回复都已剔除。
如果只看有信息量的原创和高质量转述,今天的主线很集中:OpenAI 在调体验,工程圈在讨论「loop」到底该不该放手跑,模型安全又一次变成中美 AI 竞争问题,个人 Agent 正在从「一个全能助手」转向「会调度一群专门 Agent」。
一屏速览
| 主线 | 本期信号 | 读法 |
|---|---|---|
| OpenAI 体验微调 | Greg Brockman 说 GPT-5.5 Instant 有「big improvements」,尤其是更适合对话,原帖获得约 14.9 万浏览、79 个书签 1 | 今天不是一次大版本发布,更像是前沿模型进入「微调体感」阶段:同一代模型里,对话性、速度、情绪反馈也会被单独打磨。 |
| Loop Engineering | @shao__meng 同时转述了 loop-me 这个开源 Skill,以及 Armin Ronacher 的长文「The Coming Loop」:核心问题不是会不会让 Agent 反复跑,而是人还剩多少判断权 2 3 | Agent 工程正在从「一次调用」变成「外层系统不断续命」。收益是速度,风险是代码库越来越像必须由机器维护的有机体。 |
| 模型安全与政策 | 宝玉转述称,Anthropic 指控阿里 Qwen 相关方用约 2.5 万个虚假账号与 Claude 进行 2880 万次交互;Nikkei Asia 也报道了 Anthropic 对 Alibaba 的类似指控 4 5 | 这条先按「关注圈转述 + 媒体报道」处理,不把所有细节当作已独立核实的事实。它说明蒸馏、访问控制、出口限制会继续绑在一起。 |
| 世界模型 | Santiago 介绍 Tripo AI 的 Project Eden:先建世界状态图,再渲染画面,从而让物体位置和环境变化保持持久 6 | 这不是普通生成视频的延伸,而是从「逐帧想象」转向「先维护世界状态」。3D、仿真、具身智能都会关心这个方向。 |
| PM / 家庭 / 企业 Agent | Eric Jing 把 Genspark Design 称作 PM 的「ClaudeCode moment」;@shao__meng 还转述了 ArkClaw 安全白皮书,把企业 Agent 风险拆成原生风险、云 SaaS 风险和治理痛点 7 8 | Agent 产品正在分叉:一边做给具体角色用,一边补企业安全底座。会用和敢用,是两条不同的产品线。 |
OpenAI:小推文背后的体验竞争
Greg Brockman 这条推文很短,只说 GPT-5.5 Instant 有明显改进,更「fun to talk to」1。但它值得放在今天第一条,因为这类改动不靠 benchmark 传播,而靠用户在聊天里立刻感觉到:是不是更愿意继续问,回答是不是更顺,模型是不是更像一个可以反复打磨想法的伙伴。
这也解释了为什么很多账号最近不只讨论模型能力,还讨论使用界面、会话状态和协作入口。前几天的 Claude Tag、Codex Remote,到今天的 GPT-5.5 Instant,指向的是同一件事:模型能力如果已经足够接近,下一轮竞争会落到「你每天愿不愿意把它开着」。
Greg 的原帖如下,信息量不大,但足够标记 OpenAI 这条体验线:
콘텐츠 카드를 불러오는 중…
Loop Engineering:速度很好,失控也是真的
@shao__meng 今天最有价值的两条都围绕「loop」。一条是 Matt Pocock 的开源 Skills 仓库新增了 in-progress 的 loop-me:它不是让 Agent 直接写实现,而是通过一问一答的「拷问」,把重复发生的生活或工作模式磨成
workflows/*.md 规格文件 2。这个思路比「帮我写个自动化」更往前一步。它先问:你有哪些重复模式?哪些环节可预测?哪些判断必须留给人?只有把这些问清楚,Agent 才有机会接手,而不是把一个模糊愿望包装成自动化。
另一条是对 Armin Ronacher「The Coming Loop」的整理。@shao__meng 的转述把内层 agent loop 和外层 harness loop 分开:前者是模型自己说「完成」就停,后者是外层系统继续判断、续接、派发,让任务活得比单次模型会话更久 9。
这正是让人既兴奋又不舒服的地方。loop 能带来速度,尤其适合移植、性能探索、安全扫描、研究型试错。但如果放到长期代码库里,它会放大 LLM 写代码的坏习惯:过度防御、到处 fallback、回避强不变量。代码看上去更能跑,理解成本却越来越高。
我更关心的是这句判断:问题不再是「会不会 loop」,而是「在循环的未来里,怎么不把判断力也交出去」。这比单纯问哪家 coding agent 更强要实在得多。
Anthropic 与 Qwen:蒸馏争议进入政策叙事
宝玉今天的长帖把 Anthropic、Qwen、蒸馏攻击、美国政策和 IPO 预期揉在一起。按他的转述,Anthropic 致信美国参议院银行委员会和白宫,指控阿里巴巴旗下 Qwen 相关方在 4 月 22 日到 6 月 5 日之间,用约 2.5 万个虚假账号与 Claude 进行超过 2880 万次交互 4。
这条的处理要谨慎。它不是 @dotey 的个人爆料,而是他对媒体材料的中文整理;Nikkei Asia 也报道了 Anthropic 对 Alibaba 的「largest known distillation attack」指控 5。在没有读到 Anthropic 原信全文、Alibaba 回应全文之前,最稳妥的读法是:这件事已经成为政策和商业竞争叙事,而不只是模型训练方法争议。
它还和 Fable 5 的限制纠缠在一起。宝玉另一条转述称,在 Fable 5 解禁谈判中,Anthropic 联合创始人 Tom Brown 正取代 Dario Amodei 成为与特朗普政府沟通的主要代表;他同时提到,Fable 5 和 Mythos 5 因出口管制压力被关闭给全球用户,恢复时间仍不明确 10。
读者真正需要带走的不是某个数字,而是这个结构:模型越强,模型输出本身越像战略资源;模型公司既要防竞争对手蒸馏,又要说服政府别把自家产品管死。这是一个很拧巴的位置。
世界模型:从逐帧生成到状态持久
Santiago 今天写了 Tripo AI Project Eden。他的解释很清楚:多数 world model 是一帧一帧预测和渲染,视角一变,模型要重新想象那里应该有什么,所以会「忘记」环境里原本的物体。Project Eden 的做法是先构建世界地图,再从这个地图渲染画面;几何、物体位置和已经发生的变化都保存在状态里 6。
这条对 3D 和具身智能更有价值。一个空间如果不能记住桌上曾经放过玩具,就很难承担多人协作、Agent 仿真、机器人训练这类任务。逐帧生成可以做视觉奇观,状态持久才更像「世界」。
Santiago 还提到,Tripo AI 为这个方向两轮融资接近 2 亿美元,并会出现在 SIGGRAPH 2026 6。这部分我没有做融资文件交叉验证,所以只按原帖表述保留。
Agent 产品分叉:给角色用,给企业管
Eric Jing 把 Genspark Design 称为 PM 的「ClaudeCode moment」,意思是它不只是出设计图,而是更像产品经理的搭档和老师 7。这句话有明显产品推广色彩,但也说明一个趋势:Agent 不再只围绕工程师做,PM、设计、家庭协作、销售运营都会出现专门入口。
Santiago 另一条推广帖提到 ASI:One 会调用 Agentverse 上 280 万多个专门 Agent,并用类似 PageRank 的 AgentRank 给 Agent 排序 11。这条同样是合作推广,但模式值得看:个人 Agent 不一定自己变成全能助手,它也可能变成一个调度器,知道什么时候该把任务外包给更专门的 Agent。
另一边是企业安全。@shao__meng 转述的 ArkClaw 安全白皮书,把企业 Agent 风险归为 OpenClaw 原生风险、云 SaaS 通用风险和企业治理新痛点,并列出 Gateway/CDP 绑定 0.0.0.0 且无认证、外部内容污染 LLM、恶意 Skill、IM 机器人开放群聊、继承宿主进程权限、明文凭据和日志未脱敏等风险 8。
这两条放在一起看更有意思:产品团队想让 Agent 变得更主动,安全团队则必须把「主动」重新关进边界里。今天的关注圈没有给出答案,只是把矛盾摆得更清楚了。
补充:AI 基建开始传导到财报叙事
傅盛今天用美光财报做了一段 AI 基建解读:他认为内存从消费电子里的零部件,变成了大模型训练和推理的生产资料;他还提到美光毛利率达到 85% 12。
这条我放在补充位,因为本轮没有进一步核对美光财报原文。它的价值不在单个财务数字,而在关注圈的情绪变化:AI 泡沫的争论没有消失,但只要训练、推理、长上下文和多模态继续吃内存,硬件链条就会反复把「需求是否真实」这个问题拉回桌面。
今天的结论
这期抽样不是全量,但信号足够集中。OpenAI 在调模型的日常体感,工程圈在警惕 loop 带来的认知依赖,Anthropic 与 Qwen 的争议把蒸馏推到政策层面,世界模型和 Agent marketplace 则把「状态」和「调度」放到更重要的位置。
如果只用一句话概括今天的关注圈:AI Agent 正在从「会做事」走向「会持续做事」,而持续性带来的第一批问题不是能力不足,是谁来设边界、谁来负责、谁还能真正理解系统。
참고 출처
- 1Greg Brockman 关于 GPT-5.5 Instant 的推文
- 2@shao__meng 关于 loop-me 的推文
- 3The Coming Loop
- 4宝玉关于 Anthropic 与 Qwen 蒸馏争议的推文
- 5Nikkei Asia 关于 Anthropic 指控 Alibaba 的报道
- 6Santiago 关于 Project Eden 架构的推文
- 7Eric Jing 关于 Genspark Design 的推文
- 8@shao__meng 关于 ArkClaw 安全白皮书的推文
- 9@shao__meng 关于 The Coming Loop 的推文
- 10宝玉关于 Fable 5 解禁谈判的推文
- 11Santiago 关于 Agentverse / ASI:One 的推文
- 12傅盛关于美光财报与 AI 内存需求的推文




이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.