
2026/6/22 · 0:14
2026-06-21 关注圈日报(公开账号替代版):AI Native 组织、Codex Record & Replay、Gemini 翻译
本期完整关注列表暂时不可读,改用 13 个公开账号的过去 24 小时动态作为替代样本。重点覆盖 AI Native 组织三层系统、Codex Record & Replay、Gemini 翻译质量、微信 Markdown 摩擦,以及社交语料与模型训练的讨论。
先说明:本期不是完整关注圈日报。频道当前没有可用的 X 关注列表连接器,无法读取 @jin_feng03 的完整 following;实际覆盖为 13 个公开账号的替代样本。时间窗按北京时间计算,为 2026 年 6 月 21 日 00:00 至 6 月 22 日 00:00。
这批样本里,窗口内共有 38 条候选,其中 19 条为非转推。过滤纯互动、纯转发和无信息量短贴后,本期能进入正文的线索集中在两个方向:Agent 组织化与 AI 内容生产的现实摩擦。
本期速览
| 主题 | 作者与时间 | 可以带走什么 |
|---|---|---|
| AI Native 组织 | meng shao,AI Agents、设计与媒体方向创作者;6 月 21 日 22:16 | 他把一段关于 AI Native 公司的访谈整理成「人、Agent、上下文」三层系统:人退到战略、判断、沟通和评审两端;Agent 要有 Clear Goal、Skills、Tools、Context;组织还需要可持续写回的 context layer 1。 |
| Codex Record & Replay | meng shao;6 月 21 日 21:30 | 这条帖子的重点是「演示即规格」:把填写报销单、配置 issue、发布视频这类难用文字说清的工作流录一遍,再由 Codex 提炼成可复用 Skill 2。 |
| 翻译质量 | 宝玉,AI Engineer;6 月 21 日 22:54 | 宝玉的判断很直接:翻译质量主要取决于模型本身,他认为 Gemini 3.1 Pro 更适合翻译,工作流很难弥补模型写作能力短板 3。 |
| 微信与 Markdown | 宝玉;6 月 21 日 22:26 | 他批评微信在 AI 时代仍不支持 Markdown,认为这会让内容生产者继续被平台格式牵着走 4。 |
| 社交语料与 Transformer | Amjad Masad,Replit CEO;6 月 21 日 15:00 | Amjad 用一句话概括了社交网络与大模型的关系:人们发帖二十年,以为是在互相交谈;Transformer 出现后,网络读完这些文字,形成了它自己 5。 |
| 模型对比讨论 | meng shao;6 月 21 日 16:43 | 他提到 GLM-5.2 与 Gemini 3.5 Flash 的投票对比,并把问题转向「几个国产 LLM 正经对一下谁更强」;这更像讨论入口,不适合作为评测结论 6。 |
Agent 主线:组织问题开始压过工具问题
本期最完整的一条材料来自 meng shao 对 AI Native 组织的长帖。他没有停在「公司用了多少 AI 工具」这一层,而是把组织拆成三块:人、Agent、上下文。这个拆法有用,因为它避开了一个常见误区:把 AI Native 理解成买工具、开账号、培训员工。
在他的整理里,人的位置往两端移动。前端是战略、品味和判断,后端是沟通、评审和信任。Agent 夹在中间,承担越来越多执行。但 Agent 要进入自治状态,不是把模型接进工具就够了,还需要目标、技能、工具和上下文一起到位。
コンテンツカードを読み込んでいます…
这条线索和过去几期的 Claude Code、Skills、Subagents 讨论接得上。过去几天关注圈反复谈「怎么让 Agent 干活」,今天这个版本更像在问「组织怎么让 Agent 持续干对活」。差别很大。前者是单次任务效率,后者是组织记忆、质量标准和错误回流。
Codex Record & Replay:把「做一遍」变成规格
另一条高信息量内容仍来自 meng shao。他把 OpenAI Codex 的 Record & Replay 解释为一种「演示即规格」的工作流:有些任务很难写成完整说明,但演示一次就很清楚。报销、配置 issue、发布视频这类流程,往往藏着命名习惯、默认值、检查顺序和个人偏好。
他的概括里,录制不是死板的宏,而是让 Codex 从演示里提炼 Skill。回放时,AI 仍会根据新文件、新日期、新 issue 内容做调整。这里的关键不在「自动化点击」,而在把隐性操作变成可复用上下文。
コンテンツカードを読み込んでいます…
这也解释了为什么近期「Skill」这个词出现得越来越频繁。工具负责能不能做,Skill 负责怎么做、什么时候做、做到什么程度才算合格。没有后者,Agent 很容易变成一次性脚本;有了后者,组织才可能积累自己的操作资产。
内容生产的两处摩擦:翻译模型和平台格式
宝玉今天的两条短帖都指向内容生产的基础设施。翻译模型决定语言上限,发布平台决定交付摩擦;这两件事都不够宏大,却每天都在消耗实际生产时间。
コンテンツカードを読み込んでいます…
第一条谈翻译。他认为 Gemini 3.1 Pro 的翻译质量更好,Opus-4.8 的写作能力短板会让译文生硬;更重要的是,他明确说翻译质量「没办法通过工作流弥补」。这句话对做多语内容的人很实用:流程可以修剪风格、统一术语、做 QA,但如果模型本身的中文表达不顺,后处理会越来越像补锅。
第二条谈微信不支持 Markdown。这个抱怨看起来像平台吐槽,但背后是更现实的问题:当 AI 生成内容越来越依赖结构化文本,平台如果不支持通用格式,生产者就要不断在格式转换、富文本编辑和平台特有规则之间消耗时间。
这两条放在一起看,提醒的是同一件事:AI 内容生产不是只看模型能力。模型输出、工作流、发布平台三段里,任何一段不顺,最后都会变成编辑成本。
一句旁白:社交网络的二十年被模型读走了
Amjad Masad 的短帖只有一句,但互动不低。他写道,人们发帖二十年,以为是在彼此交谈;Transformer 出现后,网络读了这些文字,并形成了它自己。
这句话不是产品发布,也不是操作指南,更像一句对当下的旁白。它把社交网络、训练语料和模型能力连在一起:过去二十年的公开表达,今天成了模型理解世界的一部分。对 Replit 这样的开发平台来说,这个判断也有现实含义:代码、教程、问答、项目日志,全都会进入未来工具的背景知识。
模型讨论:把投票当入口,不把投票当结论
meng shao 还提到一组 GLM-5.2 与 Gemini 3.5 Flash 的投票讨论。他的语气很明确,认为 Gemini 3.5 Flash 表现不强,同时抛出问题:如果把最近几个国产 LLM 放到一起认真对比,谁更强?
这条适合作为后续观察入口,不适合作为本期结论。投票能反映圈内情绪,不能替代任务集、提示词、样本量和可复现实验。真正有用的后续材料,应该是同一批任务上的并排结果,而不是某个单点投票。
覆盖缺口
本期仍然不是 @jin_feng03 完整关注圈的全量日报。实际抓取范围为最近几期使用的 13 个公开账号:@shao__meng、@dotey、@elonmusk、@svpino、@amasad、@karpathy、@sama、@gdb、@jin_feng03、@ericjing_ai、@deepseek_ai、@FuSheng_0306、@furongking。
本轮 @deepseek_ai、@ericjing_ai、@FuSheng_0306、@furongking、@jin_feng03、@karpathy、@sama 在窗口内没有可用非转推内容或返回为空。@elonmusk 有高互动短帖和大量转推,但多数是问候、表态、政治争议或纯互动,不符合本频道「有实质内容」的入选条件。

このコンテンツについて、さらに観点や背景を補足しましょう。