2026-06-17 关注圈日报：Exa Agent、Grok Imagine、GPT-Realtime-2、CC Switch

今天的技术线索比上一期更偏产品化：research agent 变成 API，视频模型开始追求实时，编码工具继续补「模型切换」「开源交付」这类小但实用的缺口。最该看的是 Exa Agent，其次是 Grok Imagine 与实时视频交互这条线；它们都在把 Agent 从「会回答」往「能持续处理任务」推。

本期速览

主题	信号	读者要点
Exa Agent	Exa 发布一个面向 Web Research 的 Agent API，主打 deep research、list-building、entity enrichment，并在 WideSearch 上用 Row-F1 衡量结构化输出质量；shao__meng 进一步转述了并行子 Agent、模型融合与 Highlights 降 token 的技术路线 1 2。	搜索公司开始直接卖「研究执行层」，不是只卖搜索结果。
视频模型	Elon Musk 称 Grok Imagine 1.5 已进入 wide release，并表示年底前会有 full movies；Santiago 同时转发了高速视频生成演示，设想实时视频流式聊天 3 4 5。	视频生成的竞争点正在从「一段短片质量」转向「速度、交互和长片能力」。
Realtime / 医疗 AI	Greg Brockman 提到「GPT-Realtime-2 is something new」，又转发 AI 帮助破解健康谜题的案例 6 7。	OpenAI 侧的叙事仍在把实时交互和高风险知识辅助并排放大。
本地隐私代理	Santiago 关注一个本地运行的屏幕观察代理：它会在用户即将暴露敏感内容前自动遮挡，用户可一键恢复显示 8。	企业桌面上的 Agent 安全，不只靠权限弹窗，也可能靠实时意图判断。
Coding Agent 小工具	shao__meng 推荐 CC Switch。GitHub 页面显示它是一个跨平台桌面管理器，可管理 Claude Code、Codex、OpenCode、Gemini CLI 等工具，并显示约 103k Star 9 10。	Coding Agent 生态已经开始出现「多模型、多客户端切换器」。
Fable 红警项目	傅盛称 Fable 写的网页版红警超过一万人体验，源码已开放；GitHub 仓库 README 写明该项目是浏览器 RTS 引擎，支持 PC 与手机、多人锁步联机，并强调不分发 EA 游戏素材 11 12。	这条更像「AI 一晚做 demo」之后的第二步：把可玩的东西交给社区继续验证。

Exa Agent：研究任务被包装成单一 API

Exa 的官方博客说得很直接：Exa Agent 是「a single API」，把前沿语言模型和 Exa 自己的 Web Search 工具组合起来，面向深度调研、名单构建、实体补全这三类任务 1。shao__meng 的转述补了一层工程视角：任务会被拆成并行子 Agent，模型选择不固定，简单部分用便宜模型，困难部分再用 frontier 模型 2。

콘텐츠 카드를 불러오는 중…

这里值得留意的是评测口径。Exa 没有只讲「回答得像不像」，而是强调 WideSearch 的 Row-F1：一行输出要实体匹配正确、所有必填列都有效，才算成功；他们也解释过，cell-level F1 太宽松，单列对了但实体错了也会被奖励 1。这更接近销售名单、公司研究、融资表这类 B2B 场景的要求。

换句话说，research agent 的商业化入口可能不是「给我写一篇报告」，而是「给我交一张能直接进 CRM、投研表或内部知识库的结构化表」。这对很多团队更实用，也更容易按请求收费。

视频模型：从短片质量卷到实时交互

Elon 今天给了两条短信号：Grok Imagine 1.5 已经 wide release，年底前会有 full movies 3 4。这两条都很短，不能当成产品细节说明，但它们指向同一件事：xAI 想把视频生成从演示片段推到更长、更可消费的形态。

콘텐츠 카드를 불러오는 중…

Santiago 的角度更偏交互。他看的是模型生成视频的速度，并设想未来聊天界面不再只返回文本，而是用实时视频流与用户对话 5。这条线如果成立，视频模型的关键指标会变成延迟、连续性和可控性，而不是单张关键帧有多漂亮。

这也是视频 Agent 与普通文生视频的分水岭：前者需要边理解、边生成、边响应，后者只要离线交付一个结果。

Realtime 和健康案例：OpenAI 继续推「可对话的智能」

Greg Brockman 的「GPT-Realtime-2 is something new」没有给参数，也没有给发布日期 6。单看这条，不该过度解读成产品发布；但它和他随后提到 AI 帮助破解健康谜题的案例放在一起，能看出 OpenAI 想强调的方向：模型不只是生成内容，也要进入更长的对话、观察和判断过程 7。

健康场景尤其需要谨慎。推文只说明「AI 帮助破解健康谜题」这一层，并不足以替代医学证据。但从产品信号看，高风险知识辅助仍是大模型公司最愿意展示的用例之一，因为它能说明模型在长上下文、跨线索推理和人机协作上的价值。

桌面 Agent 的安全问题开始前置

Santiago 关注的本地屏幕隐私代理很具体：它在本机运行，观察屏幕内容。如果用户即将在 Zoom 共享屏幕时暴露私人文档，系统会在内容可见前自动遮挡；如果用户确实想展示，可以一键恢复 8。

他也留了疑问：对方声称会基于用户意图判断，不只是基于屏幕内容，但他没有找到足够细节解释这种「意图」如何确定 8。这句保留很重要。桌面 Agent 未来会接触本地文件、浏览器、会议软件和企业账号；只要它能看屏幕，误判和越权就会跟着来。

这类工具的方向可能会成为企业部署 Agent 的基础层：默认遮挡、默认最小暴露、默认让用户确认。比起事后审计，事前拦截更符合桌面工作流。

Coding Agent 生态：小工具比大叙事更接近日常

CC Switch 今天被 shao__meng 推荐，理由很朴素：在 Coding Agent 里切换任意模型 10。GitHub 页面显示，它是一个跨平台桌面管理器，覆盖 Claude Code、Claude Desktop、Codex、Gemini CLI、OpenCode 等工具，Star 数约 103k 9。

github.com · GitHub 저장소

farion1231/cc-switch

https://github.com/farion1231/cc-switch

콘텐츠 카드를 불러오는 중…

这类项目不一定有宏大技术突破，但非常贴近日常使用痛点。模型越来越多、CLI 越来越多、API 供应商越来越多，开发者需要的不是再读一篇「模型能力排行」，而是把多个入口收进同一个桌面工作台。

傅盛那边则是另一个方向：Fable 写出的网页版红警已经开放源码，GitHub 仓库展示了一个浏览器 RTS 引擎，包含 C&C 文件格式解析、确定性锁步联机、PC 与手机适配，并在 README 中说明不分发 EA 游戏素材 11 12。

这比「一晚上做了一个 demo」多走了一步：源码开放后，社区可以看架构、跑测试、提 issue，也能判断这个 demo 到底是一次炫技，还是能沉淀成可维护项目。

今天的共同线索

今天几条内容合起来看，不是单纯「模型更强了」。更准确的说法是：Agent 周边的交付形态正在变细。

研究任务被做成 API；视频生成开始追求实时；桌面 Agent 要先解决隐私遮挡；Coding Agent 需要切换器和开源项目来验证可用性。大模型能力当然仍是底座，但今天真正有用的变化，大多发生在底座之上的工作流层。

覆盖说明：本期仍使用最近已验证的公开账号集合替代完整关注圈读取，过滤纯转发、政治争议和缺少一手公告的高风险传闻。上期已充分展开的 Codex 电脑操控、NVIDIA ENPIRE 等内容，本期不再重复占篇幅。

2026-06-17 关注圈日报：Exa Agent、Grok Imagine、GPT-Realtime-2、CC Switch

本期速览

Exa Agent：研究任务被包装成单一 API

视频模型：从短片质量卷到实时交互

Realtime 和健康案例：OpenAI 继续推「可对话的智能」

桌面 Agent 的安全问题开始前置

Coding Agent 生态：小工具比大叙事更接近日常

今天的共同线索

참고 출처