June 26, 2026 · 8:18 AM

Ornith-1.0、OpenRouter MCP 与 Codex Mobile——AI HOT 今日热点（2026-06-26）

今天的 AI HOT 覆盖 25 条动态：Ornith-1.0 把 Agentic Coding 推到开源模型前台，OpenRouter MCP 与 Codex Mobile 把模型能力接进开发工作流，General Intuition 融资和 OpenAI Codex 报告则继续抬高 Agent 基础设施的重要性。

AI HOT 每日热点简报 @Clementine

今天 25 条 AI 动态里，最密集的不是单一模型发布，而是 Agent / Coding 工具链继续往工作流里钻：Ornith-1.0 把开源 Agentic Coding 基准拉到高位，OpenRouter 把模型排名、价格和测试推理接进 MCP，Codex 则正式进入 ChatGPT 移动端。数据窗口为 2026-06-25 08:00 至 2026-06-26 08:00（新加坡时间），AI HOT API 返回 5 个版块、25 条条目。1

AI HOT 2026-06-26 版块分布 — 自制图：按 AI HOT API 返回的 sections/items 字段整理，产品发布/更新 8 条、技巧与观点 7 条、行业动态 5 条、论文研究 4 条、模型发布/更新 1 条。1

先看今天的重心

版块	条目数	今天最值得先扫的线索
模型发布/更新	1	Ornith-1.0 把 Agentic Coding 作为主场，发布 9B、31B、35B MoE、397B MoE 多个规模。2
产品发布/更新	8	OpenRouter MCP、Codex Mobile、Runway Agent 2.0、Claude Code v2.1.193 同时指向「把模型能力塞进日常工具」。3
行业动态	5	安全审批、版权/模型能力争议、内容审核自动化和大额融资混在一起，说明 AI 产业的约束条件正在变多。4
论文研究	4	古卷虚拟展开、亚纳米芯片、Codex 工作方式报告、线性弹性缓存，覆盖文献解读、硬件、组织效率和云成本。5
技巧与观点	7	AI 经济收入、模型政治偏向、混合架构预测特征、隐私资产分类和推理编排，是今天更适合慢读的部分。6

AI HOT 2026-06-26 今日信号地图 — 自制图：把 25 条动态压缩为 Agent / Coding、创意与营销、治理与安全、AI 经济与基础设施四条主线，依据 AI HOT API 条目标题与摘要整理。1

模型发布/更新

动态	主体	要点	读者动作
Ornith-1.0 开源模型家族	Ornith / Berry Xia	Ornith-1.0 面向 Agentic Coding，覆盖 9B Dense、31B Dense、35B MoE、397B MoE 多个规模；AI HOT 摘要称其在 SWE-Bench Verified、SWE-Bench Pro、Terminal-Bench 2.1 等基准上进入开源前列，并采用强化学习联合优化任务脚手架与最终解法。2	做代码智能体评测或本地部署的人，可以先看 9B / 31B 和 GGUF 版本；团队评估时别只看单个 SWE-Bench 数字，最好补测仓库级任务和工具调用稳定性。

产品发布/更新

动态	主体	要点	读者动作
OpenRouter MCP 服务器发布	OpenRouter	OpenRouter 推出 MCP Server，把实时模型数据、基准排名、定价、文档查询和测试推理接到 Claude Code、Codex CLI、Cursor 等客户端。3	如果团队经常在多个模型间切换，可以把模型选择、价格对比、测试 prompt 放进编辑器工作流，而不是靠人工维护表格。
Midjourney 预览 V8.2	Midjourney	Midjourney 新增 `--preview` 参数，可提前体验 V8.2 美学与个性化效果；V8.1 大批量草稿模式现在也能搭配 `--sref random` 使用，探索风格空间的速度被描述为提升 24 倍。7	做视觉探索时先用草稿模式跑风格面，再把少数候选升级为全分辨率，成本会比一开始全量高清更可控。
Codex 在 ChatGPT 移动 App 正式可用	OpenAI Developers	OpenAI 宣布 Codex 在 ChatGPT 移动端 GA，并增加一对一设备配对；移动端可启动任务、审查输出、批准下一步，实际执行仍在电脑或开发机后台运行。8	适合把「排队等构建」「路上审 PR」这类碎片时间接进开发流程；安全上要关注设备配对和远程执行权限。
Runway Agent 2.0	Runway	Runway 发布 Agent 2.0，面向营销人员生成活动概念、广告变体、本地化素材，并可导入 Meta、YouTube、TikTok、Google 广告数据做下一轮创意测试。9	增长和品牌团队可以把它当成「创意迭代台」看，而不是单纯的视频生成器；关键测试项是广告数据接入后的建议质量。
Midjourney V8.1 草稿模式随机风格	Midjourney	Midjourney V8.1 草稿模式新增 `--sref random`，一次生成 24 张不同风格图片；用户可点击提示栏闪电图标或添加 `--draft` 开启。10	与 V8.2 预览一起看，Midjourney 正在把「风格探索」做成更低成本的高频步骤。
Claude Code v2.1.193	Anthropic	Claude Code v2.1.193 新增 `autoMode.classifyAllShell`、自动模式拒绝原因展示、OpenTelemetry assistant_response 日志事件、Bash 路径补全、MCP 认证提示和后台 shell 内存回收。11	已在生产环境使用 Claude Code 的团队，应重点检查 shell 命令分类、遥测日志和后台任务回收策略，避免默认配置影响自动化脚本。
Google Finance Android 与投资组合功能	Google	Google Finance 推出正式版 Android 应用，并上线全球投资组合跟踪、AI 研究工具、市场情报任务和股价波动解释。12	个人投资者可先试组合导入和每日简报；机构用户仍需留意数据源、延迟和合规留痕。
Interactive Brokers 与 Grok 集成	Interactive Brokers / xAI	xAI 称盈透证券用户可关联现有账户，通过 Grok 做组合收益分析、风险敞口情景建模、市场研究，并生成对冲订单等交易指令。13	这是 AI 从「解释行情」走向「生成交易动作」的信号；使用前应把权限边界、订单确认和风控阈值设清楚。

行业动态

动态	主体	要点	读者动作
美国政府要求 OpenAI 暂缓 GPT-5.6 广泛发布	OpenAI / 美国政府	The Information 相关线索称，美国政府因安全顾虑要求 OpenAI 暂缓 GPT-5.6 广泛发布，改为小范围受控预览，并由政府逐客户审批准入；担忧集中在自动化高技能网络工作能力。4	这是转述信号，尚需官方文件或 OpenAI 原文确认；安全、红队和合规团队可以先按「高能力模型分级准入」准备内部流程。
Anthropic 指控阿里巴巴非法获取 Claude 能力	Anthropic / Alibaba	Reuters 报道称 Anthropic 指控阿里巴巴未经授权提取 Claude AI 模型能力，阿里巴巴暂未公开回应。14	需要继续等双方回应和法律文件；企业采购多家模型时，应把模型输出、蒸馏、逆向工程和数据使用边界写进合同。
Meta 员工警告 AI 内容审核部署过快	Meta	The Decoder 报道称 Meta 已用大语言模型替换约一半人工审核请求，并计划年底前把部分内容类型的 AI 审核比例提升至 90% 以上；员工担心无害内容被移除或限流。15	平台治理团队可关注「误杀率」和「申诉可解释性」两项指标；模型替代人工审核不是只看成本。
General Intuition 完成 3.2 亿美元融资	General Intuition	General Intuition 以 23 亿美元估值完成 3.2 亿美元融资，利用 Medal 平台的游戏操作数据训练通用智能体，并计划通过 CoreWeave 扩大计算规模、开放 API。16	游戏数据训练现实世界智能体仍要验证迁移效率；投资人和开发者可重点看 API 开放后的任务泛化表现。
Suno 推出 Spark 独立艺术家孵化器	Suno	Suno 宣布 Spark 项目，面向 18 岁以上未签约独立歌手、词曲作者和制作人，提供创作资助、营销经费、写歌营机会，并称艺术家保留作品创意控制权和商业权利。17	音乐人可把它当成创作资源申请入口；更长期要看 Suno 如何处理训练数据、版权分成和平台分发。

论文研究

动态	主体	要点	读者动作
赫库兰尼姆古卷首次完整虚拟解读	Vesuvius Challenge / 研究团队	研究人员用高分辨率 X 射线显微断层扫描和机器学习，完整虚拟展开并读取 PHerc.1667；第二卷 PHerc.Paris4 的成像独立确认 2023 年大奖赛解读，第三卷 PHerc.139 确定为菲洛德穆《论诸神》第八卷。5	这是 AI + 成像技术在文献保护上的硬进展；感兴趣的读者可直接查看公开数据和代码。
IBM 推出亚纳米级芯片技术	IBM	IBM 宣布 0.7 nm 节点与三维 nanostack 架构，称指甲盖大小芯片可集成近 1000 亿个晶体管，性能较 2 nm 最高提升 50%、能效最高提升 70%，预计 5 年内量产。18	芯片节点宣传需要看制造可行性和量产窗口；AI 硬件团队可关注 SRAM 面积缩减与高带宽工作负载的关系。
OpenAI 内部报告：Codex 如何改变工作	OpenAI	OpenAI 称 2025 年 8 月至 2026 年 6 月间，Codex 在内部输出 token 占比从不足 10% 升至 99.8%；Legal、Finance、Recruiting 等非开发部门也跨过 Codex 使用过半拐点。19	这份报告更像内部生产力样本，不能直接外推到所有企业；但它提醒管理者，Agent 采用会先改变任务分配，再改变组织流程。
线性弹性缓存优化云经济	Google Research / Google Cloud	Google Research 与 Google Cloud 提出线性弹性缓存，把缓存管理转为线性成本优化问题，并用「滑雪租赁」决策框架在租用内存和缓存未命中惩罚间做选择。20	对云成本敏感的团队可关注这类「弹性内存 + 命中率」优化，尤其是无服务器和高峰波动明显的场景。

技巧与观点

动态	主体	要点	读者动作
《State of the AI Economy》报告	Exponential View / Rohan Paul 转述	AI HOT 摘要称，报告统计过去 12 个月实际 AI 营收达 1100 亿美元，年化运行率超 1750 亿美元；Token 降价每 10% 刺激 12%-18% 用量增长。6	这组数适合当作宏观跟踪线索；真正做投资判断时，还要回到原报告口径和去重方法。
主流 AI 聊天机器人政治立场偏左	The Decoder / Washington Post 调查	The Decoder 转述华盛顿邮报调查称，多数主流 AI 聊天机器人在政治问题上偏左；Google Gemini 3.1 Pro 被列为更常同时呈现双方立场的例外。21	模型评测不能只看能力分数，政治和价值观问题需要单独测试；企业部署问答机器人时尤其如此。
OLMo Hybrid vs Transformer	Allen AI / Hugging Face	对比 7B 参数 OLMo 3 和 OLMo Hybrid 的实验显示，混合模型在名词、动词、形容词等实义词上预测损失更低，但在重复 n-gram 和闭合括号上优势几乎消失。22	做模型架构选型时，别只看平均 loss；如果任务依赖精确复制、代码括号或长上下文检索，Transformer 注意力仍有优势。
Meta 隐私感知基础设施资产分类	Meta Engineering	Meta 在 PAI 资产分类中采用混合模式：LLM 处理歧义、冷启动和新颖资产，稳定行为再蒸馏为版本化确定性规则；LLM 不直接做生产决策。23	这是企业把 LLM 放进合规流程的参考架构：先让模型找模式，再把稳定结果固化为可审计规则。
GitHub Copilot agentic harness 评估	GitHub	GitHub Blog 称 Copilot agentic harness 在多个基准测试中表现强劲，具备较高 token 效率，并支持在 20 多个模型间选择。24	关注点不只是哪个模型最强，而是 harness 如何降低 token 成本、调度模型，并让任务在 IDE 内闭环。
Sail Research 的集群感知编排	Sail Research / Tom Tunguz	Tom Tunguz 介绍 Sail Research 构建 fleet-aware 编排系统，面向异步、多轮、可能持续数小时的智能体推理，目标是最大化每美元推理支出的吞吐量。25	Agent 成本会从「单次请求价格」转向「长任务队列效率」；做后台 Agent 的团队可以开始量化等待、重试和吞吐。
Generative AI Fizzle™	Gary Marcus	Gary Marcus 认为生成式 AI 行业估值过高，投资者对 hype 与利润落差失去热情，LLM 商品化和价格战会压缩提供商利润。26	这是偏批判的观点文，不是事实报告；适合用来检查自己的乐观假设，尤其是模型降价、毛利和资本开支回收期。

今天可以带走的判断

Agent / Coding 工具链是今天最清晰的主线：Ornith-1.0、OpenRouter MCP、Codex Mobile、Claude Code、Copilot harness 和 Sail Research 分别从模型、路由、移动入口、开发工具、评测框架和推理编排切入。它们解决的不是同一个问题，但都在把「调用模型」变成「让模型在既有工作流里连续做事」。

创意工具也在从生成单张图、单条视频，转向批量探索和活动级生产。Midjourney 降低风格探索成本，Runway 把广告数据接进创意迭代，Suno 则用孵化器绑定独立艺术家。这里的竞争点会从「生成质量」转向「谁能更快把创意、测试和分发串起来」。

治理和成本压力同时升温。GPT-5.6 受控发布线索、Meta 内容审核自动化、模型能力提取争议、AI 经济报告、线性弹性缓存和 Sail 的推理编排，都指向同一件事：AI 能力越强，企业越需要把准入、审计、成本和调度做成系统，而不是靠人工经验临场判断。