Ornith-1.0、OpenRouter MCP 与 Codex Mobile——AI HOT 今日热点(2026-06-26)
June 26, 2026 · 8:18 AM

Ornith-1.0、OpenRouter MCP 与 Codex Mobile——AI HOT 今日热点(2026-06-26)

今天的 AI HOT 覆盖 25 条动态:Ornith-1.0 把 Agentic Coding 推到开源模型前台,OpenRouter MCP 与 Codex Mobile 把模型能力接进开发工作流,General Intuition 融资和 OpenAI Codex 报告则继续抬高 Agent 基础设施的重要性。

今天 25 条 AI 动态里,最密集的不是单一模型发布,而是 Agent / Coding 工具链继续往工作流里钻:Ornith-1.0 把开源 Agentic Coding 基准拉到高位,OpenRouter 把模型排名、价格和测试推理接进 MCP,Codex 则正式进入 ChatGPT 移动端。数据窗口为 2026-06-25 08:00 至 2026-06-26 08:00(新加坡时间),AI HOT API 返回 5 个版块、25 条条目。1
AI HOT 2026-06-26 版块分布
自制图:按 AI HOT API 返回的 sections/items 字段整理,产品发布/更新 8 条、技巧与观点 7 条、行业动态 5 条、论文研究 4 条、模型发布/更新 1 条。1

先看今天的重心

版块条目数今天最值得先扫的线索
模型发布/更新1Ornith-1.0 把 Agentic Coding 作为主场,发布 9B、31B、35B MoE、397B MoE 多个规模。2
产品发布/更新8OpenRouter MCP、Codex Mobile、Runway Agent 2.0、Claude Code v2.1.193 同时指向「把模型能力塞进日常工具」。3
行业动态5安全审批、版权/模型能力争议、内容审核自动化和大额融资混在一起,说明 AI 产业的约束条件正在变多。4
论文研究4古卷虚拟展开、亚纳米芯片、Codex 工作方式报告、线性弹性缓存,覆盖文献解读、硬件、组织效率和云成本。5
技巧与观点7AI 经济收入、模型政治偏向、混合架构预测特征、隐私资产分类和推理编排,是今天更适合慢读的部分。6
AI HOT 2026-06-26 今日信号地图
自制图:把 25 条动态压缩为 Agent / Coding、创意与营销、治理与安全、AI 经济与基础设施四条主线,依据 AI HOT API 条目标题与摘要整理。1

模型发布/更新

动态主体要点读者动作
Ornith-1.0 开源模型家族Ornith / Berry XiaOrnith-1.0 面向 Agentic Coding,覆盖 9B Dense、31B Dense、35B MoE、397B MoE 多个规模;AI HOT 摘要称其在 SWE-Bench Verified、SWE-Bench Pro、Terminal-Bench 2.1 等基准上进入开源前列,并采用强化学习联合优化任务脚手架与最终解法。2做代码智能体评测或本地部署的人,可以先看 9B / 31B 和 GGUF 版本;团队评估时别只看单个 SWE-Bench 数字,最好补测仓库级任务和工具调用稳定性。

产品发布/更新

动态主体要点读者动作
OpenRouter MCP 服务器发布OpenRouterOpenRouter 推出 MCP Server,把实时模型数据、基准排名、定价、文档查询和测试推理接到 Claude Code、Codex CLI、Cursor 等客户端。3如果团队经常在多个模型间切换,可以把模型选择、价格对比、测试 prompt 放进编辑器工作流,而不是靠人工维护表格。
Midjourney 预览 V8.2MidjourneyMidjourney 新增 --preview 参数,可提前体验 V8.2 美学与个性化效果;V8.1 大批量草稿模式现在也能搭配 --sref random 使用,探索风格空间的速度被描述为提升 24 倍。7做视觉探索时先用草稿模式跑风格面,再把少数候选升级为全分辨率,成本会比一开始全量高清更可控。
Codex 在 ChatGPT 移动 App 正式可用OpenAI DevelopersOpenAI 宣布 Codex 在 ChatGPT 移动端 GA,并增加一对一设备配对;移动端可启动任务、审查输出、批准下一步,实际执行仍在电脑或开发机后台运行。8适合把「排队等构建」「路上审 PR」这类碎片时间接进开发流程;安全上要关注设备配对和远程执行权限。
Runway Agent 2.0RunwayRunway 发布 Agent 2.0,面向营销人员生成活动概念、广告变体、本地化素材,并可导入 Meta、YouTube、TikTok、Google 广告数据做下一轮创意测试。9增长和品牌团队可以把它当成「创意迭代台」看,而不是单纯的视频生成器;关键测试项是广告数据接入后的建议质量。
Midjourney V8.1 草稿模式随机风格MidjourneyMidjourney V8.1 草稿模式新增 --sref random,一次生成 24 张不同风格图片;用户可点击提示栏闪电图标或添加 --draft 开启。10与 V8.2 预览一起看,Midjourney 正在把「风格探索」做成更低成本的高频步骤。
Claude Code v2.1.193AnthropicClaude Code v2.1.193 新增 autoMode.classifyAllShell、自动模式拒绝原因展示、OpenTelemetry assistant_response 日志事件、Bash 路径补全、MCP 认证提示和后台 shell 内存回收。11已在生产环境使用 Claude Code 的团队,应重点检查 shell 命令分类、遥测日志和后台任务回收策略,避免默认配置影响自动化脚本。
Google Finance Android 与投资组合功能GoogleGoogle Finance 推出正式版 Android 应用,并上线全球投资组合跟踪、AI 研究工具、市场情报任务和股价波动解释。12个人投资者可先试组合导入和每日简报;机构用户仍需留意数据源、延迟和合规留痕。
Interactive Brokers 与 Grok 集成Interactive Brokers / xAIxAI 称盈透证券用户可关联现有账户,通过 Grok 做组合收益分析、风险敞口情景建模、市场研究,并生成对冲订单等交易指令。13这是 AI 从「解释行情」走向「生成交易动作」的信号;使用前应把权限边界、订单确认和风控阈值设清楚。

行业动态

动态主体要点读者动作
美国政府要求 OpenAI 暂缓 GPT-5.6 广泛发布OpenAI / 美国政府The Information 相关线索称,美国政府因安全顾虑要求 OpenAI 暂缓 GPT-5.6 广泛发布,改为小范围受控预览,并由政府逐客户审批准入;担忧集中在自动化高技能网络工作能力。4这是转述信号,尚需官方文件或 OpenAI 原文确认;安全、红队和合规团队可以先按「高能力模型分级准入」准备内部流程。
Anthropic 指控阿里巴巴非法获取 Claude 能力Anthropic / AlibabaReuters 报道称 Anthropic 指控阿里巴巴未经授权提取 Claude AI 模型能力,阿里巴巴暂未公开回应。14需要继续等双方回应和法律文件;企业采购多家模型时,应把模型输出、蒸馏、逆向工程和数据使用边界写进合同。
Meta 员工警告 AI 内容审核部署过快MetaThe Decoder 报道称 Meta 已用大语言模型替换约一半人工审核请求,并计划年底前把部分内容类型的 AI 审核比例提升至 90% 以上;员工担心无害内容被移除或限流。15平台治理团队可关注「误杀率」和「申诉可解释性」两项指标;模型替代人工审核不是只看成本。
General Intuition 完成 3.2 亿美元融资General IntuitionGeneral Intuition 以 23 亿美元估值完成 3.2 亿美元融资,利用 Medal 平台的游戏操作数据训练通用智能体,并计划通过 CoreWeave 扩大计算规模、开放 API。16游戏数据训练现实世界智能体仍要验证迁移效率;投资人和开发者可重点看 API 开放后的任务泛化表现。
Suno 推出 Spark 独立艺术家孵化器SunoSuno 宣布 Spark 项目,面向 18 岁以上未签约独立歌手、词曲作者和制作人,提供创作资助、营销经费、写歌营机会,并称艺术家保留作品创意控制权和商业权利。17音乐人可把它当成创作资源申请入口;更长期要看 Suno 如何处理训练数据、版权分成和平台分发。

论文研究

动态主体要点读者动作
赫库兰尼姆古卷首次完整虚拟解读Vesuvius Challenge / 研究团队研究人员用高分辨率 X 射线显微断层扫描和机器学习,完整虚拟展开并读取 PHerc.1667;第二卷 PHerc.Paris4 的成像独立确认 2023 年大奖赛解读,第三卷 PHerc.139 确定为菲洛德穆《论诸神》第八卷。5这是 AI + 成像技术在文献保护上的硬进展;感兴趣的读者可直接查看公开数据和代码。
IBM 推出亚纳米级芯片技术IBMIBM 宣布 0.7 nm 节点与三维 nanostack 架构,称指甲盖大小芯片可集成近 1000 亿个晶体管,性能较 2 nm 最高提升 50%、能效最高提升 70%,预计 5 年内量产。18芯片节点宣传需要看制造可行性和量产窗口;AI 硬件团队可关注 SRAM 面积缩减与高带宽工作负载的关系。
OpenAI 内部报告:Codex 如何改变工作OpenAIOpenAI 称 2025 年 8 月至 2026 年 6 月间,Codex 在内部输出 token 占比从不足 10% 升至 99.8%;Legal、Finance、Recruiting 等非开发部门也跨过 Codex 使用过半拐点。19这份报告更像内部生产力样本,不能直接外推到所有企业;但它提醒管理者,Agent 采用会先改变任务分配,再改变组织流程。
线性弹性缓存优化云经济Google Research / Google CloudGoogle Research 与 Google Cloud 提出线性弹性缓存,把缓存管理转为线性成本优化问题,并用「滑雪租赁」决策框架在租用内存和缓存未命中惩罚间做选择。20对云成本敏感的团队可关注这类「弹性内存 + 命中率」优化,尤其是无服务器和高峰波动明显的场景。

技巧与观点

动态主体要点读者动作
《State of the AI Economy》报告Exponential View / Rohan Paul 转述AI HOT 摘要称,报告统计过去 12 个月实际 AI 营收达 1100 亿美元,年化运行率超 1750 亿美元;Token 降价每 10% 刺激 12%-18% 用量增长。6这组数适合当作宏观跟踪线索;真正做投资判断时,还要回到原报告口径和去重方法。
主流 AI 聊天机器人政治立场偏左The Decoder / Washington Post 调查The Decoder 转述华盛顿邮报调查称,多数主流 AI 聊天机器人在政治问题上偏左;Google Gemini 3.1 Pro 被列为更常同时呈现双方立场的例外。21模型评测不能只看能力分数,政治和价值观问题需要单独测试;企业部署问答机器人时尤其如此。
OLMo Hybrid vs TransformerAllen AI / Hugging Face对比 7B 参数 OLMo 3 和 OLMo Hybrid 的实验显示,混合模型在名词、动词、形容词等实义词上预测损失更低,但在重复 n-gram 和闭合括号上优势几乎消失。22做模型架构选型时,别只看平均 loss;如果任务依赖精确复制、代码括号或长上下文检索,Transformer 注意力仍有优势。
Meta 隐私感知基础设施资产分类Meta EngineeringMeta 在 PAI 资产分类中采用混合模式:LLM 处理歧义、冷启动和新颖资产,稳定行为再蒸馏为版本化确定性规则;LLM 不直接做生产决策。23这是企业把 LLM 放进合规流程的参考架构:先让模型找模式,再把稳定结果固化为可审计规则。
GitHub Copilot agentic harness 评估GitHubGitHub Blog 称 Copilot agentic harness 在多个基准测试中表现强劲,具备较高 token 效率,并支持在 20 多个模型间选择。24关注点不只是哪个模型最强,而是 harness 如何降低 token 成本、调度模型,并让任务在 IDE 内闭环。
Sail Research 的集群感知编排Sail Research / Tom TunguzTom Tunguz 介绍 Sail Research 构建 fleet-aware 编排系统,面向异步、多轮、可能持续数小时的智能体推理,目标是最大化每美元推理支出的吞吐量。25Agent 成本会从「单次请求价格」转向「长任务队列效率」;做后台 Agent 的团队可以开始量化等待、重试和吞吐。
Generative AI Fizzle™Gary MarcusGary Marcus 认为生成式 AI 行业估值过高,投资者对 hype 与利润落差失去热情,LLM 商品化和价格战会压缩提供商利润。26这是偏批判的观点文,不是事实报告;适合用来检查自己的乐观假设,尤其是模型降价、毛利和资本开支回收期。

今天可以带走的判断

Agent / Coding 工具链是今天最清晰的主线:Ornith-1.0、OpenRouter MCP、Codex Mobile、Claude Code、Copilot harness 和 Sail Research 分别从模型、路由、移动入口、开发工具、评测框架和推理编排切入。它们解决的不是同一个问题,但都在把「调用模型」变成「让模型在既有工作流里连续做事」。
创意工具也在从生成单张图、单条视频,转向批量探索和活动级生产。Midjourney 降低风格探索成本,Runway 把广告数据接进创意迭代,Suno 则用孵化器绑定独立艺术家。这里的竞争点会从「生成质量」转向「谁能更快把创意、测试和分发串起来」。
治理和成本压力同时升温。GPT-5.6 受控发布线索、Meta 内容审核自动化、模型能力提取争议、AI 经济报告、线性弹性缓存和 Sail 的推理编排,都指向同一件事:AI 能力越强,企业越需要把准入、审计、成本和调度做成系统,而不是靠人工经验临场判断。

Related content

Picked from other channels by content similarity—find new creators to follow.

Add more perspectives or context around this Post.

  • Sign in to comment.