
Ornith-1.0、OpenRouter MCP 与 Codex Mobile——AI HOT 今日热点(2026-06-26)
今天的 AI HOT 覆盖 25 条动态:Ornith-1.0 把 Agentic Coding 推到开源模型前台,OpenRouter MCP 与 Codex Mobile 把模型能力接进开发工作流,General Intuition 融资和 OpenAI Codex 报告则继续抬高 Agent 基础设施的重要性。

先看今天的重心
| 版块 | 条目数 | 今天最值得先扫的线索 |
|---|---|---|
| 模型发布/更新 | 1 | Ornith-1.0 把 Agentic Coding 作为主场,发布 9B、31B、35B MoE、397B MoE 多个规模。2 |
| 产品发布/更新 | 8 | OpenRouter MCP、Codex Mobile、Runway Agent 2.0、Claude Code v2.1.193 同时指向「把模型能力塞进日常工具」。3 |
| 行业动态 | 5 | 安全审批、版权/模型能力争议、内容审核自动化和大额融资混在一起,说明 AI 产业的约束条件正在变多。4 |
| 论文研究 | 4 | 古卷虚拟展开、亚纳米芯片、Codex 工作方式报告、线性弹性缓存,覆盖文献解读、硬件、组织效率和云成本。5 |
| 技巧与观点 | 7 | AI 经济收入、模型政治偏向、混合架构预测特征、隐私资产分类和推理编排,是今天更适合慢读的部分。6 |

模型发布/更新
| 动态 | 主体 | 要点 | 读者动作 |
|---|---|---|---|
| Ornith-1.0 开源模型家族 | Ornith / Berry Xia | Ornith-1.0 面向 Agentic Coding,覆盖 9B Dense、31B Dense、35B MoE、397B MoE 多个规模;AI HOT 摘要称其在 SWE-Bench Verified、SWE-Bench Pro、Terminal-Bench 2.1 等基准上进入开源前列,并采用强化学习联合优化任务脚手架与最终解法。2 | 做代码智能体评测或本地部署的人,可以先看 9B / 31B 和 GGUF 版本;团队评估时别只看单个 SWE-Bench 数字,最好补测仓库级任务和工具调用稳定性。 |
产品发布/更新
| 动态 | 主体 | 要点 | 读者动作 |
|---|---|---|---|
| OpenRouter MCP 服务器发布 | OpenRouter | OpenRouter 推出 MCP Server,把实时模型数据、基准排名、定价、文档查询和测试推理接到 Claude Code、Codex CLI、Cursor 等客户端。3 | 如果团队经常在多个模型间切换,可以把模型选择、价格对比、测试 prompt 放进编辑器工作流,而不是靠人工维护表格。 |
| Midjourney 预览 V8.2 | Midjourney | Midjourney 新增 --preview 参数,可提前体验 V8.2 美学与个性化效果;V8.1 大批量草稿模式现在也能搭配 --sref random 使用,探索风格空间的速度被描述为提升 24 倍。7 | 做视觉探索时先用草稿模式跑风格面,再把少数候选升级为全分辨率,成本会比一开始全量高清更可控。 |
| Codex 在 ChatGPT 移动 App 正式可用 | OpenAI Developers | OpenAI 宣布 Codex 在 ChatGPT 移动端 GA,并增加一对一设备配对;移动端可启动任务、审查输出、批准下一步,实际执行仍在电脑或开发机后台运行。8 | 适合把「排队等构建」「路上审 PR」这类碎片时间接进开发流程;安全上要关注设备配对和远程执行权限。 |
| Runway Agent 2.0 | Runway | Runway 发布 Agent 2.0,面向营销人员生成活动概念、广告变体、本地化素材,并可导入 Meta、YouTube、TikTok、Google 广告数据做下一轮创意测试。9 | 增长和品牌团队可以把它当成「创意迭代台」看,而不是单纯的视频生成器;关键测试项是广告数据接入后的建议质量。 |
| Midjourney V8.1 草稿模式随机风格 | Midjourney | Midjourney V8.1 草稿模式新增 --sref random,一次生成 24 张不同风格图片;用户可点击提示栏闪电图标或添加 --draft 开启。10 | 与 V8.2 预览一起看,Midjourney 正在把「风格探索」做成更低成本的高频步骤。 |
| Claude Code v2.1.193 | Anthropic | Claude Code v2.1.193 新增 autoMode.classifyAllShell、自动模式拒绝原因展示、OpenTelemetry assistant_response 日志事件、Bash 路径补全、MCP 认证提示和后台 shell 内存回收。11 | 已在生产环境使用 Claude Code 的团队,应重点检查 shell 命令分类、遥测日志和后台任务回收策略,避免默认配置影响自动化脚本。 |
| Google Finance Android 与投资组合功能 | Google Finance 推出正式版 Android 应用,并上线全球投资组合跟踪、AI 研究工具、市场情报任务和股价波动解释。12 | 个人投资者可先试组合导入和每日简报;机构用户仍需留意数据源、延迟和合规留痕。 | |
| Interactive Brokers 与 Grok 集成 | Interactive Brokers / xAI | xAI 称盈透证券用户可关联现有账户,通过 Grok 做组合收益分析、风险敞口情景建模、市场研究,并生成对冲订单等交易指令。13 | 这是 AI 从「解释行情」走向「生成交易动作」的信号;使用前应把权限边界、订单确认和风控阈值设清楚。 |
行业动态
| 动态 | 主体 | 要点 | 读者动作 |
|---|---|---|---|
| 美国政府要求 OpenAI 暂缓 GPT-5.6 广泛发布 | OpenAI / 美国政府 | The Information 相关线索称,美国政府因安全顾虑要求 OpenAI 暂缓 GPT-5.6 广泛发布,改为小范围受控预览,并由政府逐客户审批准入;担忧集中在自动化高技能网络工作能力。4 | 这是转述信号,尚需官方文件或 OpenAI 原文确认;安全、红队和合规团队可以先按「高能力模型分级准入」准备内部流程。 |
| Anthropic 指控阿里巴巴非法获取 Claude 能力 | Anthropic / Alibaba | Reuters 报道称 Anthropic 指控阿里巴巴未经授权提取 Claude AI 模型能力,阿里巴巴暂未公开回应。14 | 需要继续等双方回应和法律文件;企业采购多家模型时,应把模型输出、蒸馏、逆向工程和数据使用边界写进合同。 |
| Meta 员工警告 AI 内容审核部署过快 | Meta | The Decoder 报道称 Meta 已用大语言模型替换约一半人工审核请求,并计划年底前把部分内容类型的 AI 审核比例提升至 90% 以上;员工担心无害内容被移除或限流。15 | 平台治理团队可关注「误杀率」和「申诉可解释性」两项指标;模型替代人工审核不是只看成本。 |
| General Intuition 完成 3.2 亿美元融资 | General Intuition | General Intuition 以 23 亿美元估值完成 3.2 亿美元融资,利用 Medal 平台的游戏操作数据训练通用智能体,并计划通过 CoreWeave 扩大计算规模、开放 API。16 | 游戏数据训练现实世界智能体仍要验证迁移效率;投资人和开发者可重点看 API 开放后的任务泛化表现。 |
| Suno 推出 Spark 独立艺术家孵化器 | Suno | Suno 宣布 Spark 项目,面向 18 岁以上未签约独立歌手、词曲作者和制作人,提供创作资助、营销经费、写歌营机会,并称艺术家保留作品创意控制权和商业权利。17 | 音乐人可把它当成创作资源申请入口;更长期要看 Suno 如何处理训练数据、版权分成和平台分发。 |
论文研究
| 动态 | 主体 | 要点 | 读者动作 |
|---|---|---|---|
| 赫库兰尼姆古卷首次完整虚拟解读 | Vesuvius Challenge / 研究团队 | 研究人员用高分辨率 X 射线显微断层扫描和机器学习,完整虚拟展开并读取 PHerc.1667;第二卷 PHerc.Paris4 的成像独立确认 2023 年大奖赛解读,第三卷 PHerc.139 确定为菲洛德穆《论诸神》第八卷。5 | 这是 AI + 成像技术在文献保护上的硬进展;感兴趣的读者可直接查看公开数据和代码。 |
| IBM 推出亚纳米级芯片技术 | IBM | IBM 宣布 0.7 nm 节点与三维 nanostack 架构,称指甲盖大小芯片可集成近 1000 亿个晶体管,性能较 2 nm 最高提升 50%、能效最高提升 70%,预计 5 年内量产。18 | 芯片节点宣传需要看制造可行性和量产窗口;AI 硬件团队可关注 SRAM 面积缩减与高带宽工作负载的关系。 |
| OpenAI 内部报告:Codex 如何改变工作 | OpenAI | OpenAI 称 2025 年 8 月至 2026 年 6 月间,Codex 在内部输出 token 占比从不足 10% 升至 99.8%;Legal、Finance、Recruiting 等非开发部门也跨过 Codex 使用过半拐点。19 | 这份报告更像内部生产力样本,不能直接外推到所有企业;但它提醒管理者,Agent 采用会先改变任务分配,再改变组织流程。 |
| 线性弹性缓存优化云经济 | Google Research / Google Cloud | Google Research 与 Google Cloud 提出线性弹性缓存,把缓存管理转为线性成本优化问题,并用「滑雪租赁」决策框架在租用内存和缓存未命中惩罚间做选择。20 | 对云成本敏感的团队可关注这类「弹性内存 + 命中率」优化,尤其是无服务器和高峰波动明显的场景。 |
技巧与观点
| 动态 | 主体 | 要点 | 读者动作 |
|---|---|---|---|
| 《State of the AI Economy》报告 | Exponential View / Rohan Paul 转述 | AI HOT 摘要称,报告统计过去 12 个月实际 AI 营收达 1100 亿美元,年化运行率超 1750 亿美元;Token 降价每 10% 刺激 12%-18% 用量增长。6 | 这组数适合当作宏观跟踪线索;真正做投资判断时,还要回到原报告口径和去重方法。 |
| 主流 AI 聊天机器人政治立场偏左 | The Decoder / Washington Post 调查 | The Decoder 转述华盛顿邮报调查称,多数主流 AI 聊天机器人在政治问题上偏左;Google Gemini 3.1 Pro 被列为更常同时呈现双方立场的例外。21 | 模型评测不能只看能力分数,政治和价值观问题需要单独测试;企业部署问答机器人时尤其如此。 |
| OLMo Hybrid vs Transformer | Allen AI / Hugging Face | 对比 7B 参数 OLMo 3 和 OLMo Hybrid 的实验显示,混合模型在名词、动词、形容词等实义词上预测损失更低,但在重复 n-gram 和闭合括号上优势几乎消失。22 | 做模型架构选型时,别只看平均 loss;如果任务依赖精确复制、代码括号或长上下文检索,Transformer 注意力仍有优势。 |
| Meta 隐私感知基础设施资产分类 | Meta Engineering | Meta 在 PAI 资产分类中采用混合模式:LLM 处理歧义、冷启动和新颖资产,稳定行为再蒸馏为版本化确定性规则;LLM 不直接做生产决策。23 | 这是企业把 LLM 放进合规流程的参考架构:先让模型找模式,再把稳定结果固化为可审计规则。 |
| GitHub Copilot agentic harness 评估 | GitHub | GitHub Blog 称 Copilot agentic harness 在多个基准测试中表现强劲,具备较高 token 效率,并支持在 20 多个模型间选择。24 | 关注点不只是哪个模型最强,而是 harness 如何降低 token 成本、调度模型,并让任务在 IDE 内闭环。 |
| Sail Research 的集群感知编排 | Sail Research / Tom Tunguz | Tom Tunguz 介绍 Sail Research 构建 fleet-aware 编排系统,面向异步、多轮、可能持续数小时的智能体推理,目标是最大化每美元推理支出的吞吐量。25 | Agent 成本会从「单次请求价格」转向「长任务队列效率」;做后台 Agent 的团队可以开始量化等待、重试和吞吐。 |
| Generative AI Fizzle™ | Gary Marcus | Gary Marcus 认为生成式 AI 行业估值过高,投资者对 hype 与利润落差失去热情,LLM 商品化和价格战会压缩提供商利润。26 | 这是偏批判的观点文,不是事实报告;适合用来检查自己的乐观假设,尤其是模型降价、毛利和资本开支回收期。 |
今天可以带走的判断
References
- 1AI HOT public daily API
- 2Ornith-1.0 发布线索
- 3OpenRouter MCP Server
- 4GPT-5.6 受控发布线索
- 5First Scroll 解读项目
- 6State of the AI Economy 转述
- 7Midjourney V8.2 预览线索
- 8Codex Mobile GA
- 9Runway Agent 2.0
- 10Midjourney random styles in draft mode
- 11Claude Code v2.1.193 release
- 12Google Finance updates June 2026
- 13Grok + Interactive Brokers
- 14Reuters: Anthropic says Alibaba illicitly extracted Claude AI model capabilities
- 15Meta employees warn AI moderation rollout is too fast
- 16TechCrunch: General Intuition funding
- 17Suno Spark
- 18IBM sub-1 nanometer chip technology
- 19OpenAI: How agents are transforming work
- 20Google Research: Linear elastic caching
- 21AI chatbots political bias report
- 22Hugging Face: OLMo Hybrid token prediction
- 23Meta Engineering: Privacy-Aware Infrastructure
- 24GitHub Copilot agentic harness evaluation
- 25Sail Research inference queue
- 26Gary Marcus: The Generative AI Fizzle
Related content
Picked from other channels by content similarity—find new creators to follow.
Video·AI HOT 每日精选:编码代理、营销智能体与 AI 基础设施加速
6 月 26 日 AI HOT 视频日报,精选 Ornith-1.0、OpenRouter MCP、Codex 移动端、Runway Agent 2.0、General Intuition、IBM 亚纳米芯片与 AI 经济报告,串联编码代理、创作工作流和基础设施瓶颈三条主线。
AI 热点每日视频日报
Image post·AI 产品每日盘点|2026.06.03
今日 7 条 AI 产品动态:OpenAI Codex 推出六大白领插件(500 万+ 周活用户)、Anthropic 秘密提交 S-1 启动 IPO(估值 9650 亿美元)、微软 Build 2026 发布 Project Solara 智能体操作系统与首款推理模型 MAI-Thinking-1、Claude Code 多智能体动态工作流上线、MiniMax M3 开源百万 Token 模型、Runway Aleph 2.0 视频编辑 API 正式开放。
AI 产品每日盘点
Article·Codex 上手机了,但你还是得开着笔记本
OpenAI 5 月 14 日把 Codex 搬上手机,官方定位「与 AI agent 协作的新节奏」。说白了:不是在手机上写代码,是看 agent 在帮你写什么。功能有真实价值,但 Reddit 社区一句话点破了——「分诊界面而非缩小版桌面」。本文拆解官方话术、PC Mag 实测数据、Sam Altman 的两个月免费背后的定价战,以及那条没人强调的 macOS only 限制。
葬AI风格 · AI产品每日锐评
Video·AI HOT 每日精选:语音模型、企业智能体与公开评测
6 月 17 日 AI HOT 视频日报:覆盖 Cartesia Sonic 3.5 / Ink 2、Midjourney Draft mode、Copilot Cowork、Anthropic Claude Code 研究、OpenAI WildChat 对齐评估、Anthropic 企业订阅份额反超与 Google Cloud OKF。
AI 热点每日视频日报
Video·量子位日报视频 · 2026-06-16 创建样例
创建样例:截至 2026-06-16 12:00,抓取量子位微信公众号原号 2 篇 Codex 相关更新,演示每日 20:00 汇总成卡片轮播视频的效果。
量子位日报视频
Article·AI Agent 生态速报 | 2026-05-02:编码模型大决战、Cursor Harness 架构革新、框架集中向 v3 协议迈进
本期三条主线:GPT-5.5 发布一周 API 收入翻倍并向企业侧扩张、Claude Opus 4.7 在 CursorBench 跑出 70% 并获三家头部编码 Agent 背书,两者竞争使「真实 Agent 内测数字」正在取代学术 benchmark 成为选型锚点;Cursor 首次系统披露 Agent Harness 技术架构(动态上下文、错误分类、模型特定定制),给多代理编码系统提供了工程参考蓝图;LangChain/LangGraph 同日密集落版,节点级错误处理进入 alpha,v3 stream_events 协议成为本周框架迭代主轴,社区讨论从生产事故案例中持续收敛出「最大化确定性」的共识。
Agent 生态周报

Add more perspectives or context around this Post.