Qwen 机器人三连发、DeepSeek 首轮融资——AI HOT 今日热点（2026-06-17）

今天这组 AI 动态有两条主线。模型侧，Qwen 把机器人能力拆成操作、世界模型和导航三个方向同时推进；产品侧，Copilot Cowork、Grok for PowerPoint、OKF 和 Subagent 都在把「智能体接入日常工作」做成更具体的产品形态。行业侧更热闹：DeepSeek 首轮外部融资、Anthropic 与美国政府的拉扯、xAI 数据中心诉讼、GitHub 算力短缺和 SpaceX 收购 Cursor，说明模型能力之外，钱、算力和政府订单仍在决定 AI 公司的速度。

本期基于 AI HOT API 覆盖的 2026-06-16 00:00:00 至 2026-06-17 00:00:00 UTC 窗口，从 29 条候选中筛选 25 条。教育志愿填报、Meta 工程组织争议、WorkBuddy 使用增长和 Gary Marcus 对 OpenAI 的评论暂未展开，主要是因为它们与今天的模型、产品和产业信号相比，行动价值略低或信息仍偏观点化。

今日最该先看的 5 条

Qwen 一天内连发 RobotManip、RobotWorld、RobotNav，把机器人操作、场景世界建模和导航系统拆成三个可扩展模型方向。1 2 3
Cartesia 的 Sonic 3.5 与 Ink 2 把实时语音的「听」和「说」放进同一技术栈，首音频延迟约 82ms。4
Copilot Cowork 全球正式可用，微软开始把长期运行的工作智能体推给更多组织。5
DeepSeek 完成首轮外部融资，估值超过 500 亿美元，开源和基础研究路线仍是对外叙事核心。6
OpenAI 连续发布 Deployment Simulation 与公开聊天数据验证研究，模型上线前的「真实部署模拟」正在变成安全评估重点。7 8

模型发布/更新：机器人和实时语音是今天主线

Cartesia Sonic 3.5 / Ink 2：Cartesia 推出 Sonic 3.5 文本转语音和 Ink 2 语音转文本模型，组成实时语音栈；AI HOT 摘要显示，Ink 2 在 Artificial Analysis 流式 STT 排行第一，Sonic 3.5 在实时 TTS 中位列榜首，首音频延迟约 82ms。4

Loading content card…

Qwen-RobotManip：通义千问基于 Qwen-VL 发布视觉-语言-动作基础模型 Qwen-RobotManip，引入表示、运动、行为三维统一对齐框架；预训练语料约 38,100 小时，覆盖 15 种机器人形态，并在 LIBERO-Plus、RoboTwin-C2R、RoboCasa365、EBench 等多项基准给出成绩。1
Qwen-RobotWorld：Qwen-RobotWorld 以语言作为统一动作接口，采用双流 Multimodal Diffusion Transformer 架构，把 Qwen2.5-VL 用作动作编码器；AI HOT 摘要显示，它统一 20 多种机器人形态，训练数据包含 860 万跨场景训练对和 1,300 多项操作技能。2
Seedance 2.0 Mini：字节跳动火山方舟上线 Seedance 2.0 Mini 视频生成模型，计划近期开放 API；该模型比 Seedance 2.0 Fast 快 2 倍，图生视频定价 0.023 元/千 tokens，720P 单秒生成成本约 0.5 元，较标准版降低约一半。9
Qwen-RobotNav：Qwen-RobotNav 基于 Qwen3-VL 在 15.6M 样本上训练，统一视觉语言导航、目标导航、目标跟踪、自动驾驶和具身问答五个领域；摘要列出的指标包括 VLN-CE RxR 成功率 76.5%、HM3Dv2 目标导航 75.6%、EVT-Bench 跟踪率 90.0%、NAVSIM PDMS 91.4。3

读者该怎么用这组信息：机器人方向今天不是单点 demo，而是更接近「把基础模型拆进任务系统」。如果你在做具身智能、工业自动化或视频生成工具，Qwen 和 Seedance 这几条分别对应数据规模、任务接口和成本结构，后面要看 API、权重和许可证细节是否跟上。

产品发布/更新：工作智能体进入办公软件和知识库

Google Cloud OKF v0.1：Google Cloud 推出 Open Knowledge Format，一种供应商中立的 Markdown 规范，用带 YAML 前置元数据的目录给 AI 智能体提供结构化上下文；它不要求专有服务、SDK 或运行时，可托管在 GitHub、以 tarball 传输或挂载到文件系统。10
Copilot Cowork：Satya Nadella 宣布 Copilot Cowork 全球正式可用，并支持多模型；微软给出的定位是让长期运行的智能体处理组织内复杂多步骤任务，并基于组织知识工作。5

Loading content card…

AI 版支付宝「阿宝」：支付宝开启 AI 版邀测，用户右滑进入新版界面后，可用对话或语音让「阿宝」代办事项；涉及资金变动和支付的环节仍需用户本人确认。11
小米 MiMo Claw：小米发布 MiMo Claw 正式版，搭载 MiMo-V2.5-Pro 旗舰模型，原生兼容 MCP 工具调用协议，内置百万级超长上下文；在 OpenClaw 标准 Agent 工作流中吞吐效率提升约 3 倍，ClawEval Pass³ 达 63.8%。12
OpenRouter Subagent：OpenRouter 推出 openrouter:subagent 服务器工具，允许前沿模型在生成过程中，把文档总结、结构化数据提取、文本重格式化等独立任务委托给更小、更便宜、更快的 worker 模型。13
Midjourney V8.1 Draft mode：Midjourney V8.1 草稿模式一次生成 24 张低分辨率低质量图片，用户可对任意图片点击 Vary 渲染为全质量版本；草稿任务消耗的快速小时数减半。14
Grok for PowerPoint：xAI 发布 Grok for PowerPoint，作为免费 Microsoft 365 插件上线；它可在 PowerPoint 内把大纲转为幻灯片，做内容研究、撰写、排版，也能调用 Grok 连接器读取邮件或 SharePoint 信息。15

这一组产品的共同点很清楚：智能体不再只停在聊天框里。OKF 解决知识格式，Copilot Cowork 和 MiMo Claw 解决长任务，Subagent 解决成本分层，Grok 与支付宝则把入口嵌回办公和生活应用。对团队来说，下一步不是「要不要用 AI」，而是先决定哪些知识、工具和审批环节能被安全交给智能体。

行业动态：钱、算力和政府关系继续决定牌桌

xAI 燃气轮机诉讼：The Decoder 报道称，美国司法部在一份驳回诉讼的动议中援引国家安全，为 xAI 在密西西比州 Southaven 的 Colossus 2 设施运行未经许可的燃气轮机辩护；NAACP 起诉称，相关燃气轮机数量从 4 月的 27 台增至 57 台，并导致氮氧化物排放飙升 111%。16
五角大楼与 Anthropic：来自阿易 AI Notes 的追踪称，五角大楼已将超过三分之二日常 AI 工作流从 Anthropic 转移，目标是在 9 月前完全切断；该说法同时提到，冲突源于 Claude 是否可用于大规模监控和全自动武器。17
GitHub 算力短缺：RuntimeWire 报道称，微软旗下 GitHub 面临 AI capacity crunch，微软因此向 AWS 寻求计算资源支持；这条线索来自 Hacker News 热门讨论。18
Copilot Cowork 可能接入 DeepSeek V4：Kim 的 X 线索称，微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4 版本，作为更便宜的模型选项；同一条摘要还称 Copilot Cowork 将放弃无限定价，转向按使用量计费。19

Loading content card…

Fable 政府封禁后续：TechCrunch 发文质疑，美国政府对 Anthropic 模型 Fable 的封禁并非此前外界理解的「模型越狱」问题；该文章在 Hacker News 引发讨论并获得 103 个点赞。20
SpaceX 收购 Cursor：TechCrunch 报道称，SpaceX 同意以 600 亿美元股票收购 AI 编程公司 Cursor；报道还称 Cursor 此前接近完成一轮 20 亿美元融资，估值 500 亿美元，投资方包括 Andreessen Horowitz、Thrive 和 Nvidia。21
Anthropic 企业订阅份额超 OpenAI：TechCrunch 援引 Ramp 数据称，Anthropic 5 月企业 AI 订阅市场份额达 41%，首次超过 OpenAI 的 39.5%；同文称，特朗普政府限制最新模型访问的争议反而可能推动企业采用量。22
DeepSeek 首轮外部融资：The Decoder 报道称，DeepSeek 完成首轮外部融资，募资超过 500 亿元人民币，估值超过 500 亿美元；报道还称，多数投资者通过梁文锋管理的有限合伙企业投入资金，无投票权且锁定五年，腾讯和宁德时代为主要外部投资者。6

行业线索的关键词是「约束」。算力约束让 GitHub 找 AWS，成本约束让 Copilot Cowork 可能引入更便宜模型，监管与国防约束正在改变 Anthropic、xAI 的商业空间。DeepSeek 融资则提供了另一种对照：资金进来，但结构设计仍在强调控制权和研究方向。

论文研究：评估开始贴近真实部署

Anthropic Claude Code 专业知识研究：Anthropic 分析约 40 万次 Claude Code 交互会话后发现，人类更常负责「做什么」的规划决策，Claude 更常负责「怎么做」的执行决策；领域专业知识越强，模型每次指令完成的工作量越多。23
OpenAI Deployment Simulation：OpenAI 发布 Deployment Simulation 方法，在隐私保护下重放历史对话，用候选模型重新生成回复，以模拟模型上线后的实际表现；OpenAI 称该方法在多个 GPT-5-series Thinking 部署中，比传统评估更准确估计不良行为频率。7
公开聊天数据外部审计：OpenAI 使用 WildChat 公开数据集模拟 GPT-5.1、GPT-5.2、GPT-5.4 的部署表现，并与私有生产数据对比；研究称，WildChat 模拟的平均预测误差约 3 倍，但对技术性和智能体型失调的预测精度下降。8

这三篇研究都在把评估从「静态题库」往真实工作流推。Claude Code 研究关注人和模型怎样分工，OpenAI 的两篇则关心上线前怎样模拟真实用户分布。对做产品的人来说，结论不是多跑几个 benchmark 就够了，而是要把内部日志、真实任务和新模型评估接起来。

技巧与观点：AI 使用正在制造新的流程问题

毕业论文 AI 检测困境：数字生命卡兹克写到，学生手写摘要被判 99% AI 率，纯 AI 写作部分却显示 0%；同一论文在不同平台检测结果出现 48%、44%、59% 等差异，部分学校已改用 AI 使用声明表替代一刀切检测。24
前沿大模型后训练配方回顾：Interconnects 播客与 Finbarr Timbers 回顾后训练配方演变，从 InstructGPT 的 SFT、奖励模型、RL，到 DeepSeek R1 的大规模 RL，再到 Multi-teacher On-Policy Distillation；摘要提到 2026 年配方正在走向多个领域专家模型再合并回统一模型。25

最后这两条一个偏使用现场，一个偏模型训练现场。前者提醒学校和企业，不透明检测指标很容易把人逼进「用 AI 改到机器觉得不像 AI」的荒唐循环；后者说明前沿模型训练已经从单一路线变成配方组合，后训练能力可能继续拉开模型之间的体验差距。

Qwen 机器人三连发、DeepSeek 首轮融资——AI HOT 今日热点（2026-06-17）

今日最该先看的 5 条

模型发布/更新：机器人和实时语音是今天主线

产品发布/更新：工作智能体进入办公软件和知识库

行业动态：钱、算力和政府关系继续决定牌桌

论文研究：评估开始贴近真实部署

技巧与观点：AI 使用正在制造新的流程问题

References