Qwen 机器人三连发、DeepSeek 首轮融资——AI HOT 今日热点(2026-06-17)

Qwen 机器人三连发、DeepSeek 首轮融资——AI HOT 今日热点(2026-06-17)

Qwen 同日发布 RobotManip、RobotWorld、RobotNav,把机器人能力拆成操作、世界模型和导航三条线;Copilot Cowork、Grok for PowerPoint、OKF 和 Subagent 继续把智能体推进办公与知识库。行业侧关注 DeepSeek 首轮外部融资、xAI 数据中心诉讼、GitHub 算力短缺、Anthropic 与美国政府拉扯,以及 OpenAI 用部署模拟改进安全评估。

AI HOT 每日热点简报
June 17, 2026 · 8:16 AM
1 subscriptions · 8 items
今天这组 AI 动态有两条主线。模型侧,Qwen 把机器人能力拆成操作、世界模型和导航三个方向同时推进;产品侧,Copilot Cowork、Grok for PowerPoint、OKF 和 Subagent 都在把「智能体接入日常工作」做成更具体的产品形态。行业侧更热闹:DeepSeek 首轮外部融资、Anthropic 与美国政府的拉扯、xAI 数据中心诉讼、GitHub 算力短缺和 SpaceX 收购 Cursor,说明模型能力之外,钱、算力和政府订单仍在决定 AI 公司的速度。
本期基于 AI HOT API 覆盖的 2026-06-16 00:00:00 至 2026-06-17 00:00:00 UTC 窗口,从 29 条候选中筛选 25 条。教育志愿填报、Meta 工程组织争议、WorkBuddy 使用增长和 Gary Marcus 对 OpenAI 的评论暂未展开,主要是因为它们与今天的模型、产品和产业信号相比,行动价值略低或信息仍偏观点化。

今日最该先看的 5 条

  • Qwen 一天内连发 RobotManip、RobotWorld、RobotNav,把机器人操作、场景世界建模和导航系统拆成三个可扩展模型方向。1 2 3
  • Cartesia 的 Sonic 3.5 与 Ink 2 把实时语音的「听」和「说」放进同一技术栈,首音频延迟约 82ms。4
  • Copilot Cowork 全球正式可用,微软开始把长期运行的工作智能体推给更多组织。5
  • DeepSeek 完成首轮外部融资,估值超过 500 亿美元,开源和基础研究路线仍是对外叙事核心。6
  • OpenAI 连续发布 Deployment Simulation 与公开聊天数据验证研究,模型上线前的「真实部署模拟」正在变成安全评估重点。7 8

模型发布/更新:机器人和实时语音是今天主线

  • Cartesia Sonic 3.5 / Ink 2:Cartesia 推出 Sonic 3.5 文本转语音和 Ink 2 语音转文本模型,组成实时语音栈;AI HOT 摘要显示,Ink 2 在 Artificial Analysis 流式 STT 排行第一,Sonic 3.5 在实时 TTS 中位列榜首,首音频延迟约 82ms。4
Loading content card…
  • Qwen-RobotManip:通义千问基于 Qwen-VL 发布视觉-语言-动作基础模型 Qwen-RobotManip,引入表示、运动、行为三维统一对齐框架;预训练语料约 38,100 小时,覆盖 15 种机器人形态,并在 LIBERO-Plus、RoboTwin-C2R、RoboCasa365、EBench 等多项基准给出成绩。1
  • Qwen-RobotWorld:Qwen-RobotWorld 以语言作为统一动作接口,采用双流 Multimodal Diffusion Transformer 架构,把 Qwen2.5-VL 用作动作编码器;AI HOT 摘要显示,它统一 20 多种机器人形态,训练数据包含 860 万跨场景训练对和 1,300 多项操作技能。2
  • Seedance 2.0 Mini:字节跳动火山方舟上线 Seedance 2.0 Mini 视频生成模型,计划近期开放 API;该模型比 Seedance 2.0 Fast 快 2 倍,图生视频定价 0.023 元/千 tokens,720P 单秒生成成本约 0.5 元,较标准版降低约一半。9
  • Qwen-RobotNav:Qwen-RobotNav 基于 Qwen3-VL 在 15.6M 样本上训练,统一视觉语言导航、目标导航、目标跟踪、自动驾驶和具身问答五个领域;摘要列出的指标包括 VLN-CE RxR 成功率 76.5%、HM3Dv2 目标导航 75.6%、EVT-Bench 跟踪率 90.0%、NAVSIM PDMS 91.4。3
读者该怎么用这组信息:机器人方向今天不是单点 demo,而是更接近「把基础模型拆进任务系统」。如果你在做具身智能、工业自动化或视频生成工具,Qwen 和 Seedance 这几条分别对应数据规模、任务接口和成本结构,后面要看 API、权重和许可证细节是否跟上。

产品发布/更新:工作智能体进入办公软件和知识库

  • Google Cloud OKF v0.1:Google Cloud 推出 Open Knowledge Format,一种供应商中立的 Markdown 规范,用带 YAML 前置元数据的目录给 AI 智能体提供结构化上下文;它不要求专有服务、SDK 或运行时,可托管在 GitHub、以 tarball 传输或挂载到文件系统。10
  • Copilot Cowork:Satya Nadella 宣布 Copilot Cowork 全球正式可用,并支持多模型;微软给出的定位是让长期运行的智能体处理组织内复杂多步骤任务,并基于组织知识工作。5
Loading content card…
  • AI 版支付宝「阿宝」:支付宝开启 AI 版邀测,用户右滑进入新版界面后,可用对话或语音让「阿宝」代办事项;涉及资金变动和支付的环节仍需用户本人确认。11
  • 小米 MiMo Claw:小米发布 MiMo Claw 正式版,搭载 MiMo-V2.5-Pro 旗舰模型,原生兼容 MCP 工具调用协议,内置百万级超长上下文;在 OpenClaw 标准 Agent 工作流中吞吐效率提升约 3 倍,ClawEval Pass³ 达 63.8%。12
  • OpenRouter Subagent:OpenRouter 推出 openrouter:subagent 服务器工具,允许前沿模型在生成过程中,把文档总结、结构化数据提取、文本重格式化等独立任务委托给更小、更便宜、更快的 worker 模型。13
  • Midjourney V8.1 Draft mode:Midjourney V8.1 草稿模式一次生成 24 张低分辨率低质量图片,用户可对任意图片点击 Vary 渲染为全质量版本;草稿任务消耗的快速小时数减半。14
  • Grok for PowerPoint:xAI 发布 Grok for PowerPoint,作为免费 Microsoft 365 插件上线;它可在 PowerPoint 内把大纲转为幻灯片,做内容研究、撰写、排版,也能调用 Grok 连接器读取邮件或 SharePoint 信息。15
这一组产品的共同点很清楚:智能体不再只停在聊天框里。OKF 解决知识格式,Copilot Cowork 和 MiMo Claw 解决长任务,Subagent 解决成本分层,Grok 与支付宝则把入口嵌回办公和生活应用。对团队来说,下一步不是「要不要用 AI」,而是先决定哪些知识、工具和审批环节能被安全交给智能体。

行业动态:钱、算力和政府关系继续决定牌桌

  • xAI 燃气轮机诉讼:The Decoder 报道称,美国司法部在一份驳回诉讼的动议中援引国家安全,为 xAI 在密西西比州 Southaven 的 Colossus 2 设施运行未经许可的燃气轮机辩护;NAACP 起诉称,相关燃气轮机数量从 4 月的 27 台增至 57 台,并导致氮氧化物排放飙升 111%。16
  • 五角大楼与 Anthropic:来自阿易 AI Notes 的追踪称,五角大楼已将超过三分之二日常 AI 工作流从 Anthropic 转移,目标是在 9 月前完全切断;该说法同时提到,冲突源于 Claude 是否可用于大规模监控和全自动武器。17
  • GitHub 算力短缺:RuntimeWire 报道称,微软旗下 GitHub 面临 AI capacity crunch,微软因此向 AWS 寻求计算资源支持;这条线索来自 Hacker News 热门讨论。18
  • Copilot Cowork 可能接入 DeepSeek V4:Kim 的 X 线索称,微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4 版本,作为更便宜的模型选项;同一条摘要还称 Copilot Cowork 将放弃无限定价,转向按使用量计费。19
Loading content card…
  • Fable 政府封禁后续:TechCrunch 发文质疑,美国政府对 Anthropic 模型 Fable 的封禁并非此前外界理解的「模型越狱」问题;该文章在 Hacker News 引发讨论并获得 103 个点赞。20
  • SpaceX 收购 Cursor:TechCrunch 报道称,SpaceX 同意以 600 亿美元股票收购 AI 编程公司 Cursor;报道还称 Cursor 此前接近完成一轮 20 亿美元融资,估值 500 亿美元,投资方包括 Andreessen Horowitz、Thrive 和 Nvidia。21
  • Anthropic 企业订阅份额超 OpenAI:TechCrunch 援引 Ramp 数据称,Anthropic 5 月企业 AI 订阅市场份额达 41%,首次超过 OpenAI 的 39.5%;同文称,特朗普政府限制最新模型访问的争议反而可能推动企业采用量。22
  • DeepSeek 首轮外部融资:The Decoder 报道称,DeepSeek 完成首轮外部融资,募资超过 500 亿元人民币,估值超过 500 亿美元;报道还称,多数投资者通过梁文锋管理的有限合伙企业投入资金,无投票权且锁定五年,腾讯和宁德时代为主要外部投资者。6
行业线索的关键词是「约束」。算力约束让 GitHub 找 AWS,成本约束让 Copilot Cowork 可能引入更便宜模型,监管与国防约束正在改变 Anthropic、xAI 的商业空间。DeepSeek 融资则提供了另一种对照:资金进来,但结构设计仍在强调控制权和研究方向。

论文研究:评估开始贴近真实部署

  • Anthropic Claude Code 专业知识研究:Anthropic 分析约 40 万次 Claude Code 交互会话后发现,人类更常负责「做什么」的规划决策,Claude 更常负责「怎么做」的执行决策;领域专业知识越强,模型每次指令完成的工作量越多。23
  • OpenAI Deployment Simulation:OpenAI 发布 Deployment Simulation 方法,在隐私保护下重放历史对话,用候选模型重新生成回复,以模拟模型上线后的实际表现;OpenAI 称该方法在多个 GPT-5-series Thinking 部署中,比传统评估更准确估计不良行为频率。7
  • 公开聊天数据外部审计:OpenAI 使用 WildChat 公开数据集模拟 GPT-5.1、GPT-5.2、GPT-5.4 的部署表现,并与私有生产数据对比;研究称,WildChat 模拟的平均预测误差约 3 倍,但对技术性和智能体型失调的预测精度下降。8
这三篇研究都在把评估从「静态题库」往真实工作流推。Claude Code 研究关注人和模型怎样分工,OpenAI 的两篇则关心上线前怎样模拟真实用户分布。对做产品的人来说,结论不是多跑几个 benchmark 就够了,而是要把内部日志、真实任务和新模型评估接起来。

技巧与观点:AI 使用正在制造新的流程问题

  • 毕业论文 AI 检测困境:数字生命卡兹克写到,学生手写摘要被判 99% AI 率,纯 AI 写作部分却显示 0%;同一论文在不同平台检测结果出现 48%、44%、59% 等差异,部分学校已改用 AI 使用声明表替代一刀切检测。24
  • 前沿大模型后训练配方回顾:Interconnects 播客与 Finbarr Timbers 回顾后训练配方演变,从 InstructGPT 的 SFT、奖励模型、RL,到 DeepSeek R1 的大规模 RL,再到 Multi-teacher On-Policy Distillation;摘要提到 2026 年配方正在走向多个领域专家模型再合并回统一模型。25
最后这两条一个偏使用现场,一个偏模型训练现场。前者提醒学校和企业,不透明检测指标很容易把人逼进「用 AI 改到机器觉得不像 AI」的荒唐循环;后者说明前沿模型训练已经从单一路线变成配方组合,后训练能力可能继续拉开模型之间的体验差距。

Add more perspectives or context around this Post.

  • Sign in to comment.