谷歌DiffusionGemma挑战自回归范式、SpaceX今日上市750亿美元、昇腾910C完成DeepSeek万亿参数训练|AI公众号日报0612

谷歌DiffusionGemma挑战自回归范式、SpaceX今日上市750亿美元、昇腾910C完成DeepSeek万亿参数训练|AI公众号日报0612

今日五条:谷歌开源 DiffusionGemma,26B 扩散文本模型 H100 速度 1000+ tok/s,颠覆自回归范式;SpaceX 今日纳斯达克挂牌,融资 750 亿美元史上最大 IPO,核心叙事是「轨道 AI 数据中心」;华为昇腾 910C 完成 1.6 万亿参数 DeepSeek-V4-Pro 全参数后训练,国产算力新里程碑;钉钉 7.5 万字离职长文 7 天换帅,阿里把 AI 业务交给 92 年内部创业者;苹果开源 macOS 容器机器登顶 Hacker News。

中国 AI 公众号独家文章日报
2026/6/12 · 8:08
購読 1 件 · コンテンツ 21 件
今日五条:谷歌 DiffusionGemma 开源挑战自回归范式;SpaceX 今日纳斯达克挂牌,马斯克拿下史上最大 IPO;华为昇腾 910C 完成 1.6 万亿参数 DeepSeek 全参数后训练;钉钉 7.5 万字内部长文逼出换帅;苹果 WWDC 2026 开源 macOS 容器机器登顶 Hacker News。

1. 谷歌 DiffusionGemma:文本生成首次不用「逐字蹦」

6 月 10 日,Google DeepMind 开源了 DiffusionGemma,一个用扩散机制生成文本的 26B MoE 模型。1
它和所有 GPT/Claude/Llama 类模型的底层逻辑截然不同。自回归模型的工作方式是「看前文 → 预测下一个 token → 拼上去 → 再预测」,一个接一个,生成 1000 个 token 就要循环 1000 次。DiffusionGemma 先拿出一块 256 token 的「画布」,用随机噪声初始化,然后对整块内容同时迭代去噪,所有位置互相参照、同步修正,直到这个 block 收敛。
关键数据:
  • 架构:26B 参数 MoE,推理时仅激活 3.8B
  • 并行粒度:256 token 画布整块同时生成
  • 速度:H100 上 1000+ tok/s,RTX 5090 上 700+ tok/s
  • 显存:量化后可在 18GB VRAM 的消费级 GPU 上运行
  • 许可:Apache 2.0,完全开源,Hugging Face 无申请限制
vLLM 在同一天发布了原生支持,这才是真正的信号。vLLM 为此专门引入 ModelState 抽象层——因为扩散式语言模型需要双向注意力和迭代式修正,无法直接套进标准自回归推理路径。主流推理框架为一种新范式重构 serving 路径,说明这件事的份量。2
DiffusionGemma 自回归与扩散生成对比
DiffusionGemma 与自回归 LLM 的生成路径对比:左侧逐 token 生成,右侧整块 256 token 并行去噪 2
一个限制需要说清楚:官方说的是「最高 4 倍加速」。这个加速在本地交互、低 batch、显存带宽紧张场景里最明显。大规模在线服务、超长上下文推理,自回归模型仍有结构性优势,谷歌自己措辞也很克制,强调的是权衡而非全面碾压。
苹果 Silicon 用户还有一个附加福利:mlx-vlm v0.6.3 同期更新,已支持在 Apple Silicon 上运行 DiffusionGemma,今晚就能下载权重,明天就能测试。

2. SpaceX 今日上市:750 亿美元 IPO,马斯克把「轨道算力」卖给了二级市场

6 月 12 日,SpaceX 在纳斯达克挂牌,股票代码 SPCX。发行价 135 美元/股,发行 5.556 亿股,融资约 750 亿美元,超过沙特阿美 2019 年创下的 290 亿美元纪录,成为美国股市有史以来规模最大的 IPO。3
认购需求超过 2500 亿美元,超额认购约 3.3 倍。承销商是高盛、摩根士丹利、美银、花旗、摩根大通五大行联合护航。
这次上市之所以和 AI 行业直接相关,在于路演的核心叙事:马斯克反复强调的不是火箭,而是「轨道 AI 数据中心」。SpaceX 的 AI-1 卫星翼展 70 米、持续算力 120kW,本质是把 GPU 服务器架搬上太空,用轨道太阳能绕开地面电力审批瓶颈。Google 与 SpaceX 签署的算力协议印证了这条逻辑:每月 9.2 亿美元,从 2026 年 10 月开始、持续到 2029 年 6 月,涉及约 11 万枚 Nvidia GPU。4
与此同时,Anthropic(估值 9650 亿美元)和 OpenAI 已先后递交 IPO 申请。三家公司本周集中冲向公开市场,合计估值逾 3 万亿美元,2000 亿美元的资金需求引发流动性虹吸的担忧。CreditSights 分析师认为,这是上周科技股抛售的可能原因之一。
SpaceX IPO 的真正意义在于:商业航天第一次被公开市场要求用财务报表和资本开支来定价,「轨道算力」叙事是否撑得起 1.77 万亿美元估值,今天开始见分晓。
SpaceX IPO 三巨头上市估值对比
SpaceX、Anthropic、OpenAI 三巨头本周集中递交 IPO,合计估值逾 3 万亿美元 5

3. 国产算力里程碑:1000 张昇腾 910C 完成 DeepSeek 万亿参数全参数训练

6 月 5 日,深圳市官方通报:深圳河套学院 AI 训练平台项目团队联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为及深智城 AI 算力平台,依托昇腾 910C 国产 AI 算力集群,完成 1.6 万亿参数 DeepSeek-V4-Pro 的全参数后训练6
这是全球第三方机构首次在国产算力平台上完成该级别模型的全参数训练,与此前的推理演示和量化部署不同,全参数训练要求集群在每一步同时读写所有权重,对互联带宽和算力连续性的要求都更高。
主要数据:
  • 芯片:约 1000 张昇腾 910C,单卡 FP16 算力约 800 TFLOPS,2026 年 3 月全面量产
  • 训练过程:累计运行超 1500 步,单步约 27 秒,全程未出现中断
  • 算力利用率(MFU):最终稳定在 34.9%
  • 关键训练算子效率提升:14%
昇腾 910C 完成 DeepSeek-V4-Pro 全参数后训练
昇腾 910C 算力集群训练结果截图 7
34.9% 的 MFU 是什么水平?相比之下,英伟达 A100/H100 集群的典型训练 MFU 在 35%–55% 区间。国产算力首次在万亿参数量级达到这个数字,意味着与主流 GPU 集群的算力利用率差距已大幅缩小。
对国内 AI 基础设施格局的影响是:此前「昇腾能推理但训练没有验证」的预判可以更新了。下一个里程碑预计是等昇腾 950 超节点量产后的完整大规模训练对比。

4. 钉钉 7.5 万字内部长文,7 天内换掉创始人 CEO

6 月 11 日,阿里巴巴宣布钉钉管理层调整:钉钉创始人陈航(花名「无招」)卸任 CEO,1992 年出生的技术极客陈宇森接任,成为阿里最年轻的事业部 CEO。8
时间线只有 7 天:6 月 4 日,前产品经理「幽素」发布 7.5 万字离职长文《置身钉内》,复盘钉钉旗舰 AI 产品 ONE 被砍的全过程,描述凌晨查岗、强制延迟下班、有同事因工作强度过大被 120 送医急救。6 月 9 日,钉钉副总裁马锐拉发布《置身钉外》,以一句「我真的想多活几年」结尾后宣布离职。6 月 10 日,阿里合伙人委员会罕见内网公开点名批评钉钉管理方式「不是阿里文化该有的样子」。次日,换帅。
陈宇森的背景:22 岁创办网络安全公司长亭科技,公司后被阿里云收购;2025 年在阿里云内部创业,主导 AI Agent 产品 MuleRun,上线一个半月覆盖 43 个国家。阿里没有从传统管理序列挑人,而是把钉钉交给了一位 AI 时代的内部创业者。
这件事有一个值得单独说的数字:钉钉 8 亿注册用户,2025 年 ARR 约 30 亿元,付费转化率不到 1%。飞书以约 15% 的用户量实现了钉钉 70% 的收入。9 这才是钉钉真正要解决的问题,换 CEO 只是第一步。

5. 苹果开源 macOS Container Machines:AI 时代的开发者基建

苹果在 WWDC 2026 期间开源了 macOS Container Machines,6 月 11 日登顶 Hacker News(评分 1193,讨论 417 条),同日 GitHub 仓库 apple/container 超过 1600 星。10
这是苹果极少见地向开发者生态做重大开放:不再依赖虚拟机套娃,macOS 获得类 Docker 的深度系统级集成,支持标准 OCI 镜像,提供持久化和文件系统挂载,自动将 Mac 用户目录映射到 Linux 环境中,支持 systemd 等 init 系统,可以跑真实 Linux 服务。
为什么值得关注:过去的 Mac 开发者要在本地跑 AI 推理或 Linux 原生服务,必须借助 Docker Desktop(资源消耗高)或 UTM/Parallels(重量级 VM)。Container Machines 把这条路径轻量化了,同时保留了 Apple Silicon 的能效优势。
时间节点也有意思:这是 Tim Cook 在 WWDC 的最后一次主题演讲,9 月 1 日 John Ternus 将接任 CEO。苹果这届开发者大会技术密度被多位开发者评价为近年最高——从 Foundation Models 本地推理框架,到 Xcode 27 AI 编程,到 SiriKit 正式退场,再到 Linux 容器原生化,几乎每个核心框架都做了改动。11
一个社区还在讨论的问题:苹果为什么不提供原生的 Darwin Jails?有开发者认为苹果担心用户会大规模部署 macOS 容器,所以选择了 Linux 容器路径。

このコンテンツについて、さらに観点や背景を補足しましょう。

  • ログインするとコメントできます。