ChatGPT 破10亿月活,Gemma 4 12B 本地跑多模态——6 月 3 日 AI 动态

ChatGPT 破10亿月活,Gemma 4 12B 本地跑多模态——6 月 3 日 AI 动态

ChatGPT 以三年半时间成为史上最快破 10 亿月活应用;Microsoft Build 2026 收官,MAI-Code-1 登陆 VS Code、Surface Laptop Ultra 携 RTX Spark 亮相、Majorana 2 量子芯片发布;OpenAI Codex 推出 Sites 和 Annotations 进军白领工作台;Google Gemma 4 12B 首次支持本地音频推理;Alphabet 披露 Gemini 月活 9 亿、3.5 Pro 本月发布;Anthropic Claude Partner Hub 正式上线。

AI 产品日报
2026. 6. 4. · 08:13
구독 1개 · 콘텐츠 20개

ChatGPT 三年破 10 亿,史上最快应用

OpenAI 的 ChatGPT 在今年 5 月正式突破 10 亿月活跃用户,成为有史以来最快达成这一里程碑的应用,超越了 Google Maps、TikTok、Instagram 和 YouTube。1
这一数字来自市场情报机构 Sensor Tower 的估算,统计口径是 全球月活跃 App 用户,不包含网页端和 API 访问。ChatGPT 于 2022 年 11 月上线,到 10 亿月活耗时约三年半。2
同期,Anthropic 的 Claude 月活约为 5600 万,虽仍是 ChatGPT 的零头,但同比增速约 640%,主要增量来自开发者和编程用户。两家的差距体现在不同的市场选择上:OpenAI 押注消费者规模与 Pro 订阅漏斗,Anthropic 深耕企业与开发者侧。

Microsoft Build 2026 收官:Windows 走向代理原生

Build 2026 于 6 月 3 日在旧金山 Fort Mason Center 闭幕,为期两天,约 2500 人参会。发布周期延续自 6/2 的 MAI 系列,最后一天的重点落在 Windows 开发者工具和硬件上。3
MAI-Code-1 登陆 Copilot 和 VS Code,这是微软专门为 GitHub 调优的编码模型,开发者在 VS Code 中可直接使用。GitHub Copilot 桌面应用同步进入预览版,支持单订阅切换 OpenAI、Anthropic、Google 等不同供应商的模型。
硬件方面,Surface Laptop Ultra 正式亮相,搭载 Nvidia RTX Spark 芯片(Blackwell 架构 + 128GB 内存),15 英寸 262ppi mini-LED 屏,支持 DLSS 4.5 光追游戏和本地离线 AI 推理。值得注意的是,OpenClaw 正式登陆 Windows,依托微软 Execution Containers(MXC)安全沙箱运行,企业可在内部部署这一热门自主代理平台。
量子计算方面,微软发布 Majorana 2 拓扑量子芯片,量子比特寿命从前代的 1–12 毫秒提升至平均 20 秒,借助 Discovery AI 平台,将可扩展量子计算机的预期时间线缩短一半,目标 2029 年实现。4
Satya Nadella 在 Build 2026 旧金山舞台发表演讲
Build 2026 闭幕现场 3

OpenAI Codex 进军白领工作台

6 月 3 日夜间,OpenAI 举办「工作中的智能」直播,未发新模型,但 Codex 的产品定位完成了一次明显转型——从 AI 编程工具扩展至泛白领工作台。5
两项新功能上线预览:
  • Sites:Codex 可将工作成果直接生成交互式网页、仪表盘或轻量应用,通过链接分享给团队。目前面向 Business 和 Enterprise 客户预览,Vercel、Wix、Base44、Replit 已加入生态合作。
  • Annotations:用户可在 Codex 输出内容上直接圈选区域发送修改指令,现已从代码和 Markdown 扩展至文档、表格和幻灯片。
此次还推出了 6 个面向特定岗位的插件,覆盖销售(接入 Salesforce/HubSpot)、数据分析(接入 Snowflake/Databricks)、创意设计(接入 Figma/Canva)、投行研究(接入 PitchBook/Hebbia)等场景。同时,Codex 能力将在未来几周内整合进 ChatGPT,此前仅限开发者使用的功能将面向更广泛用户开放。
OpenAI Codex 功能扩展与插件对接逻辑展示
Codex 插件体系与岗位对接示意 5
从披露数据看,Codex 周活已超 500 万,自 2 月桌面版上线以来增长 6 倍;非开发者知识工作者已占周活的约 20%,增速是开发者用户的 3 倍以上。

Google Gemma 4 12B 开发者指南:本地跑多模态

Google 于 6 月 3 日发布 Gemma 4 12B 开发者指南,这是 Gemma 家族首个采用「编码器无架构」的中型多模态模型。6
核心改动是把视觉和音频编码器完全去掉,视觉图像直接以 48×48 像素块投影到 LLM 隐层维度,音频信号以 40ms 帧线性投影,处理延迟比传统多编码器架构更低,也是 Gemma 家族首个原生支持音频输入的中型模型
Gemma 4 12B 编码器无架构概览
Gemma 4 12B 架构示意:视觉和音频输入直接投影到统一 LLM 主干 6
模型 12B 参数大小可在 16GB 显存的独显笔记本或苹果 M 系列统一内存设备上本地运行,同步推出 macOS 桌面应用(Google AI Edge Gallery 和 AI Edge Eloquent),支持完全离线的语音对话和视觉交互。开发者也可通过新的 litert-lm serve 命令启动 OpenAI 兼容的本地 API 服务,直接对接 Continue、Aider 等工具链。
模型权重已同步上线 Hugging Face 和 Kaggle,支持 llama.cpp、MLX、vLLM 等推理框架。

Alphabet 投资者大会:Gemini 月活 9 亿,3.5 Pro 本月发布

6 月 3 日,Alphabet CEO 桑达尔·皮查伊出席 2026 年 6 月投资者演示,披露了一批 Gemini 数据与路线图。7
关键数据:
  • Gemini 应用月活突破 9 亿,过去一年翻倍,是 Alphabet 增长最快的产品之一
  • AI Mode(Gemini 3.5 驱动的搜索功能)上线仅 1 年,月活已超 10 亿
  • 2026 年 Q1 总营收 1100 亿美元,同比增长 22%;Google Cloud 增长 63%
  • 过去 2 年,token 处理规模从每月 9.7 万亿增至 3.2 千兆,增长超 300 倍
路线图方面,Gemini 3.5 Pro 计划本月(6 月)正式推出,目前 Gemini 3.5 Flash 已可用,重点强化智能体编码、长周期任务和真实场景推理。同步公布的还有 Google AI Threat Defense 安全平台,整合 Gemini 能力对抗 AI 驱动的网络威胁。

Anthropic Claude Partner Hub 正式上线

Anthropic 于 6 月 3 日宣布 Claude Partner Network 的两项升级,这是该生态系统三个月前上线以来的首次系统性更新。8
Services Track 引入分级体系,反映合作伙伴实际构建和交付 Claude 的经验;Claude Partner Hub 则是公开的查询入口,企业客户可以通过它找到已经过认证的实施方。
当前已有超过 4 万家企业申请加入该计划,1 万名顾问完成 Claude 认证。消息宣布于 Anthropic 秘密递交 IPO 申请(S-1)两天后,外界普遍将此次生态建设解读为其 IPO 叙事中"收入可持续性"的展示动作。

小讯

  • Perplexity Computer 混合推理:Perplexity 在 Computex 与英特尔联合宣布混合推理系统,可实时判断把 AI 任务路由到本地设备还是云端——敏感数据走本地轻量模型,复杂推理走云端。自动路由功能计划 7 月开始推送,Mac 先行。9
  • Grok 4.3 Beta:xAI 近期维持在 Grok 4.x 上每 4–6 周发布一次小版本的节奏,4.3 Beta 据报在推理和代码生成基准上有所提升,具体数据未经官方正式披露。10
  • ChatGPT Trusted Contact(信任联系人)功能:ChatGPT 新增功能,允许 18 岁以上用户指定一位信任联系人,当 AI 检测到对话中出现严重自伤风险迹象时自动发出提醒。11

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.

  • 로그인하면 댓글을 작성할 수 있습니다.