Gemini 进家用音箱，Grok 4.3 上 Bedrock，Midjourney V8.1 扩大草稿批量——6 月 17 日 AI 动态

先看结论

本期以 6 月 17 日公开发布、以及 6 月 18 日早晨前可核验的隔夜条目为主。今天的主线很清楚: Gemini 在向家庭硬件下沉，xAI 在把 Grok 推进企业云和创作工具，Google 则继续给 agent 生态补基础协议。

动态	你需要知道什么	为什么值得跟
Google Home Speaker	Google 发布首款为 Gemini for Home 打造的音箱，现已开放预订，价格 99.99 美元，6 月 25 日上架。1	Gemini 开始从手机和网页进入家居入口，语音助手的竞争回到「能否自然完成多步任务」。
Grok 4.3 上 Amazon Bedrock	xAI 宣布 Grok 4.3 在 Amazon Bedrock 上 GA，1M token 上下文，支持 none / low / medium / high 四档 reasoning effort，标价为输入 1.25 美元 / 100 万 tokens、输出 2.50 美元 / 100 万 tokens。2	AWS 企业客户可以在 Bedrock 的治理和计费体系内直接调用 Grok，xAI 的分发从自有产品扩到云平台。
Google ARD	Google 发布 Agentic Resource Discovery 开放规格，用 catalogs 和 registries 帮 agent 发现、验证、连接工具、skills 和其他 agents。3	这是 agent 工具生态的「目录层」尝试，后续会接入 Gemini Enterprise Agent Platform 的 Agent Registry。
A2UI + MCP Apps	Google A2UI 团队发布三种 A2UI 与 MCP Apps 组合架构，覆盖 A2UI over MCP、MCP Apps in A2UI、A2UI inside MCP Apps。4	多数 agent 产品会从纯文本转向动态界面，Google 在把 UI 渲染、安全边界和 MCP 工具体系统一起来。
Midjourney V8.1	Midjourney 发布 V8.1 big-batch draft mode，一次生成 24 张低分辨率草图，价格为标准 4 图任务的一半；看中后再点「Vary」生成全分辨率版本。5	图像生成从「少量高质量」向「先低成本铺开选项」继续移动，适合 moodboard 和大批量探索。
OpenAI Codex 欧洲区	Codex app 的 Computer Use、Chrome extension、Memories 和 Chronicle 开始面向 EEA、英国、瑞士用户推出，其中 Memories 在这些地区默认关闭，Chronicle 是 ChatGPT Pro 的 opt-in 研究预览。6	OpenAI 没有只推模型，也在补齐 agent 工作台的区域可用性和隐私默认设置。

Gemini 进入客厅: Google Home Speaker 是今天最像「产品发布」的一条

Google Home Speaker 是 Google 第一款明确写着「built for Gemini」的音频设备。它搭载 Gemini for Home，重点不是换一个唤醒词，而是把原本硬邦邦的智能音箱命令改成多步、可纠错、可追问的语音交互。Google 举的例子包括「关掉所有灯，除了床头灯」、一次说完调灯光、放音乐和设定计时器，以及说错后在同一句里纠正。1

这台音箱的硬件信息也比较完整: 99.99 美元，6 月 25 日开卖，提供 Hazel、Porcelain 以及美国限定的 Jade、Berry 配色；它有 360° 音频、环境自适应麦克风处理、底部 light ring，还可以与 Google TV Streamer 配对，两只音箱组成小型家庭影院。1

更关键的是订阅层。Google Home Premium 会把 Gemini Live、Camera History Search 和 Home Briefs 放进家庭场景: 用户可以让音箱总结家中摄像头历史，或者问「后门有没有开」「Rover 今天有没有上沙发」。这说明 Google 的家庭 AI 不是只做问答，而是在把摄像头、电视、音箱和订阅功能绑成一个家庭数据入口。1

xAI 一天两条线: Bedrock 负责企业分发，Imagine 负责创作体验

xAI 今天最重要的企业动作是 Grok 4.3 登陆 Amazon Bedrock。官方稿称，Grok 4.3 已在 Bedrock 上 GA，支持 1M token context window，并允许开发者配置 reasoning effort；同页还给出价格: 输入 1.25 美元 / 100 万 tokens，输出 2.50 美元 / 100 万 tokens。2

Grok on Amazon Bedrock 官方封面 — Grok 4.3 登陆 Amazon Bedrock 的官方配图，xAI 同页给出 1M context 和 API 价格。2

xAI 在同一篇文章里还引用了几个性能主张: Grok 4.3 在 Artificial Analysis Omniscience、Tau2 Telecom、Vals AI Case Law 和 Corporate Finance 等基准上处于前列。这里需要把语气放稳: 这些是厂商页面引用的榜单和对比口径，足够说明 xAI 在企业 agent 和长文档理解场景上发力，但不等于所有任务上的绝对领先。2

创作线也有更新。xAI 6 月 16 日发布 Grok Imagine Video 1.5，并在 6 月 17 日由 Grok 官方账号继续转发放大。官方稿称 Video 1.5 已在 Imagine API GA，grok-imagine-video-1.5 可用；Fast 版本登陆 grok.com/imagine、iOS 和 Android，6 秒 720p 视频生成约 25 秒，上一代为 40 秒以上。7 这条严格说是 6 月 16 日发布，本期列入补看，是因为它与今天的 Bedrock 发布共同构成 xAI 本周产品节奏。

Google 把 agent 生态往「可发现、可验证、可渲染」推

Google 的 ARD 规格解决的是一个底层问题: agent 不可能永远靠人手配置工具。ARD 让组织在自有域名下发布 catalog，registries 再像搜索引擎一样抓取和索引这些 catalog；当 agent 需要某种能力时，它可以按意图搜索，也可以直接读取已知合作方的 catalog，并在连接前验证发布者身份和信任元数据。3

ARD 工作流示意图 — Google 用 catalogs 和 registries 解释 ARD 如何让 agent 在运行时发现能力并验证信任。3

这不只是开源规范。Google 明确写到，Gemini Enterprise Agent Platform 里的 Agent Registry 会支持搜索、发现和托管 agents、skills、MCP servers 及其他工具；ARD 的原生支持会在未来几个月进入 Agent Platform。对企业来说，这类能力解决的是「工具能不能被发现」和「发现后敢不敢连」的问题。3

同一天，Google A2UI 团队还把 agent UI 的问题摆到台面上。文章认为 MCP Apps 给开发者 iframe 里的自由度，但会带来样式不一致、性能和安全边界问题；A2UI 用 JSON 声明界面，由宿主应用用原生组件渲染，安全和一致性更好，但复杂交互受组件库限制。4

它给出的三种组合架构分别面向不同场景: A2UI over MCP 让 MCP server 直接返回 application/a2ui+json，MCP Apps in A2UI 把复杂 iframe 应用封进 A2UI 组件，A2UI inside MCP Apps 则让旧系统不支持 A2UI 时也能在 iframe 内渲染动态界面。4 如果你在做企业 agent 产品，这类规格比模型跑分更值得看，因为最终用户接触到的是界面、权限和工作流，不是 API 名字。

Midjourney 先给 V8.1 降探索成本，硬件发布还在路上

Midjourney 今天发布了 V8.1 的 big-batch draft mode。官方说法很直接: 新模式一次生成 24 张低分辨率图片，价格是标准分辨率 4 图任务的一半；当用户喜欢其中一张，再按「Vary」生成全分辨率版本。5

这条更新看起来不大，但对重度图像工作流很有用。很多设计和视觉探索并不需要每张图一开始就高分辨率，真正费钱的是反复探索方向。Midjourney 把「先看 24 个方向」做成低价模式，等于把筛选阶段和成品阶段拆开计费。

同一天，Midjourney 还继续预告其首个硬件项目的旧金山线下发布会。6 月 17 日 22:04 UTC 的官方推文称直播链接即将放出，距离活动还有 3 小时。8 截至本期成稿时，硬件本体细节尚未由本轮可核验来源完整披露，所以这里只把它列为「待跟进」。

OpenAI: Codex 区域可用性补齐，LifeSciBench 指向科研场景

OpenAI 的产品线更新来自 Codex。6 月 16 日 changelog 写明，Codex app 的 Computer Use、Chrome extension、Memories 和 Chronicle 开始向 EEA、英国、瑞士推出；其中 Computer Use 可在 macOS 和 Windows 上操作桌面应用，Chrome extension 用于需要登录态的浏览器任务，Memories 可以记录偏好、工作流、技术栈和仓库惯例，但在 EEA、英国、瑞士默认关闭；Chronicle 则是面向 ChatGPT Pro macOS 用户的 opt-in research preview。6

Codex 应用界面截图 — Codex 欧洲区更新涉及 Computer Use、Chrome extension、Memories 和 Chronicle。6

研究线则是 LifeSciBench。OpenAI 6 月 17 日发布这个生命科学 benchmark，包含 750 个专家撰写任务、1,062 个任务附件、173 位科学家贡献者、19,020 条 rubric criteria 和 453 位专家审稿人。9 它评估的不是「会不会答生物题」，而是模型能否处理真实科研里的证据解释、实验设计、转化风险、artifact 解读和不确定性判断。9

这条不是普通用户功能，但它和 OpenAI 的产品方向相关: 当模型开始进入科研、医药和监管密集领域，benchmark 的设计会影响下一代专用模型、企业评估和销售话术。OpenAI 在文中还提到 GPT-Rosalind 相比 GPT-5.5 的整体 exact pass rate 从 25.7% 提升到 36.1%，但 artifact-heavy 任务仍明显更难。9 这说明科学 agent 的短板仍在复杂材料处理，而不只是推理链长度。

今日判断

如果只选三件事跟进，我会按这个顺序看:

企业开发者先看 Grok on Bedrock。价格、1M context、reasoning effort 和 Bedrock 分发会直接影响多模型采购清单。2
产品经理看 Google Home Speaker。Gemini for Home 的多步语音交互和 Home Premium 功能，是 Google 把 AI 订阅和家庭设备绑定的第一批清晰样本。1
agent 平台团队看 ARD + A2UI/MCP。模型能力继续上升后，工具发现、信任验证和 UI 承载会成为企业落地的瓶颈。3 4

Midjourney 的 big-batch draft mode 更偏工作流效率，适合视觉团队立即试；OpenAI Codex 欧洲区更新则说明 agent 工具开始在隐私默认和区域合规上补课。5 6