1/4
AI 产品每日盘点

AI 产品每日盘点|2026.06.04

今日 6 条 AI 产品动态:Suno 完成 4 亿美元 D 轮融资(估值 54 亿美元)、Ideogram 4.0 开源发布(9.3B 参数原生 2K)、Meta WhatsApp 商业 AI 智能体全球上线、xAI Grok Imagine Video 1.5 预览版 API 开放、Miso One 开源语音模型(8B/110ms)、Meta 规划 Hatch 智能体月费最高 200 美元。

2026/6/4 · 8:13

图集

今日 6 条 AI 产品动态,涵盖 AI 音乐融资、开源图像模型、商业智能体扩张、视频生成 API 与语音模型新进展。

💰 Suno 完成 4 亿美元 D 轮,估值 54 亿美元

AI 音乐生成平台 Suno 宣布完成 4 亿美元 D 轮融资,投后估值 54 亿美元。这轮融资发生在 Suno 仍面临多家唱片公司版权诉讼的背景下。Suno 允许用户通过文字描述生成完整歌曲,是目前用户规模最大的 AI 音乐工具之一。
1

🖼️ Ideogram 4.0 开源:9.3B 参数,原生 2K 分辨率

Ideogram 发布了 4.0 版本,以开放权重形式放出——9.3B 参数单流 Diffusion Transformer,文字渲染准确率在英文 OCR 基准(X-Omni)上达到 0.97,是目前开源模型里最强的文字渲染能力。
核心参数:
  • 支持 256–2048 像素任意分辨率,单套权重覆盖从方图到 2K 超宽
  • 使用 Qwen3-VL-8B-Instruct 作为文本编码器,JSON 格式提示词驱动
  • 支持边界框精准布局控制和最多 16 个 hex 颜色调色板
  • nf4 量化版可在单张 24GB GPU 上运行
  • 商业使用需要付费授权
在 DesignArena 排行榜上,Ideogram 4.0 在开源模型中排名第一,仅次于 OpenAI 和 Google 的闭源系统。
23

💬 Meta WhatsApp 商业 AI 智能体全球上线

Meta 的「Meta Business Agent」正式向全球 WhatsApp 企业账户开放,这也是 Meta 进军企业 AI 的正式信号。
定价方面:大型企业按 Token 用量计费,小型企业通过 WhatsApp Business Premium 订阅层级获取访问权。6 月 15 日起开始向部分客户收费,目前为免费试用期。能力覆盖自动化客服、产品问答和工作流自动化。
4

🎬 xAI Grok Imagine Video 1.5 预览版 API 开放

xAI 的图生视频模型 Grok Imagine Video 1.5 Preview 现已通过 API 可用,支持:
  • 480p 和 720p 两档输出分辨率
  • 原生音频生成(不依赖后期配音)
  • 图像到视频的「起始帧」模式
  • 视频延伸(Video Extension)功能
该模型此前已在 ModelsLab 等第三方平台上线,此次是 xAI 官方 API 渠道的正式开放预览。
5

🎙️ Miso One:8B 参数开源语音模型,110ms 延迟

Miso Labs 发布 Miso One,一款专为配音场景设计的开源语音模型:
  • 8B 参数,模型权重已在 GitHub 开源
  • 单样本语音克隆(短样本即可)
  • 推理延迟 110ms,低于人类反应时间
  • 适用场景:短视频配音、播客、教育内容
  • 可完全自托管,音频数据不离开本地设备
  • API 访问即将推出
6

🤖 Meta 规划「Hatch」AI 智能体,定价最高 200 美元/月

据 The Information 报道,Meta 正在规划一款名为「Hatch」的企业级 AI 智能体,定位与 OpenAI、Anthropic 顶级订阅直接竞争,计划月费最高 200 美元。Hatch 的核心能力包括创建软件工具和管理工作流。这是 Meta 在 WhatsApp Business Agent 之外,进一步向高端企业 AI 市场渗透的信号。
7
时间窗口:2026-06-03 至 2026-06-04(UTC+8) 信源:TechCrunch、Ideogram 官方博客、The Decoder、xAI 官网、Digg、The Information

评论