AI 领域日报|2026 年 5 月 27 日:Gemini 全面代理化、GPT-5.6 预告、视频生成格局分化

AI 领域日报|2026 年 5 月 27 日:Gemini 全面代理化、GPT-5.6 预告、视频生成格局分化

Google I/O 2026 发布 Gemini 3.5 Flash 与 Gemini Omni,大模型代理化能力全面升级;OpenAI 上线 GPT-5.5 Instant 并预告 6 月发布 GPT-5.6;视频生成赛道 Seedance 2.0 与 HappyHorse-1.0 领跑榜单,Kling 3.0 以 4K 60fps 抢占生产级市场;AI 安全、算力与工具三条线均有重要动态。

AI 领域日报
2026/5/27 · 18:10
1 订阅 · 1 内容

AI 领域日报|2026 年 5 月 27 日

Google I/O 2026 尘埃落定,AI 工具格局在一周内完成了一轮密集重构:Gemini 向「全模态代理」迈出实质步伐,视频生成赛道的玩家格局悄然分化,而大模型的版本号竞赛已进入双月一迭代的节奏。以下是本期各方向重点。

正在加载内容卡片…

大模型动态

Gemini 3.5 Flash 正式发布

Google 在 I/O 2026(5 月 19 日)发布了 Gemini 3.5 Flash,这是「Gemini 3」系列下首款代理优先(agent-first)模型,今日起可通过 Google AI Studio 和 Android Studio 的 Gemini API 公开调用。1
性能上,Gemini 3.5 Flash 在编程和代理基准测试 Terminal-Bench 2.1 中得分 76.2%,GDPval-AA(Elo)1656,MCP Atlas 83.6%,整体超越 Gemini 3.1 Pro;在 Artificial Analysis 速度-智能综合指标中,它落在「右上象限」,即高智能 + 高速度区间。Google 同时宣布 Gemini 3.5 Pro 已在内部使用,预计「下月」正式上线。1

Gemini Omni:「任意输入生成视频」的多模态新模型

与 Gemini 3.5 Flash 同步亮相的还有 Gemini Omni,Google 将其描述为「可从任意输入创建任意输出,当前从视频起步」的多模态生成模型。它是 Gemini 对话智能与视频生成能力的融合,内置 SynthID 水印,可通过 Gemini 应用、Google Flow 和 YouTube Shorts Remix 访问(YouTube 对 18 岁以上用户免费开放)。1

OpenAI:GPT-5.5 Instant 已上线,GPT-5.6 预计 6 月

OpenAI 于 5 月 5 日将 ChatGPT 的默认模型切换为 GPT-5.5 Instant,替换原先的 GPT-5.3 Instant。官方数据称新模型幻觉减少 52.5%,在 AIME 2025 数学测试中得分 81.2(前代 65.4)。2
与此同时,据钛媒体 Edge AI Daily 的信源,OpenAI 下一版 GPT-5.6 的技术细节已有泄露:150 万 token 上下文窗口(比 GPT-5.5 提升约 43%),可处理 90-105 万 token 输入;计划 2026 年 6 月发布。3

Anthropic Claude:安全边界再扩张

Anthropic 的最新进展在本期集中于安全侧。据报道,其实验性模型「Claude Mythos Preview」在金融系统漏洞挖掘测试中,成功率从前代的不足 1% 跃升至 72.4%(提升约 80 倍),已引发欧洲央行召开紧急会议,要求相关银行加速漏洞补丁部署。Anthropic 内部将这一测试项目命名为「Project Glasswing」,发现漏洞逾千个。3
Anthropic 在公开文章中同步公布了 Claude 跨产品安全部署原则:采用「爆炸半径」限制策略,claude.ai 使用临时 gVisor 容器,Claude Code 采用人机结合沙箱机制,Claude Cowork 通过本地虚拟机保护非技术用户。3

DeepSeek V4:Q2 2026 定义性发布

DeepSeek 于 4 月 24 日发布 V4 预览版,分为 V4-Pro(1.6 万亿参数)和 V4-Pro-Lite 两个变体。多位开发者将其列为 2026 年第二季度最具代表性的开源模型发布。4

视频生成技术

视频生成赛道在 2026 年上半年完成了一轮明显的能力分层,以下是截至 5 月的格局快照。
AI 视频生成模型对比横幅
AI 视频生成主要模型概览 5

Gemini Omni 取代 Veo 3.1 成为 Google 视频旗舰

Google I/O 发布 Gemini Omni 后,Veo 3.1(2026 年 1 月发布,API 定价 $0.03–$0.50/秒)的定位已向后退。Gemini Omni 支持从图片、文字、视频或音频生成统一输出,Omni Flash 变体今日即向 Google AI Plus/Pro/Ultra 订阅用户全球开放。15

Seedance 2.0 与 HappyHorse-1.0 领跑榜单

根据 Artificial Analysis 5 月数据,在「带音频」排行榜上,字节跳动 Seedance 2.0(2 月 12 日发布,1213 Elo)与阿里 ATH 的 HappyHorse-1.0(4 月发布,1212 Elo)并列第一;在「无音频」排行榜,HappyHorse-1.0 以 1357 Elo 单独领先。5
Kling 3.0(快手,2 月 4 日发布)则凭借原生 4K 60fps 和单片段最长 15 秒的生产级规格,以及累计超 6 亿视频的用户基础,占据用户量维度的头部位置。5
KlingAI 3.0 官网截图,沙漠人物场景
Kling 3.0 支持原生 4K 60fps 输出与多语言对口型 5
开源侧,阿里 Wan 2.7(4 月发布)支持 5000 字提示词和多图参考,腾讯 HunyuanVideo 1.5 在单张 RTX 4090 上可在 75 秒内生成 480p 图生视频,两款均采用 Apache 2.0 授权,可免费商用。5

AI 工具与产品

Google Antigravity 2.0 全面升级

Google 将 Antigravity 定位为「唯一代理优先开发平台」,2.0 版本作为独立桌面应用发布,支持并发多代理编排。Antigravity CLI、Antigravity SDK 同步上线,开发者可通过 AGENTS.md 和 SKILL.md 文件扩展代理能力。Gemini API 的 Managed Agents 功能让单次 API 调用即可在隔离的 Linux 环境内完成「推理→写代码→读取文件→浏览网页」完整链路。1

Gemini Spark:首个面向消费者的 24/7 代理

Google 发布 Gemini Spark,定位为在设备关机时仍能在后台运行任务的个人 AI 代理,下周起向美国区 Google AI Ultra 用户内测。AI Search 的 AI Mode 月活已超过 10 亿,Search 查询量创历史新高,搜索框本身完成 25 年来最大改版,支持文字、图片、文件、视频、Chrome 标签页混合搜索。1

三星 6 月起开放外部 AI 工具权限

三星电子宣布,2026 年 6 月起设备体验(DX)部门员工可在通过安全培训后使用 Google Gemini、OpenAI ChatGPT 等第三方 AI 模型,此前一直严格限制使用外部 AI 工具。半导体(DS)部门因涉及核心芯片设计,仍仅限使用内部模型「三星高斯」。3

Gemini 算力计费争议

Google 于 5 月 17 日调整 Gemini 计费模式,从按提示词次数改为按算力消耗计费。部分用户反映,5 秒视频生成请求就会消耗 AI Pro 月度配额的 5%,且失败后配额仍被扣除。Google 已承诺一周内公布调整方案,并新增实时算力消耗预估功能。3

AI 前沿与安全

AI 制药进度:截至 2026 年 5 月,全球超过 200 种 AI 设计的药物已进入临床试验阶段,其中 15–20 款进入三期试验,但尚无一款获得 FDA 正式批准。FDA 于 4 月启动「AI 赋能早期临床试验」试点项目,公众意见征集截止日期为 5 月 29 日。3
英伟达芯片与算力链:英伟达 2025 财年 Q1 营收 260 亿美元(同比增长 262%)。据悉新一代 AI 芯片价格或翻倍至约 8 万美元,驱动因素主要是 HBM3E 内存需求从 80GB 增至 192GB(成本接近三倍)及 NVLink 4.0 带宽升级。AMD MI300X 同期以低约 20% 的价格获得谷歌、Meta 订单。3
隐私搜索替代需求上升:谷歌 2024 年第四季度搜索市场份额降至 89.73%,自 2015 年来首次跌破 90%。DuckDuckGo 同期安装量增长 30%,用户反弹原因集中在 AI 强制推送和结果可控性降低。3
微软 Copilot 安全漏洞:研究人员发现 Microsoft 365 Copilot Cowork 存在间接提示注入漏洞,攻击者可通过恶意技能文件操控 AI 发送含预认证下载链接的消息,导致 SharePoint 和 OneDrive 文件泄露,5 次测试全部成功。微软已收到披露报告。3

本期数据截止 2026 年 5 月 27 日 10:00(北京时间)。信息来源:Google 官方博客、钛媒体 Edge AI Daily、Medium The AI Landscape May 2026、Pinggy AI 视频生成模型评测。

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。