GitHub Copilot 用量计费将于 6 月 1 日切换,本周 AI 编程工具升级速览

本期(2026-05-04 至 05-11)速览:Copilot 计费模式 6 月强制切换、Cursor 3.3 并行构建、Claude Code 8 个版本迭代、Gemini CLI v0.41.0 实时语音、Windsurf v2.2.17 集成 Devin Review,ServiceNow Build Agent GA。

本周(2026-05-04 至 2026-05-11)有三件事需要在 6 月 1 日之前处理:
  1. GitHub Copilot 用量计费切换:Premium Request Units (PRU) 停用,改为按 token 计费的 GitHub AI Credits
  2. Cursor Enterprise 模型控制迁移:旧 blocklist 须迁至新的细粒度访问控制系统
  3. GitHub Copilot 多模型弃用:GPT-4.1、Claude Sonnet 4、Grok Code Fast 1 等 4 款模型进入弃用队列
其余更新:Cursor 3.3 带来 PR Review 和并行构建,Claude Code 一周推出 8 个版本,Gemini CLI 稳定版新增实时语音模式,Windsurf 把 Devin Review 搬进了编辑器。

需要立即行动的三件事

GitHub Copilot 全面转用量计费(6 月 1 日生效)

GitHub 在 2026-04-27 宣布1,Premium Request Units (PRU) 将于 6 月 1 日退场,由 GitHub AI Credits 取代。新计费体系按 token 消耗(input/output/cached)以各模型公开 API 费率计算,每个订阅层附带等值 credits:Pro $10/月含 $10 credits,Pro+ $39/月含 $39 credits,Business $19/用户/月含 $19 credits,Enterprise $39/用户/月含 $39 credits。代码补全和 Next Edit Suggestions 继续不限量、不消耗 credits。
有几个地方需要关注:
  • Code Review 会产生额外费用:6 月 1 日起,Copilot code review 将额外消耗 GitHub Actions 分钟数,不再包含在 credits 内
  • PRU 耗尽时的 fallback 取消:此前 PRU 耗尽后会降级到较弱模型继续工作,新体系下改为由 credits 余额和管理员预算控制,余额耗尽即停止响应
  • 年费用户延缓切换:年费用户保留现有 PRU 模式至订阅到期,到期后模型乘数先涨再转 Free
  • 推广期 credits:Business 和 Enterprise 客户在 6-8 月享有额外推广 credits(Business $30、Enterprise $70)
GitHub CPO Mario Rodriguez 在公告中表示,当前 premium request 模型「将快速聊天和数小时自主编程会话的成本等同对待,已不可持续」,用量计费「更好地将定价与实际使用对齐,有助于维护长期服务可靠性」。社区反应分化:Reddit 用户 retsof81 质疑 agent 出错时是否有 credits 退款机制;另有用户表示已开始评估 Cursor 和 Claude Code 作为替代。
GitHub 在 5 月初推出了预览账单功能,Pro/Pro+ 用户建议在切换前查看一下实际用量分布,再判断是否需要调整使用习惯或换工具。

Cursor Enterprise 模型访问控制迁移(截止 6 月 1 日)

Cursor 于 2026-05-04 发布企业管理功能更新2,同时宣布一个 Breaking Change:现有 Enterprise 管理员必须在 2026-06-01 前将旧 blocklist 迁移至新的「模型访问控制」系统,否则旧配置将失效。
新系统支持在 model 和 provider 两个粒度设置 allow/blocklist,可按速度和上下文窗口大小过滤模型配置,企业还可以选择默认屏蔽新加入的 provider 或模型版本(避免新模型自动对用户可见)。
迁移入口:Cursor Dashboard → team model settings。
同期上线的配套功能:
  • 软性消费限额(Soft Spend Limits):替代原有硬限额,达到上限后不再直接中断用户操作
  • 智能告警:用量达到软/硬限额的 50%、80%、100% 时自动通知相关用户
  • 使用分析面板升级:支持按用户筛选,并按 clients、Cloud Agents、automations、Bugbot、Security Review 五个产品面拆分用量

GitHub Copilot 多模型弃用(4 款模型进入弃用队列)

本周 GitHub 密集发布弃用公告3
模型弃用/公告日期备注
GPT-4.12026-06-01 弃用替代模型:GPT-5.5
Claude Sonnet 42026-05-07 标记为 deprecated
GPT-5.2 / GPT-5.2-Codex2026-05-01 宣布弃用
Grok Code Fast 12026-05-08 宣布弃用
Enterprise 管理员需要在 Copilot 设置中为受影响的模型配置替代模型策略;已使用弃用模型的用户无需手动移除,但需确认替代模型已启用,否则对应体验(Chat、内联编辑、代码补全等)会中断。

IDE 工具更新

Cursor 3.3(2026-05-07)

Cursor 3.3 的主要更新集中在「PR 全流程」和「并行执行」两个方向。4
PR Review 新增三个标签页:Reviews 展示内联审查线程和顶层 PR 评论,Commits 提供提交历史的聚焦视图,Changes 以文件树和变更选择器辅助浏览大型 PR。
Build in Parallel 将 plan 中相互独立的任务分拆给异步子代理并行执行,有依赖关系的步骤仍保持顺序。点击一个按钮触发,不需要手动切分。
Split Changes into PRs 利用对话上下文识别逻辑切片,默认将每个切片生成独立 PR(除非存在依赖),创建备份快照后提交拆分方案由用户审批。这两个功能加在一起,把「大 PR 难以审查」的问题搬到了工具层来解决,而不是靠流程规范约束。
其他更新:
  • Pin Skills as Quick Actions:把常用 skill 固定为快捷按钮
  • /multitask 命令:编辑器内直接发起并行子代理请求
  • Context Usage Breakdown:按 rules、skills、MCPs、subagents 查看代理的上下文占用分布,用于诊断上下文问题
  • Explore 子代理控制:可指定模型、继承父代理模型或禁用,子代理配置支持通用模型名(如 model: opus 自动解析到最新 Opus 版本)
  • MCP 连接稳定性:re-auth 时新增显式过期 token 清理

Windsurf v2.2.17(2026-05-06)

Windsurf 这次更新的核心是把代码审查能力整合进 IDE,而不是作为独立工具存在。5
Devin Review(深度审查):按变更逻辑重新整理 diff——将相关编辑分组、清晰展示复制/移动的代码——同时结合上下文识别 bug 并附说明,支持 Autofix 自动生成修复并应用到 PR 分支。对自服务用户提供 2 周免费试用,Enterprise 用户需通过 Cognition 平台协议。
Quick Review(本地快速审查):基于 Cognition 自研的 SWE-check 模型,定位为「提交 PR 前的快速扫描」,速度比 Devin Review 快 10 倍,免费使用。两个审查层各有定位:Quick Review 覆盖日常提交前检查,Devin Review 用在需要深度分析的 PR 节点。
Agent Command Center 同期改进:新增列表显示选项,改进会话侧栏的排序和筛选,加载和切换会话的性能也有提升。
Windows 用户注意:本版本有一个手动更新 bug,需要先在任务管理器中关闭 devin.exe 进程才能完成安装。

GitHub Copilot VS Code 四月更新(v1.116–v1.119)

GitHub 于 2026-05-06 汇总发布了 VS Code 插件 4 月版本(v1.116 至 v1.119)的更新内容6,以下几个值得关注:
  • 语义搜索全面覆盖:语义索引现在覆盖所有工作区;新增 githubTextSearch 工具支持跨 GitHub 仓库/组织的 grep 搜索
  • BYOK(自带密钥)扩展范围:支持范围从 Pro/Pro+ 扩展至 Copilot Business 和 Enterprise,支持 OpenRouter、Microsoft Foundry、Google、Anthropic、OpenAI 等多 provider,以及 Ollama 本地模型
  • 实验性 /chronicle 命令:本地数据库跟踪聊天交互历史,可查询曾经接触过的文件和 PR
  • 代理浏览器标签共享:代理可读取浏览器当前打开的标签页内容并与页面交互
  • 代理终端读写:代理可读写任意打开的终端,含 REPL 和交互脚本
  • CLI 会话远程监控(实验性):Copilot CLI 会话可从 GitHub.com 或移动端远程监控和控制

CLI 工具更新

Claude Code:5 月 4–9 日连发 8 个版本

Claude Code 在 6 天内发布了 8 个版本(v2.1.128 至 v2.1.138),本窗口内有几个需要关注的配置变更78
v2.1.136(5 月 8 日)——本周最大规模版本,50+ 修复
新增 settings.autoMode.hard_deny 配置项:在自动模式下无条件阻止匹配的 classifier 规则,无论用户意图或 allow 例外是否存在。适用于「永远不应自动执行的关键操作」,例如生产环境推送、数据库删除等——这是在 allow 规则之上的一层兜底,而不是 allow 规则的替代。
MCP 稳定性获得两处实质修复:一是 /clear 之后 VS Code 扩展、JetBrains 插件和 Agent SDK 中的 MCP 服务器消失的问题;二是多个远程 MCP 服务器并发刷新时 OAuth 刷新令牌丢失(导致需要每天重新认证)的问题。
WSL2 新增图片粘贴支持:当 xclip/wl-paste 无法读取图片数据时,通过 PowerShell 回退方案从 Windows 剪贴板粘贴。
⚠️ v2.1.133(5 月 7 日)——worktree 行为变更
新增 worktree.baseRef 配置项,可选值 fresh(默认)或 head,控制 EnterWorktree 是从 origin/ 还是本地 HEAD 创建新分支。
这里有个反复:v2.1.128 将 EnterWorktree 的默认行为从 origin/ 改为本地 HEAD,v2.1.133 又将默认值改回 origin/(即 fresh),同时新增 worktree.baseRef 让用户显式控制。如果你在 v2.1.128 之后依赖了本地 HEAD 的行为,需要在配置中显式设为 head
其他本周关键变更汇总:
  • v2.1.129:新增 --plugin-url 从 URL 安装插件;Ctrl+R 历史搜索恢复跨项目全局行为(Ctrl+S 缩小到当前项目/会话)
  • v2.1.132:新增 CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN=1 环境变量退出全屏渲染;外部 SIGINT 优雅终止
  • v2.1.133:新增 parentSettingsBehavior 管理员级键(first-wins | merge);Hooks 现在接收 effort.level$CLAUDE_EFFORT

Gemini CLI v0.41.0(2026-05-05,稳定版)

Gemini CLI v0.41.0 是本窗口内的稳定版,推荐所有用户使用910
  • 实时语音模式(Real-time Voice Mode):支持云端和本地后端,是 CLI 推出以来最大的 UI 扩展
  • Gemma 4 模型支持(实验性):通过 Gemini API 使用 Gemma 4,在 v0.42.0-preview 中默认启用
  • 安全强化:headless 模式下强制 workspace trust 并安全加载 .env 文件;shell 命令验证通过核心工具 allowlist 加固
  • 新 ContextManager 和 AgentChatHistory:提供更可靠的会话处理
  • Auto-Memory 持久化:auto-memory scratchpad 持久化,支持跨 turn 的技能提取
5 月 6 日还发布了 v0.41.1 和 v0.41.2 两个补丁版,均为 race condition 的 cherry-pick 修复。v0.42.0-preview.0 至 preview.2 已在同期发布,包含 Gemma 4 默认启用等实验性特性,尚未进入稳定频道。

OpenAI Codex CLI v0.130.0(2026-05-08)

Codex CLI v0.130.0 的主要新增是 codex remote-control 命令11——作为启动 headless、远程可控 app-server 的入口,适合 CI/CD 流水线和后台 agent 场景,比手动配置 app-server 参数更简洁。
其他更新:
  • 插件共享和可发现性:插件详情现在显示 bundled hooks;插件共享暴露链接元数据和可发现性控制
  • Bedrock 认证扩展:现在支持使用 aws login profiles 的 AWS console-login 凭据,不再需要单独配置 API 密钥
  • 实时配置刷新:app-server 实时线程在配置变更后无需重启即可生效
  • research preview 标识移除codex exec 启动横幅中的 stale 「research preview」字样已清除
v0.129.0(5 月 7 日)以 TUI Vim 编辑模式和线程存储迁移为主;v0.131.0-alpha 系列于 5 月 9–11 日发布,均为自动生成版本,无详细 release notes。

GitHub Copilot CLI v1.0.41–v1.0.44(2026-05-05~05-08)

本窗口内 Copilot CLI 密集发布 4 个版本12
⚠️ 安全修复(v1.0.43,5 月 6 日):修复安全漏洞 GHSA-9ccr-r5hg-74gf,该漏洞允许恶意裸仓库(bare repository)通过远程代码执行(RCE)运行任意代码。建议尽快升级到 v1.0.43 及以上版本。
功能方面:
  • v1.0.41:实验性 MCP Tasks 支持(后台代理);--attachment 标志附加文件到请求;shell 补全首次运行自动安装
  • v1.0.43:实验性 rubber-duck 副代理(Claude 驱动,用于 GPT 会话);Auto 模式使用服务端模型路由
  • v1.0.44:路径补全不再闪烁/被拦截;斜杠命令支持中间输入;userPromptSubmitted hooks 可绕过 LLM 直接响应

生态动态

Tabnine:4 月功能汇总(2026-05-06)

Tabnine 在 5 月 6 日发布了 4 月功能回顾博文13,本次更新的重心在于让 agent 在企业环境中「可信任地运行」,而非追加新功能。
Tabnine 四月更新
Tabnine 四月更新
几个值得关注的更新:
  • CLI Plan Mode:在执行前展示 agent 的完整意图(打算做什么、操作哪些文件),让用户在实际执行之前有机会审查和中止
  • CLI Sandboxed Execution:更严格的工具限制和操作边界,限制 agent 在沙箱外的权限
  • Token 消耗与成本 API:提供真实用量可见性,支持构建 chargeback 模型(按团队分摊 AI 使用成本)
  • Per-team 配额执行:将用量控制粒度从组织级细化到团队级
  • Agent 驱动的 Code Review:由上下文感知、coaching guidelines 驱动,替代旧版 IDE review 标签页
Tabnine 也在同期预告了 5–6 月的功能方向14:Improved Chat 将在 5 月的 v6.2 版本上线(支持 thinking 和更复杂的上下文查找);6 月的 v6.3 将把测试体验迁移至 /test 命令,同时移除 Inline Actions,改由 chat-based 工作流(如 /explain)承接原有功能;新 Code Awareness 方案无需 Docker、无需长时间索引。

Windsurf × Cursor 扩展:ServiceNow Build Agent 正式 GA(2026-05-06)

ServiceNow 在 Knowledge 2026 大会上宣布 Build Agent 正式 GA,其核心 skills 已扩展至 Cursor、Windsurf、Claude Code 和 GitHub Copilot 四个 AI 编程工具15。开发者可以在任意一个 IDE 里直接调用 ServiceNow AI Platform 的能力,包含完整的上下文和治理约束。
Build Agent 以 Anthropic 模型驱动,支持更长的上下文会话;作为 MCP Client 可连接 Figma(设计规格)、Miro(需求文档)、GitHub(代码上下文)等外部工具。Build Agent Skills 已于 2026 年 4 月发布,MCP Client 集成和新版 AI Agent Studio 预计 Q2 2026 发布。ServiceNow 同期宣布 App Engine Management Center(AEMC)免费向所有客户开放。

GitHub MCP Server 密钥扫描 GA(2026-05-05)

GitHub MCP Server 的密钥扫描功能于 5 月 5 日正式 GA16,支持在所有 MCP 兼容的 AI 编码 agent 或 IDE 中扫描代码里的暴露密钥。新增特性:遵循组织/仓库级别的 push protection 自定义设置,而不是只有单一的全局策略。

Cursor TypeScript SDK 公开测试版(2026-04-29)

Cursor 于 4 月 29 日发布了 TypeScript SDK 的公开测试版17,开放 Cursor 编辑器底层的运行时(Harness 框架、Agent Loop、MCP/工具模块)供开发者使用。安装方式为 npm install @cursor/sdk
Cursor SDK 架构示意图
Cursor SDK 架构示意图
支持三种部署环境:托管云(带安全沙箱隔离的专属 VM,自动克隆仓库和配置环境,网络中断后台继续运行)、自有托管工作节点(私有网络内执行)、本地运行(快速调试)。支持所有 Cursor 兼容模型(Composer 2、Claude、GPT 等)及完整原生能力(代码库语义搜索、MCP 服务、skills 自动加载、Hooks 扩展、子代理)。官方示例仓库:github.com/cursor/cookbook

GitHub Spec Kit v0.8.7 与 Kiro(2026-05-07)

GitHub Spec Kit v0.8.7 于 5 月 7 日发布18,支持 30+ AI 编码 agent(Claude Code、GitHub Copilot、Amazon Q、Gemini CLI 等),核心是一套四阶段工作流:Specify(业务上下文和成功标准)→ Plan(架构决策)→ Tasks(可测试可审查单元)→ Implement(约束下执行)。
工作流的关键机制是 constitution——一个 markdown 规则文件,包含适用于每次变更的不可变原则,作为开发者和 agent 之间的持久合约。Kiro IDE 基于 Code OSS 构建,支持 Open VSX 插件,内置 Auto router(结合 Claude Sonnet、Qwen、DeepSeek 等多模型按任务选择),以及事件驱动的 Agent hooks(文件保存时自动触发测试更新、README 刷新、安全扫描等)。

本期无更新

  • Continue:最新 GitHub release 为 2026-03-27(v1.3.38-vscode),本窗口内无新版本发布19
  • Aider:最新 tagged release v0.86.1 在本窗口前发布,main 分支有活跃开发(含 Claude 4.5/4.6、Gemini 3 preview 支持等),但本窗口无 tagged release20

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。