GitHub Copilot 用量计费将于 6 月 1 日切换,本周 AI 编程工具升级速览
本期(2026-05-04 至 05-11)速览:Copilot 计费模式 6 月强制切换、Cursor 3.3 并行构建、Claude Code 8 个版本迭代、Gemini CLI v0.41.0 实时语音、Windsurf v2.2.17 集成 Devin Review,ServiceNow Build Agent GA。
本周(2026-05-04 至 2026-05-11)有三件事需要在 6 月 1 日之前处理:
- GitHub Copilot 用量计费切换:Premium Request Units (PRU) 停用,改为按 token 计费的 GitHub AI Credits
- Cursor Enterprise 模型控制迁移:旧 blocklist 须迁至新的细粒度访问控制系统
- GitHub Copilot 多模型弃用:GPT-4.1、Claude Sonnet 4、Grok Code Fast 1 等 4 款模型进入弃用队列
其余更新:Cursor 3.3 带来 PR Review 和并行构建,Claude Code 一周推出 8 个版本,Gemini CLI 稳定版新增实时语音模式,Windsurf 把 Devin Review 搬进了编辑器。
需要立即行动的三件事
GitHub Copilot 全面转用量计费(6 月 1 日生效)
GitHub 在 2026-04-27 宣布1,Premium Request Units (PRU) 将于 6 月 1 日退场,由 GitHub AI Credits 取代。新计费体系按 token 消耗(input/output/cached)以各模型公开 API 费率计算,每个订阅层附带等值 credits:Pro $10/月含 $10 credits,Pro+ $39/月含 $39 credits,Business $19/用户/月含 $19 credits,Enterprise $39/用户/月含 $39 credits。代码补全和 Next Edit Suggestions 继续不限量、不消耗 credits。
有几个地方需要关注:
- Code Review 会产生额外费用:6 月 1 日起,Copilot code review 将额外消耗 GitHub Actions 分钟数,不再包含在 credits 内
- PRU 耗尽时的 fallback 取消:此前 PRU 耗尽后会降级到较弱模型继续工作,新体系下改为由 credits 余额和管理员预算控制,余额耗尽即停止响应
- 年费用户延缓切换:年费用户保留现有 PRU 模式至订阅到期,到期后模型乘数先涨再转 Free
- 推广期 credits:Business 和 Enterprise 客户在 6-8 月享有额外推广 credits(Business $30、Enterprise $70)
GitHub CPO Mario Rodriguez 在公告中表示,当前 premium request 模型「将快速聊天和数小时自主编程会话的成本等同对待,已不可持续」,用量计费「更好地将定价与实际使用对齐,有助于维护长期服务可靠性」。社区反应分化:Reddit 用户 retsof81 质疑 agent 出错时是否有 credits 退款机制;另有用户表示已开始评估 Cursor 和 Claude Code 作为替代。
GitHub 在 5 月初推出了预览账单功能,Pro/Pro+ 用户建议在切换前查看一下实际用量分布,再判断是否需要调整使用习惯或换工具。
Cursor Enterprise 模型访问控制迁移(截止 6 月 1 日)
Cursor 于 2026-05-04 发布企业管理功能更新2,同时宣布一个 Breaking Change:现有 Enterprise 管理员必须在 2026-06-01 前将旧 blocklist 迁移至新的「模型访问控制」系统,否则旧配置将失效。
新系统支持在 model 和 provider 两个粒度设置 allow/blocklist,可按速度和上下文窗口大小过滤模型配置,企业还可以选择默认屏蔽新加入的 provider 或模型版本(避免新模型自动对用户可见)。
迁移入口:Cursor Dashboard → team model settings。
同期上线的配套功能:
- 软性消费限额(Soft Spend Limits):替代原有硬限额,达到上限后不再直接中断用户操作
- 智能告警:用量达到软/硬限额的 50%、80%、100% 时自动通知相关用户
- 使用分析面板升级:支持按用户筛选,并按 clients、Cloud Agents、automations、Bugbot、Security Review 五个产品面拆分用量
GitHub Copilot 多模型弃用(4 款模型进入弃用队列)
本周 GitHub 密集发布弃用公告3:
| 模型 | 弃用/公告日期 | 备注 |
|---|---|---|
| GPT-4.1 | 2026-06-01 弃用 | 替代模型:GPT-5.5 |
| Claude Sonnet 4 | 2026-05-07 标记为 deprecated | — |
| GPT-5.2 / GPT-5.2-Codex | 2026-05-01 宣布弃用 | — |
| Grok Code Fast 1 | 2026-05-08 宣布弃用 | — |
Enterprise 管理员需要在 Copilot 设置中为受影响的模型配置替代模型策略;已使用弃用模型的用户无需手动移除,但需确认替代模型已启用,否则对应体验(Chat、内联编辑、代码补全等)会中断。
IDE 工具更新
Cursor 3.3(2026-05-07)
Cursor 3.3 的主要更新集中在「PR 全流程」和「并行执行」两个方向。4
PR Review 新增三个标签页:Reviews 展示内联审查线程和顶层 PR 评论,Commits 提供提交历史的聚焦视图,Changes 以文件树和变更选择器辅助浏览大型 PR。
Build in Parallel 将 plan 中相互独立的任务分拆给异步子代理并行执行,有依赖关系的步骤仍保持顺序。点击一个按钮触发,不需要手动切分。
Split Changes into PRs 利用对话上下文识别逻辑切片,默认将每个切片生成独立 PR(除非存在依赖),创建备份快照后提交拆分方案由用户审批。这两个功能加在一起,把「大 PR 难以审查」的问题搬到了工具层来解决,而不是靠流程规范约束。
其他更新:
- Pin Skills as Quick Actions:把常用 skill 固定为快捷按钮
- /multitask 命令:编辑器内直接发起并行子代理请求
- Context Usage Breakdown:按 rules、skills、MCPs、subagents 查看代理的上下文占用分布,用于诊断上下文问题
- Explore 子代理控制:可指定模型、继承父代理模型或禁用,子代理配置支持通用模型名(如
model: opus自动解析到最新 Opus 版本) - MCP 连接稳定性:re-auth 时新增显式过期 token 清理
Windsurf v2.2.17(2026-05-06)
Windsurf 这次更新的核心是把代码审查能力整合进 IDE,而不是作为独立工具存在。5
Devin Review(深度审查):按变更逻辑重新整理 diff——将相关编辑分组、清晰展示复制/移动的代码——同时结合上下文识别 bug 并附说明,支持 Autofix 自动生成修复并应用到 PR 分支。对自服务用户提供 2 周免费试用,Enterprise 用户需通过 Cognition 平台协议。
Quick Review(本地快速审查):基于 Cognition 自研的 SWE-check 模型,定位为「提交 PR 前的快速扫描」,速度比 Devin Review 快 10 倍,免费使用。两个审查层各有定位:Quick Review 覆盖日常提交前检查,Devin Review 用在需要深度分析的 PR 节点。
Agent Command Center 同期改进:新增列表显示选项,改进会话侧栏的排序和筛选,加载和切换会话的性能也有提升。
Windows 用户注意:本版本有一个手动更新 bug,需要先在任务管理器中关闭
devin.exe 进程才能完成安装。GitHub Copilot VS Code 四月更新(v1.116–v1.119)
GitHub 于 2026-05-06 汇总发布了 VS Code 插件 4 月版本(v1.116 至 v1.119)的更新内容6,以下几个值得关注:
- 语义搜索全面覆盖:语义索引现在覆盖所有工作区;新增
githubTextSearch工具支持跨 GitHub 仓库/组织的 grep 搜索 - BYOK(自带密钥)扩展范围:支持范围从 Pro/Pro+ 扩展至 Copilot Business 和 Enterprise,支持 OpenRouter、Microsoft Foundry、Google、Anthropic、OpenAI 等多 provider,以及 Ollama 本地模型
- 实验性
/chronicle命令:本地数据库跟踪聊天交互历史,可查询曾经接触过的文件和 PR - 代理浏览器标签共享:代理可读取浏览器当前打开的标签页内容并与页面交互
- 代理终端读写:代理可读写任意打开的终端,含 REPL 和交互脚本
- CLI 会话远程监控(实验性):Copilot CLI 会话可从 GitHub.com 或移动端远程监控和控制
CLI 工具更新
Claude Code:5 月 4–9 日连发 8 个版本
v2.1.136(5 月 8 日)——本周最大规模版本,50+ 修复
新增
settings.autoMode.hard_deny 配置项:在自动模式下无条件阻止匹配的 classifier 规则,无论用户意图或 allow 例外是否存在。适用于「永远不应自动执行的关键操作」,例如生产环境推送、数据库删除等——这是在 allow 规则之上的一层兜底,而不是 allow 规则的替代。MCP 稳定性获得两处实质修复:一是
/clear 之后 VS Code 扩展、JetBrains 插件和 Agent SDK 中的 MCP 服务器消失的问题;二是多个远程 MCP 服务器并发刷新时 OAuth 刷新令牌丢失(导致需要每天重新认证)的问题。WSL2 新增图片粘贴支持:当
xclip/wl-paste 无法读取图片数据时,通过 PowerShell 回退方案从 Windows 剪贴板粘贴。⚠️ v2.1.133(5 月 7 日)——worktree 行为变更
新增
worktree.baseRef 配置项,可选值 fresh(默认)或 head,控制 EnterWorktree 是从 origin/ 还是本地 HEAD 创建新分支。这里有个反复:v2.1.128 将
EnterWorktree 的默认行为从 origin/ 改为本地 HEAD,v2.1.133 又将默认值改回 origin/(即 fresh),同时新增 worktree.baseRef 让用户显式控制。如果你在 v2.1.128 之后依赖了本地 HEAD 的行为,需要在配置中显式设为 head。其他本周关键变更汇总:
- v2.1.129:新增
--plugin-url从 URL 安装插件;Ctrl+R历史搜索恢复跨项目全局行为(Ctrl+S缩小到当前项目/会话) - v2.1.132:新增
CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN=1环境变量退出全屏渲染;外部 SIGINT 优雅终止 - v2.1.133:新增
parentSettingsBehavior管理员级键(first-wins|merge);Hooks 现在接收effort.level和$CLAUDE_EFFORT
Gemini CLI v0.41.0(2026-05-05,稳定版)
- 实时语音模式(Real-time Voice Mode):支持云端和本地后端,是 CLI 推出以来最大的 UI 扩展
- Gemma 4 模型支持(实验性):通过 Gemini API 使用 Gemma 4,在 v0.42.0-preview 中默认启用
- 安全强化:headless 模式下强制 workspace trust 并安全加载
.env文件;shell 命令验证通过核心工具 allowlist 加固 - 新 ContextManager 和 AgentChatHistory:提供更可靠的会话处理
- Auto-Memory 持久化:auto-memory scratchpad 持久化,支持跨 turn 的技能提取
5 月 6 日还发布了 v0.41.1 和 v0.41.2 两个补丁版,均为 race condition 的 cherry-pick 修复。v0.42.0-preview.0 至 preview.2 已在同期发布,包含 Gemma 4 默认启用等实验性特性,尚未进入稳定频道。
OpenAI Codex CLI v0.130.0(2026-05-08)
Codex CLI v0.130.0 的主要新增是
codex remote-control 命令11——作为启动 headless、远程可控 app-server 的入口,适合 CI/CD 流水线和后台 agent 场景,比手动配置 app-server 参数更简洁。其他更新:
- 插件共享和可发现性:插件详情现在显示 bundled hooks;插件共享暴露链接元数据和可发现性控制
- Bedrock 认证扩展:现在支持使用
aws loginprofiles 的 AWS console-login 凭据,不再需要单独配置 API 密钥 - 实时配置刷新:app-server 实时线程在配置变更后无需重启即可生效
research preview标识移除:codex exec启动横幅中的 stale 「research preview」字样已清除
v0.129.0(5 月 7 日)以 TUI Vim 编辑模式和线程存储迁移为主;v0.131.0-alpha 系列于 5 月 9–11 日发布,均为自动生成版本,无详细 release notes。
GitHub Copilot CLI v1.0.41–v1.0.44(2026-05-05~05-08)
本窗口内 Copilot CLI 密集发布 4 个版本12:
⚠️ 安全修复(v1.0.43,5 月 6 日):修复安全漏洞 GHSA-9ccr-r5hg-74gf,该漏洞允许恶意裸仓库(bare repository)通过远程代码执行(RCE)运行任意代码。建议尽快升级到 v1.0.43 及以上版本。
功能方面:
- v1.0.41:实验性 MCP Tasks 支持(后台代理);
--attachment标志附加文件到请求;shell 补全首次运行自动安装 - v1.0.43:实验性 rubber-duck 副代理(Claude 驱动,用于 GPT 会话);Auto 模式使用服务端模型路由
- v1.0.44:路径补全不再闪烁/被拦截;斜杠命令支持中间输入;
userPromptSubmittedhooks 可绕过 LLM 直接响应
生态动态
Tabnine:4 月功能汇总(2026-05-06)
Tabnine 在 5 月 6 日发布了 4 月功能回顾博文13,本次更新的重心在于让 agent 在企业环境中「可信任地运行」,而非追加新功能。

几个值得关注的更新:
- CLI Plan Mode:在执行前展示 agent 的完整意图(打算做什么、操作哪些文件),让用户在实际执行之前有机会审查和中止
- CLI Sandboxed Execution:更严格的工具限制和操作边界,限制 agent 在沙箱外的权限
- Token 消耗与成本 API:提供真实用量可见性,支持构建 chargeback 模型(按团队分摊 AI 使用成本)
- Per-team 配额执行:将用量控制粒度从组织级细化到团队级
- Agent 驱动的 Code Review:由上下文感知、coaching guidelines 驱动,替代旧版 IDE review 标签页
Tabnine 也在同期预告了 5–6 月的功能方向14:Improved Chat 将在 5 月的 v6.2 版本上线(支持 thinking 和更复杂的上下文查找);6 月的 v6.3 将把测试体验迁移至
/test 命令,同时移除 Inline Actions,改由 chat-based 工作流(如 /explain)承接原有功能;新 Code Awareness 方案无需 Docker、无需长时间索引。Windsurf × Cursor 扩展:ServiceNow Build Agent 正式 GA(2026-05-06)
ServiceNow 在 Knowledge 2026 大会上宣布 Build Agent 正式 GA,其核心 skills 已扩展至 Cursor、Windsurf、Claude Code 和 GitHub Copilot 四个 AI 编程工具15。开发者可以在任意一个 IDE 里直接调用 ServiceNow AI Platform 的能力,包含完整的上下文和治理约束。
Build Agent 以 Anthropic 模型驱动,支持更长的上下文会话;作为 MCP Client 可连接 Figma(设计规格)、Miro(需求文档)、GitHub(代码上下文)等外部工具。Build Agent Skills 已于 2026 年 4 月发布,MCP Client 集成和新版 AI Agent Studio 预计 Q2 2026 发布。ServiceNow 同期宣布 App Engine Management Center(AEMC)免费向所有客户开放。
GitHub MCP Server 密钥扫描 GA(2026-05-05)
GitHub MCP Server 的密钥扫描功能于 5 月 5 日正式 GA16,支持在所有 MCP 兼容的 AI 编码 agent 或 IDE 中扫描代码里的暴露密钥。新增特性:遵循组织/仓库级别的 push protection 自定义设置,而不是只有单一的全局策略。
Cursor TypeScript SDK 公开测试版(2026-04-29)
Cursor 于 4 月 29 日发布了 TypeScript SDK 的公开测试版17,开放 Cursor 编辑器底层的运行时(Harness 框架、Agent Loop、MCP/工具模块)供开发者使用。安装方式为
npm install @cursor/sdk。
支持三种部署环境:托管云(带安全沙箱隔离的专属 VM,自动克隆仓库和配置环境,网络中断后台继续运行)、自有托管工作节点(私有网络内执行)、本地运行(快速调试)。支持所有 Cursor 兼容模型(Composer 2、Claude、GPT 等)及完整原生能力(代码库语义搜索、MCP 服务、skills 自动加载、Hooks 扩展、子代理)。官方示例仓库:github.com/cursor/cookbook。
GitHub Spec Kit v0.8.7 与 Kiro(2026-05-07)
GitHub Spec Kit v0.8.7 于 5 月 7 日发布18,支持 30+ AI 编码 agent(Claude Code、GitHub Copilot、Amazon Q、Gemini CLI 等),核心是一套四阶段工作流:Specify(业务上下文和成功标准)→ Plan(架构决策)→ Tasks(可测试可审查单元)→ Implement(约束下执行)。
工作流的关键机制是 constitution——一个 markdown 规则文件,包含适用于每次变更的不可变原则,作为开发者和 agent 之间的持久合约。Kiro IDE 基于 Code OSS 构建,支持 Open VSX 插件,内置 Auto router(结合 Claude Sonnet、Qwen、DeepSeek 等多模型按任务选择),以及事件驱动的 Agent hooks(文件保存时自动触发测试更新、README 刷新、安全扫描等)。
本期无更新
- Continue:最新 GitHub release 为 2026-03-27(v1.3.38-vscode),本窗口内无新版本发布19
- Aider:最新 tagged release v0.86.1 在本窗口前发布,main 分支有活跃开发(含 Claude 4.5/4.6、Gemini 3 preview 支持等),但本窗口无 tagged release20
参考ソース
- 1GitHub Copilot is moving to usage-based billing
- 2Cursor: Model controls, spend management, and usage analytics
- 3GitHub Changelog: Upcoming deprecation of GPT-4.1
- 4Cursor: PR Review, Build Plan in Parallel, and Split PRs
- 5Windsurf Editor Changelog
- 6GitHub Copilot in Visual Studio Code, April releases
- 7Anthropic: Releases · anthropics/claude-code
- 8Claude Code Docs: Week 19 · May 4-8, 2026
- 9Google: Latest stable release v0.41.0
- 10Gemini CLI release notes
- 11OpenAI: Release 0.130.0 · openai/codex
- 12GitHub: Releases · github/copilot-cli
- 13Tabnine: April Recap: Agents you can trust
- 14Tabnine: May 2026 Product Update: Improving Core Workflows
- 15ServiceNow Build Agent now works inside every major AI coding tool
- 16Secret scanning with GitHub MCP Server is now generally available
- 17Cursor: Build programmatic agents with the Cursor SDK
- 18Kiro: Bring engineering rigor to agentic development
- 19Continue: GitHub Releases
- 20Aider: GitHub Releases
このコンテンツについて、さらに観点や背景を補足しましょう。