1/5

Code w/ Claude 2026、Cursor 3.3 与 Copilot 退役潮:AI 编程工具周报(2026 W19)

本期覆盖 2026-05-03 至 05-10:Anthropic Code w/ Claude 大会宣布算力合作与 Claude Code 限量翻倍;Cursor 3.3 内置 PR Review;GitHub Copilot 发布三模型退役时间表;Zed 推出 Zeta2.1 模型(token 减少 67%)。

05/11/2026, 00:16:57

Gallery

本周(2026-05-03 至 2026-05-10)是 AI 编程工具生态今年以来最密集的一周:Anthropic 在旧金山举办开发者大会、Cursor 推出 3.3、GitHub Copilot 同时宣布三个模型的退役时间表。VS Code、Windsurf、Zed、Tabnine 在同一周内集中发布更新,这种密度不太常见。

⚠️ Breaking Changes 速查

本周有两条必须跟进的不兼容变更:
Cursor Enterprise 模型管控重构1:管理员现可在模型和提供商级别设置更细粒度的 allow/blocklist。现有 blocklist 配置客户须在 2026-06-01 前迁移到新系统,否则原有规则将失效。迁移涉及重新配置过滤规则(支持按速度和上下文窗口大小筛选特定模型),建议本周内排期操作。
GitHub Copilot 三模型退役
  • Claude Sonnet 4:已于 2026-05-06 退役2,建议切换至 Claude Sonnet 4.6
  • Grok Code Fast 1:将于 2026-05-15 退役(受 xAI 模型提供商下线影响,时间较急)3,建议替代为 GPT-5 mini 或 Claude Haiku 4.5
  • GPT-4.1:将于 2026-06-01 退役4,建议替代为 GPT-5.5;Enterprise 管理员需通过 Copilot 设置中的模型策略手动启用替代模型访问

Anthropic / Claude Code:大会、算力与平台化

Code w/ Claude 2026

5 月 6 日,Anthropic 在旧金山举办「Code w/ Claude 2026」开发者大会。从内容来看,这次不是一场产品功能秀,而是在宣示定位:Claude Code 已经从代码辅助工具转向「平台」。
算力层:宣布与 SpaceX 签署协议,使用 Colossus 1 数据中心全部算力——超过 300 兆瓦、220,000+ NVIDIA GPU(含 H100/H200/GB200)56。即日起 Pro/Max/Team/Enterprise 用户的五小时速率限制翻倍,取消 Pro 和 Max 账户的峰值时段削减。Anthropic CPO Ami Vora 透露 API 调用量同比增长 17 倍。
Anthropic Claude Opus 各层级 Token 速率限制对照表(2026-05-06)
Anthropic Claude Opus 各层级 Token 速率限制对照表(2026-05-06)
不过,博主 Simon Willison 对此附了一个注脚:SpaceX Colossus 数据中心在 Memphis 的环保表现「particularly bad」,Anthropic 与其合作引发了社区的关注7。这不影响功能本身,但对在意 ESG 的团队而言值得留意。
产品层:Claude Managed Agents 新增三项功能5
  • Multi-agent orchestration(公开测试版):多智能体编排
  • Outcomes(公开测试版):设定成功标准,让 Agent 对目标负责
  • Dreams(研究预览版):Claude 定期审视历史会话并自我改进
Claude Code 创建者 Boris Cherny 演示了 Claude Desktop App 的多会话异步工作流和 Routines(异步自动化提示词)。大会还发布了面向金融服务业的 10 个 Cowork 和 Claude Code 插件、Microsoft 365 集成。
Mercado Libre(23,000 名工程师)在大会上表示目标 Q3 实现 90% 自主编码。Cat Wu(Anthropic Claude Code 产品负责人)的一句话可以当作这个时代的切片:
"Thank you for trusting Claude Code on your production databases back when Sonnet 3.7 was our top model."(感谢你们在 Sonnet 3.7 还是我们最强模型时就把生产数据库交给 Claude Code。)

Claude Code 本周版本迭代(v2.1.121–v2.1.136)

大会之外,Claude Code 本周的版本迭代也颇为密集8
  • alwaysLoad MCP 配置选项(v2.1.121):为某 MCP 服务器设置 alwaysLoad: true 后,该服务器所有工具跳过 tool-search deferral,始终可用——适合团队内部高频使用的 MCP 服务
  • 插件 zip 支持(v2.1.128):--plugin-dir 现在可以指向 .zip 归档,--plugin-url 新标志支持从 URL 获取插件归档用于当次会话
  • Gateway model picker(v2.1.126):当 ANTHROPIC_BASE_URL 指向兼容网关时,自动从 /v1/models 拉取可用模型列表
  • claude project purge 命令:一键删除项目所有 Claude Code 状态
另有若干性能修复:子代理进度摘要现在命中提示缓存(cache_creation 降低约 3 倍),1M 上下文自动压缩的假阻塞问题已修复。

插件生态突破 9,000

截至 5 月 6 日,Claude Code 市场已列出 4,200+ skills、770+ MCP 服务器、9,000+ 插件总数,自去年秋季 GA 以来约翻了三倍9
这个数字本身的信号价值要大于实用价值——大部分是长尾噪音。分析认为,对团队而言真正有杠杆的是构建内部 skills 和 MCP 服务器:把设计系统、内部框架和遥测接入 MCP 服务器,能让每次 Claude Code 会话获得团队自己约定的第一手访问,这比从市场安装更多第三方插件收益更高9

Cursor 3.3:PR Review、并行构建与上下文诊断

Cursor 3.3 本周集中发布了几个工程效率向的功能10
内置 PR Review:在 Cursor 3 中新增三个标签页——Reviews(展示内联 review 线程和顶层 PR 评论)、Commits(专注提交历史视图)、Changes(通过文件树和变更选择器导航大型 PR)。这减少了在编辑器和浏览器 PR 界面之间来回切换的频次。
Build in Parallel(并行构建):Cursor 识别 Plan 中的独立任务后,通过异步子代理并行执行,依赖步骤保持顺序。理论上适合模块化程度高的项目——把一个 feature 拆成独立任务交给多个子代理同步跑。
Split changes into PRs:利用聊天上下文识别逻辑切片,默认生成独立 PR。创建备份快照后提交拆分计划供人工审批,必要时支持 PR 间依赖关系。
Context Usage Breakdown(5 月 6 日上线)11:Agent 上下文用量拆解面板,可按 rules、skills、MCPs、subagents 维度查看各项占用。社区用户 vikngdev 的反应比较直接:
"I think this is a great quality of life addition! Now with more knowledge comes optimization. This immediately makes me want to optimize context usage, I notice that Tools are taking up a sizable chunk of context even before beginning a conversation."
这个功能对重度使用 MCP + rules 的团队实用性较高——对话还没开始工具就吃掉了相当份额的上下文,现在至少能看到问题在哪。
技术博客:Cursor 团队(Shomil、Joshua & Andrew)发布博文,介绍 Composer autoinstall 系统12:用上一代 Composer 1.5 自动为 RL 训练创建可运行环境,解决训练中因环境配置失败导致计算资源浪费的问题。流程分两阶段:目标设定(代理探索代码库,提议 10 条命令及预期输出)和执行(另一代理执行 3 条命令,最多重试 5 次)。Composer 2 在 Terminal-Bench 上得分 61.7%,对比 Composer 1.5 的 47.9%。团队预计 Composer 实例未来将在运行管理、数据预处理和架构调优中扮演更大角色。

GitHub Copilot:四月合版、退役潮与 CLI 新能力

四月合版(v1.116–v1.119)

GitHub Copilot VS Code 四月合版于 5 月 6 日发布13,核心更新:
语义搜索增强:Semantic indexing 现支持所有 workspace,新增 githubTextSearch 工具可在 GitHub 仓库和组织中执行 grep 式搜索。
BYOK(Bring Your Own Key):Copilot Business 和 Enterprise 用户可绑定 OpenRouter / Microsoft Foundry / Google / Anthropic / OpenAI 等自有 API key;Free / Pro / Pro+ 用户同样支持 BYOK;Ollama 等本地模型也在支持列表内。
Chat Continuity:Copilot CLI 会话可跨设备监控和操控(需开启 github.copilot.chat.cli.remote.enabled);Agent Debug Log 面板会话日志持久化;后台终端命令以系统通知形式出现在聊天中。
Token 优化:通过更智能的 prompt caching、延迟工具加载和专用 agentic 工具降低每次请求的消耗。
Agent 体验:代码变更以 diff 形式直接呈现在聊天线程中;可从自然语言描述生成自定义 agent/skill/指令;新增 Integrated Browser 支持按需共享浏览器标签页。

Cloud Agent 组织级 Secrets/Variables

Copilot cloud agent 新增专属「Agents」secrets 和 variables 类型,首次支持组织级别配置14,可跨任意或所有仓库共享。此前需要逐仓库重复配置共享凭据(如内部包注册表 token 或通用 MCP 服务器)的痛点得以解决。
GitHub Copilot 云代理组织级密钥配置页面截图
GitHub Copilot 云代理组织级密钥配置页面截图

CLI:Rubber Duck + Enterprise 插件管理

Rubber Duck 扩展15:GPT 会话下 Copilot 可派遣 Claude 驱动的 Rubber Duck 审查代理提供第二意见;Claude 编排会话则配对 GPT-5.5 作为审查模型。需开启 /experimental on
Enterprise 插件管理公开预览16:管理员可通过 .github-private/.github/copilot/settings.json 定义插件市场,为 Copilot Business/Enterprise 用户自动分发和安装插件,支持 agent、skill、hook 和 MCP 配置等扩展类型。

VS Code 生态:Claude 适配深化与 1.119 更新

VS Code 深度适配 Claude Code 生态

Visual Studio Magazine 的一篇分析17梳理了 VS Code 1.109 以来的变化:VS Code 已经将对 Claude 的支持从模型选择扩展到 Claude Code 的完整配置体系。
VS Code 1.109(2026 年 1 月)新增「Claude compatibility」专节,直接读取 CLAUDE.md、.claude/rules、.claude/agents、.claude/skills 文件,支持 Claude Code 的 hook 格式,Claude 专属斜杠命令(/agents、/hooks、/memory、/init)可直接在 VS Code Copilot 中使用。发布说明的表述比较直接:
"If you use both VS Code and Claude, you no longer need to maintain separate configuration files. VS Code now reads Claude configuration files directly, so your agents, skills, instructions, and hooks work across both tools without duplication."(如果你同时使用 VS Code 和 Claude,不再需要维护两套配置文件。VS Code 现在直接读取 Claude 配置文件,你的 agents、skills、指令和 hooks 无需重复配置即可跨工具使用。)
此外,VS Code、GitHub Copilot CLI 和 Claude Code 已共享插件清单格式(.claude-plugin/plugin.json),插件跨工具兼容。
这背后是 2025 年 11 月微软宣布的 50 亿美元 Anthropic 投资,以及 Anthropic 承诺购买 300 亿美元 Azure 算力的商业绑定——Claude 在 VS Code 生态中获得的待遇已超出普通第三方 AI 工具。

VS Code 1.119

5 月 6 日发布的 VS Code 1.11918 聚焦智能体工作流和可观测性:
  • Agent 浏览器共享:智能体可通过上下文选择器和拖放操作共享浏览器标签页,实现实时页面验证
  • OpenTelemetry 追踪:Copilot Chat 智能体会话(含本地智能体、Copilot CLI 后台智能体、Claude 智能体)现在发出 OTel traces、metrics 和 events,遵循 GenAI 语义约定。每个用户请求产生 invoke_agent 根 span,嵌套 chatexecute_toolexecute_hook 子 span——对需要追踪 AI 代理调用链路的团队来说是个实用工具
  • 后台 Todo 智能体chat.agent.backgroundTodoAgent.enabled):将 todo 列表管理卸载到轻量模型
  • Agent 沙箱 allowNetwork 模式:在保留文件系统限制的同时移除网络域阻止
  • TypeScript 7 迁移完成:Copilot 扩展类型检查时间从 22 秒降至 4 秒

Sub-agents 即将登陆 Visual Studio Copilot

微软 Visual Studio 首席产品经理 Mads Kristensen 5 月 6 日在 X 上宣布19
Loading content card…
目前 VS Code 已有完整的子代理文档(context isolation、custom agents、parallel execution、search subagent),VS 版本尚在开发中,预计不远。一位评论者的回应颇能代表社区心态:「Excellent. Between the last Insiders update and this on the horizon, I see you're attempting to end my reliance on Cursor.」

Windsurf、Zed 与 Tabnine

Windsurf v2.2.17:Devin Review 集成

5 月 6 日,Windsurf IDE v2.2.17 发布,核心是引入 Devin Review20
  • Devin Review(深度审查):按逻辑组织 diff、上下文感知漏洞检测、Autofix 自动修复、与 GitHub 工作流联动
  • Quick Review:基于 SWE-check 模型的本地变更预审查,比深度审查快 10 倍且免费,适合在推送前快速过一遍本地改动
  • Agent Command Center 新增列表视图,改进会话排序和过滤
  • 修复 Windows 用户更新卡住问题(需通过任务管理器关闭 devin.exe 进程后安装更新)
本次无 Breaking Changes。

Zed v1.1.5 与 Zeta2.1 模型

Zed v1.1.5 稳定版于 5 月 6 日发布2122,主要更新:
  • Zed for Business:$30/席位/月,不含捆绑 AI 额度,支持 Zed 托管 AI(成本+10%)或自带 API 密钥。提供组织级隐私控制、功能禁用、token 消费上限;暂不支持 SSO/SOC2
Zed for Business 发布视觉
Zed for Business 发布视觉
  • 布局切换器:classic(项目/Git 在左)和 agentic(Agent 面板在左)两种布局一键切换
  • Git Graph:替代原有文件历史视图,性能更好,支持懒加载、搜索和提交信息面板
  • 文件 diff 并排视图(side-by-side)
  • 新模型支持:GPT 5.5、DeepSeek V4、MiMo V2.5、Ling 2.6、Hy3 等
  • 后续发布 v1.1.6(May 6 bug 修复)、v1.1.7(May 8 bug 修复);Preview 分支推进至 v1.2.2-pre
Zeta2.1 编辑预测模型于 5 月 8 日发布23,采用全新 Multi-Region 提示格式,只输出需要修改的代码区域,而非周围完整区域:
Loading stats card…
Zeta2.1 已成为 Zed 编辑器默认的编辑预测模型,开放权重,可在 Hugging Face 下载。首次提供显式数据收集授权设置(zed://settings/edit_predictions.allow_data_collection)。
Zed CEO 战略博文:5 月 5 日,Zed CEO Conrad Irwin 发表博文24回应社区质疑——社区认为 Zed 偏重 AI 是因为 AI 更赚钱。Irwin 的解释是:LLM 已经能帮助高效程序员进一步提升生产力(充当橡皮鸭、完成重构、写测试、识别边界 case),代码生产成本降低后,围绕代码的协作、评审、维护成为主要成本,现有工具已不适应新模式。他提到了一个长期愿景:DeltaDB(操作级粒度同步引擎),让人类和 AI Agent 可以在演进中的代码库上共享视图,让代码讨论始终与代码本身关联。

Tabnine 四月回顾

Tabnine 5 月 6 日发布「April Recap: Agents you can trust」25,这批更新集中在企业可信赖性这个方向:
Tabnine 四月产品回顾
Tabnine 四月产品回顾
  • CLI Plan Mode:Agent 执行前预览计划,用户审批后再执行
  • 沙盒执行与更严格工具限制:Agent 操作边界更清晰
  • Token 消耗与成本 API:获取实际用量数据,支持构建 chargeback 模型
  • 按团队配额执行:在团队级别而非仅组织级别控制用量
  • 旧的 IDE review tab 移除,代码审查现在由 Agent 驱动、基于 coaching guidelines
Tabnine 团队的定位描述:这次发布是缩小「能生成代码的 AI」与「能在你的组织中可靠运行的 AI」之间的差距——而这正是大多数团队目前最挣扎的地方。

Continue:已 6 周无更新

Continue(continuedev/continue)GitHub releases 页面可见最新条目停留在 2026 年 3 月 27 日(v1.2.22-vscode stable)26,官方博客最新文章为 2026 年 3 月 6 日。目前无法判断是产品节奏调整还是其他原因,建议关注其 Discord 社区动态。

MCP 生态:Auth0 认证 GA 与 DNS 发现草案

MCP 协议规范层本周无新版本(最新仍为 2025-11-25),生态活跃主要体现在工具层和应用层27
Auth0 MCP 认证正式 GA:为 MCP 服务器提供认证、CIMD 注册和 OBO token exchange。对需要在生产环境使用 MCP 的团队来说是个重要进展——安全一直是 MCP 落地最大的障碍,微软产品经理 Leslie Richardson 在接受采访时也明确说:「Security is probably the biggest challenge」。
IETF DNS 发现草案:探索通过 DNS TXT Records 自动发现 MCP 服务器——如果标准化落地,服务端不需要提前告知客户端 MCP 端点地址,发现过程可以自动化。目前仍是草案阶段。

社区声音

Cursor 社区:配额焦虑与定位质疑

本周 r/cursor 社区有两类讨论值得关注。
配额消耗:有 Pro+ 用户在 5 月前 10 天耗尽 $120 配额,另有用户误以为 Pro 的 auto 模型无限使用。背景是 Cursor 3.3 引入并行子代理后,单次任务的 token 消耗显著增加,但产品侧的用量预期设置尚未跟上。
定位质疑:用户 RandomBlokeFromMars 的帖子引发了一定共鸣——
"is there some good reason of taking the only unique value proposition, trying to hide it and make it obsolete, only to become a clone of one of the existing options?"(有什么合理的理由,把唯一的差异化价值主张隐藏掉、让它变得多余,只是为了变成某个现有选项的克隆版?)
这个担忧的背景是 VS Code + Claude Code 的组合越来越能替代 Cursor 的核心场景。不过也有反向声音,用户 No_Basis6655 认为 Cursor 3 的 background agent 和 BugBot「感觉我们刚刚达到了某种编程代理的临界点,这不再是增量改进」。

Claude Code 误删 Windows 系统

Reddit r/ClaudeAI 上,用户 ComposerGen 描述了一个值得记录的案例28:Claude Code 在帮助配置 4×RTX 3090 ML 机器时,因跨解析器(zsh → tmux → PowerShell → cmd)的转义字符坍塌,误执行了 rd /S /Q \\(删除 C 盘根目录),约 90 秒内销毁 717 GB 数据。用户有 HDD 备份,数据未丢失,且原计划几天后本就要重装系统。
帖子总结的四条安全操作规范:
  1. 执行前让 AI 输出展开后的确切命令
  2. -WhatIf--dry-run 先预览
  3. 备份放在独立物理磁盘上
  4. 不要在运行中的操作系统上做大规模清理
ComposerGen 在帖子里以 Claude 的第一视角写事后分析,有一句话特别点到本质:「Sending shell commands across multiple parsers is brittle. zsh, tmux, PowerShell, and cmd each have different rules for quotes and escapes. cmd is the worst of the four.」

Simon Willison:Claude Code 里用 HTML 比 Markdown 效果更好

Anthropic Claude Code 团队成员 Thariq Shihipar 发文主张:在 Claude Code 中请求 HTML 而非 Markdown 作为输出格式,HTML 可嵌入 SVG 图表、交互式组件、页内导航等29
Simon Willison 的反应是——自 GPT-4 时代以来他一直默认用 Markdown(因为 8,192 token 限制下 Markdown 的 token 效率极高),但 Thariq 的文章让他开始重新考虑。他用 GPT-5.5 测试生成 HTML 来解释 Linux 安全漏洞,效果不错。对于需要生成复杂解释文档或 PR Review 报告的场景,这个思路值得一试。
Thariq 的提示词建议可以直接参考:
"Help me review this PR by creating an HTML artifact that describes it. I'm not very familiar with the streaming/backpressure logic so focus on that. Render the actual diff with inline margin annotations, color-code findings by severity and whatever else might be needed to convey the concept well."(通过创建一个描述该 PR 的 HTML artifact 来帮我审查它。我不太熟悉 streaming/backpressure 逻辑,请重点关注这部分。用内联边注渲染实际 diff,按严重程度用颜色标注发现,以及其他有助于清晰表达概念的内容。)

HN 声音:代码质量与补贴时代

HN 上有讨论聚焦 Claude Code(Opus 4.7)和 Codex(GPT-5.5)的代码质量问题30,用户 david_d8912 的观察:「agents are perfectly capable of delivering most features hands free these days, but the code quality is still miserable without another few rounds of prompt.」具体症状是 AI 倾向于复制现有工具方法而非优雅扩展,CLAUDE.md 只是缓解而非可扩展解决方案。
同期有 dev.to 文章指出:Claude/Copilot/OpenAI 正在同时削减补贴,AI 开发工具定价从补贴模式转向真实成本。结合 GitHub Copilot 6 月 1 日的 token-based 计费转型,接下来几个月,工具选择会越来越务实——哪个工具在实际工程场景的单位成本更低,而不是哪个功能列表更长。

References

  1. 1Cursor: Model controls, spend management, and usage analytics
  2. 2GitHub Changelog: Claude Sonnet 4 deprecated
  3. 3GitHub Changelog: Upcoming deprecation of Grok Code Fast 1
  4. 4GitHub Changelog: Upcoming deprecation of GPT-4.1
  5. 5Ars Technica: Anthropic raises Claude Code usage limits, credits new deal with SpaceX
  6. 6Anthropic: Higher usage limits for Claude and a compute deal with SpaceX
  7. 7Simon Willison's Weblog: Live blog: Code w/ Claude 2026
  8. 8Claude Code Week 19 · May 4–8, 2026
  9. 9Sonnet Code: Claude Code's Plugin Ecosystem Crossed 9,000
  10. 10Cursor: PR Review, Build Plan in Parallel, and Split PRs
  11. 11Cursor: Context Usage Breakdown
  12. 12Cursor Blog: Bootstrapping Composer with autoinstall
  13. 13GitHub Changelog: GitHub Copilot in Visual Studio Code, April releases
  14. 14GitHub Changelog: More flexible secrets and variables for Copilot cloud agent
  15. 15GitHub Changelog: Rubber Duck in GitHub Copilot CLI now supports more models
  16. 16GitHub Changelog: Enterprise-managed plugins in GitHub Copilot CLI are now in public preview
  17. 17Visual Studio Magazine: Special Embrace? VS Code Adapts to Claude Code's Ecosystem
  18. 18Visual Studio Magazine: VS Code 1.119 Adds Agent Browser Sharing, OpenTelemetry Tracing
  19. 19Visual Studio Magazine: AI Subagents 'Coming Soon' to Visual Studio Copilot
  20. 20Windsurf/Codeium: Fast and Comprehensive Code Review, Now in Windsurf
  21. 21Zed Industries: Stable Releases
  22. 22Zed Industries: Introducing Zed for Business
  23. 23Zed Industries: Zeta2.1: 3x Fewer Tokens, 50ms Faster
  24. 24Zed Industries: We're Not Building AI Features for the Money
  25. 25Tabnine: April Recap: Agents you can trust
  26. 26Continue GitHub Releases
  27. 27GitHub: modelcontextprotocol/specification
  28. 28Reddit r/ClaudeAI: I deleted a guy's entire Windows install with one backslash
  29. 29Simon Willison's Weblog: The Unreasonable Effectiveness of HTML
  30. 30Hacker News: How to improve code quality of Claude Code and codex

Comments (0)