
云服务降价速报:AWS GPU 实例最高降 45%,GCP 新模型比旧款便宜 25%,Azure DocumentDB 免费层秒级就绪
过去两个月,AWS、GCP、Azure 接连出手:AWS EC2 NVIDIA GPU 实例(P4/P5)最高降价 45%,S3 Express One Zone GET 请求费用砍去 85%;Google Cloud 发布 Gemini 3.5 Flash,价格比上代 Pro 便宜 25%,同期 Gemini 2.0 Flash 已下线;Azure DocumentDB 免费层正式 GA,集群秒级配置。本文逐条梳理降价幅度、生效时间与操作建议。
リサーチノート
过去两个月,AWS、GCP、Azure 接连出手——GPU 算力、对象存储、AI 推理 API、文档数据库,四条降价/新增免费线同时落地。对正在优化云支出的开发团队来说,这波窗口值得逐条核实。
AWS:GPU 实例最高降价 45%,S3 高速存储请求费砍去 85%
GPU 实例降价是本轮规模最大的一笔。AWS 宣布对 NVIDIA GPU 加速的 EC2 实例(P4d、P4de、P5、P5en)按需价格和 Savings Plan 同步下调,最高降幅 45%。1 P5 系列搭载 NVIDIA H100,P4 系列搭载 A100,都是大模型训练和推理的主力机型。有长期 GPU 集群需求的团队,此时重新测算 Savings Plan 锁定成本值得排上日程。
同步落地的还有 S3 Express One Zone 降价,打折力度更猛。自 2025 年 4 月 10 日起,美东 N. Virginia 区域存储价从 $0.16 降至 $0.11/GB·月(−31%);GET 请求费从 $0.0002 降到 $0.00003/千次请求,降幅高达 85%;PUT 请求费降 55%,上传/检索数据传输费各降 60%。2 S3 Express One Zone 专为频繁小对象读写设计,AI 推理管线(特征向量、embedding 缓存)和实时分析场景是主要受益方。

| 项目 | 原价 | 新价 | 降幅 |
|---|---|---|---|
| 存储(US-East-1) | $0.16/GB·月 | $0.11/GB·月 | −31% |
| GET 请求 | $0.0002/千次 | $0.00003/千次 | −85% |
| PUT 请求 | $0.0025/千次 | $0.00113/千次 | −55% |
| 上传/检索数据传输 | $0.008/$0.0015/GB | $0.0032/$0.0006/GB | −60% |
同期,AWS 也把 SageMaker AI GPU 加速实例的降价同步到了 SageMaker 侧,幅度相同。4
GCP:Gemini 3.5 Flash 亮相 Google I/O,性能超旧 Pro 款、价格便宜 25%
2026 年 5 月 19 日 Google I/O,Google Cloud 发布 Gemini 3.5 Flash,定价 $1.50/百万输入 token、$9.00/百万输出 token。5 与之比较的是上一代 Gemini 3.1 Pro($2.00/$12.00),新款在同等或更强性能下,输入端单价降约 25%,输出端降 25%。
此前占据过渡档位的 Gemini 2.0 Flash 和 Flash-Lite 已于 2026 年 6 月 1 日正式下线,所有调用需迁移到 2.5 系列或更新版本。6 目前 Google AI Studio 免费层仅保留 Gemini 2.5 Flash、2.5 Flash-Lite 的免费访问;Pro 模型系列免费入口已关闭。
对正在跑 Gemini API 的团队,迁移路径简明:2.0 Flash 用户直接切 2.5 Flash(价格持平或更低);如有性能提升需求,可测试 3.5 Flash——基准表现优于 3.1 Pro,价格反而更低。
コンテンツカードを読み込んでいます…
Azure:DocumentDB 免费层秒级配置正式 GA
Azure DocumentDB(MongoDB 兼容的全托管文档数据库)本月将免费层集群的配置时间从「数分钟」压缩到了近乎即时(秒级),并正式进入 General Availability。7 功能兼容性与原免费层完全一致,变化只在速度:适合快速原型开发、函数测试、以及 AI Agentic 工作流中动态启停临时数据库的场景。
唯一值得注意的小变动:免费层集群的 admin 用户名现在由系统预分配(不再用户指定),配置完成后可在 Azure Portal 的 Connection strings 页面或通过 API/CLI 查到。
Cloudflare:Pages 免费层「无限带宽、无限构建分钟」持续有效
Cloudflare Pages 的免费层持续保持行业高基线——无限站点数、无限带宽、无限构建分钟、每次 PR 自动生成预览 URL、即时回滚到任意历史版本。8 相较同类平台对带宽或构建时长设上限的做法,Cloudflare Pages 的免费层对个人项目和小团队的托管成本基本为零。

操作清单
本期涉及的省钱动作按优先级汇总:
- AWS GPU 用户:重新核算 P4/P5 系列的 Savings Plan,新报价已降 45%,锁定合同前建议先跑 spot + on-demand 混合测试。
- AWS AI 管线:用了 S3 Express One Zone 的团队账单已自动按新价计费(自 2025/4/10 起),无需任何操作,检查 Cost Explorer 确认降幅。
- GCP API 用户:已在用 Gemini 2.0 Flash/Flash-Lite 的团队须完成迁移(6/1 已下线会报错)。3.5 Flash 价格优于 3.1 Pro,值得 A/B 测试。
- Azure DocumentDB 用户:免费层新建集群现在秒级就绪,可用于快速搭建测试环境,无需额外预算。
- 静态站点/前端项目:若尚未迁到 Cloudflare Pages,其免费层的无限带宽是与 Vercel/Netlify 相比最直接的成本差异点。
参考ソース
- 1Announcing up to 45% price reduction for Amazon EC2 NVIDIA GPU-accelerated instances
- 2Amazon S3 Express One Zone reduces storage and request prices
- 3Pixabay 版权声明
- 4Announcing price reductions for Amazon SageMaker AI GPU-accelerated instances
- 5Gemini 3.5 Flash: more expensive, but Google plan to use it for...
- 6GCP May 2026: Gemini 3.5 Launches, 2.0 Shuts Down
- 7Instant Free Tier Clusters in Azure DocumentDB
- 8Cloudflare Free Tier: Everything You Can Do Without Paying a Dollar
- 9Pixabay 版权声明

このコンテンツについて、さらに観点や背景を補足しましょう。