Twitter AI 精选 · 2026/05/06–05/08:Claude 杀进微软、Agent 成本炸弹、EU 合规倒计时

精选 5 篇近三日 Twitter AI 深度 thread:Claude 全面进入 Microsoft 365、Uber AI Agent 成本炸弹分析、EU AI Act 88 天合规倒计时、OpenAI GPT-Realtime-2 三模型发布。

リサーチノート

导读:过去三天,AI 圈最密集的讨论集中在一个事件上——Anthropic 的 Claude 正式进入 Microsoft 365,OpenAI 在 Office 套件里的独家时代就此终结。与此同时,Uber 烧光全年 AI 预算的故事把 Agent 成本问题推到台前,Jevons 悖论在企业 AI 侧已经发作;OpenAI 趁势发布三款实时语音模型,试图用 voice 层的执行能力拉开差距。另一个不该被忽略的信号:EU AI Act 高风险截止日期 8 月 2 日已不足 90 天,Omnibus 谈判破裂,没有缓冲期可用。

📌 本期精选 5 篇

#作者主题互动亮点
1@tetumemo (48K)Claude for MS365 日本实测8,905 浏览 · 32 赞 · 37 书签
2@elmeb (14.5K)Claude×MS365 战略格局分析法文深度 thread
3@ShurtcurtUber 预算教训 · Agent 经济学数据最扎实
4@NikoGamulin (3.8K)EU AI Act 合规倒计时时效最紧迫
5@0xBlackVectorGPT-Realtime-2 三模型技术解析技术最详尽

1|@tetumemo — Claude for MS365 实测:「复制粘贴地狱」消失了

作者背景:テツメモ(@tetumemo),日本 AI 创作者、博主,运营超过 10 年,粉丝 48,054,专注 AI 工具实测与图解科普。
发帖时间:2026-05-08 13:58 UTC 1
互动数据:8,905 浏览 · 32 点赞 · 3 转发 · 4 引用 · 37 书签
コンテンツカードを読み込み中…
核心观点
@tetumemo 的这篇实测聚焦在「跨应用上下文连续性」这个具体功能点上。他的结论很干脆:Claude for Microsoft 365 真正解决的不是「从零创建 PPT」——现有工具都能做到——而是之后的「最后 10% 精细修正」痛点。1
具体来说:Claude for Word/Excel/PowerPoint 已正式 GA,Outlook 进入 Public Beta。核心卖点是工作流打通——Outlook 里阅读的邮件内容直接带入 Word,Excel 建模结果无缝进入 PowerPoint,无需中间的复制粘贴。ServiceNow 的企业反馈也印证了这一点:「工具间移动内容的麻烦消失了。」1
安装方式:通过 Microsoft AppSource 获取 add-in,管理员可通过 admin center 批量部署。
关键金句
「ツール間の『コピペ地獄』がなくなる感じ」
——「工具间的『复制粘贴地狱』消失了的感觉」
「"最後の10%問題"が解決される点に感動した」
——「『最后 10% 问题』被解决的地方让人感动」
编辑注:书签数 37 远高于转发数 3,说明读者把它当参考资料存档,而非传播分享。这类「高书签低转发」的实测帖,通常是从业者日常工具选型的参考池。

2|@elmeb — Claude 登陆 MS365 战略解读:单一供应商时代终结

作者背景:El Meb(@elmeb),ML 工程师,法国里尔,粉丝 14,473,已验证。
发帖时间:2026-05-08 17:15 UTC 2
コンテンツカードを読み込み中…
核心观点
@elmeb 的 thread 从资本关系往下挖。2019 年以来微软向 OpenAI 投入 130 亿美元,Microsoft 365 Copilot 自发布起独家使用 GPT——这套安排在 2026 年 5 月 7 日被打破。2
他的核心论点有三层:
技术差异:Claude 的长对话记忆有两年领先优势,跨应用上下文连续性(cross-app context)是真实技术壁垒,不是营销说辞。从 Outlook 邮件摘要到 Word 文档、到 Excel 建模、到 PowerPoint 演示,Claude 全程保持上下文,无需重新解释。2
市场分化:首批企业客户 Citadel、ServiceNow、Deloitte、BCI 集中在金融、法律、健康等受监管行业——这不是随机分布。对这类客户来说,Claude 的可审计性(auditability)比 Copilot 便宜 10 美元的价格差异更重要。2
格局极化:他的结论是,企业 AI 正在按客户类型分化——OpenAI 瞄准大众市场和通用 agentic,Anthropic 做受监管行业和可审计性,Google 押注原生多模态,微软则终于接受「不再做 OpenAI 的代理」这个角色。2
关键金句
"Le mono-vendor a vécu."(单一供应商时代终结了。)
"Pour OpenAI, c'est rude. À 7 mois de l'IPO prévue fin 2026, perdre l'exclusivité Microsoft 365 est une claque diplomatique majeure."
——「对 OpenAI 来说代价不小。距 2026 年底计划 IPO 仅 7 个月,失去 MS365 独家权,是一记外交上的重锤。」
定价对比可参考:Microsoft Copilot 30 美元/用户/月(直接写入文件);Claude add-in 含在现有 Claude 订阅中(20 美元+/月),但修改需人工审核。2

3|@Shurtcurt — Uber 烧光全年预算:Agent 成本为何总被低估 3-5 倍

作者背景:ItsAllAboutLife(@Shurtcurt),美国明尼苏达,318 粉丝,已认证。粉丝数不高,但这条 thread 的数据密度和逻辑链在本期所有精选中最扎实。
发帖时间:2026-05-06 16:13 UTC 3
コンテンツカードを読み込み中…
核心观点
这篇 thread 从一个具体事件——Uber CTO 公开确认公司 2026 全年 AI 预算在 4 个月内被 Claude Code 消耗殆尽——展开了一套 Agent 成本结构分析。3
Jevons 悖论已经在 AI 侧发作:token 价格在过去两年下降 80-90%,但企业 AI 支出同期增长 320%——两条曲线同时成立。这和 19 世纪 Jevons 观察到的煤炭现象一模一样:效率提升反而加速消耗。3
AI Agent 成本爆炸示意
AI Agent 成本爆炸示意
低估成本的根本原因是建模方式错误。用「轮数 × 平均每轮成本」建模的团队系统性低估成本 3-5 倍——因为 Agent 的每一步都要携带完整上下文:所有文件读取、工具结果、历史消息。一个 10 步 workflow 的实际成本不是单次查询的 10 倍,而是 30-50 倍。3
@Shurtcurt 的结论直接点名了「补贴期结束」:Gartner 预测到 2027 年超过 40% 的 Agentic AI 项目将被取消,原因不是模型不行,而是经济学行不通。3
关键金句
"Token prices have dropped 80-90% in two years. Enterprise AI spend went up 320% in the same window. Both things are true and that's exactly the problem."
——「token 价格两年内跌了 80-90%,企业 AI 支出在同一时间窗口涨了 320%。这两件事同时成立——而这恰恰就是问题所在。」
"The agent demo worked. The agent budget didn't."
——「Agent demo 成功了,Agent 预算没撑住。」
"Token governance is now the unglamorous skill that separates teams shipping in production from teams stuck explaining to a CFO why the pilot cost $90k and delivered nothing yet."
——「Token governance 现在是那项没人愿意谈的技能,但它是区分『已在生产环境交付的团队』和『还在给 CFO 解释为什么 pilot 花了 9 万刀却什么都没交付』的关键分水岭。」
编辑注:这里的 Gartner 预测(⚠️ 低可信度,系 @Shurtcurt 引用,非官方报告直链)值得独立核查,使用时建议标注出处层级。

4|@NikoGamulin — EU AI Act 8 月 2 日截止:先问「有多少 AI 系统你不知道」

作者背景:Niko Gamulin(@NikoGamulin),AI 顾问、AI 博士,粉丝 3,819,已验证。
发帖时间:2026-05-06 04:37 UTC 4
コンテンツカードを読み込み中…
核心观点
EU Parliament、Council、Commission 三方关于 AI Act Omnibus 的谈判已宣告破裂。原本有望延期的 2026 年 8 月 2 日高风险 AI 系统义务截止日期,恢复生效。4
高风险 AI 系统的范围包括信用评分、欺诈检测、客户 onboarding 等 Annex III 定义的系统——这些都在截止日期管辖内,没有延期到 2027 年的余地。罚款上限:3,500 万欧元,或全球营收的 7%,比 GDPR 还严。4
@NikoGamulin 的论点不在于合规路径,而在于大多数企业连「合规第一步」都还没迈出——他们不知道自己有多少 AI 系统在运行。「库存问题在文档问题之前」,这句话戳穿了大量合规准备停留在 PPT 层面的现实。4
关键金句
"The first question every compliance team should answer right now: how many AI systems are running in your organization that nobody in compliance knows about?"
——「每个合规团队现在应该回答的第一个问题:你们组织里有多少 AI 系统在运行,而合规部门根本不知道它们的存在?」
"Most can't answer that. The inventory problem comes before the documentation problem."
——「大多数企业无法回答这个问题。系统清单问题,在文档问题之前。」
距 8 月 2 日(以 5 月 6 日发帖日计算):约 88 天。

5|@0xBlackVector — GPT-Realtime-2 三模型详解:语音 AI 从对话到执行

作者背景:Black Vector(@0xBlackVector),AI 系统 / CUDA 内核工程师,粉丝 63,已验证。粉丝极少,但技术解析精度高。
发帖时间:2026-05-08 18:58 UTC 5
コンテンツカードを読み込み中…
核心观点
OpenAI 同时发布三款实时音频模型,@0xBlackVector 把它们的定位区分得很清楚:5
  • GPT-Realtime-2:旗舰推理,接近 GPT-5 级别推理能力,支持长对话、理解打断、通话中调用工具/API
  • GPT-Realtime-Translate:实时翻译,70+ 种输入语言 → 13 种输出语言,实时保持对话节奏
  • GPT-Realtime-Whisper:超低延迟流式转录,比前代更快更准确
統計カードを読み込み中…
@0xBlackVector 的核心判断:这不是语音 chatbot 的升级,而是执行能力的跃迁。GPT-Realtime-2 可以在通话中调用工具和 API——他举的例子是:口头请求「找预算内的房子、避开嘈杂路段、安排周末看房」,模型能实际推理并采取行动,而不只是回答问题。Zillow、Priceline、Deutsche Telekom 是已测试的企业。5
关键金句
"AI assistants are moving from 'chatbots' to real-time action-taking agents."
——「AI 助手正在从『聊天机器人』迈向实时行动执行的 agent。」
"The flagship voice model with near GPT-5-level reasoning abilities."
——「旗舰语音模型,具备接近 GPT-5 级别的推理能力。」

延伸信号

@JettHuu(24K粉) 同日发布了一条 AI 产业链美股分析:NVDA 为算力核心、AVGO 为定制芯片、TSM 为制造瓶颈、MU 为内存瓶颈。他的结论——「AI 不只缺 GPU,也缺内存、带宽、电力和存储」6——与本期 Uber 成本 thread 的底层逻辑相通:算力扩张在多个层面同时触顶。该帖互动数据极低(浏览量 25,零转发),暂未进入精选,但框架本身值得参考。

本期覆盖时间窗口:2026-05-06 至 2026-05-08(UTC)

このコンテンツについて、さらに観点や背景を補足しましょう。

  • ログインするとコメントできます。