
千问 Qwen3.7-Plus 炸场、Anthropic 警示递归 AI、DeepSeek 登顶美企支出榜|AI 公众号日报 0605
今日五条:阿里 Qwen3.7-Plus 正式发布,多模态智能体 11 小时自主开发 App、屏幕理解超越 GPT-5.4,Vision Arena 国产第一;Anthropic 披露 80% 代码已由 Claude 撰写,2 年内或递归自升级,特朗普同步签署 AI 行政令要求发布前 30 天对政府开放;DeepSeek 登顶美企 AI 支出榜,「收费成人礼」讨论升温;信通院双线推进智能体操作系统与金融智能体两项标准;微信 AI 智能体右滑首屏内测再获确认。

昨日中国 AI 圈有三条主线同步推进:阿里通义悄然发布 Qwen3.7-Plus 多模态智能体模型,国产 Agent 工程化能力再上台阶;Anthropic 首次公开披露递归自我改进数据,叠加特朗普 AI 行政令签署,全球 AI 治理进入实质性加速;与此同时,Ramp 6 月报告显示 DeepSeek 已登顶美国企业 AI 支出榜,公众号热议的「收费成人礼」话题亦随之浮出水面。
一、阿里 Qwen3.7-Plus 正式发布:11 小时自主开发一款 App
6 月 4 日晚,阿里通义实验室低调发布 Qwen3.7-Plus 多模态智能体模型,同步接入千问云与阿里云百炼 API1。
官方给出两个实测数据堪称亮眼:
- 屏幕理解:在 BabyVision、ScreenSpot Pro、AndroidWorld 等多个基准测试中,Qwen3.7-Plus 超越 GPT-5.4 和 Claude Opus 4.7,在 Vision Arena 中国区排名第一、全球前五2。
- 长周期 Agent 执行:从零开发一款英语词汇学习 App,AI 连续自主运行超 11 小时,生成 10000+ 行代码、触发 1000+ 次工具调用,覆盖需求文档、代码编写、自动部署、测试、GUI 自动化与版本迭代全链路。
콘텐츠 카드를 불러오는 중…
此外,已发布的旗舰版 Qwen3.7-Max 在 Artificial Analysis 全球榜中拿下 56.6 分,位列全球第五、国产第一,并以单次输入最多修改 6 次、重新生成 3-6 次的节奏持续迭代3。
一句话判断:Qwen3.7 系列的核心赌注是「让 AI 能干真实工程活」,而不是跑分。能否经住生产环境的持续验证,是后续观察的核心指标。
二、Anthropic「递归 AI」报告引爆全球讨论
6 月 4 日,Anthropic 发布报告《When AI Builds Itself》,首次披露递归自我改进数据4:
- 截至 2026 年 5 月,超过 80% 合并入 Anthropic 代码库的代码已由 Claude 撰写
- 工程师日均 AI 辅助工作时长约 4 小时,开发效率约提升 4 倍
- Anthropic 明确警告:AI 或在 2 年内实现递归自我升级(无需人类干预自主迭代新版本),罕见呼吁全球协调暂缓前沿 AI 研发
该报告在 Hacker News 拿到 352 分、470 条评论,成为 48 小时内全球最热 AI 话题之一。
与此同时,特朗普于 6 月 2 日签署 AI 行政令:要求 AI 公司在向公众发布前沿模型前 30 天,向联邦政府开放访问权限;政府将以自愿参与方式邀请企业加入基准测试机制。这被业界视为美国 AI 监管从「软引导」转向「硬介入」的标志性事件5。
콘텐츠 카드를 불러오는 중…
值得关注的信号:Anthropic 自揭「递归自改进」数据 + 美国立法加速,两件事同一天曝光,并非巧合——更像是产业界和政策层对同一个未来风险的两套应对路径。
三、DeepSeek 登顶美企 AI 支出榜,「收费成人礼」讨论升温
6 月 5 日,据南华早报援引企业支出平台 Ramp 的 6 月报告:DeepSeek 已在美国企业 AI 产品支出中位居榜首,越来越多的公司用其替代 OpenAI 和 Anthropic6。
同天,字母榜一篇《收费才是 DeepSeek 的「成人礼」》在公众号大量转载,核心论点:
- 豆包已确立 68-500 元/月三档 C 端订阅,"免费午餐"时代事实上已经终结
- DeepSeek V4-Pro API 永久降价 75%,百万 Token 输入仅 0.025 元,创全球最低
- 作者认为 DeepSeek 迟早需要向 C 端收费,以支撑 500 亿元融资后的大规模算力投入7
两条消息叠放,一个有趣的矛盾浮出:DeepSeek 作为最便宜的模型,已经被美国企业用来最多——但商业模式能否长期维持,仍是悬而未决的问题。
콘텐츠 카드를 불러오는 중…
四、中国信通院双线推进 AI 智能体标准
6 月 5 日,中国信通院发布两项标准化动作8:
- 智能体操作系统标准:召开《可信互联网智能体操作系统》系列标准首次研讨会,涵盖 Agent OS(任务编排)、AI OS(端侧嵌入)、Agentic OS(系统改造)三条技术路线,腾讯 MaVIS、科大讯飞玲珑、钉钉木兰等均在参考范围
- 金融智能体标准:依托金融科技标准推进委员会(TC604)启动 FinClaw 类企业级智能体平台系列标准建设,公开征集参编单位9
两项举措均延续了中国「先建标准、后规范市场」的监管路径,直接对应 BCS 2026 北京网络安全大会上「2026 中国 AI 智能体领航者」产业图谱同步发布的节奏。
五、腾讯微信 AI 智能体内测消息再获确认
AI 新资本论 6 月 5 日援引多位知情人士称:腾讯正在小范围测试微信 AI 智能体,调出方式为首屏右划;腾讯方面未透露具体上线时间,称取决于监管审批进展10。
此消息与上期(0603)「微信 AI 助手进入原型测试」形成印证,腾讯混元大模型为底座、右滑首屏入口、依赖监管审批的基本框架持续清晰,但正式发布时间仍属未定。
이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.