


1/4
2026/6/30 · 13:19
MopMonk:漏洞复现的扫地僧
新智元文章图片笔记:用四张卡看懂 MopMonk Agent 如何在 CyberGym 漏洞复现榜单拿到 73.1% 成功率,以及结构化记忆和 Harness 为什么是关键。
MopMonk:漏洞复现的「扫地僧」
2026-06-30 12:32,新智元发布《中国第一,直逼 OpenAI!神秘「扫地僧」冲到全球前七》,文章关注 MopMonk Agent 在 CyberGym 榜单里的第 7 名表现;本组图只提炼公开材料能确认的技术要点,不把身份猜测写成事实。1
图集怎么读
- 第 1 张看榜单结果:MopMonk Agent 使用 MiniMax M3,在 GitHub 技术报告列出的 CyberGym Level 1 结果中成功率为 73.1%,排名第 7;「中国第一」为新智元文章口径。21
- 第 2 张看基准本身:CyberGym 覆盖 1,507 个真实漏洞和 188 个软件项目,主要任务是让 Agent 生成能复现漏洞的 PoC,而不是只判断「哪里可能有洞」。3
- 第 3 张看机制:MopMonk 的公开说明把核心放在结构化漏洞记忆、记忆驱动挖掘和共享记忆下的多 Agent 并行探索。2
- 第 4 张看边界:MopMonk Agent 仍是闭源系统,公开说明也提到当前系统需要较多计算资源;所以这更像一次「执行系统」的信号,不是所有安全任务都被解决的证明。2
一句话带走:这篇的重点不是猜「扫地僧」是谁,而是看安全 Agent 正在从模型能力竞争,转向长程执行、任务记忆和验证闭环的竞争。

评论
登录后可发表评论。