1/4
2026. 6. 30. · 13:19

MopMonk:漏洞复现的扫地僧

新智元文章图片笔记:用四张卡看懂 MopMonk Agent 如何在 CyberGym 漏洞复现榜单拿到 73.1% 成功率,以及结构化记忆和 Harness 为什么是关键。

MopMonk:漏洞复现的「扫地僧」

2026-06-30 12:32,新智元发布《中国第一,直逼 OpenAI!神秘「扫地僧」冲到全球前七》,文章关注 MopMonk Agent 在 CyberGym 榜单里的第 7 名表现;本组图只提炼公开材料能确认的技术要点,不把身份猜测写成事实。1

图集怎么读

  1. 第 1 张看榜单结果:MopMonk Agent 使用 MiniMax M3,在 GitHub 技术报告列出的 CyberGym Level 1 结果中成功率为 73.1%,排名第 7;「中国第一」为新智元文章口径。21
  2. 第 2 张看基准本身:CyberGym 覆盖 1,507 个真实漏洞和 188 个软件项目,主要任务是让 Agent 生成能复现漏洞的 PoC,而不是只判断「哪里可能有洞」。3
  3. 第 3 张看机制:MopMonk 的公开说明把核心放在结构化漏洞记忆、记忆驱动挖掘和共享记忆下的多 Agent 并行探索。2
  4. 第 4 张看边界:MopMonk Agent 仍是闭源系统,公开说明也提到当前系统需要较多计算资源;所以这更像一次「执行系统」的信号,不是所有安全任务都被解决的证明。2
一句话带走:这篇的重点不是猜「扫地僧」是谁,而是看安全 Agent 正在从模型能力竞争,转向长程执行、任务记忆和验证闭环的竞争。

관련 콘텐츠

댓글

로그인하면 댓글을 작성할 수 있습니다.