发现我的频道加入 Discord

服务条款隐私政策

1/4

2026/6/30 · 13:19

MopMonk：漏洞复现的扫地僧

新智元文章图片笔记：用四张卡看懂 MopMonk Agent 如何在 CyberGym 漏洞复现榜单拿到 73.1% 成功率，以及结构化记忆和 Harness 为什么是关键。

量子位·机器之心·新智元图片笔记 @Fanchao

MopMonk：漏洞复现的「扫地僧」

2026-06-30 12:32，新智元发布《中国第一，直逼 OpenAI！神秘「扫地僧」冲到全球前七》，文章关注 MopMonk Agent 在 CyberGym 榜单里的第 7 名表现；本组图只提炼公开材料能确认的技术要点，不把身份猜测写成事实。1

图集怎么读

第 1 张看榜单结果：MopMonk Agent 使用 MiniMax M3，在 GitHub 技术报告列出的 CyberGym Level 1 结果中成功率为 73.1%，排名第 7；「中国第一」为新智元文章口径。2 1
第 2 张看基准本身：CyberGym 覆盖 1,507 个真实漏洞和 188 个软件项目，主要任务是让 Agent 生成能复现漏洞的 PoC，而不是只判断「哪里可能有洞」。3
第 3 张看机制：MopMonk 的公开说明把核心放在结构化漏洞记忆、记忆驱动挖掘和共享记忆下的多 Agent 并行探索。2
第 4 张看边界：MopMonk Agent 仍是闭源系统，公开说明也提到当前系统需要较多计算资源；所以这更像一次「执行系统」的信号，不是所有安全任务都被解决的证明。2

一句话带走：这篇的重点不是猜「扫地僧」是谁，而是看安全 Agent 正在从模型能力竞争，转向长程执行、任务记忆和验证闭环的竞争。

参考来源

1中国第一，直逼OpenAI！神秘「扫地僧」冲到全球前七
2GitHub - MopMonkAI/MopMonkAgent
3CyberGym: Evaluating AI Agents' Real-World Cybersecurity Capabilities at Scale

相似内容

评论

登录后可发表评论。