Laguna，把开源当门票 (2026)

「开源不是慈善，是进门费。」

作者：沐秋

Laguna 今天爬上 Product Hunt。榜单第 6，介绍很克制：给 agentic coding 和长周期工作用的 foundation models。Product Hunt 页面显示它今日上线，产品页挂着 100 个 followers。1 2

这听起来像又一个「写代码 AI」。

不完全是。

它更像一台租给开发者的挖掘机。车钥匙看起来免费，油费、停车场、保险和施工许可都在后面等你。

Poolside Laguna 深入介绍封面 — Poolside 用这张官方封面介绍 Laguna XS.2 和 M.1 的训练与产品思路。3

它聪明的地方：不是又做一个聊天框

Poolside 这次拿出来的不是一个单品，而是一套组合拳。

Laguna M.1 是 225B 总参数、23B active 的 MoE 模型。Laguna XS.2 是 33B 总参数、3B active 的小模型。官方在 4 月 28 日宣布两款模型和两个预览产品：终端 coding agent「pool」，以及云端开发环境 Shimmer。4

这个组合很有意思。

大模型负责撑门面。小模型负责进社区。pool 负责把模型塞进终端、编辑器和自动化流程。Shimmer 负责让你不用先搭环境就能试。

这不是卖一把锤子。

这是开一家五金城。

官方在 5 月 26 日说，Laguna XS.2 和 M.1 都升级到 256K context；上线 4 周后，两款模型处理了超过 1 万亿 tokens，XS.2 在 Hugging Face 的下载量超过 5 万次。5 Hugging Face 页面现在显示，XS.2 最近一个月下载量为 230,939，M.1 为 2,580。6 7

所以今天的 Product Hunt 发布，严格说不是「模型刚出生」。

更像补办满月酒。

跑分能打，但没到神坛

先承认一句：Laguna 的数字不丢人。

官方 Hugging Face 页面给 M.1 的成绩是 SWE-bench Verified 74.6%、SWE-Bench Pro 49.2%、Terminal-Bench 2.0 45.8%。同一张表里，DeepSeek-V4 Flash 是 79.0%、52.6%、56.9%；Claude Sonnet 4.6 是 79.6% 和 59.1%，中间两项未披露。7

模型	SWE-bench Verified	SWE-Bench Pro	Terminal-Bench 2.0	我的翻译
Laguna M.1	74.6%	49.2%	45.8%	能打，但不是榜一大哥
DeepSeek-V4 Flash	79.0%	52.6%	56.9%	更强，尤其终端任务
Claude Sonnet 4.6	79.6%	未披露	59.1%	仍是贵但稳的办公室老油条

这张表的重点不是谁多 4 个点。

重点是 Poolside 选择了一个很刁钻的战场：长周期软件任务。它不跟你聊人生，不给你写朋友圈文案。它要进 repo、读文件、跑测试、改代码、再跑测试。

这就像招聘一个工程师。简历好看只是第一关。

真正要命的是：他能不能在你公司那坨十年祖传代码里活过一周。

Laguna M.1 官方 benchmark 图强调长周期软件工程任务表现；图中对照了 Devstral、GLM、DeepSeek、Qwen 和 Claude。7

最狠的产品点：便宜不是礼物，是采样器

OpenRouter 上，Laguna XS.2 标价是每百万输入 tokens 0.10 美元、每百万输出 tokens 0.20 美元；Laguna M.1 是 0.20 和 0.40 美元。两个模型都标 262K context。8

这价格很像烧烤摊试吃。

尝一口不贵。真要请全公司吃一个月，你就会开始算炭火、人工和摊位费。

Poolside 官网页面也说得很直白：它不是只给你模型，而是给企业一套 agent 工作方式。沙箱执行、细粒度权限、版本控制、轨迹追踪、指标和成本都在 Console 里管。9

这才是生意。

开源 XS.2，是把开发者拉进来。M.1 开放权重，是给更认真、更有预算的人递名片。企业真正买的不是「一个模型回答得像不像人」。

企业买的是：出了事以后，谁背锅，谁能审计，谁能关掉它的手。

槽点：它要求你先把自己变成成熟公司

我最喜欢 Laguna 的地方，也是我最不敢直接推荐它的地方。

它很诚实地把 agent 当员工管。

pool 的 GitHub 页面写得很清楚：默认模式会在工具调用前请求批准；也可以切到 Accept edits 或 Allow all。它支持 AGENTS.md、Skills、MCP、ACP，也能用 pool exec 非交互执行任务。10

听起来很完整。

问题也在这里。

如果你的团队连人工 code review 都靠「看心情」，权限规则也写得像年久失修的宿舍门禁，那你上 Laguna 不是自动化，是给混乱装了涡轮增压。

还有一个小字。

OpenRouter 页面写着：如果你免费使用 Laguna XS.2 或 M.1，输入和输出可能被用于训练和改进模型。8 这句话不邪恶。免费服务这么写很常见。

它只是提醒你：别把公司祖传秘方、客户数据和半成品并购计划喂进去，然后装作自己很懂安全。

大模型不会偷你代码。

人会偷懒。

谁该试，谁该等

如果你是个人开发者，最值得先碰的是 XS.2。它有 Apache 2.0 许可证，Hugging Face 页面说 33B 总参数、3B active，并且官方写明可以在 36GB RAM 的 Mac 上跑。6 这不是玩具，至少能让你在本地试 agentic coding 的手感。

Laguna XS.2 官方 benchmark 图 — Laguna XS.2 的官方 benchmark 图，把它放在 30B 级开源和闭源小模型旁边比较；适合看它的「本地可跑」定位有没有代价。6

如果你是创业团队，可以试 pool。

但别一上来就给它生产库写权限。先让它读、解释、写测试、改小 patch。像带实习生一样带它。

如果你是企业，Poolside 的真正卖点不是便宜 tokens。是它愿意谈「边界」。官网强调可以在 on-prem、VPC 或 workstation 里部署，强调你的数据不离开控制范围。11

这话不好笑。

这话值钱。

因为 2026 年的 coding agent 已经不缺会写代码的表演型选手。缺的是能进公司流程、接受权限、留下轨迹、出了错能被追责的苦力。

Laguna 今天在 Product Hunt 上看起来像新品。

我看它更像一张门票。

Poolside 把小模型开出来，把大模型价格摆出来，把 agent 外壳也放出来，然后站在门口说：来，先免费试试。

试完以后，你会发现真正贵的不是 tokens。

是你那套还没准备好被 AI 员工进入的工程管理。

God bless 祖传代码库。🫡

（本文配图来自 Poolside 官方页面，ChatGPT 辅助写作。）

Laguna，把开源当门票

它聪明的地方：不是又做一个聊天框

跑分能打，但没到神坛

最狠的产品点：便宜不是礼物，是采样器

槽点：它要求你先把自己变成成熟公司

谁该试，谁该等

참고 출처

관련 콘텐츠

AI Agent 生态速报 | 2026-04-30：OpenAI 登陆 AWS、Poolside 开源 33B、ClawSwarm 供应链攻击曝光

Karpathy 把 Claude 叫成「第三种 UI」，Levie 说应用层要管模型路由：6月24日精选

Ornith-1.0、OpenRouter MCP 与 Codex Mobile——AI HOT 今日热点（2026-06-26）