
2026. 6. 22. · 00:15
Laguna,把开源当门票
Poolside 把 Laguna M.1、XS.2 和 pool agent 推到 Product Hunt。本文拆它为什么不是普通聊天框,而是一套面向企业代码仓库的模型、权限和审计生意。
「开源不是慈善,是进门费。」
作者:沐秋
Laguna 今天爬上 Product Hunt。榜单第 6,介绍很克制:给 agentic coding 和长周期工作用的 foundation models。Product Hunt 页面显示它今日上线,产品页挂着 100 个 followers。12
这听起来像又一个「写代码 AI」。
不完全是。
它更像一台租给开发者的挖掘机。车钥匙看起来免费,油费、停车场、保险和施工许可都在后面等你。

它聪明的地方:不是又做一个聊天框
Poolside 这次拿出来的不是一个单品,而是一套组合拳。
Laguna M.1 是 225B 总参数、23B active 的 MoE 模型。Laguna XS.2 是 33B 总参数、3B active 的小模型。官方在 4 月 28 日宣布两款模型和两个预览产品:终端 coding agent「pool」,以及云端开发环境 Shimmer。4
这个组合很有意思。
大模型负责撑门面。小模型负责进社区。pool 负责把模型塞进终端、编辑器和自动化流程。Shimmer 负责让你不用先搭环境就能试。
这不是卖一把锤子。
这是开一家五金城。
官方在 5 月 26 日说,Laguna XS.2 和 M.1 都升级到 256K context;上线 4 周后,两款模型处理了超过 1 万亿 tokens,XS.2 在 Hugging Face 的下载量超过 5 万次。5 Hugging Face 页面现在显示,XS.2 最近一个月下载量为 230,939,M.1 为 2,580。67
所以今天的 Product Hunt 发布,严格说不是「模型刚出生」。
更像补办满月酒。
跑分能打,但没到神坛
先承认一句:Laguna 的数字不丢人。
官方 Hugging Face 页面给 M.1 的成绩是 SWE-bench Verified 74.6%、SWE-Bench Pro 49.2%、Terminal-Bench 2.0 45.8%。同一张表里,DeepSeek-V4 Flash 是 79.0%、52.6%、56.9%;Claude Sonnet 4.6 是 79.6% 和 59.1%,中间两项未披露。7
| 模型 | SWE-bench Verified | SWE-Bench Pro | Terminal-Bench 2.0 | 我的翻译 |
|---|---|---|---|---|
| Laguna M.1 | 74.6% | 49.2% | 45.8% | 能打,但不是榜一大哥 |
| DeepSeek-V4 Flash | 79.0% | 52.6% | 56.9% | 更强,尤其终端任务 |
| Claude Sonnet 4.6 | 79.6% | 未披露 | 59.1% | 仍是贵但稳的办公室老油条 |
这张表的重点不是谁多 4 个点。
重点是 Poolside 选择了一个很刁钻的战场:长周期软件任务。它不跟你聊人生,不给你写朋友圈文案。它要进 repo、读文件、跑测试、改代码、再跑测试。
这就像招聘一个工程师。简历好看只是第一关。
真正要命的是:他能不能在你公司那坨十年祖传代码里活过一周。
最狠的产品点:便宜不是礼物,是采样器
OpenRouter 上,Laguna XS.2 标价是每百万输入 tokens 0.10 美元、每百万输出 tokens 0.20 美元;Laguna M.1 是 0.20 和 0.40 美元。两个模型都标 262K context。8
这价格很像烧烤摊试吃。
尝一口不贵。真要请全公司吃一个月,你就会开始算炭火、人工和摊位费。
Poolside 官网页面也说得很直白:它不是只给你模型,而是给企业一套 agent 工作方式。沙箱执行、细粒度权限、版本控制、轨迹追踪、指标和成本都在 Console 里管。9
这才是生意。
开源 XS.2,是把开发者拉进来。M.1 开放权重,是给更认真、更有预算的人递名片。企业真正买的不是「一个模型回答得像不像人」。
企业买的是:出了事以后,谁背锅,谁能审计,谁能关掉它的手。
槽点:它要求你先把自己变成成熟公司
我最喜欢 Laguna 的地方,也是我最不敢直接推荐它的地方。
它很诚实地把 agent 当员工管。
pool 的 GitHub 页面写得很清楚:默认模式会在工具调用前请求批准;也可以切到 Accept edits 或 Allow all。它支持 AGENTS.md、Skills、MCP、ACP,也能用
pool exec 非交互执行任务。10听起来很完整。
问题也在这里。
如果你的团队连人工 code review 都靠「看心情」,权限规则也写得像年久失修的宿舍门禁,那你上 Laguna 不是自动化,是给混乱装了涡轮增压。
还有一个小字。
OpenRouter 页面写着:如果你免费使用 Laguna XS.2 或 M.1,输入和输出可能被用于训练和改进模型。8 这句话不邪恶。免费服务这么写很常见。
它只是提醒你:别把公司祖传秘方、客户数据和半成品并购计划喂进去,然后装作自己很懂安全。
大模型不会偷你代码。
人会偷懒。
谁该试,谁该等
如果你是个人开发者,最值得先碰的是 XS.2。它有 Apache 2.0 许可证,Hugging Face 页面说 33B 总参数、3B active,并且官方写明可以在 36GB RAM 的 Mac 上跑。6 这不是玩具,至少能让你在本地试 agentic coding 的手感。
如果你是创业团队,可以试 pool。
但别一上来就给它生产库写权限。先让它读、解释、写测试、改小 patch。像带实习生一样带它。
如果你是企业,Poolside 的真正卖点不是便宜 tokens。是它愿意谈「边界」。官网强调可以在 on-prem、VPC 或 workstation 里部署,强调你的数据不离开控制范围。11
这话不好笑。
这话值钱。
因为 2026 年的 coding agent 已经不缺会写代码的表演型选手。缺的是能进公司流程、接受权限、留下轨迹、出了错能被追责的苦力。
Laguna 今天在 Product Hunt 上看起来像新品。
我看它更像一张门票。
Poolside 把小模型开出来,把大模型价格摆出来,把 agent 外壳也放出来,然后站在门口说:来,先免费试试。
试完以后,你会发现真正贵的不是 tokens。
是你那套还没准备好被 AI 员工进入的工程管理。
God bless 祖传代码库。🫡
(本文配图来自 Poolside 官方页面,ChatGPT 辅助写作。)
참고 출처
- 1Product Hunt 2026 年 6 月 21 日榜
- 2Laguna by Poolside 产品页
- 3Laguna XS.2 and M.1: A Deeper Dive
- 4Introducing Laguna XS.2 and Laguna M.1
- 5Long context update: Laguna XS.2 and M.1
- 6poolside/Laguna-XS.2 Hugging Face 页面
- 7poolside/Laguna-M.1 Hugging Face 页面
- 8Poolside on OpenRouter
- 9Poolside Products 页面
- 10poolsideai/pool GitHub 仓库
- 11Poolside 官网首页




이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.