Agent 第五百天:AI 创业者别再先画界面1×0:0019:540:08开场问题1:44一、G U I 思维的问题,不是界面没用了4:32二、C L I 和接口开放,是新的分发问题7:21三、Skill 是品味和流程的封装10:28四、智能体经济还早,但价值交换会换网13:12五、Token 正在变成早期创业燃料15:54六、三个容易误读的地方17:17给创始人的行动检查0:08主持人这期我们从一个很刺耳的问题开始:如果你正在做 A I 产品,第一反应还是先画界面、排按钮、改侧边栏,你可能已经在解上一代软件的问题。本期依据「十字路口Crossing」和真格基金「此话当真」的串台节目,来拆《Agent 元年第五百天》里真正值得创业者带走的东西。0:28分析师原节目五十二分钟,嘉宾是钟天杰和归藏,主持人 Koji。它不只是聊几个热词,更像一场产品尽调:G U I、C L I、Skill、Agentic Economy、Token Grant,这些词到底会改变创业公司的产品形态、分发方式和成本结构。0:48主持人先交代素材边界:本期使用小宇宙官方 shownotes 和完整公开音频转写做事实基础,没有把原节目嘉宾原声片段混入成品。你会听到的是我们的二次精炼,不是原集剪辑版。1:02分析师这集之所以适合创业者听,是因为它没有停在「Agent 很厉害」这种层面。它在问更难的问题:什么旧产品会被智能体绕开,什么能力反而会变得更贵,创业公司该把有限时间花在做页面、做接口、做 Skill,还是做一个更底层的价值交换网络。1:23主持人我们会按五个判断拆开。第一,G U I 思维的问题。第二,C L I 和接口开放为什么是新分发。第三,Skill 为什么像品味和流程的产品化。第四,智能体经济为什么还早,但值得提前布线。第五,Token 为什么正在变成早期创业燃料。1:44主持人第一个判断:别把「不投资 G U I 思维的软件」理解成界面没价值。原节目里,钟天杰的限定很清楚:当一件任务主要由智能体完成,人的注意力不再是工作流的中心,界面就不应该继续按人的认知缺陷来设计。2:03分析师这句话对创业者很狠。过去做生产力工具,大家默认先问:页面怎么排,入口放哪,用户怎么点。现在更该先问:用户要的结果是什么,智能体需要哪些上下文、数据和操作权限,系统怎样在没有人来回点按钮的情况下完成任务。2:23主持人所以旧界面不是立刻消失。Notion、飞书、Gmail 这些产品仍然有大量老用户,人的浏览、确认、修改还需要好界面。问题是,新用户如果通过智能体来完成邮件整理、资料总结、会议行动项提取,你再把所有能力塞进一个越来越重的页面,反而会拖慢任务。2:46分析师这里可以用一个简单例子。过去做销售管理软件,会先设计线索列表、详情页、跟进记录、任务提醒。智能体时代的起点可能变成:帮我判断这二十个线索今天应该先跟谁,分别写一封什么样的邮件,什么时候提醒我确认合同风险。3:05主持人注意,这个例子里用户还是会看到结果,甚至还会修改邮件。但真正的产品价值不再是一个漂亮的线索表,而是系统能否读懂线索质量、历史沟通、报价约束和下一步动作。界面变成确认和信任层,而不是把用户困在流程里。3:24分析师原节目里对「G U I 思维」的批评,其实是批评一种惯性:把人的点击路径当成产品骨架。可智能体最擅长的事,恰恰是替人穿过这些路径。如果你的产品核心竞争力只是多了几个入口、多了几个筛选项,智能体接入后,这些差异很容易被压平。3:43主持人因此创始人要做一次产品重写。把你的核心流程拆成三列:第一列,用户最终要得到什么结果;第二列,为了得到结果,系统必须读哪些上下文;第三列,哪些动作可以由机器完成,哪些动作必须由人确认。只有第三列里必须由人确认的部分,才值得优先设计成人能一眼理解的界面。4:09分析师这里有一个实用检查:如果你的产品路演里,大部分时间都在展示页面,而不是展示一个任务如何被自动完成,就要小心。页面可以漂亮,但它必须服务结果。尤其是 A I 原生产品,创始人要证明的不是「我也有一个聊天框」,而是「我把原来需要人传来传去的那段流程拿掉了」。4:32主持人第二个判断:C L I 不是程序员的小众癖好,它正在变成智能体时代的分发入口。归藏在节目里解释得很直白:C L I 的本质是纯文本命令,过去人记不住几百上千个参数,所以门槛高;现在大模型能把自然语言翻成命令,最大障碍被移走了。4:53分析师这对产品公司意味着两件事。第一,你的能力最好能被机器稳定调用。第二,入口可能不再只在你自己的 App 里。节目里举到飞书、Google Suite、瑞幸、肯德基这些例子,本质都一样:把能力开放给智能体,用户就可能绕开原来的页面,直接让代理去完成点单、读邮件、找文件。5:16主持人听起来像主动放弃入口,所以大公司会纠结。微信、小红书、美团、滴滴、携程这类产品,一旦开放太多接口,用户可能被外部智能体隔开。可如果完全不开放,新的沟通和交易又可能跑到抖音、豆包、别的智能体里。5:36分析师创业者可以把这个问题落到一句话:我的公司是在卖一个页面,还是在卖一个可被调用的能力?如果价值来自真实履约,比如咖啡、出行、住宿、企业数据处理,开放给智能体未必是损失入口,可能是多了一个渠道。你的产品越像底层能力,越要尽早设计机器可读的接口和权限边界。5:59主持人对早期公司来说,这不是让你立刻做一套庞大的开放平台。更现实的第一步,是把内部接口和数据语义整理干净。一个 Agent 要帮用户完成任务,至少要知道有哪些可执行动作、每个动作需要哪些参数、失败时怎么回滚、用户授权到什么粒度。6:20分析师节目里谈到的 MCP,也可以放进这个框架理解。它真正重要的地方,不只是协议本身,而是让一个智能体可以通过统一方式连接文件、浏览器、数据库、企业工具和外部服务。谁能用更低摩擦把能力接进智能体工作流,谁就多一个分发机会。6:40主持人这会改写很多产品的增长逻辑。过去你买流量,是把人导到页面;做品牌,是让人记住 App 名;做留存,是让人每天打开。现在也许有一部分增长会变成:让主流智能体认识你,理解你能做什么,并且在合适任务里调用你。6:59分析师但开放不是没有代价。权限、安全、价格、滥用、数据回传,都要重新设计。创始人要避免两种极端:一种是害怕被绕开,所以什么都不开放;另一种是为了蹭 Agent 热点,把能力裸奔给外部调用。真正可持续的接口,是既让机器能用,又让公司能控制交付边界。7:21主持人第三个判断:Skill 的商业价值被低估了。原节目里归藏讲自己的 PPT Skill,说第一版很大程度来自他过往项目、审美和工作记忆的沉淀。也就是说,Skill 不只是提示词,它把一个人的品味、反复调整过的流程、失败经验,一起打包成可复用能力。7:44分析师这点对早期团队很关键。很多创业者现在盯着「我要做一个通用 Agent」。但通用 Agent 很难建立信任,用户也很难比较两个 Agent 到底差在哪。反过来,一个好 Skill 只解决一个明确任务,比如做路演稿、整理会议、生成店铺海报、检查代码库,它更容易被安装、传播和评价。8:08主持人你可以把 Skill 看成一种新的微型软件。它不一定有完整界面,也不一定要独立登录,但它有清楚的输入、输出、步骤和质量标准。更重要的是,它能把一个专家脑子里「我一般会这么做」的部分,变成别人可以直接使用的生产力。8:26分析师这和传统模板不一样。模板通常只规定最终样子,Skill 规定的是过程。比如做融资路演,不只是给你一个页面结构,还会提醒你先确定听众、压缩一句话定位、调整对比对象、检查单位经济模型。真正有价值的是这些中间判断。8:47主持人节目里还有一个有意思的分歧:长期看,模型能力会吃掉一部分 Skill,很多复杂提示会被一句自然语言替代。但短期里,半年到一年已经算很长。只要用户还需要稳定结果,Skill 就有位置。9:03分析师所以创业者不要把 Skill 当成临时补丁。至少在接下来一段时间,它可能就是你的产品化单元。你可以从团队内部最依赖高手经验的流程开始,比如销售写跟进方案、客服判断升级、运营做素材复盘、产品经理写需求评审。把这些流程做成 Skill,先让内部产能提高,再考虑对外分发。9:29主持人还有一个容易忽略的点:Skill 的品牌可能先于 Agent 的品牌被记住。用户不一定关心今天用了哪个通用智能体,但会记得「那个能把访谈稿变成投资备忘录的 Skill」很好用。对小团队来说,这可能是避开大模型平台正面竞争的一条路。9:49分析师不过,Skill 也不能写成一团魔法咒语。它要有版本管理、失败案例、适用边界和可解释的输出质量。否则用户第一次惊艳,第二次翻车,就会把它当成玩具。真正能收费的 Skill,必须在重复任务里稳定胜过人肉复制粘贴。10:07主持人这给创始人的动作很明确:把团队里重复发生、每次都靠高手手感完成的事,拆出来做成 Skill。别急着讲生态,先让一个窄任务做到「别人装上就能看出差别」。如果你的 Skill 能跨多个 Agent 使用,它的分发半径可能比单一应用更大。10:28主持人第四个判断:Agentic Economy 还处在基建期,别过早把故事讲满。节目里谈到沙箱、记忆系统、支付、智能体之间的网络。钟天杰提醒,科技投资很吃时间点。现在离 ChatGPT 发布不算久,离 Agent 共识形成也就几百天,很多下游应用还没到最舒服的创业窗口。10:52分析师但他也给了一个方向:代替人类完成某些信息价值交换的网络,大概率会出现。比如找合适的人、找合适的 Skill、找某个非常具体的供给。今天不是没有供给,而是供给没有用机器能理解的方式公开出来。11:07主持人这对做 A I 产品的人很现实。你不一定要马上做一个「智能体经济平台」。更值得先问:我的产品掌握了哪类供给和需求?这些信息能不能被结构化表达?一个外部智能体来请求时,我能不能判断权限、价格、质量和交付结果?11:27分析师如果把互联网看成给人看的信息网,智能体经济更像给机器执行任务的协作网。人类网页告诉你「我们提供服务」,机器网络要告诉智能体「我能在什么条件下完成什么动作,成功标准是什么,出了错谁负责」。这两套表达不一样。11:45主持人这也解释了为什么基建机会会先出现。记忆、沙箱、浏览器控制、身份、支付、评价、审计,这些都不是听起来最性感的应用,却决定智能体能不能从演示走向真实业务。早期创业者如果只做一个外壳聊天产品,很容易被下一次模型升级冲掉。12:07分析师还有成本问题。节目里提到 Token 价格是浮动的,受模型能力、能源、电力、内存、资本市场和需求影响。早期团队不要只看今天某个套餐的价格,也不要默认未来推理成本线性下降。你要为核心工作流算账:一次完整任务消耗多少 Token,失败重试几次,用户愿不愿意为这个结果付费。12:32主持人这里可以做一个反常识判断:如果一个任务的人力成本很高,但用户容错率极低,A I 未必马上能替代;如果一个任务单次价值不高,但重复频率极高、错误可被快速发现,它反而可能更早被智能体吃掉。创业者要从任务经济性出发,不要只按技术炫酷程度排序。12:55分析师所以,本期对智能体经济的结论是:别急着把愿景讲成已经发生,但要开始把产品做成机器可理解、可调用、可结算的形态。等网络真正起来时,今天整理好的能力,会比临时追热点更容易接上去。13:12主持人第五个判断:早期创业缺的资源在变。原节目最后聊到真格基金和十字路口发起的 Token Grant,给 A I 创业者和创作者提供五万元人民币的算力支持。这个动作背后有一个判断:今天从零到一,钱和人不是唯一瓶颈,Token 也可能是瓶颈。13:34分析师归藏介绍的 Code Pilot,是一个希望把 Skill、记忆、C L I 和本地环境留下来的开源 Agent 项目。另一个 Yoyo Agent,则像一个数字生命实验,从零行代码进化到十万行代码。你可以不同意这些项目的终局,但它们说明一件事:小团队能用更少人、更短时间,做出过去需要工程团队才敢碰的东西。13:58主持人这里的重点不是「零代码神话」。恰恰相反,真正变的是试错半径。过去一个想法要验证,可能先招人、排期、写原型、做测试。现在创始人可以用 Token 把一部分原型、脚本、设计、数据处理先跑出来,尽快知道这个方向有没有信号。14:18分析师但 Token 不是免费的魔法。一个 Agent 项目看起来能自动跑,背后仍然要付推理成本、上下文成本、工具调用成本和人工检查成本。很多创业者会低估「失败重试」这部分:一次答错不贵,连续十次答错并让人来收拾,就很贵。14:38主持人所以,Token Grant 这类支持对早期团队的价值,不只是省钱。它会迫使团队把产品实验写得更具体:我要用这些 Token 验证什么假设,跑多少真实任务,输出什么可评价结果。如果只是多聊几轮模型,很快就会烧完而没有产品进展。14:57分析师不过这不等于所有产品都会长成全新形态。节目最后有个判断值得记住:下一个抖音未必是新交互,也可能还是上下滑的视频,只是背后的生产效率提高十倍、一百倍,供给侧被重做。15:12主持人这也是给创始人的提醒。不要为了显得 A I 原生,就强行发明一个用户学不会的新界面。真正的变化可能藏在后端:内容如何生成,客服如何处理,销售如何匹配线索,研发如何维护代码,运营如何每天迭代素材。用户看到的前端很熟悉,但成本结构和交付速度已经换了。15:35分析师如果你在融资,也可以把 Token 看成一种新的资源解释方式。以前投资人问你 burn rate,你会讲工资、服务器、渠道。现在还要讲:模型调用成本占比多少,哪个环节最烧 Token,未来靠模型降价、工程优化、还是业务客单价来覆盖它。15:54主持人在进入行动清单前,再补三个容易误读的地方。第一个误读,是把「G U I 不重要」听成「设计不重要」。这很危险。越是智能体替用户做事,用户越需要在关键时刻看懂系统为什么这么做、结果是否可靠、出错后怎么撤回。16:13分析师第二个误读,是把「开放接口」听成「把用户送给平台」。更准确的说法是:你要区分哪些能力必须在自己场域里完成,哪些能力可以成为外部智能体的供给。不是所有公司都该全开放,但所有公司都该知道自己被调用时怎么计费、怎么授权、怎么保证质量。16:34主持人第三个误读,是把 Skill 当成提示词商品。提示词会贬值,流程、品味、评估标准和持续更新才可能值钱。一个 Skill 如果不能处理真实边界,不能告诉用户什么时候不适用,不能根据失败案例进化,它就很难成为长期产品。16:54分析师这三个误读合在一起,其实指向同一个创业判断:不要被表层形态迷惑。聊天框、命令行、Skill、接口、Token,都只是载体。真正决定公司价值的,是你是否掌握了一段高频、高摩擦、高付费意愿的任务,并且用智能体把它做得更快、更稳、更便宜。17:17主持人收束成一张创始人检查表。第一,重新写你的产品定义,不要从页面开始,要从「用户要完成的任务」开始。你可以用一句话写:用户在什么场景下,把什么输入交给我,最后要拿到什么可验证结果。17:34分析师第二,给核心能力设计机器可调用的接口,哪怕暂时只对内部 Agent 开放。先把动作、参数、权限、错误处理、日志和人工确认点定义清楚。这些看起来像工程细节,实际上会决定你的产品能不能进入新的分发网络。17:52主持人第三,把团队里最有手感的流程做成 Skill,先服务一个窄任务。不要一开始追求通用。一个能稳定做完的窄任务,胜过一个什么都能说、什么都不保证的全能 Agent。18:06分析师第四,算清 Token 账,不只算单次调用,还要算上下文、失败重试和人工兜底。最好把每个核心任务拆成输入、推理、工具调用、验证、交付五段,分别估成本。算不清,就很难定价。18:22主持人第五,别把「界面不重要」当偷懒理由。人还会看你的官网、路演稿、输出物和结果质量,这些地方仍然是在建立信任。界面从工作流中心,退到信任、确认和纠错中心,但它没有消失。18:39分析师第六,给你的产品留一条被外部智能体调用的路。哪怕今天只是内部实验,也要开始记录哪些请求最常见、哪些数据最敏感、哪些任务最值得自动化。未来真正的渠道变化,往往先从这些小接口开始。18:57主持人本期的核心不是劝你删掉 G U I,而是劝你少一点上个时代的软件本能。先想清楚任务,想清楚机器怎样拿到上下文、怎样调用能力、怎样交付结果。界面最后再来,它应该是信任和确认的地方,不是让用户继续当传送带的地方。19:16分析师如果你正在做 A I 产品,今天就可以做一件小事:找出一个用户每周重复三次以上的流程,把里面需要复制、粘贴、转述、点按钮的环节画出来。能被智能体拿走的地方,就是你下一版产品应该先动的地方。19:33主持人本期就到这里。原节目链接放在 shownotes 里,建议你回去听完整对话,尤其是关于微信、Skill 分发和 Token Grant 的部分。我们下期再见。