智谱上市前夜:张鹏谈 AGI、DeepSeek 与开路的人
2026/7/2 · 13:21

智谱上市前夜:张鹏谈 AGI、DeepSeek 与开路的人

精读张小珺《商业访谈录》第129集:智谱 CEO 张鹏在上市前夕复盘从清华实验室、认知智能、GPT-3/ChatGPT 到 DeepSeek、开源闭源与 IPO 的关键判断。

一场上市前夜的访谈,最值得记住的不是「第一股」这个标签,而是张鹏不断把智谱拉回同一个坐标:它不是一家只靠项目、融资或热点叙事往前冲的公司,而是一支把 AGI 当长跑终点、把上市当补给站的工程师队伍。第 129 集里,张小珺把问题一路追到智谱的源头:从清华实验室、认知智能、GPT-3 冲击,到 DeepSeek、开源闭源、IPO 和「开路的人」。1

本期速读

维度精华
本期主角智谱 CEO 张鹏。访谈发生在智谱上市日期尚未明朗、外界仍在比较智谱与 MiniMax 谁会成为「大模型第一股」的时刻。1
核心问题智谱究竟是一家 2B 项目公司、开源模型公司,还是一家以 AGI 为终局的技术公司?张鹏的回答是:商业化、开源、IPO 都是路径,目标仍是「让机器像人类一样思考」。1
最大信息增量张鹏把智谱的发展拆成三条线:技术上从感知智能走向认知智能,商业上从 MaaS 与企业服务找确定性,资本上用 IPO 为 AGI 长跑补充能量。1
最可收藏判断张鹏不把 Scaling Law 理解为「堆参数」的永恒公式,而看成会随阶段变化的现象:预训练阶段看参数、数据、算力;推理阶段看测试时计算;再往后,强化学习与在线自学习会成为关键。1

时间线:智谱不是突然出现在「百模大战」里

  • 2016 年前后:问题从「感知」转向「认知」。 张鹏回忆,清华团队当时已经在讨论上一代 AI 的天花板:图像识别、语音识别、机器翻译这些「单项技能」能做到很强,但还不是一个会推理、会泛化、知道自己不知道的「脑子」。他们把下一步叫做「认知智能」,认为这是迈向通用人工智能的台阶。1
  • 2017-2019 年:从清华科技成果转化里「吃螃蟹」。 智谱团队不是先有热门产品再创业,而是从清华知识工程实验室的工程转化路径走出来。张鹏提到,学校、团队和相关机构一起摸索科技成果作价、股权、流程,前后花了一年多,公司在 2019 年注册成立。1
  • 2020-2022 年:GPT-3 让智谱确认方向。 GPT-3 发布后,张鹏向张钹院士请教如何看待这一路线。张鹏说,团队后来研究 GPT 与 BERT 的差异,发展出 GLM,希望综合填空式理解与自回归生成的优势,并在 2022 年做出 GLM-130B。1
  • 2023 年:ChatGPT 替智谱完成市场教育。 在 ChatGPT 真正火起来前,投资人还会问「这东西怎么挣钱」。ChatGPT 之后,智谱不必再解释大模型是什么,只需要说「我们做的就是往这儿去的」。1
  • 2024-2025 年:新主角轮流出现。 2024 年,市场更多讨论 Kimi、MiniMax;2025 年,DeepSeek 成为行业绕不开的参照。张鹏对 DeepSeek 的反应不是「为什么不是我」,而是复盘对方在强化学习、工程优化、开源策略上做对了什么。1
  • 2026 年 1 月:IPO 成为阶段性里程碑。 节目方介绍,智谱确认于 2026 年 1 月 8 日登陆港交所,成为中国首家上市的大模型公司,也被称为「全球大模型第一股」。1

核心观点拆解

1. 智谱的底色不是「项目制」,而是「工程转化」

张鹏最想纠正的误解,是外界把智谱看成一家靠项目交付、靠政府订单活着的 2B 公司。他给出的自我解释更接近「清华工科体系里的工程转化公司」:实验室不只发论文,还要把 paper 变成 project、product。早期 A-miner 这类科技情报系统,本质上是在用算法处理论文、专利、报告,再做技术趋势预测。这不是简单的信息检索,而是对「认知智能」的早期应用:理解旧知识,组合、推演,再产出新判断。1
这也解释了为什么智谱看起来不够「酷」。它的强项不是制造情绪价值,而是把模型能力变成可部署、可交付、可算成本的生产力。张鹏接受「像水泥一样」这个评价:不一定有趣,但稳定、能用,能支撑真实工程。1

2. 认知智能的关键,不是会回答,而是知道边界、会泛化

张鹏反复回到一个问题:上一代 AI 解决的是感知任务,大模型要解决的是认知任务。差别不是「回答得更像人」,而是能不能把有限样本里的经验迁移到没见过的情境里。
他用自动驾驶解释这个差别。传统自动驾驶可以把感知、决策、控制链路做得很细,但遇到长尾场景会卡住,因为它按规则执行,难以真正泛化。认知能力需要的是学习、试错、反馈、自我纠错,以及对未知边界的识别。换句话说,模型不能只是「知道自己知道」,还要「知道自己不知道」。1

3. ChatGPT 带来的不是意外,而是确认

GPT-3 出来时,智谱已经在研究这一路线。张鹏说,GPT-3 的厉害之处在于它证明了一条新路径,但它也会「一本正经地胡说八道」,还没有解决「不知道自己不知道」的问题。智谱后来做 GLM,一开始就不是简单复制 GPT,而是试图综合 BERT 的双向理解与 GPT 的单向生成。1
真正改变公司处境的是 ChatGPT。此前智谱跟投资人解释大模型,常被追问「怎么商业化」「能不能变成钱」。ChatGPT 爆发后,市场教育成本突然降低,融资和客户沟通都变了。张鹏把那一刻说成「赌对了」:不是一夜之间开始做大模型,而是长期押注终于被外部事件验证。1

4. Scaling Law 不是信仰,而是会换形态的现象

这期最有技术含量的一段,是张鹏解释 Scaling Law 的演变。他不把它理解成「参数越大越聪明」的线性公式,而是把它放进智谱提出的 L1 到 L5 路径里:
  1. L1:预训练。 通过已有数据学习世界知识,核心变量是参数量、数据量、算力。
  2. L2:对齐与推理。 模型要学会正确使用知识,测试时计算开始变重要。
  3. L3:自学习。 强化学习成为核心,通过经验、试错、反馈来提升能力。
  4. L4:自我认知。 模型要识别自己的能力边界,知道哪些问题自己不知道。
  5. L5:类意识阶段。 张鹏承认这个阶段定义仍不清晰,但认为它可能涉及更接近人类意识的能力。1
这套解释的重要性在于,它把大模型竞争从「谁敢烧钱」拉回「谁能找到更有效的计算方式」。张鹏提到,GLM-130B 的算力花费约 400 万元人民币,加上人工等整体约 1000 万元人民币;相比 GPT-3 当年被分析出的约 2000 万美元训练成本,智谱一直把降成本、提升训练效率、控制推理成本当成主线。1

5. DeepSeek 的冲击,是把智谱重新推回「更开放、更极致」

张鹏承认 DeepSeek 对智谱影响很大,而且团队在春节后密集研讨。他给出的复盘很工科:不是情绪化地追问「为什么不是我」,而是拆解对方做对了什么。
他总结的启发有三点:第一,强化学习还要下更大力气;第二,工程优化还能更极致;第三,下一个范式的探索可以更大胆。智谱后来在强化学习框架、GLM-4.5/4.6/4.7 的连续迭代里,都把这些基础工作往前推。1
更现实的冲击来自开源。张鹏认为,开源和免费不能画等号。客户可以自己部署开源模型,但如果要把模型接进内部系统、改造成生产力,仍需要产品、工具、服务和专业团队。DeepSeek 的彻底开源延迟了一些客户决策,但一段时间后,部分客户会重新回来寻找商业化服务。1

6. 智谱选择 2B,不是放弃想象力,而是选择中国市场的确定性

张鹏对 2C 战场的判断很直接:中国 C 端用户付费意愿弱,SaaS 订阅习惯也弱;如果没有巨大首发优势,照搬 ChatGPT 的订阅模式,很容易陷入补贴、引流和薅羊毛。智谱做过智谱清言,也投过流,但它把产品定位成效率工具,而不是情绪娱乐型产品。1
所以它更重视企业服务。张鹏给出一组解释智谱结构的数据:中国前十大互联网企业里有九个是智谱客户;收入结构中,企业客户约占 60%,政府约占 20%。在他看来,企业是生产力最集中的地方,生产力变革级技术当然要先落到这里。1

7. IPO 不是终点,而是 AGI 马拉松里的补给站

张鹏把上市放在一个很长的时间尺度里。他说,AGI 不是短期目标,而是马拉松;不同阶段需要不同方式平衡消耗和补给。IPO 对智谱和行业都有里程碑意义:它证明大模型不是「镜中花水中月」,而是能走到产业级阶段的真实技术浪潮。1
他也反驳「大模型公司上市是在逃生」的说法。张鹏的逻辑是:如果 AI 真是泡沫,上市救不了 AI;如果目标是 AGI,而中国在 AI 上的投入仍远远不够,就不能简单说这是过度投资。他承认任何周期都会有泡沫,但更看重泡沫破后留下的基础设施、技术和产品,就像互联网泡沫之后仍留下了长期价值。1

高密度金句

  • 「我们本愿还是在于探索 AGI 到底是什么。」1
  • 「融资这些钱都是盘缠。」这句话解释了智谱为什么愿意把资本、商业化和 AGI 叙事放在同一条路上。1
  • 「不要轻易地去所谓曲线救国,人很容易忘记原来坚持的一些东西。」1
  • 「Scaling Law 本身只是一个现象描述。」它不是终局答案,而是提醒研究者继续追问智能与计算之间的本质关系。1
  • 「开源和免费之间不能直接画等号。」这是智谱解释开源模型与商业服务边界的关键句。1
  • 「机会永远留给有准备的人;有一块木板从你眼前飘过,你也要扑腾两下才能抓住。」1
  • 「上市并不是终点,后面还有很多事情,有很多路要走。」1
  • 「智谱是 AGI 历史上的一个先行者,一个开路的人。」1

读完带走

  1. 智谱的叙事核心不是「第一股」,而是「先行者」。 第一股是资本市场标签,先行者才是张鹏希望智谱留在 AI 历史里的位置。
  2. 张鹏看大模型,不迷信单一范式。 参数、数据、算力仍重要,但强化学习、在线自学习、多模态统一和世界模型,才是他认为接下来更值得盯的方向。
  3. DeepSeek 对智谱的价值,更多是校准。 它提醒智谱把强化学习、工程效率、开源策略和范式探索看得更开放、更极致。
  4. 2B 路线不是「不性感」的退路。 在张鹏的判断里,中国市场的 C 端订阅与 SaaS 土壤不同,企业服务反而是大模型进入生产力场景的主路。
  5. IPO 之后真正的考题才开始。 上市会带来二级市场压力,也会带来补给。智谱能否不变平庸,取决于它能否继续把技术投入、商业回款和 AGI 长期目标维持在同一个平衡里。
这期的张鹏像是在为智谱写一份上市前的自我说明书:为什么出发,为什么开源,为什么做 2B,为什么要上市,以及为什么即便已经成为「第一股」,仍然只是在路上。

相似内容

  • 登录后可发表评论。