
Sesame:Oculus 创始人觉得 AI 语音差在哪,他们把答案做成了一款 App
2026 年 5 月 28 日,Sesame 正式开放 iOS 公测版。Oculus 联合创始人 Brendan Iribe、Nate Mitchell 做的这款语音 AI,核心不是「速度更快」,而是解决语音 AI 最根本的「时机问题」:边说边思考、角色化记忆隔离、以「好奇引擎」而非助理定位作为北极星——三个设计决策,折射出一套完全不同的 AI 产品哲学。
2026 年 5 月 28 日,Sesame 正式向全球 39 个国家开放 iOS 公测版。这家由 Oculus 联合创始人 Brendan Iribe、Nate Mitchell,以及 Ankit Kumar 联合创立的公司,此前已悄悄跑通了一个研究预览版——仅数周内就吸引超过 100 万用户,产生 500 万分钟以上的对话量。
但真正让 Sesame 值得单独拆解的,不是这个数字,而是他们在做一件大多数语音 AI 产品绕开了的事:解决「时机」问题。1
问题:语音 AI 为什么让人觉得「假」?
用过 ChatGPT 语音模式、Google Assistant,或者几乎任何一款语音 AI 的人,都会有类似的感受:AI 说话流畅,但节奏不对。要么快得没有思考感,要么中间停顿一下突然冒出一段完整答案,让对话变成了「问题 → 等待 → 答案播报」。
Sesame 给这件事起了个技术名词,但背后是个人人都懂的体验难题:一个思考型回答需要时间,但等太久就不像在聊天了。2
「回复快和回复准之间存在一种根本性的张力。慢一点的回答通常更正确,但如果等太长时间,就会让对话感觉很不自然。」 — Raven Jiang,Sesame 产品工程负责人
这不是纯粹的工程延迟问题,而是一个交互时机设计问题。
设计信号一:边说边思考——把「延迟」变成「节奏」
Sesame 的核心技术突破是:让 AI 在说话的同时运行多个并行搜索,然后在说话过程中把新信息无缝编织进答案里。必要时,可以在句子中途转向——就像人在回答时突然想起一个更重要的细节,自然地改变了表述方向。1
这个看似小的设计决策,解决的其实是语音 AI 最深的「恐怖谷」裂缝之一:人类说话是流动的、有修正感的,而 AI 往往是「生成完毕再输出」。
对产品设计者的启示:延迟本身不是问题,没有节奏感才是问题。 把延迟做成思考感,比把延迟压到极限要更接近真实对话体验。

设计信号二:四个 Agent,四套独立记忆——人格化不是配置项
这里有个设计决策很容易被忽略:Sesame 提供了四个 AI Agent(Maya、Miles、Simone、Charlie),每个都有独立的记忆。
你和 Miles 聊过的事,Simone 不知道。
这不只是隐私设计——它更是一种人格完整性设计。当你和一个人建立关系,这个人不会和另一个人共享关于你的记忆。Sesame 把这个逻辑应用到了 AI Agent 上:每个角色有自己的声线、性格、视角,以及只属于它和你之间的记忆积累。1
与此同时,Sesame 加入了「隐身模式」(Incognito Mode):Agent 在这个模式下能访问之前的上下文,但对话结束后什么都不会被保存。这是一种精细化的隐私分层——不是「全有」就是「全无」,而是让用户决定哪段对话有资格进入长期记忆。
这套设计透露了 Sesame 的一个根本假设:持续化的 AI 关系,不是靠更多功能堆砌,而是靠更清晰的「人格边界感」来建立信任。

设计信号三:「好奇引擎」作为北极星——不是助理,是思维伙伴
Sesame 把自己的产品定位叫做「好奇引擎」(curiosity engine)。他们不说「productivity tool」,不说「AI assistant」,说的是——帮你学习、发现、和反思的对话伙伴。1
这个定位反映在产品功能的取舍上:
- 搜索卡片(Search cards with images):AI 说到一个概念,屏幕上同步出现可视化的参考图;理解优先,而不是给你一段文字去读
- 笔记功能(Notes):保留对话中浮现的想法,让「边走边聊」的临时洞察能落地
- 文字模式(Texting mode):当你不方便开口时,对话不中断
- 深度探索(Deep Dives):需要时,可以切换成更深的信息挖掘模式
这些功能有个共同点:它们都不假设你有一个明确的任务要完成。它们服务的是那种「脑子里有个问题但说不清楚要问什么」的状态——正是人在通勤、散步、发呆时最常进入的状态。
Sesame 自己把这个场景描述得很准确:「在日常生活的间隙时刻,在你不经意间最好的思考就会发生。」1
콘텐츠 카드를 불러오는 중…
背景:Oculus 创始人为什么来做语音 AI?
Brendan Iribe 和 Nate Mitchell 把 Oculus 卖给 Meta,然后在 VR 硬件的世界里待了很长时间。他们在做 Sesame 时,带来的是一套硬件产品人的直觉:接口要贴合人体,而不是让人适应接口。
VR 最终失败在「前置感知负担」上——你要戴上头盔、进入另一个空间,才能开始使用。Sesame 的语音 Agent 策略反其道而行之:不要求你做任何准备,说话就行。而这家公司已经公开表示,2027 年将推出轻量化 AI 智能眼镜——这才是最终形态。3
iOS App,是那个最终形态的热身阶段。
设计者可以带走的三个问题
- 你的 AI 产品的「等待感」是让用户焦虑,还是在传递思考感? 等待本身不是问题,缺乏节奏才是。
- 你的 AI 有「人格边界」吗? 当用户和不同 AI 角色建立不同关系时,如果记忆是共通的,信任感实际上会被稀释。
- 你的产品假设用户「有任务要完成」,还是「有想法想探索」? 这两种假设,会导致完全不同的功能选择和界面语言。
Sesame 给出了一套自洽的答案:它不想成为最快的 AI,而想成为你最愿意一直说下去的那个。

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.