Musk AI 推文:Grok Voice 夺评测冠军,Grok Build CLI 发布
5 月 13 日,Musk 引用第三方评测称 Grok Voice Think Fast 1.0 在语音 benchmark 排名第一;5 月 15 日,xAI 发布 Grok Build agentic CLI 编程代理,Musk 密集推广并公开征集改进意见。
5 月 13 日和 15 日,Elon Musk 在 X 上密集发布了两组 AI 产品推文,分别围绕 Grok Voice 的第三方评测成绩和 Grok Build 这款新 CLI 工具的早期 beta 发布。
Grok Voice 语音评测排名第一
5 月 13 日凌晨四点,Musk 连发三条推文推广 Grok Voice Think Fast 1.0(xAI 旗下的语音对话模型)。
콘텐츠 카드를 불러오는 중…
Musk 先后引用了两个来源:AI 模型评测账号 @XFreeze 和独立评测机构 Artificial Analysis(@ArtificialAnlys)。两者均援引了 Artificial Analysis 发布的 τ-Voice benchmark——一个专门测试语音到语音模型 agentic 客服场景性能的基准测试。评测数据显示,Grok Voice Think Fast 1.0 在该基准中排名第一,领先 OpenAI GPT-Realtime-2 (High) 和 Google Gemini Flash 3.1 超过 12%。1

Musk 的第三条推文「Grok now has skills」2 宣布 Grok 新增 skills 功能,这也是三条推文中互动最高的一条:50,845 点赞、6,541 转发、2317 万次浏览。
有几点值得记住:τ-Voice benchmark 是 Artificial Analysis 自行设计的评测基准,非中立第三方标准;Musk 引用的两个信源均非独立研究机构,评测范围是否完整覆盖同类竞品尚无更多数据支撑。不过 Artificial Analysis 长期追踪 LLM 性能数据,在圈内有一定认知度,这次评测数据至少有方法论可溯。1
Grok Build 发布:agentic CLI 进入早期 beta
5 月 15 日凌晨三点半,Musk 引用 xAI 官方公告发出第一条 Grok Build 推文:3
"An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for SuperGrok Heavy subscribers. Through this early beta, we will improve the model and product based on your feedback. Try it at x.ai/cli"「Grok Build 早期 beta 现已向 SuperGrok Heavy 订阅者开放,这是一款面向编程、应用构建和自动化工作流的 agentic CLI(命令行代理)。我们将通过这次早期 beta 根据用户反馈持续改进模型和产品。访问 x.ai/cli 立即试用。」
Grok Build 的基本定位是一个运行在终端内的 AI 编程代理,当前仅限 SuperGrok Heavy 订阅层的用户访问。4
发布后约 8 分钟内,Musk 连续引用了早期用户 Jason Ginsberg(@JasonBud)的两条反馈推文。Ginsberg 重点描述了工具的交互体验:Grok Build 是一个「完整的交互式 CLI,支持鼠标点击操作,无界面闪烁」,他自述同时运行 5 个以上 agent 并在不同计划间切换。5 另一条反馈则指出,Grok Build 在运行 subagent 时会主动自检工作结果。6
콘텐츠 카드를 불러오는 중…

6 小时后,Musk 在同一 Thread 中追加了一条公开征集推文:7
"Please list the most important features to improve, fix or add in the replies below:"「请在下方回复中列出最需要改进、修复或新增的功能:」
距离 Grok Build 首条发布推文仅 6 小时,Musk 就把产品路线图的决策权部分开放给了用户。
到 5 月 15 日中午,Musk 在回复中坦承:「It has issues, but getting better super fast. Core model and the Build harness are evolving rapidly.」(「有问题,但改进极快。核心模型和 Build harness 都在快速进化。」)8 他另外引用了 @myrhex 转发的用户反馈,并加注:「Go in with expectations that Grok Build is still beta, but improving almost every day」(「以 beta 期望入场,但每天都在进步。」)9
@myrhex 的引用帖称有开发者反馈「Grok Build 感觉领先其他 coding agent 10 倍」——这是用户主观评价,无独立测试数据支撑,Musk 在引用时也并未将其升格为产品能力声明。9
互动数据参考:Grok Build 首条公告推文获得 37,384 点赞、5,635 转发、2275 万浏览,是本轮次高热推文;征集改进建议的 Thread 追帖收到 1,016 条评论,但评论区数据因采集超时,评论内容暂无法汇总。
참고 출처
- 1Grok Voice is #1!
- 2Grok now has skills
- 3Try this early Grok Build (anything) beta and let us know what to improve. Much appreciated!
- 4xAI Grok Build announcement
- 5Grok Build
- 6Try it out!
- 7Please list the most important features to improve, fix or add in the replies below:
- 8@tetsuoai It has issues, but getting better super fast.
- 9Go in with expectations that Grok Build is still beta, but improving almost every day
이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.