
2026/6/29 · 0:28
DSpark、BrowserBC与它石线束路线|AI公众号日报0628
本期梳理6月28日中国AI公众号的五条高信号文章:DeepSeek DSpark把推理加速推向系统工程,BrowserBC用人类浏览轨迹补强Web Agent,北大与智源追溯模型能力来源,它石智航和Agent支付基础设施显示具身与AI商业化正在进入更硬的落地阶段。
6 月 28 日的中国 AI 公众号,重点不在「又一个模型发布」,而在模型和 Agent 怎么更便宜、更稳地跑起来。DeepSeek DSpark 把推理加速讲成一套系统工程,BrowserBC 试图让 Web Agent 不再每次从零摸索,北大与智源把可解释性问题追到训练数据源头;具身智能和 Agent 支付两条线,则继续把 AI 从演示拉向真实交付。
| 线索 | 原文发布时间 | 文章看点 | 读者要跟踪什么 |
|---|---|---|---|
| DeepSeek DSpark 推理加速 | 6 月 28 日 14:30 | 量子位拆解称,DSpark 单用户速度最高提升 85%,高并发有效吞吐可到 4 倍,并把并行草稿、顺序修正、硬件感知调度放进同一套推理系统。1 | 推理成本下降是否继续由「模型结构 + 服务端调度」共同完成,而不只是换更小模型。 |
| BrowserBC:人类点一遍,Agent 复用 | 6 月 28 日 12:58 | 机器之心报道,BrowserBC 把浏览器操作轨迹转写成自然语言 Skill;在 WebArena-Hard 上,注入 Skill 后成功率从 60.5% 提升到 81.4%。2 | Web Agent 的瓶颈可能从「会不会点」转向「有没有可复用的流程经验」。 |
| 北大、智源提出机理数据归因 | 6 月 28 日 12:58 | 机器之心报道,该工作把问题从「模型内部有什么机制」推进到「哪些训练数据塑造了这些机制」,并称论文被 ICML 2026 接收为 Oral & Spotlight。3 | 训练数据治理不再只是清洗低质文本,还要判断哪些结构性样本会催生关键能力。 |
| 它石智航谈具身智能「难题路线」 | 6 月 28 日 13:00 | 甲子光年专访中,它石智航丁文超把线束装配、世界模型、human-centric 数据和灵巧手放在同一条产品化路线里,并提出用「任务吞吐率」衡量具身价值。4 | 具身公司会不会从追 demo 速度,转向对成功率、效率和场景外溢能力的硬考核。 |
| Agent 支付与 Token Pay 基础设施 | 6 月 28 日 11:47 | 硅星人 Pro 梳理 Stripe、Coinbase、Skyfire、支付宝 Token Pay 等路线,核心问题是让 Agent 具备身份、授权、钱包、清算和风控能力。5 | 如果 Agent 能自己调用工具和购买服务,支付、预算控制和责任归属会先成为基础设施问题。 |
本日政策监管和融资关键词召回中,营销号、泛化周报和二手转述占比偏高;未看到足够高信号且可完整核验的新政策或融资条目,因此没有单独列入。
DeepSeek DSpark:推理加速开始拼「系统工程」
DSpark 的重点不是「换一个更快的小模型」。量子位在拆解中写到,DSpark 仍在推测解码这条线上做文章,但它把 DFlash 的并行生成、Eagle/MTP 的内部状态复用、轻量顺序头、可变长度草稿和在线置信度校准都放进了一个闭环里。文章给出的结果是:单用户速度最高提升 85%,高并发场景有效吞吐最高 4 倍。1
这条线索值得放在今日第一位,是因为它把推理成本问题从「模型大小」拉回到「服务系统」:草稿长度该猜多少、GPU 空闲和拥塞时怎么调度、草稿器过度自信时怎么校准,都直接影响真实服务成本。文章还提到,DeepSpec 全栈训练库开源,Eagle3、DFlash、DSpark 三种草稿模型训练代码支持 Qwen3 和 Gemma 等外部模型;这意味着开发者不只是读论文,还可以把推理加速方案迁移到自己的模型栈里。1
对产业侧来说,接下来要看两件事:一是 DSpark 这类方案在长上下文、代码、开放对话等不同负载下的收益差异;二是开源训练库能否被云厂商和模型服务商快速吸收。推理加速如果只停在 benchmark 上,价值有限;能稳定进入线上服务,才会真的改变模型价格。
BrowserBC:Web Agent 需要经验库,不只需要更强模型
BrowserBC 的问题意识很具体:现在的 Web Agent 已经能看页面、点按钮、填表单,但换一个网站或任务,常常又从零摸索。机器之心介绍的方案是「录制 → 转写成 Skill → 交付执行」:人先在浏览器里完整做一遍,系统把轨迹提炼成自然语言技能卡,再让模型按这份过程性知识完成同类任务。2
实验数据比概念更有用。文章称,在 WebArena-Hard 的 258 个任务中,基础 Agent 成功率为 60.5%,注入 BrowserBC 检索到的 Skill 后提升到 81.4%;在真实线上网站 ClawBench 的 152 个任务中,成功率从 32.9% 提升到 68.4%。同时,WebArena-Hard 上平均工具调用次数从 31.2 次降到 22.7 次。2
这里的判断不该写成「BrowserBC 解决了 Web Agent」。它更像把问题拆清楚了:模型缺的往往不是点击能力,而是流程先验。网页天天变,写死坐标和 DOM 选择器很脆;但「先找筛选器、逐项核查结果、确认完成信号」这类过程知识可以迁移。接下来真正难的是技能检索、技能冲突处理,以及执行模型在长流程里的稳定性。
机理数据归因:训练数据的价值,不能只按「干净」判断
北大与智源的 MDA 工作,把可解释性研究往前推了一步。机器之心报道,这套框架关注的不是某条训练数据对整体 Loss 的影响,而是某些数据怎样塑造特定可解释单元,例如归纳头。文章称,该工作被 ICML 2026 接收为 Oral & Spotlight,168 篇入选自 23,918 篇投稿,比例约 0.7%。3
最反直觉的地方在数据类型。文章称,排名靠前的高影响样本不是通常意义上的优美自然语言,而是 XML/HTML、LaTeX 源码、UUID、日志、Base64 等重复结构明显的样本;约 10% 的样本贡献了 50% 的累计影响力。研究者通过删除和增强实验观察到,剔除这些高影响样本会抑制或延后归纳头形成,增强这类样本则会催化归纳头出现。3
这对模型训练团队的含义很直接:数据治理不能只按「像不像人写的好文章」来打分。某些看起来脏、重复、结构化很强的样本,可能正好在训练某种底层能力。下一步如果能把这类归因方法扩展到更大模型和更多能力单元,数据配方会从经验问题变成可测试问题。
它石智航:具身智能的评价口径正在变硬
甲子光年这篇专访不是一个简单的机器人公司故事。丁文超把它石智航的路径归纳为三角形:数据、通用 AI 模型、核心零部件与终端应用。文章提到,它石 A1 机器人今年 3 月完成百余次亚毫米级柔性线束装配并拿下吉尼斯世界纪录,随后完成 4.55 亿美元 Pre-A 轮融资。4
专访里最值得跟踪的是评价指标的变化。丁文超提出,具身价值可以用「任务吞吐率」衡量,简化公式是任务成功率乘以任务完成效率再乘以其他因子。他还强调,真正的 GPT 时刻不是一个任务被打穿,而是若干任务都被打穿;如果一个 demo 只有人的 30% 效率,很难证明通用价值。4
这和过去一年具身行业常见的展示逻辑不同。市场已经看过太多视频和单点演示,现在更需要知道:成功率多少、节拍多少、换场景需要多少后训练数据、灵巧手和触觉能否带来稳定收益。它石选择线束,是因为柔性、动态、长程任务很难被传统自动化覆盖;但难题路线也意味着交付压力更大。
Agent 支付:下一层基础设施可能先从「谁来付钱」开始
硅星人 Pro 这篇项目梳理,把 Agent 支付问题放到同一张图上看:Stripe 让 Agent 在授权下使用支付凭证,Coinbase 用 Agentic Wallets 和 x402 处理链上钱包与微支付,Skyfire 试图给 Agent 做身份和支付通行证,支付宝 Token Pay 面向模型服务场景处理 Token 购买、分发和计费。5
这条线索看似离模型能力很远,其实正好卡在 Agent 落地的现实入口。一个 Agent 如果要自己调用 API、订阅服务、升级资源或替企业完成采购,就必须有身份、授权边界、预算上限、付款凭证和争议处理机制。文章提到,Google 牵头的 AP2 拉进 Mastercard、PayPal、American Express、Adyen 等 60 多家机构,走信用卡、银行转账和稳定币并存路线;这说明传统支付网络也在把 Agent 当作新行动者来处理。5
国内读者尤其可以留意支付宝 Token Pay。它不是简单的「给模型充值」,而是把用户侧随用随充、企业侧统一采买分发、底层订阅和按量计费组合在一起。难点同样明显:让 Agent 自行充值会带来账单不可控,To B 场景还需要稳定的预算、审批和风控规则。
今日信号
- 推理加速正在从单点算法变成服务端系统工程,DSpark 这类方案会把模型厂商、云厂商和企业自部署团队拉到同一个成本问题上。
- Agent 的下一阶段竞争,不只看大模型能力,还看流程经验能否积累、检索和复用;BrowserBC 给出了一个可观察的方向。
- 训练数据治理可能进入「按机制贡献评估」阶段,简单清洗低质文本未必总是正确。
- 具身智能的口径会越来越接近工业交付:成功率、效率、泛化成本和真实任务吞吐率,比单个视频更重要。
- Agent 一旦开始代表人或企业花钱,支付、身份和授权会先成为基础设施瓶颈。

このコンテンツについて、さらに観点や背景を補足しましょう。