1/5

🤖 机器人×自动驾驶 — 2026Q2 前沿周报

ICLR 2026 VLA 方向爆发、Figure 03 量产提速 24 倍、禾赛 Picasso 开启全彩 LiDAR 时代,机器人与自动驾驶双领域 2026 Q2 核心技术进展一图读懂。

05/15/2026, 18:36:22

Gallery

ICLR 2026 这届大会,VLA 方向投稿 164 篇——
三个月前大家还在争论「VLA 到底能不能控制真实机器人」,现在这个问题已经没人问了。

【机器人:从实验室到量产线】
WholebodyVLA(OpenDriveLab)是这轮 ICLR 最受关注的机器人论文之一。 思路很直接:不再把运动和操作拆成两个模块,用统一潜空间把两者绑在一起。 在 AgiBot X2 上跑,比此前最优基线高了 21.3%。
同期被接收的 X-VLA 走另一个方向—— 用「软提示」把每种机器人的硬件配置编成可学习嵌入,骨干网络完全冻结。 适配一台新机器人只需更新 1% 的参数(约 900 万个),LIBERO 基准 93% 成功率。 已经集成进 HuggingFace LeRobot,6 个 checkpoint 公开。

【量产:机器人不再只是展台上的道具】
Figure AI 4 月 29 日公布了一个数字:BotQ 工厂产能从「每天 1 台」提升到「每小时 1 台」,Figure 03 已交付超过 350 台,电池线首次通过率 99.3%。
这不是 demo 视频,是工厂真实出货数据。
同一周期,NVIDIA 在 GTC 2026 开源了 GR00T N1—— 双系统认知架构(快思考管实时反应,慢思考管长链规划), 仅需 20-40 次人工演示就能适配新任务。 Boston Dynamics、Unitree、1X Technologies 都在合作伙伴列表里。

【自动驾驶:感知终于有了颜色】
这轮最有意思的硬件进展发生在 LiDAR 层。
4 月 18 日,禾赛发布 Picasso 芯片——在底层硬件里把测距和色彩感知直接融合,不是拼接摄像头,而是 LiDAR 像素本身就带颜色,最高 4320 通道。
两周后,Ouster 发布 Rev8,256 通道,200m 探测,原生彩色,L4 芯片每秒处理 20 万亿光子。Google 和 Volvo 自动驾驶部门都在采购名单里。
MIT 同期在 Nature Communications 发了固态 LiDAR 的芯片级突破:把天线串扰从 100% 压到 1%,让固态无机械 LiDAR 的宽视场精度第一次达到实用水平。
三个不同路线,同一个方向:机器视觉不再是黑白的。

【算法:端到端规划还在演进】
VADv2(华中科技大学)ICLR 2026 接收,把规划动作空间离散化成「规划词表」再 tokenization,用概率分布替代单一确定性输出。CARLA Town05 和 Bench2Drive 都拿到了 SOTA。
NVIDIA 方面,DRIVE Hyperion 平台这周又签了 BYD、Geely、Isuzu、Nissan,Mercedes CLA 是第一款搭载全栈方案的量产车。CEO Ali Kani 直接说:Hyperion 就是汽车行业的「Wintel」。

下滑看本周详细技术图解 👇
#机器人 #自动驾驶 #人形机器人 #VLA #具身智能 #ICLR2026 #LiDAR #端到端驾驶 #NVIDIA #前沿科技

Comments (0)