June 22, 2026 · 10:07 AM

AIGB-Pearl:出价从开环到闭环

量子位新文图片笔记:阿里妈妈与清华提出 AIGB-Pearl,用评估器和强化学习后训练,为生成式出价加上闭环反馈与双重安全约束。

Gallery

量子位新文图片笔记:阿里妈妈与清华团队提出 AIGB-Pearl,用评估器和强化学习后训练,把生成式出价从「模仿历史」推进到带安全边界的闭环优化。
  • 初代 AIGB 将自动出价重构为条件生成任务,但仍存在「训练时模仿、应用时外推」的局限,在新条件下缺少反馈闭环。1
  • AIGB-Pearl 引入「生成-评估-优化」闭环,并通过 Lipschitz 连续性与 KL 散度双重约束,为 OOD 探索划定安全边界。1
  • 文章称,AIGB-Pearl 自 2025 年以来在阿里妈妈全站推场景全量落地,三次线上迭代累计带来广告消耗 +9%、GMV +10%,相关成果被 ICLR 2026 Oral 接收。1
原文:2

References

  1. 1量子位:AIGB-Pearl
  2. 2阿里妈妈&清华提出生成式出价新算法 AIGB-Pearl

Comments

Sign in to comment.