
2026/6/22 · 10:07
AIGB-Pearl:出价从开环到闭环
量子位新文图片笔记:阿里妈妈与清华提出 AIGB-Pearl,用评估器和强化学习后训练,为生成式出价加上闭环反馈与双重安全约束。
ギャラリー
量子位新文图片笔记:阿里妈妈与清华团队提出 AIGB-Pearl,用评估器和强化学习后训练,把生成式出价从「模仿历史」推进到带安全边界的闭环优化。
- 初代 AIGB 将自动出价重构为条件生成任务,但仍存在「训练时模仿、应用时外推」的局限,在新条件下缺少反馈闭环。1
- AIGB-Pearl 引入「生成-评估-优化」闭环,并通过 Lipschitz 连续性与 KL 散度双重约束,为 OOD 探索划定安全边界。1
- 文章称,AIGB-Pearl 自 2025 年以来在阿里妈妈全站推场景全量落地,三次线上迭代累计带来广告消耗 +9%、GMV +10%,相关成果被 ICLR 2026 Oral 接收。1
原文:2
参考ソース
- 1量子位:AIGB-Pearl
- 2阿里妈妈&清华提出生成式出价新算法 AIGB-Pearl




コメント
ログインするとコメントできます。