HuggingFace Daily Papers(社区热门论文)
63
世界-动作交互模型的曙光:DAWN
AI 摘要
研究团队提出世界-动作交互模型(WAIMs)概念,并针对自动驾驶实例化出DAWN模型。DAWN在紧凑的语义潜在空间中,通过世界预测器与条件动作去噪器的耦合进行交互式推理:预测的世界为动作去噪提供条件,而去噪后的动作又反馈以更新世界预测,两者在推理中递归优化。该方法无需在像素空间展开完整未来预测,仅通过短时潜在推演即可支持复杂交互场景中的长时程轨迹生成。实验表明,DAWN在多个自动驾驶基准测试中取得了优异的规划性能与安全相关结果,证明交互式世界-动作生成是构建真正可操作世界模型的有效路径。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文arxiv.org