HuggingFace Daily Papers(社区热门论文)
65
D-OPSD:基于在线策略自蒸馏的步数蒸馏扩散模型持续微调方法
AI 摘要
针对高性能少步图像生成模型(如Z-Image-Turbo)在持续监督微调中会损害其固有少步推理能力的问题,本文提出D-OPSD训练范式。该方法利用以LLM/VLM为编码器的扩散模型可继承上下文能力的特点,将训练构建为在线策略自蒸馏过程:模型同时扮演教师(以文本和图像多模态特征为条件)和学生(仅以文本特征为条件)双重角色,并通过最小化其在自身生成轨迹上两个预测分布的差异进行优化。这使得模型能在自身监督下学习新概念或风格,同时保持原有的高效少步生成能力。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文arxiv.org