HuggingFace Daily Papers（社区热门论文）

D-OPSD：基于在线策略自蒸馏的步数蒸馏扩散模型持续微调方法

2026-05-06 08:00·40天前

AI 摘要

针对高性能少步图像生成模型（如Z-Image-Turbo）在持续监督微调中会损害其固有少步推理能力的问题，本文提出D-OPSD训练范式。该方法利用以LLM/VLM为编码器的扩散模型可继承上下文能力的特点，将训练构建为在线策略自蒸馏过程：模型同时扮演教师（以文本和图像多模态特征为条件）和学生（仅以文本特征为条件）双重角色，并通过最小化其在自身生成轨迹上两个预测分布的差异进行优化。这使得模型能在自身监督下学习新概念或风格，同时保持原有的高效少步生成能力。

该来源未收录可展示正文，站内仅提供摘要。

图像生成数据/训练论文/研究

阅读原文

HuggingFace Daily Papers（社区热门论文）

D-OPSD：基于在线策略自蒸馏的步数蒸馏扩散模型持续微调方法

2026-05-06 08:00·40天前

AI 摘要

该来源未收录可展示正文，站内仅提供摘要。

阅读原文arxiv.org

图像生成数据/训练论文/研究