HuggingFace Daily Papers（社区热门论文）

先验对齐自编码器：为潜在扩散模型构建友好的潜在流形

2026-05-08 08:00·37天前

AI 摘要

本文研究了潜在扩散模型所需潜在流形的关键特性，提出了三个核心属性：连贯的空间结构、局部流形连续性和全局流形语义。基于此发现，研究者设计了先验对齐自编码器（PAE），它通过利用视觉基础模型提炼的先验和基于扰动的正则化，将这些属性转化为明确的训练目标，从而主动塑造对生成友好的潜在空间。在ImageNet 256x256数据集上的实验表明，PAE在训练效率和生成质量上均优于现有分词器，在相同设置下收敛速度比RAE快达13倍，并取得了1.03的最新最优gFID分数。

该来源未收录可展示正文，站内仅提供摘要。

图像生成开源生态论文/研究

阅读原文

HuggingFace Daily Papers（社区热门论文）

先验对齐自编码器：为潜在扩散模型构建友好的潜在流形

2026-05-08 08:00·37天前

AI 摘要

该来源未收录可展示正文，站内仅提供摘要。

阅读原文arxiv.org

图像生成开源生态论文/研究