HuggingFace Daily Papers(社区热门论文)
54
Active Tabular Augmentation via Policy-Guided Diffusion Inpainting
AI 摘要
研究揭示了表格数据生成增强中存在的“保真度-效用差距”,即仅追求分布真实性未必能提升下游模型性能。为此提出的TAP方法将扩散修复技术与轻量级策略相结合,该策略根据学习器状态动态引导生成高效用样本,并通过显式门控和保守窗口承诺控制安全注入。在七个真实数据集上的实验表明,在数据极度稀缺时,TAP显著优于现有生成基线,最高提升分类准确率15.6个百分点,降低回归任务RMSE达32%。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文arxiv.org