HuggingFace Daily Papers(社区热门论文)
69
ShapeCodeBench: 一个用于合成形状场景感知到程序重建的可再生基准
AI 摘要
ShapeCodeBench是一个用于感知到程序重建的合成基准测试。给定一张渲染的光栅图像,模型必须输出一个可执行的绘图程序,由确定性评估器重新渲染并与目标图像比对。其v1版本在512x512黑白画布上定义了四种基本图形,每个实例均由随机数生成器生成,可创建全新的测试集以减少数据污染。基准发布了一个包含150个样本的固定评估集,涵盖简单、中等和困难三个级别,评估指标包括精确匹配、像素精度、前景IoU等。测试结果显示,传统计算机视觉启发式方法在简单场景中表现尚可,但在图形重叠时失效;最强的多模态配置能保留大部分前景结构,但因细微参数误差仍无法达到精确匹配。目前最佳精确匹配率仍然很低,表明该基准远未饱和。相关代码、数据集及论文资源均已开源。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文arxiv.org