ShapeCodeBench：一个用于合成形状场景感知到程序重建的可再生基准

2026-05-12 08:00·33天前

AI 摘要

ShapeCodeBench是一个用于感知到程序重建的合成基准测试。给定一张渲染的光栅图像，模型必须输出一个可执行的绘图程序，由确定性评估器重新渲染并与目标图像比对。其v1版本在512x512黑白画布上定义了四种基本图形，每个实例均由随机数生成器生成，可创建全新的测试集以减少数据污染。基准发布了一个包含150个样本的固定评估集，涵盖简单、中等和困难三个级别，评估指标包括精确匹配、像素精度、前景IoU等。测试结果显示，传统计算机视觉启发式方法在简单场景中表现尚可，但在图形重叠时失效；最强的多模态配置能保留大部分前景结构，但因细微参数误差仍无法达到精确匹配。目前最佳精确匹配率仍然很低，表明该基准远未饱和。相关代码、数据集及论文资源均已开源。

该来源未收录可展示正文，站内仅提供摘要。

多模态开源/仓库推理论文/研究

HuggingFace Daily Papers（社区热门论文）

ShapeCodeBench：一个用于合成形状场景感知到程序重建的可再生基准

2026-05-12 08:00·33天前

AI 摘要

该来源未收录可展示正文，站内仅提供摘要。

阅读原文arxiv.org

多模态开源/仓库推理论文/研究

ShapeCodeBench： 一个用于合成形状场景感知到程序重建的可再生基准

ShapeCodeBench： 一个用于合成形状场景感知到程序重建的可再生基准

ShapeCodeBench：一个用于合成形状场景感知到程序重建的可再生基准

ShapeCodeBench：一个用于合成形状场景感知到程序重建的可再生基准