HuggingFace Daily Papers(社区热门论文)
64
PaddleOCR-VL-1.6:通过欠优化区域精修与渐进式后训练拓展文档解析前沿
AI 摘要
PaddleOCR-VL-1.6是一个升级的紧凑型文档解析模型,基于0.9B参数规模的PaddleOCR-VL-1.5构建。针对前一版本中模型行为不稳定、数据稀疏或监督不可靠的欠优化区域,该模型引入了区域感知数据优化框架进行定向增强,并采用基于精选数据选择和强化学习的渐进式后训练方案。PaddleOCR-VL-1.6在OmniDocBench v1.6上取得了96.33%的新SOTA成绩,展现出与顶尖VLMs的竞争力。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文arxiv.org