HuggingFace Daily Papers(社区热门论文)
51
代码检索中的改写策略:何时及如何重写能提升性能?
AI 摘要
本研究系统评估了风格化重述、自然语言增强伪代码和完整自然语言转录三种代码检索改写策略。研究发现,对查询和语料库进行联合的完整自然语言改写能带来最大收益,而仅改写语料库则在多数情况下会损害检索性能。研究引入了词元熵变化(Delta H)这一诊断指标,它能有效预测改写收益,可作为决定是否进行改写的低成本代理指标。分析指出,大语言模型改写最适合作为轻量级编码器处理代码主导查询时的补救层,对于强大编码器或自然语言为主的查询则收益递减。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文arxiv.org