AIHOT

全部动态资讯 · 1789 条

6月2日周二

6月2日

20:40

HuggingFace Daily Papers（社区热门论文）

精选71

NLP领域2018-2025年人类标注报告实践的大规模审计

本研究对NLP领域2018至2025年间的人类标注报告实践进行了首次大规模审计。研究构建并验证了一个LLM辅助提取管线，其在Annotated-gold数据集（41篇论文，72个标注任务）上与人工裁决的一致性（Krippendorff's alpha）达到0.606。基于此，研究构建了Annotated-llm数据集，涵盖ACL会议论文，从1603篇论文中提取了2667个标注任务。分析发现，论文常报告招募策略、标注者专长等操作细节，但经常遗漏评估标注效度所需的关键信息，如培训、语言能力、薪酬、裁决过程及一致性数值。研究指出标注报告虽有改善但仍不均衡，并提出了一个可扩展的框架和最低报告标准。

arXivHugging Face数据/训练论文/研究

推荐理由：NLP论文里的标注环节一直是个黑箱，这篇首次用大规模数据把各家怎么标注、哪些信息缺失扒了个遍，值得每个做数据和评估的人细看。

18:40

HuggingFace Daily Papers（社区热门论文）

几何潜推理使LLM生成更短

研究提出几何潜推理方法，将推理建模为模型预训练嵌入空间中的几何路径逼近问题，使用轻量级过渡头预测方向更新。在Qwen3模型上评估发现，该方法能诱导模型生成显著更短的输出，用连续潜步骤替代早期显式推理后，模型常以更少总步数得出正确答案。研究揭示了连续轨迹作为紧凑中间推理状态，暴露了潜计算预算、输出长度与准确率之间的新权衡。

推理论文/研究

17:52

Anthropic：Transformer Circuits（可解释性研究）

精选63

Anthropic可解释性研究：区分因果效应相似的特征

Anthropic可解释性团队介绍了其Circuits研究的新进展。为区分那些激活模式相似但因果效应不同的模型特征，团队提出一种新方法。该方法通过分析特征的下游连接来预测其实际影响，并使用基于共激活统计的TWERA（虚拟权重）对连接进行加权排序。实验表明，借助下游连接信息能更准确地判断哪个特征会引导特定输出。此方法为识别模型内部真正的因果组件提供了新途径。

Anthropic安全/对齐论文/研究

推荐理由：做可解释性研究的同学值得读，它用下游连接区分看似相同的特征，比只看激活例子更能预测因果作用，对齐审计里能省不少试错。

17:12

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选57

Codex正在成为每个人的生产力工具

The Next Era of Knowledge Work报告指出，Codex正通过AI增强的研究、数据分析、工作流自动化与内容创作，变革知识工作的生产力。

OpenAI现象/趋势论文/研究

关联讨论 1 条

推荐理由：OpenAI 这份报告把 Codex 从编码工具重新定位成每个人都能用的生产力引擎，虽然还是趋势预测，但官方出手定调，对「AI 怎么改变白领工作」的讨论会是个强参考。