AIHOT

全部动态一手 · 2385 条

全部一手资讯 X 论文

6月25日周三

6月24日周二

6月23日周一

6月16日周一

6月15日周日

6月13日周五

6月12日周四

6月11日周三

6月10日周二

6月9日周一

6月6日周五

6月4日周三

6月3日周二

6月2日周一

5月31日周六

5月30日周五

5月29日周四

5月28日周三

5月27日周二

6月25日

08:00

OpenRouter：Announcements（RSS）

OpenRouter 推出开发者与 BYOK 更新：可用性 API + 更智能的密钥管理

OpenRouter 新增通过 API 追踪模型可用性的功能，并增强了 BYOK 密钥管理，支持设置使用限制和可测试密钥。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

Dev & BYOK 更新：Uptime API 与更智能的密钥管理

Anthropic 为其开发者和 BYOK 客户推出两项重要更新。新发布的 Uptime API 允许开发者通过编程接口直接追踪模型运行状态与可用性。同时，BYOK 密钥管理功能得到增强，用户现在可以对密钥设置使用量限制，并创建可测试的密钥，从而实现对加密密钥更精细化的控制与验证。

产品更新部署/工程

6月24日

22:00

Google DeepMind：Blog（RSS）

精选

Gemini Robotics On-Device 将 AI 引入本地机器人设备

Gemini Robotics On-Device 推出高效端侧机器人模型，具备通用灵巧操作与快速任务适应能力，支持本地设备直接部署运行。

DeepMindGoogle具身智能模型发布

关联讨论 2 条

推荐理由：DeepMind 发布端侧机器人模型，支持本地部署与快速任务适应

00:12

Ethan Mollick：One Useful Thing（RSS）

精选

当下如何使用 AI：快速指南

一份当下 AI 工具的快速选用指南，聚焦目前值得使用的 AI 产品及其具体使用方法，帮助读者快速上手并选对工具。

教程/实践

关联讨论 1 条

推荐理由：AI教育专家Ethan Mollick撰写，指导读者当下如何选择和使用AI工具

6月23日

08:00

EleutherAI：Blog

研究进展：局部体积测量在下游任务中的应用

该研究更新了局部体积测量技术在下游任务中的最新应用进展。通过将局部体积测量方法拓展至具体应用场景，探索了该技术在实际任务中的实施路径与性能表现。研究涵盖方法论优化及多场景适配策略，为相关技术的实际落地提供参考。

多模态论文/研究

6月16日

00:00

LMSYS：Blog（Chatbot Arena 团队）

在GB200 NVL72上部署DeepSeek 671B：PD与大规模EP架构实现2.7倍解码加速

SGLang团队在GB200 NVL72集群部署DeepSeek 671B模型，采用预填充-解码分离（PD）与大规模专家并行（EP）架构，结合Blackwell专用优化组件（DeepGEMM、DeepEP等），实现单GPU解码吞吐7,583 tokens/秒。在2,000 token输入下，性能较H100提升2.7倍，整体加速比达2.5-3.4倍。系统利用NVLink全互联降低通信延迟，依托更大显存支持高批次处理，显著提升MoE模型推理效率。

DeepSeek开源/仓库推理部署/工程

6月15日

08:00

Anthropic：Transformer Circuits（可解释性研究）

精选78

Crosscoder模型差异分析见解

Anthropic可解释性团队在Crosscoder模型差异分析中发现，模型独占特征往往多义性高、激活密集，难以解释。实验表明，这是由于有限特征容量下的竞争：共享特征能同时解释两个模型的激活模式，而独占特征需编码更多信息以证明其存在。团队提出缓解策略，即引入少量指定共享特征并降低其稀疏性惩罚，使独占特征变得更可解释和单义。该方法应用于真实模型时，成功分离出能捕捉模型间行为差异的可解释特征。此外，观察到独占特征激活频率比共享特征高一个数量级，且两模型独占特征数量相近。

Anthropic推理数据/训练论文/研究

关联讨论 1 条

推荐理由：为 AI 可解释性提供新视角，助力模型行为分析与安全研究。

08:00

Anthropic：Transformer Circuits（可解释性研究）

精选83

注意力机制研究进展

Anthropic可解释性团队报告了注意力机制的最新研究进展。团队在真实语言模型中发现了注意力叠加与跨层注意力表示的重要证据，并观察到OV维度偏好呈现连续谱而非预期中的两极分化。研究进一步表明QK条件与OV条件相互耦合，并提出了以多令牌转码器为形式的实用研究方法。目前核心未解问题是理解注意力模式的形成机制，团队提出通过QK对角化这一前景明确的路径进行探索。文中还详细阐述了包括“注意力替换层”在内的多种实验方法，以及初步结果与当前局限，为后续研究提供了方向。

Anthropic推理论文/研究

关联讨论 1 条

推荐理由：可解释性研究揭示模型内部机制，对 AI 安全和优化至关重要。

08:00

Anthropic：Transformer Circuits（可解释性研究）

精选83

稀疏混合线性变换（MOLT）

稀疏混合线性变换（MOLT）是一种正在开发的新方法，旨在替代Transformer模型中的MLP层，以解决此前“转码器”方法在计算效率和表示忠实性上的局限。与转码器学习稀疏激活的特征向量不同，MOLT学习稀疏激活的线性变换，这些变换直接对残差流进行线性操作以贡献输出，充当纯粹的计算单元。初步实验表明，MOLT比转码器计算效率更高、机制更忠实，其激活条件具有可解释性，有助于理解层间特征的转换过程。该方法与混合解码器架构相关，但采用了低秩矩阵等不同参数化策略。

Anthropic推理论文/研究

推荐理由：新可解释性方法让 AI 内部计算更透明，助力模型调试与安全研究。

08:00

Anthropic：Transformer Circuits（可解释性研究）

精选83

干扰权重的玩具模型研究

本文探讨神经网络中“干扰权重”与“权重叠加”现象，认为这是从特定示例归因分析转向全局电路分析的核心障碍。研究通过在玩具模型中的初步探索得出三点发现：干扰权重可在修改解释的玩具模型中复现，其表现与真实模型相似，分析时通常需滤除；其定义多样，既有原则性定义也有实用启发式方法，可在玩具模型中比较，并有望将计算成本高的原则性定义应用于真实模型少量权重以校准启发式方法；仍需大量玩具模型研究以深入理解。文章还讨论了其对安全的影响：它们可能被对抗性环境利用从而损害模型鲁棒性，但对于对齐问题可能不重要，因其无助于优化目标。

Anthropic推理论文/研究

关联讨论 1 条

推荐理由：可解释性研究新进展，揭示权重叠加问题，对AI安全分析有重要启示。

08:00

Anthropic：Transformer Circuits（可解释性研究）

精选76

通过特征交互追踪注意力计算

研究团队提出“QK归因”方法，将Transformer注意力头的关注模式解释为查询侧与键侧特征激活的双线性函数，并将其整合至原有的归因图中，从而弥补了原有方法忽略注意力计算关键信息的缺陷。案例研究验证了此前在归纳提示、反义词任务等场景中假设的特征交互机制，并发现了如“一致性头”用于合理性检查等新计算模式。该方法实现了对模型前向传播过程更完整的可解释性因果图描述。

Anthropic论文/研究

推荐理由：Anthropic补齐可解释性方法论的关键拼图，有助于理解大模型内部推理机制

08:00

Anthropic：Transformer Circuits（可解释性研究）

精选78

一个关于机制（非）忠实性的玩具模型

本文通过“绝对值”玩具模型，揭示了稀疏自动编码器（SAE）和转码器在解释神经网络时可能存在的“机制非忠实性”问题。核心在于，即使转码器能很好地近似模型的输入-输出映射，它也可能采用与原始模型完全不同的内部计算机制。作者特别指出，当训练数据中存在重复数据点时，转码器可能形成专门“记忆”该点的特征电路，而原模型并无此机制。这种机制背离可能导致模型在分布外数据上泛化行为出现差异，从而威胁机械可解释性研究的可信度。文章最后简要讨论了“雅可比匹配”等潜在缓解方法。

Anthropic推理数据/训练论文/研究

推荐理由：揭示可解释性方法中潜在的忠实性问题，帮助开发者更可靠地理解模型内部机制。

08:00

Anthropic：Transformer Circuits（可解释性研究）

精选78

当模型操纵流形：一项计数任务的几何原理

本研究探讨了Claude 3.5 Haiku等语言模型如何从纯文本中学习类似生物感知的空间推理能力，以完成固定宽度文本的自动换行任务。模型通过两种对偶机制表征位置信息：离散特征激活与特征流形上的几何变换。具体而言，它通过追踪当前行字符数、行宽限制等变量，整合信息以估算剩余空间，从而决定是否换行。研究发现，这些计数表征存在于残差流的低维高曲率一维流形上，其计算过程既可解读为离散电路，也可视为连续的几何变换。

Anthropic推理论文/研究

推荐理由：模型内部自发形成类似哺乳动物空间感知的几何表征，揭示大模型'感知'世界的底层机制

08:00

Anthropic：Transformer Circuits（可解释性研究）

精选83

大语言模型中涌现的自省意识

研究通过“概念注入”技术直接操控模型内部激活状态，以检验大语言模型是否具备真正的内省能力。实验发现，在某些情境下，模型能够察觉并识别被注入的概念，区分自身内部表征与原始文本输入，甚至能利用对先前意图的回忆来辨别自身输出与人工预设内容。其中，Claude Opus系列模型展现出最强的自省意识，但这种能力不稳定且高度依赖情境。研究表明，当前模型已具备某种对其内部状态的功能性感知，尽管仍不可靠，但可能随模型能力提升而发展。

Anthropic安全/对齐推理论文/研究

推荐理由：研究揭示大模型可能具备有限内省能力，对 AI 安全和透明度有重要启示。

6月13日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选73

我们如何构建多智能体研究系统

Claude的多智能体研究系统采用协调器-工作者架构，一个主导智能体分析用户查询并制定策略，并行调用多个专用子智能体协同工作。内部评估显示，以Claude Opus 4为主导、Claude Sonnet 4为子智能体的系统，在研究任务上比单智能体Claude Opus 4性能提升90.2%。该系统擅长处理需要同时探索多个独立方向的广度优先查询，通过分配独立上下文窗口实现并行推理扩容。但多智能体系统消耗的token量约为普通聊天的15倍，适用于任务价值足以支撑性能提升的场景，在需要高度并行化、大信息量或多工具调用的任务中表现卓越。

智能体Anthropic教程/实践

推荐理由：Anthropic 把 Research 背后的多智能体架构、prompt 工程和踩坑经验全抖出来了，做 Agent 的同行可以直接抄作业，尤其是『token 用量解释 80% 性能方差』这个结论，选型逻辑要变。

6月12日

23:00

Google DeepMind：Blog（RSS）

我们如何利用 AI 支持更精准的热带气旋预测

推出 Weather Lab 平台展示实验性 AI 气旋预测能力，与美国国家飓风中心建立合作，直接支持本季热带气旋预报和预警工作。

Google产品更新

08:00

EleutherAI：Blog

通过局部体积研究随机网络的归纳偏置

研究团队通过星形域体积估计方法，系统研究随机神经网络参数-函数映射的归纳偏置特性。这项工作建立在先前关于随机采样训练神经网络概率及 Neural Redshift 理论的基础上，致力于解释固定架构下不同任务学习难度存在指数级差异的机制，为理解深度神经网络的泛化能力提供了新的几何分析视角。

数据/训练论文/研究

00:00

Runway：Changelog（网页）

更多创作方式

推出一站式创作解决方案，整合实现任意创意所需的全部工具与资源，覆盖从构思到完成的全流程，让用户能够自由创建任何内容。

产品更新视频

6月11日

05:12

Sam Altman：Blog（RSS）

精选

温和的奇点

人类已越过AI发展的"事件视界"。2025年代理将承担真正认知工作，永久改变编程；2026年系统或能发现新见解，2027年机器人可能执行现实任务。科学家称生产力已提升2-3倍，递归改进正在加速。2030年代智能与能源将极大丰富，技术成本趋近电力。尽管就业结构剧变，但财富增长将带来前所未有的政策空间。人类正适应"温和的奇点"：奇迹迅速变成常态，我们将很快测试智能能超越人类多远。

智能体OpenAI大佬观点

推荐理由：Sam Altman 谈温和奇点：AGI 已启动，预测 2025-2027 发展路线