AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态一手 · 2385 条
全部一手资讯X论文
6月25日周三
6月24日周二
6月23日周一
6月16日周一
6月15日周日
6月13日周五
6月12日周四
6月11日周三
6月10日周二
6月9日周一
6月6日周五
6月4日周三
6月3日周二
6月2日周一
5月31日周六
5月30日周五
5月29日周四
5月28日周三
5月27日周二
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月25日
08:00
OpenRouter:Announcements(RSS)
40
OpenRouter 推出开发者与 BYOK 更新:可用性 API + 更智能的密钥管理

OpenRouter 新增通过 API 追踪模型可用性的功能,并增强了 BYOK 密钥管理,支持设置使用限制和可测试密钥。

产品更新部署/工程
08:00
OpenRouter:Announcements(RSS)
46
Dev & BYOK 更新:Uptime API 与更智能的密钥管理

Anthropic 为其开发者和 BYOK 客户推出两项重要更新。新发布的 Uptime API 允许开发者通过编程接口直接追踪模型运行状态与可用性。同时,BYOK 密钥管理功能得到增强,用户现在可以对密钥设置使用量限制,并创建可测试的密钥,从而实现对加密密钥更精细化的控制与验证。

产品更新部署/工程
6月24日
22:00
Google DeepMind:Blog(RSS)
精选
Gemini Robotics On-Device 将 AI 引入本地机器人设备

Gemini Robotics On-Device 推出高效端侧机器人模型,具备通用灵巧操作与快速任务适应能力,支持本地设备直接部署运行。

DeepMindGoogle具身智能模型发布
关联讨论 2 条Google DeepMind:Blog(RSS)X:Google DeepMind (@GoogleDeepMind)
推荐理由:DeepMind 发布端侧机器人模型,支持本地部署与快速任务适应
00:12
Ethan Mollick:One Useful Thing(RSS)
精选
当下如何使用 AI:快速指南

一份当下 AI 工具的快速选用指南,聚焦目前值得使用的 AI 产品及其具体使用方法,帮助读者快速上手并选对工具。

教程/实践
关联讨论 1 条Ethan Mollick:One Useful Thing(RSS)
推荐理由:AI教育专家Ethan Mollick撰写,指导读者当下如何选择和使用AI工具
6月23日
08:00
EleutherAI:Blog
研究进展:局部体积测量在下游任务中的应用

该研究更新了局部体积测量技术在下游任务中的最新应用进展。通过将局部体积测量方法拓展至具体应用场景,探索了该技术在实际任务中的实施路径与性能表现。研究涵盖方法论优化及多场景适配策略,为相关技术的实际落地提供参考。

多模态论文/研究
6月16日
00:00
LMSYS:Blog(Chatbot Arena 团队)
在GB200 NVL72上部署DeepSeek 671B:PD与大规模EP架构实现2.7倍解码加速

SGLang团队在GB200 NVL72集群部署DeepSeek 671B模型,采用预填充-解码分离(PD)与大规模专家并行(EP)架构,结合Blackwell专用优化组件(DeepGEMM、DeepEP等),实现单GPU解码吞吐7,583 tokens/秒。在2,000 token输入下,性能较H100提升2.7倍,整体加速比达2.5-3.4倍。系统利用NVLink全互联降低通信延迟,依托更大显存支持高批次处理,显著提升MoE模型推理效率。

DeepSeek开源/仓库推理部署/工程
6月15日
08:00
Anthropic:Transformer Circuits(可解释性研究)
精选78
Crosscoder模型差异分析见解

Anthropic可解释性团队在Crosscoder模型差异分析中发现,模型独占特征往往多义性高、激活密集,难以解释。实验表明,这是由于有限特征容量下的竞争:共享特征能同时解释两个模型的激活模式,而独占特征需编码更多信息以证明其存在。团队提出缓解策略,即引入少量指定共享特征并降低其稀疏性惩罚,使独占特征变得更可解释和单义。该方法应用于真实模型时,成功分离出能捕捉模型间行为差异的可解释特征。此外,观察到独占特征激活频率比共享特征高一个数量级,且两模型独占特征数量相近。

Anthropic推理数据/训练论文/研究
关联讨论 1 条Anthropic:Transformer Circuits(可解释性研究)
推荐理由:为 AI 可解释性提供新视角,助力模型行为分析与安全研究。
08:00
Anthropic:Transformer Circuits(可解释性研究)
精选83
注意力机制研究进展

Anthropic可解释性团队报告了注意力机制的最新研究进展。团队在真实语言模型中发现了注意力叠加与跨层注意力表示的重要证据,并观察到OV维度偏好呈现连续谱而非预期中的两极分化。研究进一步表明QK条件与OV条件相互耦合,并提出了以多令牌转码器为形式的实用研究方法。目前核心未解问题是理解注意力模式的形成机制,团队提出通过QK对角化这一前景明确的路径进行探索。文中还详细阐述了包括“注意力替换层”在内的多种实验方法,以及初步结果与当前局限,为后续研究提供了方向。

Anthropic推理论文/研究
关联讨论 1 条Anthropic:Transformer Circuits(可解释性研究)
推荐理由:可解释性研究揭示模型内部机制,对 AI 安全和优化至关重要。
08:00
Anthropic:Transformer Circuits(可解释性研究)
精选83
稀疏混合线性变换(MOLT)

稀疏混合线性变换(MOLT)是一种正在开发的新方法,旨在替代Transformer模型中的MLP层,以解决此前“转码器”方法在计算效率和表示忠实性上的局限。与转码器学习稀疏激活的特征向量不同,MOLT学习稀疏激活的线性变换,这些变换直接对残差流进行线性操作以贡献输出,充当纯粹的计算单元。初步实验表明,MOLT比转码器计算效率更高、机制更忠实,其激活条件具有可解释性,有助于理解层间特征的转换过程。该方法与混合解码器架构相关,但采用了低秩矩阵等不同参数化策略。

Anthropic推理论文/研究

推荐理由:新可解释性方法让 AI 内部计算更透明,助力模型调试与安全研究。
08:00
Anthropic:Transformer Circuits(可解释性研究)
精选83
干扰权重的玩具模型研究

本文探讨神经网络中“干扰权重”与“权重叠加”现象,认为这是从特定示例归因分析转向全局电路分析的核心障碍。研究通过在玩具模型中的初步探索得出三点发现:干扰权重可在修改解释的玩具模型中复现,其表现与真实模型相似,分析时通常需滤除;其定义多样,既有原则性定义也有实用启发式方法,可在玩具模型中比较,并有望将计算成本高的原则性定义应用于真实模型少量权重以校准启发式方法;仍需大量玩具模型研究以深入理解。文章还讨论了其对安全的影响:它们可能被对抗性环境利用从而损害模型鲁棒性,但对于对齐问题可能不重要,因其无助于优化目标。

Anthropic推理论文/研究
关联讨论 1 条Anthropic:Transformer Circuits(可解释性研究)
推荐理由:可解释性研究新进展,揭示权重叠加问题,对AI安全分析有重要启示。
08:00
Anthropic:Transformer Circuits(可解释性研究)
精选76
通过特征交互追踪注意力计算

研究团队提出“QK归因”方法,将Transformer注意力头的关注模式解释为查询侧与键侧特征激活的双线性函数,并将其整合至原有的归因图中,从而弥补了原有方法忽略注意力计算关键信息的缺陷。案例研究验证了此前在归纳提示、反义词任务等场景中假设的特征交互机制,并发现了如“一致性头”用于合理性检查等新计算模式。该方法实现了对模型前向传播过程更完整的可解释性因果图描述。

Anthropic论文/研究

推荐理由:Anthropic补齐可解释性方法论的关键拼图,有助于理解大模型内部推理机制
08:00
Anthropic:Transformer Circuits(可解释性研究)
精选78
一个关于机制(非)忠实性的玩具模型

本文通过“绝对值”玩具模型,揭示了稀疏自动编码器(SAE)和转码器在解释神经网络时可能存在的“机制非忠实性”问题。核心在于,即使转码器能很好地近似模型的输入-输出映射,它也可能采用与原始模型完全不同的内部计算机制。作者特别指出,当训练数据中存在重复数据点时,转码器可能形成专门“记忆”该点的特征电路,而原模型并无此机制。这种机制背离可能导致模型在分布外数据上泛化行为出现差异,从而威胁机械可解释性研究的可信度。文章最后简要讨论了“雅可比匹配”等潜在缓解方法。

Anthropic推理数据/训练论文/研究

推荐理由:揭示可解释性方法中潜在的忠实性问题,帮助开发者更可靠地理解模型内部机制。
08:00
Anthropic:Transformer Circuits(可解释性研究)
精选78
当模型操纵流形:一项计数任务的几何原理

本研究探讨了Claude 3.5 Haiku等语言模型如何从纯文本中学习类似生物感知的空间推理能力,以完成固定宽度文本的自动换行任务。模型通过两种对偶机制表征位置信息:离散特征激活与特征流形上的几何变换。具体而言,它通过追踪当前行字符数、行宽限制等变量,整合信息以估算剩余空间,从而决定是否换行。研究发现,这些计数表征存在于残差流的低维高曲率一维流形上,其计算过程既可解读为离散电路,也可视为连续的几何变换。

Anthropic推理论文/研究

推荐理由:模型内部自发形成类似哺乳动物空间感知的几何表征,揭示大模型'感知'世界的底层机制
08:00
Anthropic:Transformer Circuits(可解释性研究)
精选83
大语言模型中涌现的自省意识

研究通过“概念注入”技术直接操控模型内部激活状态,以检验大语言模型是否具备真正的内省能力。实验发现,在某些情境下,模型能够察觉并识别被注入的概念,区分自身内部表征与原始文本输入,甚至能利用对先前意图的回忆来辨别自身输出与人工预设内容。其中,Claude Opus系列模型展现出最强的自省意识,但这种能力不稳定且高度依赖情境。研究表明,当前模型已具备某种对其内部状态的功能性感知,尽管仍不可靠,但可能随模型能力提升而发展。

Anthropic安全/对齐推理论文/研究

推荐理由:研究揭示大模型可能具备有限内省能力,对 AI 安全和透明度有重要启示。
6月13日
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选73
我们如何构建多智能体研究系统

Claude的多智能体研究系统采用协调器-工作者架构,一个主导智能体分析用户查询并制定策略,并行调用多个专用子智能体协同工作。内部评估显示,以Claude Opus 4为主导、Claude Sonnet 4为子智能体的系统,在研究任务上比单智能体Claude Opus 4性能提升90.2%。该系统擅长处理需要同时探索多个独立方向的广度优先查询,通过分配独立上下文窗口实现并行推理扩容。但多智能体系统消耗的token量约为普通聊天的15倍,适用于任务价值足以支撑性能提升的场景,在需要高度并行化、大信息量或多工具调用的任务中表现卓越。

智能体Anthropic教程/实践

推荐理由:Anthropic 把 Research 背后的多智能体架构、prompt 工程和踩坑经验全抖出来了,做 Agent 的同行可以直接抄作业,尤其是『token 用量解释 80% 性能方差』这个结论,选型逻辑要变。
6月12日
23:00
Google DeepMind:Blog(RSS)
我们如何利用 AI 支持更精准的热带气旋预测

推出 Weather Lab 平台展示实验性 AI 气旋预测能力,与美国国家飓风中心建立合作,直接支持本季热带气旋预报和预警工作。

Google产品更新
08:00
EleutherAI:Blog
通过局部体积研究随机网络的归纳偏置

研究团队通过星形域体积估计方法,系统研究随机神经网络参数-函数映射的归纳偏置特性。这项工作建立在先前关于随机采样训练神经网络概率及 Neural Redshift 理论的基础上,致力于解释固定架构下不同任务学习难度存在指数级差异的机制,为理解深度神经网络的泛化能力提供了新的几何分析视角。

数据/训练论文/研究
00:00
Runway:Changelog(网页)
更多创作方式

推出一站式创作解决方案,整合实现任意创意所需的全部工具与资源,覆盖从构思到完成的全流程,让用户能够自由创建任何内容。

产品更新视频
6月11日
05:12
Sam Altman:Blog(RSS)
精选
温和的奇点

人类已越过AI发展的"事件视界"。2025年代理将承担真正认知工作,永久改变编程;2026年系统或能发现新见解,2027年机器人可能执行现实任务。科学家称生产力已提升2-3倍,递归改进正在加速。2030年代智能与能源将极大丰富,技术成本趋近电力。尽管就业结构剧变,但财富增长将带来前所未有的政策空间。人类正适应"温和的奇点":奇迹迅速变成常态,我们将很快测试智能能超越人类多远。

智能体OpenAI大佬观点

推荐理由:Sam Altman 谈温和奇点:AGI 已启动,预测 2025-2027 发展路线
00:00
Mistral AI:News(网页)
49
Mistral Compute: 面向全球的私有AI基础设施服务

Mistral AI 推出 Mistral Compute,这是一项私有、集成化的 AI 基础设施服务,旨在让用户能够从基础设施层开始,自主构建并拥有完整的 AI 技术栈。该服务提供从裸机服务器到完全托管 PaaS 的多种交付形式,包含 GPU、编排、API 及产品。作为一项在欧洲前所未有的举措,Mistral Compute 为全球各国政府、企业及研究机构提供了美国或中国云厂商之外的替代选择,以支持其在国防、制药、金融等领域开发 AI 工作负载。该服务基于 NVIDIA 最新的参考架构,提供数万 GPU,并特别强调数据主权与可持续性。

产品更新部署/工程
6月10日
00:00
Mistral AI:News(网页)
67
Mistral AI 发布首个推理模型 Magistral

Mistral AI 发布了其首个推理模型 Magistral,包含开源版 Magistral Small(24B 参数)和企业版 Magistral Medium。在 AIME2024 上,Magistral Medium 得分为 73.6%,Magistral Small 为 70.7%。该模型核心特点是支持透明的多步推理,并能在 Le Chat 中以 10 倍于多数竞品的速度运行。Magistral 原生支持包括英语、法语、简体中文在内的多语言推理。开源版 Magistral Small 以 Apache 2.0 许可证发布。

开源生态推理模型发布
6月9日
08:00
OpenRouter:Announcements(RSS)
50
OpenRouter 推出更简单透明的平台费用结构

OpenRouter 正在推出更简单、更透明的平台费用结构。

行业动态部署/工程
08:00
OpenRouter:Announcements(RSS)
39
OpenRouter 简化平台费用结构

OpenRouter 正在推行一套更简单、透明的平台费用结构,旨在简化计费方式并提升透明度。

产品更新部署/工程
08:00
OpenRouter:Announcements(RSS)
49
简化我们的平台费用

平台宣布推出更简单、更透明的费用结构。此次调整旨在简化原有收费模式,提升费用透明度,让用户更清晰地理解相关成本。新结构将逐步实施,预计会影响平台上的各项服务收费方式。

产品更新部署/工程
6月6日
04:00
EleutherAI:Blog
Common Pile v0.1 正式发布

Common Pile v0.1 正式发布,这是一个规模达 8TB 的文本数据集,专门收录公共领域及开放许可的文本内容。该数据集提供了海量可合法自由使用的语料资源,适用于大规模语言模型训练等需要合规数据源的场景,旨在解决 AI 训练中的数据版权合规问题。

开源/仓库数据/训练
6月4日
08:00
OpenRouter:Announcements(RSS)
52
OpenRouter 新增 GIF 提示词、Omni Search、工具缓存与 BYOK 确认

OpenRouter 现已上线 GIF 作为提示词输入、跨提供商搜索(Omni Search)、Anthropic 工具调用缓存以及 BYOK 确认标志。这些更新旨在加速工作流、提升工具智能化并优化图像支持。

Anthropic产品更新
08:00
OpenRouter:Announcements(RSS)
49
OpenRouter 上线 GIF 提示、全能搜索、Anthropic 工具调用缓存及 BYOK 确认等新功能

OpenRouter 新增 GIF 作为提示词(GIF Prompts)、跨提供商搜索(Omni Search)、Anthropic 工具调用缓存(Tool Caching)以及 BYOK 确认标志(BYOK confirmation),旨在通过更快的图像支持、更智能的工具和更流畅的工作流提升开发体验。

智能体AnthropicMCP/工具产品更新
08:00
OpenRouter:Announcements(RSS)
52
GIF提示、Omni搜索、工具缓存与BYOK标志

多项新功能正式上线,包括GIF提示支持、Omni全平台搜索、Anthropic工具调用缓存以及自带密钥(BYOK)确认标志。这些更新显著提升了工作流程效率,实现了更智能的工具调用机制,并优化了图像支持体验。用户现可更快捷地生成GIF动图、跨平台检索内容、缓存常用工具以加速响应,并通过BYOK标志明确数据控制权限。

MCP/工具产品更新部署/工程
00:00
Mistral AI:News(网页)
44
Mistral Code 发布:企业级 AI 编程助手

Mistral AI 推出企业级 AI 编程助手 Mistral Code。该产品基于开源项目 Continue 构建,集成了 Codestral、Codestral Embed、Devstral 和 Mistral Medium 四个模型,分别用于代码补全、代码搜索、智能体编码和对话辅助。Mistral Code 支持 80 多种编程语言,并提供私有化部署、模型微调及企业级管控功能。目前,包括 Abanca、SNCF 和 Capgemini 在内的多家企业已在混合云或本地环境中部署该产品。目前该产品已开放私有测试。

产品更新开源生态编码部署/工程
00:00
Runway:News(网页)
Runway 与 AMC Networks 在营销与电视开发领域达成合作

Runway 与 AMC Networks 达成合作,将 AI 模型和工具整合到后者的营销与电视开发流程中。合作涵盖视觉概念开发、营销工作流优化及特效构思,旨在加速预可视化制作并提升宣传素材生产效率。AMC Networks 旗下拥有《绝命毒师》《广告狂人》等知名 IP。

行业动态视频
6月3日
00:00
Suno:Blog(网页)
精选76
更高水平的创意控制 · Suno团队

Suno发布了新的创作工具,旨在将创意控制权完全交还给艺术家。新功能包括支持上传最长8分钟的音频、具备行业首创编辑工具(如歌词替换、段落修改和重混)的升级版歌曲编辑器,以及可调节创作风格的“创意滑块”。创作完成后,用户可利用前沿技术将轨道分离为12条独立音轨(如人声、鼓、贝斯)进行预览和下载,便于在数字音频工作站(DAW)中进行后续编辑。

产品更新多模态
关联讨论 1 条Suno:Blog(网页)
推荐理由:Suno 这次不是加几个 style,而是给了波形编辑和 12 轨分离,把 AI 音乐从生成器变成了制作工具,音乐创作者可以进来真正干活了。
6月2日
06:17
Ethan Mollick:One Useful Thing(RSS)
精选
AI 近期发展史:32 只水獭版

以 32 只水獭为主角,通过海洋哺乳动物视角回顾 AI 过去三年技术进展,用轻松方式呈现模型迭代与行业突破。

大佬观点

推荐理由:Ethan Mollick 用 32 张水獭图创意回顾 AI 三年发展历程,视角独特且易懂
5月31日
06:00
EleutherAI:Blog
使用积键记忆编码稀疏编码器特征

采用积键记忆(Product Key Memory)技术对稀疏编码器(Sparse Coder)特征进行编码。该方法结合PKM的高效键值检索机制与稀疏表示学习,通过分层记忆结构存储高维稀疏特征,在扩展模型参数容量的同时保持计算效率,适用于大规模特征表示与检索场景。

数据/训练论文/研究
5月30日
09:32
公众号:小米 MiMo
59
Xiaomi MiMo-VL:通向Agent时代的推理基座,小米多模态大模型开源

小米开源多模态大模型Xiaomi MiMo-VL,该模型定位为Agent时代的推理基座,旨在为智能体时代提供基础推理能力。

智能体多模态模型发布
关联讨论 1 条公众号:小米 MiMo
5月29日
20:06
公众号:DeepSeek(深度求索)
51
DeepSeek-R1 更新,思考更深,推理更强

DeepSeek-R1 更新,思考更深,推理更强。开启“深度思考”功能即可体验新版 R1 更加强大的思考与推理能力。

DeepSeek推理模型发布
5月28日
08:00
OpenRouter:Announcements(RSS)
精选56
OpenRouter 推出推理流摘要、加密货币发票等多项新功能

OpenRouter 上线了推理流摘要(Reasoning Streams)功能,支持流式推理过程摘要,同时新增加密货币发票支付、最终用户 ID(End-User IDs)、速率限制保护以及密钥锁定等特性。

产品更新推理部署/工程
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:如果你在用 OpenRouter 做应用,这几个更新挺实用,推理流输出让代理开发更可控,加密支付和端用户 ID 也降低了商业化门槛。
08:00
OpenRouter:Announcements(RSS)
50
OpenRouter 新功能:推理流、加密发票、终端用户 ID 等

OpenRouter 上线了一系列新功能:推理流(Reasoning Streams)支持流式推理摘要,保护速率限制,加密发票(Crypto Invoices)允许用加密货币支付,终端用户 ID(End-User IDs)实现密钥锁定。所有功能现已可用。

产品更新部署/工程
08:00
OpenRouter:Announcements(RSS)
49
新功能发布:推理流、加密货币支付、终端用户ID等

OpenRouter平台上线多项新功能。核心更新包括“推理流”,允许开发者在模型生成完整回复前实时获取并处理中间推理步骤,提升交互应用的响应速度。平台新增加密货币支付选项,支持通过加密货币开具发票。同时引入“终端用户ID”功能,帮助开发者更好地追踪和管理最终用户的使用情况,以保护API速率限制。此外,密钥锁定机制也已上线,增强了密钥管理的安全性。

产品更新部署/工程
00:00
Mistral AI:News(网页)
61
Mistral AI 发布代码专用嵌入模型 Codestral Embed

Mistral AI 发布首个专为代码设计的嵌入模型 Codestral Embed。该模型在代码检索任务上性能显著超越当前领先的 Voyage Code 3、Cohere Embed v4.0 和 OpenAI 大型嵌入模型。它支持输出不同维度和精度的嵌入向量,即使在 256 维度 int8 精度下仍优于竞品。模型通过 API 以 `codestral-embed-2505` 名称提供,定价为每百万 token 0.15 美元,批量 API 享五折优惠。最大上下文长度为 8192 tokens,推荐使用 3000 字符(含 1000 字符重叠)分块以优化检索效果。

检索增强模型发布编码
5月27日
00:00
Mistral AI:News(网页)
58
Mistral AI 发布 Agents API:构建AI智能体的专用框架

Mistral AI 发布了 Agents API,这是一个用于构建能够执行操作、解决问题的 AI 智能体的专用框架。该 API 将 Mistral 的语言模型与一系列内置连接器相结合,支持代码执行、网页搜索、图像生成、文档库访问及 MCP 工具集成,并提供跨对话的持久记忆和智能体编排能力。文章展示了其在 Github 编程助手、Linear 任务管理、金融分析、旅行及营养助手等场景的应用。集成网页搜索后,模型在 SimpleQA 基准测试上的准确率显著提升,其中 Mistral Large 和 Mistral Medium 的表现分别从 23% 和 22.08% 提高至 75% 和 82.32%。

智能体MCP/工具产品更新
‹ 上一页
1…484950
下一页 ›