AIHOT

4月27日

04:59

elvis@omarsar0

阿里巴巴提出一种通过双强化学习飞轮训练智能体的新方法，并基于此推出了AgenticQwen-30B-A3B模型。该模型总参数量为300亿，但每次推理仅激活30亿参数，在TAU-2和BFCL-V4多轮工具使用基准测试中取得了50.2的平均分，性能与参数量达2350亿的Qwen3-235B相当。其核心在于并行运行两个飞轮：推理循环将模型自身错误转化为更难训练问题；智能体循环则将简单工具使用轨迹扩展为多分支行为树，并通过模拟用户误导主动增加训练难度。该方法意味着开发者无需为常规工具任务支付高昂的尖端模型成本，且飞轮配方可复用，能从智能体自身失败中生成困难样本。

智能体推理论文/研究部署/工程

00:54

elvis@omarsar0

新研究提出智能体协同进化框架，解决长期任务规划与技能库僵化难题

构建复杂智能体时，长期任务智能体常因决策者分解能力不足或技能库过时而失败。新研究提出一种协同进化框架，让LLM决策智能体与动态技能库通过迭代优化共同改进。决策智能体负责选取和串联技能，性能反馈同时更新其策略和技能库本身。新技能通过归纳成功序列自动生成，而非预先手动编码。传统方法将技能与决策作为独立问题优化，容易陷入瓶颈。协同进化则能在单一循环中实现自适应规划，并持续增长可复用行为库，这对任务结构不确定的领域（如机器人、游戏智能体、复杂规划）至关重要。

智能体具身智能论文/研究

4月26日

23:20

meng shao@shao__meng

精选77

【论文分享】深入解析 Claude Code 架构：生产级 Coding Agent 的设计哲学与实现

论文通过分析 Claude Code 泄露源码，揭示其生产级 Coding Agent 架构的核心是“最小 AI 决策+最大确定性环境”设计。仅约 1.6% 代码为 AI 逻辑，其余 98.4% 用于构建安全、可靠的操作框架。架构围绕人类决策权、安全等五种价值驱动，采用七层独立防御体系保障工具调用安全，并通过五层渐进压缩策略高效管理上下文窗口。其扩展机制按上下文成本分级，子 Agent 采用隔离设计，整体强调透明性与用户可控性，与依赖状态图或显式规划的主流路径形成鲜明对比。

BURKOV: A must read for anyone interested in building practical AI systems in 2026: Dive into Claude Code: The Design Space of T...

智能体Anthropic编码论文/研究

关联讨论 1 条

推荐理由：这篇论文逆向拆解了 Claude Code 的完整架构，最值钱的不是那 13 条设计原则，而是 1.6% vs 98.4% 这个数字——它直接回答了「agent 系统该把工程重心放在哪」，做 coding agent 的人应该把这当设计参考书来读。

04:52

elvis@omarsar0

研究提出PARE框架，通过将应用程序建模为具有状态导航和状态相关操作的有限状态机，实现对主动式AI代理的更真实评估。基于此构建的PARE-Bench基准包含143项跨通信、生产力等领域的任务，测试代理的情境观察、目标推断、干预时机及多应用协调能力。该工作弥补了当前主流基准将应用视为扁平API、忽略真实交互状态性与顺序性的缺陷，为衡量代理能否推断用户未言明目标并在正确时刻行动提供了原则性方法。

DAIR.AI: Great paper on improving proactive agents. (bookmark it) Proactive agents act before you do. But how do you evaluate som...

智能体论文/研究评测/基准

01:02

elvis@omarsar0

微软论文揭示AI长文档编辑工作流普遍损坏内容

微软新论文引入DELEGATE-52基准，模拟52个专业领域的长文档编辑工作流。测试19个模型，包括Gemini 3.1 Pro、Claude 4.6 Opus和GPT-5.4等前沿模型，发现在长工作流结束时平均损坏25%的文档内容。代理工具使用未能改善表现。论文还提供了其他相关见解。

论文/研究评测/基准部署/工程

4月25日

00:20

AK@_akhaliq

Omni模型中的上下文展开 paper： https：//huggingface.co/papers/2604.21921

Hugging Face多模态论文/研究

4月24日

11:19

AK@_akhaliq

看见快与慢学习视频中的时间流论文： https：//huggingface.co/papers/2604.21931

多模态视频论文/研究

00:48

AK@_akhaliq

近未来策略优化论文：https：//huggingface.co/papers/2604.20733

推理数据/训练论文/研究

00:07

Saining Xie@sainingxie

vision🍌 现已发布 https：//vision-banana.github.io/ 如果你像我一样进入计算机视觉领域，从像素级标注任务（如分割、边缘、深度或表面法线）开始，看到这些结果时你可能会有同感--某些重大的转变已悄然发生，这将永久改变我们处理这些问题的方式 🧵

图像生成多模态论文/研究

关联讨论 1 条

4月22日