63
AI 摘要
研究显示,多智能体LLM系统在生产环境中的故障率高达41%至87%,且多数失败源于协调缺陷,而非基础模型能力问题。当前多数架构对比无法区分性能提升是来自协调优化还是更大的上下文窗口。该研究主张将协调视为一个独立、可配置的架构层,并通过控制变量实验验证:在保持LLM、工具、提示等所有条件不变时,仅改变协调结构即可显著影响系统表现。这为准确评估协调机制的价值提供了更清晰的方法论,并建立了将协调视为核心架构而非底层实现的理论框架。
Pay attention to this one if you build multi-agent systems.
Pay attention to this one if you build multi-agent systems. Coordination is as important as prompts or agent architecture. Multi-agent LLM systems fail in produ...