Hacker News:AI 热帖
精选76
展示 HN:Statewright--通过可视化状态机提升AI智能体可靠性
精选理由
Statewright用状态机给AI代理上“紧箍咒”,让13B小模型也能搞定SWE-bench任务,做coding agent的应该立刻装上试试。
AI 摘要
Statewright 是一个通过状态机为AI智能体提供约束的系统,能控制其在各阶段可使用的工具,从而聚焦推理并提升可靠性。它将工作流定义为规划、实施、测试等多个阶段,自动执行工具限制与状态转换。在本地模型测试中,两个模型在5项SWE-bench子任务上应用约束后,正确率从2/10显著提升至10/10。该系统已集成到Claude Code等平台,一个修复测试失败的典型工作流可在46秒内完成。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文github.com