Claude Fable 5 费用约是 Opus 4.8 的三倍,但效率提升显著:Parameter Golf 挑战效率高 6 倍;Slay the Spire 加持久记忆后表现翻 3 倍;可一次性迁移 50 万行代码。Anthropic 内部两大杠杆:① 自我纠正循环——写 rubric(目标+量化评分标准+沙箱),让模型自主改代码、跑测试;② 记忆系统——共享文件系统作为外脑,每次记录错误与改进规则。Fable 5 是唯一能完整走通“出错→调查→验证→蒸馏成规则”流程的模型。独立上下文的验证代理可使准确率翻倍。
关于屌炸天的Claude Fable 5, 这条推文是你必看和必收藏的, 帮大家总结了Anthropic内部用烂了的核心杠杆和方法:我敢说用了这个,你的Agent会越用越聪明,复利效应爆炸。
虽然很多人吐槽Fable 5的费用是Opus 4.8的将近3倍,但我想说他确实值这个价!
Anthropic内部工程师这篇文章大家可以看看,基本说透了,我帮大家总结下核心要点:
1️⃣90%的人都在浪费Fable 5的能力, 很多人还在给它扔单次prompt, 它真正的实力,是当一个能自主干活的长期工程师,
2️⃣Fable 5是第一个能真正自律循环的模型, 所以不要只给它一个指令让它交差, 得给它一个清晰的目标, 一个可量化的打分标准, 一个能自己跑的环境,
然后它会自己做实验、看结果、踩坑、反思、改代码、再跑,直到把事干成。
3️⃣这就是它比Opus强一个档次的真正原因, 任务越长、越复杂、越需要迭代,它的优势就会越夸张:
✅ Parameter Golf工程挑战,效率比Opus高6倍 ✅ Slay the Spire加持久记忆后,表现直接翻3倍 ✅ 50万行代码库迁移,一次性搞定不用人擦屁股
4️⃣@RLanceMartin 分享了两个Anthropic内部用烂了的核心杠杆:
杠杆❶ 自我纠正循环:不要写prompt,写rubric
不要说帮我优化这个代码,
要说:
• 目标:把这个接口的延迟降到100ms以内
• 评分标准:延迟达标、所有单元测试通过、代码不超过300行
• 给它一个能自己运行代码的沙箱
然后你就可以去喝咖啡了😆 它会自己改、自己跑、自己看日志、自己调,
5️⃣最关键的一步:不要让它自己批评自己, 单独开一个独立上下文的验证代理,客观打分, 这一个改动,准确率直接翻倍!
杠杆2 记忆系统:给它一个能写日记的外脑
不要把所有东西都塞进上下文, 给它一个共享的文件系统, 让它每次干完活,都写工作笔记:
• 今天犯了什么错
• 为什么会错
• 下次应该怎么改
• 提炼成一条通用规则
Fable 5是目前唯一一个能真正走完这个流程的模型: 出错→调查→验证→蒸馏成规则→下次直接用。 Opus只能到第二步,Sonnet连第一步都做不好。