
Claude Fable 5 是 Anthropic 2026 年 6 月 9 日推出的旗舰模型,主打 1M context、多天无人监督自主运作、xhigh effort 级推理。Fable 5 曾于 6 月 12 日因商务部出口管制暂停,6 月 30 日解除禁令重新上线,是 Anthropic 目前 API 可用的最高等级模型。
本文汇整 Anthropic 官方《Prompting Claude Fable 5》handbook 精华,拆解 Fable 5 相比 Opus 4.8 的核心行为改变,以及对应的 prompt 与 harness 调整方式。适合开发者、AI Agent 建构者、企业技术决策者作为 Fable 5 上手的第一份中文完整指南。
Fable 5 是什么:1M context、xhigh effort、多天自主运作
Fable 5 API 型号 claude-fable-5,同时具备以下规格:
- Context window:1M token(百万级 context),单次 output 最高 128K tokens
- 定价:Input $10/M tokens、Output $50/M tokens(prompt caching 可打 9 折);美国本地推论加价 1.1 倍
- 可用平台:Claude API、Claude Platform on AWS、Amazon Bedrock、Google Cloud、Microsoft Foundry
- Adaptive thinking:唯一 thinking 模式,无法关闭;thinking.display 可设为 summarized(读 summary)或 omitted(不读,预设)
- Safety classifier:Fable 5 内建拒绝分类器,涉及攻击型资安、生物与生命科学、model reasoning 提取的请求会被拒(HTTP 200 但 stop_reason: refusal),Mythos 5 版本无此分类器,仅开放给 Project Glasswing 受核准客户
- 资料保留:30 天(不可用 ZDR 零资料保留)
Anthropic 官方对 Fable 5 相对 Opus 4.8 的改进定调为 7 项:长时序自主(Long-horizon autonomy)、复杂问题单次通过率(first-shot correctness)、视觉、企业工作流、程式码审查与除错、模糊需求处理、并发子代理。这 7 项改进的共同底层逻辑是同一件事:Fable 5 可以在用户不看的时间里持续稳定产出。
核心典范转向:从Prompt Engineering 进到Loop Engineering
Fable 5 最大的心法转变不是 prompt 写更好,而是从 prompt 步骤改成设计 loop。过去 Opus 4.6/4.7 的心法是:写一个好 prompt、Claude 回一个好答案。Fable 5 的心法是:设计一个能让 Claude 自我修正的环境回圈,让它反复 plan → act → review → improve,直到任务完成。
Anthropic 在官方 handbook 明确给出这条 loop 设计指令:
建立一种方法,在构建过程中每隔 [X] 个时间间隔检查自己的工作。每隔 [X 个时间间隔] 运行一次此方法,使用子代理根据规范验证你的工作。
这一段的翻译:「建立一套自我检查机制,以 [X] 为间隔验证你自己的工作。每 [X] 间隔跑一次验证,用子代理对照规格检查。」关键是用一组独立 context 的验证子代理(fresh-context verifier subagents),而不是让主 agent 自我批评—因为主 agent 已经有偏见。
这个转向也回应了 abmedia 过去报导的「Harness Engineering」概念—AI 的下一个战场不是模型,而是模型外面那层架构;以及 Akshay 提出的「模型只是回圈中的一个节点」观点。Loop engineering 是 Anthropic 对这条思路的官方版本。
Effort 参数分级:5 级控制Fable 的token 花费
Effort 是 Fable 5 最重要的成本控制旋钮,分成 5 级,由高到低影响 Claude 愿意花多少 token 在 thinking、tool calls、text response 上:
- max:最高能力、无成本上限。用于需要最深推理的前沿问题。频繁调用会产生大量成本,不建议常态使用
- xhigh:延伸能力,适合超过 30 分钟、token 用量以百万计的长时序 agent 与程式码任务
- high(预设):复杂推理、困难程式码、agent 任务。等同不设 effort 参数
- medium:平衡速度、成本、效能的中间值,适合需要平衡的 agent 任务
- low:最省成本,适合简单任务、子代理、高流量情境
Anthropic 官方对 Fable 5 的建议是:从 high(预设)开始,对能力最敏感的工作用 xhigh,例行工作降到 medium 或 low。官方特别强调:Fable 5 在 low effort 下的表现,常常超过前代模型的 xhigh 表现—这是 Fable 5 世代模型能力提升的直接证据。如果任务完成但比预期慢、或想要更互动的工作节奏,直接降 effort。
另外 Anthropic 提醒:在 high 与 xhigh effort 下要设较大的 max_tokens,因为这是 thinking + response text 的总硬性上限;起始建议 64K tokens,再依实测调整。
官方 8 大 Prompt 范本:handbook 精华整理
Anthropic handbook 提供了 8 段可直接复制的 prompt 范本,涵盖 Fable 5 最常出现的行为偏差。以下逐条整理与翻译。
范本 1:防止过度规划(避免无限考虑选项)
当你掌握足够的信息时,就立即行动。不要重复对话中已经确定的事实,不要重新讨论用户已经做出的决定,也不要在面向用户的消息中赘述你不会采取的选项。如果你正在权衡某个选择,请给出建议,而不是进行详尽的调查。
翻译:「当你有足够资讯执行时,执行。不要重新推导对话已建立的事实,不要重议用户已做的决定,不要在给用户看的讯息里条列你不会采用的选项。若要判断选择,给出建议、不要穷举分析。」
范本 2:防止 xhigh effort 下的过度整理(不必要的 refactor)
不要添加超出任务需求的功能、重构代码或引入抽象概念。修复 bug 不需要后续的清理工作,一次性操作通常也不需要辅助函数。不要为不可能发生的情况添加错误处理、回退机制或验证。信任内部代码和框架的保证。
翻译:「不要新增超出任务所需的功能、重构,或抽象化。修 bug 不需要顺手清理周围程式码;一次性操作通常不需要拉出 helper。不要对不会发生的情境加错误处理、fallback 或验证。信任内部程式码与框架保证。」
范本 3:确保回报基于工具实测结果(防止 hallucinated status)
在汇报进度之前,请对照本次会议的工具测试结果审核每一项声明。只汇报你能提供证据支持的工作;如果某些内容尚未验证,请明确说明。如实汇报结果:如果测试失败,请在输出结果中注明;如果跳过了某个步骤,也请说明。
翻译:「回报进度前,先对照本次 session 的工具结果 audit 每一项声明。只回报你能指得出证据的工作;若某项尚未验证,明确说出来。忠实回报结果:测试失败就连 output 一起说;某步被跳过就说跳过了。」
范本 4:界定 Fable 5 该做与不该做的边界
当用户描述问题、提出疑问或表达想法而非提出更改请求时,你的工作成果就是评估结果。汇报你的发现后就停止。在用户提出要求之前,不要轻易进行修复。
翻译:「当用户是在描述问题、问问题,或思考中自言自语,而不是要求你改动时,交付物就是你的评估。回报你的发现然后停下来。除非他们要求,否则不要动手修改。」
范本 5:并发子代理指示
将独立的子任务委派给子代理,并在它们运行期间继续工作。如果子代理偏离轨道或缺少相关上下文,则进行干预。
翻译:「把独立子任务派给子代理,在它们执行的期间你继续工作。若子代理走偏或缺乏相关 context,再介入。」
范本 6:记忆系统(让 Fable 累积跨对话的知识)
每个课程都以文件形式存储,并在文件顶部附上一行简短的总结。记录纠正错误和已确认的方法,并说明其重要性。不要保存代码库或聊天记录中已有的内容;更新现有笔记,而不是创建重复的笔记;删除已证明错误的笔记。
翻译:「一个档案存一条教训,顶端写一行摘要。修正与已确认可用的方法都记下来,连同为什么重要一起写。不要重复记录 repo 或聊天纪录已经有的内容;更新现有笔记而不是复制一份新的;错的笔记直接删掉。」
范本 7:防止长对话尾端的 early-stopping(Fable 常见的「我等等来做」)
您目前处于自主操作状态。用户不会实时观看,也无法在任务进行中回答问题,因此询问“我想让我……?”或“我应该……吗?”会阻塞工作。对于可逆操作(即由原始请求引发的操作),无需询问即可直接执行。在结束您的回合之前,请检查您的最后一段。如果最后一段是计划、分析、问题、后续步骤列表或您尚未完成的工作承诺,请立即使用工具调用来完成这些工作。
翻译:「你正在自主运作。用户没有即时盯着、也无法在任务进行到一半回答问题,问「要我…吗?」「要不要…?」会 block 工作。原始请求延伸的可逆行动,直接执行不用问。结束回合前,检查你的最后一段。如果那是一个 plan、分析、问题、下一步清单,或未完成工作的承诺,现在就用工具呼叫把工作做完。」
范本 8:context 用量恐慌(告诉 Fable 不要自我限缩)
您还有足够的上下文信息。不要因为上下文信息有限而停止、总结或建议另开一节课。继续工作。
翻译:「你的 context 还有充裕余量。不要因为 context 上限就停下、总结,或建议开新 session。继续工作。」
Skills 与记忆系统:让 Fable 累积跨对话知识
Fable 5 相比前代最重要的差异之一,是它能主动使用外部记忆。Anthropic 官方推荐的做法是给 Fable 一个可写的 Markdown 档案作为 memory store,让它把每次对话学到的教训写下来、下次对话再读取。
官方 bootstrap 指令:
回顾我们之前一起进行的课程。使用子代理来识别核心主题和经验教训,并将它们存储在[X]中。确保您知道在将来使用时如何引用[X]。
对已有专案的实务做法:让 Fable 5 用并发子代理去分析过去的 session 纪录(如 Claude Code 的 ~/.claude/projects/ 底下的 JSONL 档),抽取核心主题与教训,储存到指定 memory 档案。往后每次启动时,Fable 会自动 reference 这个档案作为背景。
Skills 是与 memory 平行的另一套机制。Skills 是可执行的技能档案(通常是 Markdown + 相关资源),让 Fable 5 在遇到特定情境时触发特定行为。Anthropic 官方警告:为前代模型开发的 Skills 对 Fable 5 常常过度规范,反而降低输出品质。迁移时应该检视旧 Skills、移除过度指令、让 Fable 5 用预设能力发挥;Fable 5 本身也能在执行任务中即时更新 Skills。
并发子代理:Fable 5 最强的差异化能力
官方明确指出 Fable 5「dispatches parallel subagents more readily than prior models」—比前代模型更愿意主动派并发子代理。这是 Fable 5 相对 Opus 4.8 最大的能力跃进之一。
Anthropic 给的实务建议:
- 频繁使用子代理:不要吝于 delegation;独立子任务直接派给子代理
- 明确给出何时该派子代理的指引:在 system prompt 写清楚 delegation 判断标准
- 优先用非同步沟通:orchestrator 与子代理之间用非同步沟通、不要 block 到子代理回应才继续
- 长寿子代理较划算:跨 subtask 保持 context 的长寿子代理省时省钱—透过 cache reads,同时避免被最慢的子代理拖住
abmedia 过去《AI Agent 工具链完整指南》已解析编码、支付、托管三层工具链设计,Fable 5 的并发子代理能力刚好填补了「orchestrator 层」的能力缺口。
常见踩坑:Anthropic 官方点名的 4 个陷阱
官方 handbook 特别点名以下 4 个常见的踩坑情境,以及对应的解方:
陷阱 1:客户端 timeout 太短—Fable 5 单次请求在高 effort 下可能跑几十分钟、autonomous 情境可能跑几小时。旧 harness 的 timeout 设定会直接挂掉。解方:调高 timeout、启用 streaming、加入 progress indicator;长时序任务改为非同步查询(排程 job 检查)而不是 block。
陷阱 2:System prompt 要求 Claude「解释你的推理」—会触发 refusal。Fable 5 的 safety classifier 有一条 reasoning_extraction 分类,若你的 prompt 明确要求「echo/transcribe/explain your internal reasoning as response text」,会被拒。Anthropic 建议:迁移时 audit 所有 skills 与 system prompts,移除 show-your-thinking 指令;若真的需要推理可见性,读 adaptive thinking 的 thinking block、或用 send-to-user tool 表面化。
陷阱 3:Effort 用错—旧模型的直觉是「越高越好」,Fable 5 不是。低 effort 常常已经超过前代 xhigh。解方:xhigh 专用于能力最敏感的 workload;例行工作降到 medium/low、可省显著成本。
陷阱 4:未处理 refusal 分支—Fable 5 拒绝请求时回 HTTP 200 + stop_reason: refusal(不是 error)。整合方要新加三段处理:refusal 回应解析、fallback 到其他 Claude 模型(server-side fallbacks 参数、SDK middleware、或手动)、new billing rules(refused-before-output 不收费、retry 有 fallback credit 补偿 cache 切换成本)。
3 步骤 checklist:开始你的第一个 Fable 5 专案
综合上述,以下是给第一次上手 Fable 5 的 3 步骤 checklist:
Step 1:选一个「以前对 Opus 4.8 太难」的任务。Anthropic 官方建议「Start at the top of your difficulty range」—挑一个原本你不会派给 Opus 4.8 的难题,让 Fable 5 自己 scope、问澄清问题、执行到完。用简单任务测试 Fable 5 只会 undersell 它的能力。
Step 2:建立 verifier subagent 回圈。不要靠 Fable 5 自我批评;派 fresh-context 子代理定期验证主 agent 的输出。这是 loop engineering 的核心。设定验证间隔(例如每完成一个 subtask、每 30 分钟、每花 100K tokens 一次),让子代理对照原始规格检查。
Step 3:建立 memory 档案,累积跨对话知识。给 Fable 一个 Markdown 档案作为 memory store,把每次对话学到的教训、修正、确认过的方法写入;每次启动让 Fable 读取这个档案。这是 Fable 5 相对前代模型最能发挥的优势之一。
Fable 5 的能力天花板远比 prompt 表面看起来高。多数用户低估它的原因,是还在用前代模型的 prompt 心法对待它—把它当一次性回答机、而不是一个持续运作的 loop 内节点。Loop engineering 是 2026 年 AI 开发的下一个学习曲线。
本文链接地址:https://www.wwsww.cn/rgzn/39758.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。



