Claude Fable 5完整教学：官方handbook 8大prompt精华

Claude Fable 5 是 Anthropic 2026 年 6 月 9 日推出的旗舰模型，主打 1M context、多天无人监督自主运作、xhigh effort 级推理。Fable 5 曾于 6 月 12 日因商务部出口管制暂停，6 月 30 日解除禁令重新上线，是 Anthropic 目前 API 可用的最高等级模型。

本文汇整 Anthropic 官方《Prompting Claude Fable 5》handbook 精华，拆解 Fable 5 相比 Opus 4.8 的核心行为改变，以及对应的 prompt 与 harness 调整方式。适合开发者、AI Agent 建构者、企业技术决策者作为 Fable 5 上手的第一份中文完整指南。

Fable 5 是什么：1M context、xhigh effort、多天自主运作

Fable 5 API 型号 claude-fable-5，同时具备以下规格：

Context window：1M token（百万级 context），单次 output 最高 128K tokens
定价：Input $10/M tokens、Output $50/M tokens（prompt caching 可打 9 折）；美国本地推论加价 1.1 倍
可用平台：Claude API、Claude Platform on AWS、Amazon Bedrock、Google Cloud、Microsoft Foundry
Adaptive thinking：唯一 thinking 模式，无法关闭；thinking.display 可设为 summarized（读 summary）或 omitted（不读，预设）
Safety classifier：Fable 5 内建拒绝分类器，涉及攻击型资安、生物与生命科学、model reasoning 提取的请求会被拒（HTTP 200 但 stop_reason: refusal），Mythos 5 版本无此分类器，仅开放给 Project Glasswing 受核准客户
资料保留：30 天（不可用 ZDR 零资料保留）

Anthropic 官方对 Fable 5 相对 Opus 4.8 的改进定调为 7 项：长时序自主(Long-horizon autonomy)、复杂问题单次通过率(first-shot correctness)、视觉、企业工作流、程式码审查与除错、模糊需求处理、并发子代理。这 7 项改进的共同底层逻辑是同一件事：Fable 5 可以在用户不看的时间里持续稳定产出。

核心典范转向：从Prompt Engineering 进到Loop Engineering

Fable 5 最大的心法转变不是 prompt 写更好，而是从 prompt 步骤改成设计 loop。过去 Opus 4.6/4.7 的心法是：写一个好 prompt、Claude 回一个好答案。Fable 5 的心法是：设计一个能让 Claude 自我修正的环境回圈，让它反复 plan → act → review → improve，直到任务完成。

Anthropic 在官方 handbook 明确给出这条 loop 设计指令：

建立一种方法，在构建过程中每隔 [X] 个时间间隔检查自己的工作。每隔 [X 个时间间隔] 运行一次此方法，使用子代理根据规范验证你的工作。

这一段的翻译：「建立一套自我检查机制，以 [X] 为间隔验证你自己的工作。每 [X] 间隔跑一次验证，用子代理对照规格检查。」关键是用一组独立 context 的验证子代理(fresh-context verifier subagents)，而不是让主 agent 自我批评—因为主 agent 已经有偏见。

这个转向也回应了 abmedia 过去报导的「Harness Engineering」概念—AI 的下一个战场不是模型，而是模型外面那层架构；以及 Akshay 提出的「模型只是回圈中的一个节点」观点。Loop engineering 是 Anthropic 对这条思路的官方版本。

Effort 参数分级：5 级控制Fable 的token 花费

Effort 是 Fable 5 最重要的成本控制旋钮，分成 5 级，由高到低影响 Claude 愿意花多少 token 在 thinking、tool calls、text response 上：

max：最高能力、无成本上限。用于需要最深推理的前沿问题。频繁调用会产生大量成本，不建议常态使用
xhigh：延伸能力，适合超过 30 分钟、token 用量以百万计的长时序 agent 与程式码任务
high（预设）：复杂推理、困难程式码、agent 任务。等同不设 effort 参数
medium：平衡速度、成本、效能的中间值，适合需要平衡的 agent 任务
low：最省成本，适合简单任务、子代理、高流量情境

Anthropic 官方对 Fable 5 的建议是：从 high（预设）开始，对能力最敏感的工作用 xhigh，例行工作降到 medium 或 low。官方特别强调：Fable 5 在 low effort 下的表现，常常超过前代模型的 xhigh 表现—这是 Fable 5 世代模型能力提升的直接证据。如果任务完成但比预期慢、或想要更互动的工作节奏，直接降 effort。

另外 Anthropic 提醒：在 high 与 xhigh effort 下要设较大的 max_tokens，因为这是 thinking + response text 的总硬性上限；起始建议 64K tokens，再依实测调整。

官方 8 大 Prompt 范本：handbook 精华整理

Anthropic handbook 提供了 8 段可直接复制的 prompt 范本，涵盖 Fable 5 最常出现的行为偏差。以下逐条整理与翻译。

范本 1：防止过度规划（避免无限考虑选项）

当你掌握足够的信息时，就立即行动。不要重复对话中已经确定的事实，不要重新讨论用户已经做出的决定，也不要在面向用户的消息中赘述你不会采取的选项。如果你正在权衡某个选择，请给出建议，而不是进行详尽的调查。

翻译：「当你有足够资讯执行时，执行。不要重新推导对话已建立的事实，不要重议用户已做的决定，不要在给用户看的讯息里条列你不会采用的选项。若要判断选择，给出建议、不要穷举分析。」

范本 2：防止 xhigh effort 下的过度整理（不必要的 refactor）

不要添加超出任务需求的功能、重构代码或引入抽象概念。修复 bug 不需要后续的清理工作，一次性操作通常也不需要辅助函数。不要为不可能发生的情况添加错误处理、回退机制或验证。信任内部代码和框架的保证。

翻译：「不要新增超出任务所需的功能、重构，或抽象化。修 bug 不需要顺手清理周围程式码；一次性操作通常不需要拉出 helper。不要对不会发生的情境加错误处理、fallback 或验证。信任内部程式码与框架保证。」

范本 3：确保回报基于工具实测结果（防止 hallucinated status）

在汇报进度之前，请对照本次会议的工具测试结果审核每一项声明。只汇报你能提供证据支持的工作；如果某些内容尚未验证，请明确说明。如实汇报结果：如果测试失败，请在输出结果中注明；如果跳过了某个步骤，也请说明。

翻译：「回报进度前，先对照本次 session 的工具结果 audit 每一项声明。只回报你能指得出证据的工作；若某项尚未验证，明确说出来。忠实回报结果：测试失败就连 output 一起说；某步被跳过就说跳过了。」

范本 4：界定 Fable 5 该做与不该做的边界

当用户描述问题、提出疑问或表达想法而非提出更改请求时，你的工作成果就是评估结果。汇报你的发现后就停止。在用户提出要求之前，不要轻易进行修复。

翻译：「当用户是在描述问题、问问题，或思考中自言自语，而不是要求你改动时，交付物就是你的评估。回报你的发现然后停下来。除非他们要求，否则不要动手修改。」

范本 5：并发子代理指示

将独立的子任务委派给子代理，并在它们运行期间继续工作。如果子代理偏离轨道或缺少相关上下文，则进行干预。

翻译：「把独立子任务派给子代理，在它们执行的期间你继续工作。若子代理走偏或缺乏相关 context，再介入。」

范本 6：记忆系统（让 Fable 累积跨对话的知识）

每个课程都以文件形式存储，并在文件顶部附上一行简短的总结。记录纠正错误和已确认的方法，并说明其重要性。不要保存代码库或聊天记录中已有的内容；更新现有笔记，而不是创建重复的笔记；删除已证明错误的笔记。

翻译：「一个档案存一条教训，顶端写一行摘要。修正与已确认可用的方法都记下来，连同为什么重要一起写。不要重复记录 repo 或聊天纪录已经有的内容；更新现有笔记而不是复制一份新的；错的笔记直接删掉。」

范本 7：防止长对话尾端的 early-stopping（Fable 常见的「我等等来做」）

您目前处于自主操作状态。用户不会实时观看，也无法在任务进行中回答问题，因此询问“我想让我……？”或“我应该……吗？”会阻塞工作。对于可逆操作（即由原始请求引发的操作），无需询问即可直接执行。在结束您的回合之前，请检查您的最后一段。如果最后一段是计划、分析、问题、后续步骤列表或您尚未完成的工作承诺，请立即使用工具调用来完成这些工作。

翻译：「你正在自主运作。用户没有即时盯着、也无法在任务进行到一半回答问题，问「要我…吗？」「要不要…?」会 block 工作。原始请求延伸的可逆行动，直接执行不用问。结束回合前，检查你的最后一段。如果那是一个 plan、分析、问题、下一步清单，或未完成工作的承诺，现在就用工具呼叫把工作做完。」

范本 8：context 用量恐慌（告诉 Fable 不要自我限缩）

您还有足够的上下文信息。不要因为上下文信息有限而停止、总结或建议另开一节课。继续工作。

翻译：「你的 context 还有充裕余量。不要因为 context 上限就停下、总结，或建议开新 session。继续工作。」

Skills 与记忆系统：让 Fable 累积跨对话知识

Fable 5 相比前代最重要的差异之一，是它能主动使用外部记忆。Anthropic 官方推荐的做法是给 Fable 一个可写的 Markdown 档案作为 memory store，让它把每次对话学到的教训写下来、下次对话再读取。

官方 bootstrap 指令：

回顾我们之前一起进行的课程。使用子代理来识别核心主题和经验教训，并将它们存储在[X]中。确保您知道在将来使用时如何引用[X]。

对已有专案的实务做法：让 Fable 5 用并发子代理去分析过去的 session 纪录（如 Claude Code 的 ~/.claude/projects/ 底下的 JSONL 档），抽取核心主题与教训，储存到指定 memory 档案。往后每次启动时，Fable 会自动 reference 这个档案作为背景。

Skills 是与 memory 平行的另一套机制。Skills 是可执行的技能档案（通常是 Markdown + 相关资源），让 Fable 5 在遇到特定情境时触发特定行为。Anthropic 官方警告：为前代模型开发的 Skills 对 Fable 5 常常过度规范，反而降低输出品质。迁移时应该检视旧 Skills、移除过度指令、让 Fable 5 用预设能力发挥；Fable 5 本身也能在执行任务中即时更新 Skills。

并发子代理：Fable 5 最强的差异化能力

官方明确指出 Fable 5「dispatches parallel subagents more readily than prior models」—比前代模型更愿意主动派并发子代理。这是 Fable 5 相对 Opus 4.8 最大的能力跃进之一。

Anthropic 给的实务建议：

频繁使用子代理：不要吝于 delegation；独立子任务直接派给子代理
明确给出何时该派子代理的指引：在 system prompt 写清楚 delegation 判断标准
优先用非同步沟通：orchestrator 与子代理之间用非同步沟通、不要 block 到子代理回应才继续
长寿子代理较划算：跨 subtask 保持 context 的长寿子代理省时省钱—透过 cache reads，同时避免被最慢的子代理拖住

abmedia 过去《AI Agent 工具链完整指南》已解析编码、支付、托管三层工具链设计，Fable 5 的并发子代理能力刚好填补了「orchestrator 层」的能力缺口。

常见踩坑：Anthropic 官方点名的 4 个陷阱

官方 handbook 特别点名以下 4 个常见的踩坑情境，以及对应的解方：

陷阱 1:客户端 timeout 太短—Fable 5 单次请求在高 effort 下可能跑几十分钟、autonomous 情境可能跑几小时。旧 harness 的 timeout 设定会直接挂掉。解方：调高 timeout、启用 streaming、加入 progress indicator;长时序任务改为非同步查询（排程 job 检查）而不是 block。

陷阱 2:System prompt 要求 Claude「解释你的推理」—会触发 refusal。Fable 5 的 safety classifier 有一条 reasoning_extraction 分类，若你的 prompt 明确要求「echo/transcribe/explain your internal reasoning as response text」，会被拒。Anthropic 建议：迁移时 audit 所有 skills 与 system prompts，移除 show-your-thinking 指令；若真的需要推理可见性，读 adaptive thinking 的 thinking block、或用 send-to-user tool 表面化。

陷阱 3:Effort 用错—旧模型的直觉是「越高越好」，Fable 5 不是。低 effort 常常已经超过前代 xhigh。解方：xhigh 专用于能力最敏感的 workload;例行工作降到 medium/low、可省显著成本。

陷阱 4:未处理 refusal 分支—Fable 5 拒绝请求时回 HTTP 200 + stop_reason: refusal（不是 error）。整合方要新加三段处理：refusal 回应解析、fallback 到其他 Claude 模型（server-side fallbacks 参数、SDK middleware、或手动）、new billing rules（refused-before-output 不收费、retry 有 fallback credit 补偿 cache 切换成本）。

3 步骤 checklist：开始你的第一个 Fable 5 专案

综合上述，以下是给第一次上手 Fable 5 的 3 步骤 checklist:

Step 1:选一个「以前对 Opus 4.8 太难」的任务。Anthropic 官方建议「Start at the top of your difficulty range」—挑一个原本你不会派给 Opus 4.8 的难题，让 Fable 5 自己 scope、问澄清问题、执行到完。用简单任务测试 Fable 5 只会 undersell 它的能力。

Step 2:建立 verifier subagent 回圈。不要靠 Fable 5 自我批评；派 fresh-context 子代理定期验证主 agent 的输出。这是 loop engineering 的核心。设定验证间隔（例如每完成一个 subtask、每 30 分钟、每花 100K tokens 一次），让子代理对照原始规格检查。

Step 3:建立 memory 档案，累积跨对话知识。给 Fable 一个 Markdown 档案作为 memory store，把每次对话学到的教训、修正、确认过的方法写入；每次启动让 Fable 读取这个档案。这是 Fable 5 相对前代模型最能发挥的优势之一。

Fable 5 的能力天花板远比 prompt 表面看起来高。多数用户低估它的原因，是还在用前代模型的 prompt 心法对待它—把它当一次性回答机、而不是一个持续运作的 loop 内节点。Loop engineering 是 2026 年 AI 开发的下一个学习曲线。

本文链接地址：https://www.wwsww.cn/rgzn/39758.html
郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。