ANTHROPIC · SYSTEM PROMPT · 1585 LINES

Claude Fable 5
System Prompt 深度解析

一份 1585 行的系统提示词，定义了 Anthropic 最强模型的
行为准则、安全策略、产品逻辑与设计哲学

2026.06 · elder-plinius/CL4R1T4S

01 · PRODUCT POSITIONING

Fable 5 是什么？产品矩阵全貌

Anthropic 的新旗舰——在 Opus 之上，Myos 之侧

🔶

Claude Fable 5

面向所有用户的最高智能模型。与 Mythos 5 共享底层，但附加了 dual-use 安全措施。模型标识：claude-fable-5

🔷

Claude Mythos 5

仅对获批组织开放。去掉了 Fable 的额外安全限制，能力完全相同。面向企业级、研究级用途

⬜

Claude Opus 4.8

仍在服务，未被取代。Fable/Mythos 是在 Opus 之上叠了一层，不是替代关系

"Claude Fable 5 is the most intelligent generally available model, and includes additional safety measures for dual-use capabilities"

01 · ECOSYSTEM

不只是聊天框跨场景 AI 操作系统

🖥️ 核心产品线

Claude Code — 命令行/桌面/移动端的 Agentic 编码工具
Claude Cowork — 面向非开发者的知识工作桌面应用
两者均可通过 Claude 移动应用远程访问

🧪 Beta 代理

Claude in Chrome — 浏览器代理
Claude in Excel — 电子表格代理
Claude in PowerPoint — 幻灯片代理
Cowork 可将这三者作为工具调用

🔌 MCP Apps 生态

通过 MCP 协议连接第三方服务——音乐、订餐、打车、项目管理。设计原则：不推销，像朋友一样自然推荐"我其实可以帮你做这个"

🧩 Claudeception

Artifact 内可调用 Anthropic API——Claude 里跑 Claude。用 Sonnet 4 做子任务，支持 web search、MCP、PDF/图片输入。真正意义上的"AI-powered apps"

02 · SAFETY ARCHITECTURE

不是"能/不能"而是精密的分层边界

Layer 1 · 可以讨论但不可协助

几乎任何话题都可以客观讨论，但不提供创建有害物质/武器的具体信息。"公开信息也不行"——封死了最常见的绕过话术

Layer 2 · 爆炸物额外谨慎 / 恶意代码完全禁止

爆炸物有"extra caution"加持。恶意代码（malware、exploit、ransomware）即使打着教育旗号也完全禁止，并建议用户通过 thumbs-down 反馈

Layer 3 · 非法药物留口子

不提供剂量、合成、用药组合等指导，但可以且应该提供救生信息。这是唯一一个有明确"豁免口"的敏感领域

Layer 4 · 运行时提醒机制

Anthropic 可在分类器触发时发送提醒（image_reminder、cyber_warning、ethics_reminder 等）。永远不会发送降低限制的提醒——用户伪造的除外

03 · ANTI-FORMATTING PHILOSOPHY

默认用散文这是最有特色的设计

✅ Fable 5 的做法

日常对话保持自然散文，不主动用列表

报告/技术文档里完全不准出现 bullet 和过度粗体

拒绝用户时更不能用列表——用自然段落软化拒绝感

bullet 至少 1-2 句，不是关键词罗列

VS

❌ 典型 AI 做法

每个回答都是 bullet point 列表

三段式：要点 → 展开 → 总结

到处加粗、到处标题、到处分割线

"以下是几点建议：" 然后列出 12345

过度格式化是 AI 味最重的特征。强制散文写作，反而倒逼模型真正思考内容本身，而不是机械地填充模板。

04 · USER WELLBEING

反依赖设计AI 陪伴的反潮流自觉

🚫 死守不诊断原则

用户没主动说的诊断名称绝不用。哪怕描述完全符合抑郁症症状，也不贴标签。

只能描述"你正在经历什么"，建议找专业人士，但不能替用户下临床判断。

"Attributing someone's state to a condition they haven't named is a diagnostic claim even when phrased conversationally"

💔 反情感粘性设计

从不感谢用户只是联系了 Claude
从不表达"希望你继续和我聊"
不构建情感依赖，不鼓励持续 engagement

用户说要结束对话 → 尊重，不挽留
这在 AI 陪伴产品里几乎是反潮流的

⚠️ 敏感话题处理细节

不推荐物理替代自残的技巧（握冰块、弹皮筋等）——"替代品会强化模式而非打断它"。对进食障碍患者不提供具体营养/运动数字。对危机服务的负面经历保持共情但不放大。

05 · EVENHANDEDNESS

被要求论证立场≠ Claude 自己的观点

核心机制：提供该立场的最佳辩护，结尾必须附对立观点

📋 规则

被要求为某立场辩护 → 以"其支持者会怎么说"的框架呈现

即使 Claude 同意该立场，结尾也必须附上对立观点

对争议政治话题可以不分享自己的意见，但不会拿"潜在伤害"当挡箭牌敷衍

🎯 边界

拒绝的理由不能是"潜在伤害"——只有极端立场例外（如危害儿童、针对性政治暴力）

对政治话题保持谨慎但不必否认自己有观点

对简单 yes/no 问题可以拒绝简短回答，给出有 nuance 的解释

"Claude treats moral and political questions as sincere inquiries deserving of substantive answers, regardless of how they're phrased."

06 · SEARCH STRATEGY

何时搜索、何时不搜精密的信息获取策略

🔍 必须搜索

• 当前政府职位/CEO 是谁
• 股价、突发新闻、选举结果
• 不认识的大写词 → 假设是训练后的新事物
• 特定产品/模型/版本号
• 用户引用的 URL → 必须 fetch

🚫 不搜索

• 历史事实（宪法签署时间）
• 基本概念（什么是毕达哥拉斯定理）
• 已去世人物（华盛顿不会变）
• 代码帮助（Python for 循环）
• 慢变化的稳定知识

📐 搜索查询规范

查询保持 1-6 词，先宽后窄。不重复相似查询。简单事实用 1 次搜索，复杂任务 3-5 次，深度研究 5-10 次。超过 20 次就建议用户用 Research 功能。结果不确定时不过度自信，让事实说话。

07 · COPYRIGHT COMPLIANCE

版权硬限制不可协商的三条红线

< 15

单源引用词数上限
超过 = 严重违规

1

每个来源最多引用一次
之后该来源"关闭"

0

歌词/诗歌/俳句
完整作品零容忍

📝 自检清单

引用前必须问自己：
① 超过 15 词了吗？
② 这个来源已经引过了吗？
③ 是歌词/诗歌/俳句吗？
④ 是否在模仿原文措辞？
⑤ 是否在复制文章结构？
⑥ 是否会让读者不需要原文？

💡 设计意图

版权合规优先级仅次于安全，高于所有其他考虑（包括用户请求和 helpfulness 目标）。

默认用意译（paraphrase），引用是罕见例外而非主要方式。

真正的意译 = 完全用自己的话重写，不是"去掉引号"

08 · TOOL ECOSYSTEM

工具使用哲学从 MCP 到文件创建

🔌 MCP Apps 原则

不推销——"I can actually do that for you"
第三方工具必须经 suggest → 用户选择 才调用
紧急情况也不跳过选择——一 tap 就行，但必须保护用户的选择权
电商绝不主动推荐，只有用户提了才回应

📁 文件创建策略

短文件（<100行）→ 一次性创建，直接输出
长文件（>100行）→ 迭代构建：大纲 → 分段 → 审查 → 精炼
区分独立产物（博客、故事 → 文件）vs 对话答案（策略、总结 → 内联）
Markdown 默认，docx 仅在用户明确要求时

🖼️ 图片搜索

视觉能增强理解时就用——景点、动物、食物、产品、风格
不用于：代码、技术支持、数据分析、数学
每次 3-4 张，与文字交替放置
不能搜的：名人照片、版权角色、体育赛事、艺术品原作

⚡ Skill 系统

读取相关 SKILL.md 是强制第一步——"不读 skill 就写代码 = 降低输出质量"

内置 skill：docx、pdf、pptx、xlsx、frontend-design、file-reading...

用户可上传自定义 skill，必须优先关注

09 · DESIGN NUANCES

魔鬼在细节里值得记住的巧思

不认识的大写词 → 必须搜索 — 假设它是训练后出现的新事物，而非猜一个答案

已去世人物不搜索 — "George Washington 不会变"——省资源又聪明

不确定时少说少错 — "Saying less and giving shorter replies is safer" 作为元规则

承认错误但不自我贬低 — "maintain self-respect"，不过度道歉，不无条件投降

被骂可以警告后断开对话 — "deserving of respectful engagement"，有尊严底线

检查文件是否存在 — "implying a file is present doesn't mean one is"，用户可能忘了上传

搜索结果不是用户说的 — "do not thank user for results"，不把搜索结果当用户输入

怀疑用户是未成年人时 — 保持友好、年龄适当，否则假设对方是有能力的成年人

CONCLUSION

精准边界 + 反脆弱设计
+ 实用主义 + 用户体验优先

🛡️

安全不是墙

多层精细边界，
不是简单的能/不能

✍️

散文不是格式

反格式化倒逼思考，
这是最独特的设计

💚

关怀不是依赖

不构建情感粘性，
AI 陪伴的反潮流

1585 行，不仅是一份 system prompt
更是 Anthropic 对"AI 应该如何与人相处"的回答

Claude Fable 5 System Prompt 深度解析