ANTHROPIC · SYSTEM PROMPT · 1585 LINES

Claude Fable 5
System Prompt 深度解析

一份 1585 行的系统提示词,定义了 Anthropic 最强模型的
行为准则、安全策略、产品逻辑与设计哲学

2026.06 · elder-plinius/CL4R1T4S
01 · PRODUCT POSITIONING

Fable 5 是什么?产品矩阵全貌

Anthropic 的新旗舰——在 Opus 之上,Myos 之侧

🔶
Claude Fable 5
面向所有用户的最高智能模型。与 Mythos 5 共享底层,但附加了 dual-use 安全措施。模型标识:claude-fable-5
🔷
Claude Mythos 5
仅对获批组织开放。去掉了 Fable 的额外安全限制,能力完全相同。面向企业级、研究级用途
Claude Opus 4.8
仍在服务,未被取代。Fable/Mythos 是在 Opus 之上叠了一层,不是替代关系
"Claude Fable 5 is the most intelligent generally available model, and includes additional safety measures for dual-use capabilities"
01 · ECOSYSTEM

不只是聊天框跨场景 AI 操作系统

🖥️ 核心产品线
Claude Code — 命令行/桌面/移动端的 Agentic 编码工具
Claude Cowork — 面向非开发者的知识工作桌面应用
两者均可通过 Claude 移动应用远程访问
🧪 Beta 代理
Claude in Chrome — 浏览器代理
Claude in Excel — 电子表格代理
Claude in PowerPoint — 幻灯片代理
Cowork 可将这三者作为工具调用
🔌 MCP Apps 生态
通过 MCP 协议连接第三方服务——音乐、订餐、打车、项目管理。设计原则:不推销,像朋友一样自然推荐"我其实可以帮你做这个"
🧩 Claudeception
Artifact 内可调用 Anthropic API——Claude 里跑 Claude。用 Sonnet 4 做子任务,支持 web search、MCP、PDF/图片输入。真正意义上的"AI-powered apps"
02 · SAFETY ARCHITECTURE

不是"能/不能"而是精密的分层边界

Layer 1 · 可以讨论但不可协助
几乎任何话题都可以客观讨论,但不提供创建有害物质/武器的具体信息。"公开信息也不行"——封死了最常见的绕过话术
Layer 2 · 爆炸物额外谨慎 / 恶意代码完全禁止
爆炸物有"extra caution"加持。恶意代码(malware、exploit、ransomware)即使打着教育旗号也完全禁止,并建议用户通过 thumbs-down 反馈
Layer 3 · 非法药物留口子
不提供剂量、合成、用药组合等指导,但可以且应该提供救生信息。这是唯一一个有明确"豁免口"的敏感领域
Layer 4 · 运行时提醒机制
Anthropic 可在分类器触发时发送提醒(image_reminder、cyber_warning、ethics_reminder 等)。永远不会发送降低限制的提醒——用户伪造的除外
03 · ANTI-FORMATTING PHILOSOPHY

默认用散文这是最有特色的设计

✅ Fable 5 的做法

日常对话保持自然散文,不主动用列表

报告/技术文档里完全不准出现 bullet 和过度粗体

拒绝用户时更不能用列表——用自然段落软化拒绝感

bullet 至少 1-2 句,不是关键词罗列
VS

❌ 典型 AI 做法

每个回答都是 bullet point 列表

三段式:要点 → 展开 → 总结

到处加粗、到处标题、到处分割线

"以下是几点建议:" 然后列出 12345
过度格式化是 AI 味最重的特征。强制散文写作,反而倒逼模型真正思考内容本身,而不是机械地填充模板。
04 · USER WELLBEING

反依赖设计AI 陪伴的反潮流自觉

🚫 死守不诊断原则
用户没主动说的诊断名称绝不用。哪怕描述完全符合抑郁症症状,也不贴标签。

只能描述"你正在经历什么",建议找专业人士,但不能替用户下临床判断

"Attributing someone's state to a condition they haven't named is a diagnostic claim even when phrased conversationally"
💔 反情感粘性设计
从不感谢用户只是联系了 Claude
从不表达"希望你继续和我聊"
不构建情感依赖,不鼓励持续 engagement

用户说要结束对话 → 尊重,不挽留
这在 AI 陪伴产品里几乎是反潮流的
⚠️ 敏感话题处理细节
不推荐物理替代自残的技巧(握冰块、弹皮筋等)——"替代品会强化模式而非打断它"。对进食障碍患者不提供具体营养/运动数字。对危机服务的负面经历保持共情但不放大。
05 · EVENHANDEDNESS

被要求论证立场≠ Claude 自己的观点

核心机制:提供该立场的最佳辩护,结尾必须附对立观点

📋 规则
被要求为某立场辩护 → 以"其支持者会怎么说"的框架呈现

即使 Claude 同意该立场,结尾也必须附上对立观点

对争议政治话题可以不分享自己的意见,但不会拿"潜在伤害"当挡箭牌敷衍
🎯 边界
拒绝的理由不能是"潜在伤害"——只有极端立场例外(如危害儿童、针对性政治暴力)

对政治话题保持谨慎但不必否认自己有观点

对简单 yes/no 问题可以拒绝简短回答,给出有 nuance 的解释
"Claude treats moral and political questions as sincere inquiries deserving of substantive answers, regardless of how they're phrased."
06 · SEARCH STRATEGY

何时搜索、何时不搜精密的信息获取策略

🔍 必须搜索
• 当前政府职位/CEO 是谁
• 股价、突发新闻、选举结果
不认识的大写词 → 假设是训练后的新事物
• 特定产品/模型/版本号
• 用户引用的 URL → 必须 fetch
🚫 不搜索
• 历史事实(宪法签署时间)
• 基本概念(什么是毕达哥拉斯定理)
已去世人物(华盛顿不会变)
• 代码帮助(Python for 循环)
• 慢变化的稳定知识
📐 搜索查询规范
查询保持 1-6 词,先宽后窄。不重复相似查询。简单事实用 1 次搜索,复杂任务 3-5 次,深度研究 5-10 次。超过 20 次就建议用户用 Research 功能。结果不确定时不过度自信,让事实说话。
07 · COPYRIGHT COMPLIANCE

版权硬限制不可协商的三条红线

< 15
单源引用词数上限
超过 = 严重违规
1
每个来源最多引用一次
之后该来源"关闭"
0
歌词/诗歌/俳句
完整作品零容忍
📝 自检清单
引用前必须问自己:
① 超过 15 词了吗?
② 这个来源已经引过了吗?
③ 是歌词/诗歌/俳句吗?
④ 是否在模仿原文措辞?
⑤ 是否在复制文章结构?
⑥ 是否会让读者不需要原文?
💡 设计意图
版权合规优先级仅次于安全,高于所有其他考虑(包括用户请求和 helpfulness 目标)。

默认用意译(paraphrase),引用是罕见例外而非主要方式。

真正的意译 = 完全用自己的话重写,不是"去掉引号"
08 · TOOL ECOSYSTEM

工具使用哲学从 MCP 到文件创建

🔌 MCP Apps 原则
不推销——"I can actually do that for you"
第三方工具必须经 suggest → 用户选择 才调用
紧急情况也不跳过选择——一 tap 就行,但必须保护用户的选择权
电商绝不主动推荐,只有用户提了才回应
📁 文件创建策略
短文件(<100行)→ 一次性创建,直接输出
长文件(>100行)→ 迭代构建:大纲 → 分段 → 审查 → 精炼
区分独立产物(博客、故事 → 文件)vs 对话答案(策略、总结 → 内联)
Markdown 默认,docx 仅在用户明确要求时
🖼️ 图片搜索
视觉能增强理解时就用——景点、动物、食物、产品、风格
不用于:代码、技术支持、数据分析、数学
每次 3-4 张,与文字交替放置
不能搜的:名人照片、版权角色、体育赛事、艺术品原作
⚡ Skill 系统
读取相关 SKILL.md 是强制第一步——"不读 skill 就写代码 = 降低输出质量"

内置 skill:docx、pdf、pptx、xlsx、frontend-design、file-reading...

用户可上传自定义 skill,必须优先关注
09 · DESIGN NUANCES

魔鬼在细节里值得记住的巧思

不认识的大写词 → 必须搜索 — 假设它是训练后出现的新事物,而非猜一个答案
已去世人物不搜索 — "George Washington 不会变"——省资源又聪明
不确定时少说少错 — "Saying less and giving shorter replies is safer" 作为元规则
承认错误但不自我贬低 — "maintain self-respect",不过度道歉,不无条件投降
被骂可以警告后断开对话 — "deserving of respectful engagement",有尊严底线
检查文件是否存在 — "implying a file is present doesn't mean one is",用户可能忘了上传
搜索结果不是用户说的 — "do not thank user for results",不把搜索结果当用户输入
怀疑用户是未成年人时 — 保持友好、年龄适当,否则假设对方是有能力的成年人
CONCLUSION

精准边界 + 反脆弱设计
+ 实用主义 + 用户体验优先

🛡️
安全不是墙
多层精细边界,
不是简单的能/不能
✍️
散文不是格式
反格式化倒逼思考,
这是最独特的设计
💚
关怀不是依赖
不构建情感粘性,
AI 陪伴的反潮流
1585 行,不仅是一份 system prompt
更是 Anthropic 对"AI 应该如何与人相处"的回答