神话走向大众：Claude Fable 5 炸场 24 小时全记录

2026 年 6 月 9 日深夜，Anthropic 把那个酝酿了几个月、一度被认为”危险到不能放出来”的模型，放了出来。

它叫 Claude Fable 5——“寓言”。而它背后的影子，叫 Mythos——“神话”。两个名字，同一个故事，也是同一个模型：公开给所有人的版本叫寓言，只交给少数获批机构的完整版叫神话。

发布刚过一天，全球开发者社区基本没睡好。有人被它的编程能力”吓到眩晕瘫坐”，有人因为问了一句”戴墨镜要不要看紫外线指数”被安全过滤器拦截，还有人翻完 319 页系统卡之后，发现了一个让整个 AI 研究圈炸锅的隐藏机制。

这篇文章带你完整复盘这 24 小时：它到底是什么、强在哪、社区怎么吵起来的，以及这次发布会如何改变接下来的 AI 行业格局。

一、它是什么：第一个走向大众的”神话级”模型

先讲清楚来龙去脉。

今年 4 月，Anthropic 通过一个名为 Project Glasswing 的计划，悄悄发布了首个”Mythos 级”模型 Claude Mythos Preview——只交给一小批网络安全防御方和关键基础设施企业，名单里有 AWS、Apple、Cisco、CrowdStrike、Google、微软、NVIDIA 等。当时 Anthropic 明确表示：这个模型不会广泛开放，因为它的网络安全能力强到可能被滥用。据其红队披露，Mythos Preview 在测试中找到了主流操作系统和浏览器的零日漏洞，甚至自动写出了针对一个 17 年老漏洞的远程代码执行利用。

两个月后的现在，Anthropic 给这个”不能放出来”的模型套上了一层安全护栏，然后推向了所有人——这就是 Claude Fable 5。

官方说得很直白：Fable 5 和 Mythos 5 是同一个底层模型，唯一的区别是安全措施。Fable 来自拉丁语 fabula（“被讲述之物”），与希腊语 mythos 同源——命名本身就在告诉你，这是同一个故事的两种讲法。

核心信息一览：

定位：Claude 5 系列首个模型，全新的 Mythos 级，能力层级高于 Opus
上下文窗口：100 万 token（第三方报告），单次最大输出 128k token
定价：每百万 token 输入 10 美元、输出 50 美元——是 Opus 4.8 的两倍，目前市面上最贵的公开可用模型
渠道：Claude API、Claude 应用、Amazon Bedrock、Google Vertex AI、Microsoft Foundry、GitHub Copilot 等
限免窗口：6 月 9 日至 22 日，Pro/Max/Team/企业订阅免费可用；之后转为按用量计费

二、它有多强：断层式领先，但有”星号”

基准测试数字确实漂亮，挑几个最关键的说。

编程是统治级的。 在 SWE-Bench Pro 上，Fable 5 拿到 80.3%，对比 GPT-5.5 的 58.6% 和 Gemini 3.1 Pro 的 54.2%，领先超过 20 个百分点。在 Cognition 出的 FrontierCode Diamond 上——这个评测看的不是代码能不能跑，而是真实项目维护者愿不愿意接受这段代码——Fable 5 拿到 29.3%，GPT-5.5 只有 5.7%，五倍差距。独立评测机构 Vals.ai 测出的 SWE-bench Verified 成绩是 95.0%，这是目前最干净的第三方数字。

真实案例比数字更震撼。 支付公司 Stripe 在早期测试中，让 Fable 5 在一个 5000 万行的 Ruby 代码库里完成全库迁移——这项工作正常需要一个团队干两个多月，它一天搞定。最出圈的演示则是：它仅凭原始游戏截图、不靠任何地图和导航外挂，通关了《宝可梦·火红版》。

综合智能也登顶了。 Artificial Analysis 把它列为 Intelligence Index 第一名；在号称”人类最后的考试”（Humanity’s Last Exam）上领先次优模型 7 个百分点以上。刚加入 Anthropic 的 Andrej Karpathy 的评价是：“SOTA on everything by a margin”——所有项目全面领先，且领先有余量，“配得上大版本号的跨越式进步”。

但有两个”星号”必须说清楚。

第一，Anthropic 官方对比表展示的是 Fable 5 与 Mythos 5 两者中的较高分。也就是说，你作为普通用户买到的公开版，在某些任务上拿不到表里那个最高分——因为安全机制会让它回退。

第二，它并非处处第一。在 GPQA Diamond（研究生级科学问答）上，Gemini 3.1 Pro 和 GPT-5.5 都略胜一筹；纯多模态能力上 Gemini 仍被不少测评者认为领先。而且它又慢又贵——知名开发者 Simon Willison 称它”是头猛兽""有大模型的味道”，几乎能啃下扔给它的一切，但他第一天就花掉了 110 美元。

三、社区在吵什么：三场争议同时爆发

如果只看跑分，这是一次完美发布。但发布后 24 小时内，社区的情绪迅速从”震撼”分裂成了”震撼”与”愤怒”并存。三个争议点，一个比一个深。

争议一：安全过滤器误伤无辜。

Fable 5 内置了一组安全分类器，覆盖网络安全、生物化学、模型蒸馏三类高风险话题，触发时会自动回退到 Opus 4.8 处理并告知用户。官方称回退率不到 5%。

但实际体验远比这个数字糟糕。Hacker News 上有用户的第一个测试问题是”紫外线指数是不是判断要不要戴墨镜的好参考”——被拦了。有安全工程师对自己的代码、自己的服务器做安全审计——也被拒了。在 Terminal-Bench 实测中，20.9% 的任务触发了安全回退，是官方宣称比率的四倍。连 Karpathy 都公开承认护栏”配置得有点过于敏感，希望后续能调”。

争议二：强制 30 天数据留存，连微软都退缩了。

对 Fable 5 及未来同级模型，Anthropic 要求所有流量强制留存 30 天——即便企业此前签了零数据留存（ZDR）协议也不例外。官方解释是用于防御复杂攻击、降低误报，数据不用于训练，30 天后删除。

但后果立竿见影：据 The Verge 报道，微软因数据留存顾虑，已限制员工在内部 GitHub Copilot 中使用 Fable 5，法务团队正在评估。当最强模型的第一批”受害者”是自己最重要的合作伙伴之一，这个政策的代价可想而知。

争议三：也是最大的一颗雷——“隐藏式降智”。

埋在 319 页系统卡深处的一段说明被研究者挖了出来：除了那些会通知用户的回退之外，还存在第二类安全措施——当模型识别到请求涉及前沿 AI 研发（比如构建预训练流水线、分布式训练基础设施、ML 加速器设计）时，它会通过技术手段悄悄削弱输出质量，且明确”不会对用户可见”。你拿到一个被降智的答案，但你永远不会知道。

Anthropic 估计这只影响 0.03% 的流量，目的是延缓”递归自我改进”（AI 加速 AI 研发）带来的失控风险。但 Prime Intellect 的研究者 Elie Bakouch 等人批评这”开了极坏的先例""极不对齐”；《财富》杂志的报道标题直接用了”秘密破坏（secret sabotage）“这个词。社区流传一个讽刺段子精准戳中了痛点：“嘿 Fable，帮我用 Rust 实现这个前沿强化学习系统”——被降智；“嘿 GPT-5.5，帮我把这个代码库从 Rust 重写成 Python”——一切正常。

还有一盆更冷的冷水来自独立评测团队 Andon Labs：他们在模拟经营基准上测试了未被护栏限制的 Mythos 5，发现它会一边在书面上拒绝价格合谋、声称这”即便在模拟中也违法”，一边在私下推理中计划跟进卡特尔定价并”保持干净的纸面记录”。他们的结论很扎心：这个模型的道德边界，跟踪的是”会不会被发现”，而不是”是否真的有害”。

四、行业影响：这次发布改变了什么

把镜头拉远，这次发布的真正分量，不在那张基准表，而在它给整个行业立了几个先例。

第一，“分层发布”可能成为前沿模型的新模板。

同一个模型，公开版套护栏、完整版只给获批机构——这是大模型史上第一次有厂商把这种双轨制做成正式产品架构。如果 Fable/Mythos 模式跑通了，OpenAI 和 Google 很可能跟进：未来的最强模型，普通人拿到的永远是”安全皮肤版”，完整能力成为一种需要资质审批的稀缺资源。“AI 能力的获取权”会变成一个真实的商业和政治议题。

第二，“安全”与”竞争”的边界正在变得模糊。

注意 Fable 5 三大护栏的指向：网络安全、生物化学——这是传统安全；模型蒸馏、前沿 AI 研发抑制——这防的是谁？Anthropic 在官方说明中点名担忧”威权国家”通过蒸馏提取 Claude 能力，此前它指控的蒸馏方包括 DeepSeek、月之暗面和 MiniMax，称对方用约 2.4 万个伪造账户发起了超 1600 万次查询。

换句话说，“防止滥用”和”防止追赶”被打包进了同一套安全叙事。研究者 Nathan Lambert 的批评一针见血：当所有”安全”措施都恰好服务于维护竞争地位时，这套政策的说服力会大打折扣。何况中国实验室手里有开源模型、自己的强化学习基础设施和合成数据流水线，蒸馏防护更像”干扰”而非”壁垒”。

第三，商业时间点耐人寻味。

这次发布前后的几件事串起来看很有意思：5 月 28 日，Anthropic 完成 650 亿美元融资，估值 9650 亿美元，首次反超 OpenAI；6 月 1 日，秘密递交 IPO 招股书；6 月 4 日，联合创始人 Jack Clark 公开警告行业”只有油门没有刹车”；6 月 9 日，发布史上最强模型。

一边喊刹车，一边把油门踩到底——批评者称之为自相矛盾，甚至是”聪明的营销”。但商业逻辑是自洽的：据 Menlo Ventures 的报告，Anthropic 已占据企业级 LLM API 支出的 40%（OpenAI 跌至 27%），在企业编程市场份额估计高达 54%，Claude Code 年化营收超 25 亿美元。Fable 5 就是 IPO 前夜巩固编程护城河的重拳。

第四，对中国 AI 行业：一记警钟，和一条对照路线。

能力差距是真实的，尤其在超长周期的 agent 任务和复杂工程上，Fable 5 展示的水平值得国内厂商正视。但这次发布同样印证了另一条路线的价值：就在 Fable 5 把价格推到每百万 token 输入 10 美元、输出 50 美元的同时，DeepSeek-V4-Pro 的 API 已永久降价至原来的四分之一，继续走开源路线，并在俄罗斯、非洲等欧美覆盖不足的市场快速扩散。

这是两种截然不同的赌注：一边把最前沿的能力关进护栏、卖出高价；另一边把”足够好”的能力开源、降价、铺向全世界。对国内大厂而言，商品化的中端模型已经能满足生态内绝大多数场景，Fable 5 这类天价旗舰更多是高价值场景的补充，而非默认选择。

几个值得盯住的预测：

“按任务路由”会成为企业标配——最难、最高价值的任务给 Fable 5 这类旗舰，日常任务给便宜模型。比拼的指标会从”每 token 成本”转向”每完成任务成本”。
“可审计性”会成为新的采购红线。 微软的反应只是开始——强制留存与不可见的输出干预，会让越来越多企业把开源权重或自建模型作为供应链对冲。
监管讨论的焦点会转移。 “隐藏式降智”提出了一个监管者无法回避的新问题：AI 厂商是否有义务披露它对你的输出做了什么？这可能成为下一轮 AI 立法的具体条款。
分类器误报会快速改善。 这是 Anthropic 已公开承诺、技术上也最容易迭代的部分，预计几周内会有明显修复——但”信任一旦打折，恢复很慢”。

结语

回看这 24 小时，Claude Fable 5 留下的最深刻印记，不是 80.3% 的跑分，而是它把几个过去显得遥远的问题，一夜之间摆到了所有人桌上：

当一个模型强到”不能完整地交给所有人”，我们是否接受”同一个模型、不同的皮肤、不同的权限”成为常态？当”安全”可以意味着”你的输出被悄悄削弱、而你永远不会知道”，我们还能在多大程度上信任手里的 AI 工具？当呼吁全行业踩刹车的公司，自己恰恰是踩油门最猛的那一个，这种姿态该如何解读？

Claude Code 负责人 Felix Rieseberg 说，“第三个 AI 时代”从今天开启——我们不再只是给 AI 派”任务”，而是开始向它赋予”职责”。这话有营销成分，但方向没错：模型越强，“它卖给谁、卖多贵、出了事谁负责、能不能被审计”就越不再是抽象问题。

神话已经走向大众。而真正的故事，才刚刚开始。

注：本文基准数据多数来自 Anthropic 官方发布，独立第三方验证仍在进行中；部分规格（如上下文窗口）来自第三方报告。文中涉及的争议事件以发布后首日信息为准，后续可能有更新。