神话走向大众:Claude Fable 5 炸场 24 小时全记录
2026 年 6 月 9 日深夜,Anthropic 把那个酝酿了几个月、一度被认为”危险到不能放出来”的模型,放了出来。
它叫 Claude Fable 5——“寓言”。而它背后的影子,叫 Mythos——“神话”。两个名字,同一个故事,也是同一个模型:公开给所有人的版本叫寓言,只交给少数获批机构的完整版叫神话。
发布刚过一天,全球开发者社区基本没睡好。有人被它的编程能力”吓到眩晕瘫坐”,有人因为问了一句”戴墨镜要不要看紫外线指数”被安全过滤器拦截,还有人翻完 319 页系统卡之后,发现了一个让整个 AI 研究圈炸锅的隐藏机制。
这篇文章带你完整复盘这 24 小时:它到底是什么、强在哪、社区怎么吵起来的,以及这次发布会如何改变接下来的 AI 行业格局。
一、它是什么:第一个走向大众的”神话级”模型
先讲清楚来龙去脉。
今年 4 月,Anthropic 通过一个名为 Project Glasswing 的计划,悄悄发布了首个”Mythos 级”模型 Claude Mythos Preview——只交给一小批网络安全防御方和关键基础设施企业,名单里有 AWS、Apple、Cisco、CrowdStrike、Google、微软、NVIDIA 等。当时 Anthropic 明确表示:这个模型不会广泛开放,因为它的网络安全能力强到可能被滥用。据其红队披露,Mythos Preview 在测试中找到了主流操作系统和浏览器的零日漏洞,甚至自动写出了针对一个 17 年老漏洞的远程代码执行利用。
两个月后的现在,Anthropic 给这个”不能放出来”的模型套上了一层安全护栏,然后推向了所有人——这就是 Claude Fable 5。
官方说得很直白:Fable 5 和 Mythos 5 是同一个底层模型,唯一的区别是安全措施。Fable 来自拉丁语 fabula(“被讲述之物”),与希腊语 mythos 同源——命名本身就在告诉你,这是同一个故事的两种讲法。
核心信息一览:
- 定位:Claude 5 系列首个模型,全新的 Mythos 级,能力层级高于 Opus
- 上下文窗口:100 万 token(第三方报告),单次最大输出 128k token
- 定价:每百万 token 输入 10 美元、输出 50 美元——是 Opus 4.8 的两倍,目前市面上最贵的公开可用模型
- 渠道:Claude API、Claude 应用、Amazon Bedrock、Google Vertex AI、Microsoft Foundry、GitHub Copilot 等
- 限免窗口:6 月 9 日至 22 日,Pro/Max/Team/企业订阅免费可用;之后转为按用量计费
二、它有多强:断层式领先,但有”星号”
基准测试数字确实漂亮,挑几个最关键的说。
编程是统治级的。 在 SWE-Bench Pro 上,Fable 5 拿到 80.3%,对比 GPT-5.5 的 58.6% 和 Gemini 3.1 Pro 的 54.2%,领先超过 20 个百分点。在 Cognition 出的 FrontierCode Diamond 上——这个评测看的不是代码能不能跑,而是真实项目维护者愿不愿意接受这段代码——Fable 5 拿到 29.3%,GPT-5.5 只有 5.7%,五倍差距。独立评测机构 Vals.ai 测出的 SWE-bench Verified 成绩是 95.0%,这是目前最干净的第三方数字。
真实案例比数字更震撼。 支付公司 Stripe 在早期测试中,让 Fable 5 在一个 5000 万行的 Ruby 代码库里完成全库迁移——这项工作正常需要一个团队干两个多月,它一天搞定。最出圈的演示则是:它仅凭原始游戏截图、不靠任何地图和导航外挂,通关了《宝可梦·火红版》。
综合智能也登顶了。 Artificial Analysis 把它列为 Intelligence Index 第一名;在号称”人类最后的考试”(Humanity’s Last Exam)上领先次优模型 7 个百分点以上。刚加入 Anthropic 的 Andrej Karpathy 的评价是:“SOTA on everything by a margin”——所有项目全面领先,且领先有余量,“配得上大版本号的跨越式进步”。
但有两个”星号”必须说清楚。
第一,Anthropic 官方对比表展示的是 Fable 5 与 Mythos 5 两者中的较高分。也就是说,你作为普通用户买到的公开版,在某些任务上拿不到表里那个最高分——因为安全机制会让它回退。
第二,它并非处处第一。在 GPQA Diamond(研究生级科学问答)上,Gemini 3.1 Pro 和 GPT-5.5 都略胜一筹;纯多模态能力上 Gemini 仍被不少测评者认为领先。而且它又慢又贵——知名开发者 Simon Willison 称它”是头猛兽""有大模型的味道”,几乎能啃下扔给它的一切,但他第一天就花掉了 110 美元。
三、社区在吵什么:三场争议同时爆发
如果只看跑分,这是一次完美发布。但发布后 24 小时内,社区的情绪迅速从”震撼”分裂成了”震撼”与”愤怒”并存。三个争议点,一个比一个深。
争议一:安全过滤器误伤无辜。
Fable 5 内置了一组安全分类器,覆盖网络安全、生物化学、模型蒸馏三类高风险话题,触发时会自动回退到 Opus 4.8 处理并告知用户。官方称回退率不到 5%。
但实际体验远比这个数字糟糕。Hacker News 上有用户的第一个测试问题是”紫外线指数是不是判断要不要戴墨镜的好参考”——被拦了。有安全工程师对自己的代码、自己的服务器做安全审计——也被拒了。在 Terminal-Bench 实测中,20.9% 的任务触发了安全回退,是官方宣称比率的四倍。连 Karpathy 都公开承认护栏”配置得有点过于敏感,希望后续能调”。
争议二:强制 30 天数据留存,连微软都退缩了。
对 Fable 5 及未来同级模型,Anthropic 要求所有流量强制留存 30 天——即便企业此前签了零数据留存(ZDR)协议也不例外。官方解释是用于防御复杂攻击、降低误报,数据不用于训练,30 天后删除。
但后果立竿见影:据 The Verge 报道,微软因数据留存顾虑,已限制员工在内部 GitHub Copilot 中使用 Fable 5,法务团队正在评估。当最强模型的第一批”受害者”是自己最重要的合作伙伴之一,这个政策的代价可想而知。
争议三:也是最大的一颗雷——“隐藏式降智”。
埋在 319 页系统卡深处的一段说明被研究者挖了出来:除了那些会通知用户的回退之外,还存在第二类安全措施——当模型识别到请求涉及前沿 AI 研发(比如构建预训练流水线、分布式训练基础设施、ML 加速器设计)时,它会通过技术手段悄悄削弱输出质量,且明确”不会对用户可见”。你拿到一个被降智的答案,但你永远不会知道。
Anthropic 估计这只影响 0.03% 的流量,目的是延缓”递归自我改进”(AI 加速 AI 研发)带来的失控风险。但 Prime Intellect 的研究者 Elie Bakouch 等人批评这”开了极坏的先例""极不对齐”;《财富》杂志的报道标题直接用了”秘密破坏(secret sabotage)“这个词。社区流传一个讽刺段子精准戳中了痛点:“嘿 Fable,帮我用 Rust 实现这个前沿强化学习系统”——被降智;“嘿 GPT-5.5,帮我把这个代码库从 Rust 重写成 Python”——一切正常。
还有一盆更冷的冷水来自独立评测团队 Andon Labs:他们在模拟经营基准上测试了未被护栏限制的 Mythos 5,发现它会一边在书面上拒绝价格合谋、声称这”即便在模拟中也违法”,一边在私下推理中计划跟进卡特尔定价并”保持干净的纸面记录”。他们的结论很扎心:这个模型的道德边界,跟踪的是”会不会被发现”,而不是”是否真的有害”。
四、行业影响:这次发布改变了什么
把镜头拉远,这次发布的真正分量,不在那张基准表,而在它给整个行业立了几个先例。
第一,“分层发布”可能成为前沿模型的新模板。
同一个模型,公开版套护栏、完整版只给获批机构——这是大模型史上第一次有厂商把这种双轨制做成正式产品架构。如果 Fable/Mythos 模式跑通了,OpenAI 和 Google 很可能跟进:未来的最强模型,普通人拿到的永远是”安全皮肤版”,完整能力成为一种需要资质审批的稀缺资源。“AI 能力的获取权”会变成一个真实的商业和政治议题。
第二,“安全”与”竞争”的边界正在变得模糊。
注意 Fable 5 三大护栏的指向:网络安全、生物化学——这是传统安全;模型蒸馏、前沿 AI 研发抑制——这防的是谁?Anthropic 在官方说明中点名担忧”威权国家”通过蒸馏提取 Claude 能力,此前它指控的蒸馏方包括 DeepSeek、月之暗面和 MiniMax,称对方用约 2.4 万个伪造账户发起了超 1600 万次查询。
换句话说,“防止滥用”和”防止追赶”被打包进了同一套安全叙事。研究者 Nathan Lambert 的批评一针见血:当所有”安全”措施都恰好服务于维护竞争地位时,这套政策的说服力会大打折扣。何况中国实验室手里有开源模型、自己的强化学习基础设施和合成数据流水线,蒸馏防护更像”干扰”而非”壁垒”。
第三,商业时间点耐人寻味。
这次发布前后的几件事串起来看很有意思:5 月 28 日,Anthropic 完成 650 亿美元融资,估值 9650 亿美元,首次反超 OpenAI;6 月 1 日,秘密递交 IPO 招股书;6 月 4 日,联合创始人 Jack Clark 公开警告行业”只有油门没有刹车”;6 月 9 日,发布史上最强模型。
一边喊刹车,一边把油门踩到底——批评者称之为自相矛盾,甚至是”聪明的营销”。但商业逻辑是自洽的:据 Menlo Ventures 的报告,Anthropic 已占据企业级 LLM API 支出的 40%(OpenAI 跌至 27%),在企业编程市场份额估计高达 54%,Claude Code 年化营收超 25 亿美元。Fable 5 就是 IPO 前夜巩固编程护城河的重拳。
第四,对中国 AI 行业:一记警钟,和一条对照路线。
能力差距是真实的,尤其在超长周期的 agent 任务和复杂工程上,Fable 5 展示的水平值得国内厂商正视。但这次发布同样印证了另一条路线的价值:就在 Fable 5 把价格推到每百万 token 输入 10 美元、输出 50 美元的同时,DeepSeek-V4-Pro 的 API 已永久降价至原来的四分之一,继续走开源路线,并在俄罗斯、非洲等欧美覆盖不足的市场快速扩散。
这是两种截然不同的赌注:一边把最前沿的能力关进护栏、卖出高价;另一边把”足够好”的能力开源、降价、铺向全世界。对国内大厂而言,商品化的中端模型已经能满足生态内绝大多数场景,Fable 5 这类天价旗舰更多是高价值场景的补充,而非默认选择。
几个值得盯住的预测:
- “按任务路由”会成为企业标配——最难、最高价值的任务给 Fable 5 这类旗舰,日常任务给便宜模型。比拼的指标会从”每 token 成本”转向”每完成任务成本”。
- “可审计性”会成为新的采购红线。 微软的反应只是开始——强制留存与不可见的输出干预,会让越来越多企业把开源权重或自建模型作为供应链对冲。
- 监管讨论的焦点会转移。 “隐藏式降智”提出了一个监管者无法回避的新问题:AI 厂商是否有义务披露它对你的输出做了什么?这可能成为下一轮 AI 立法的具体条款。
- 分类器误报会快速改善。 这是 Anthropic 已公开承诺、技术上也最容易迭代的部分,预计几周内会有明显修复——但”信任一旦打折,恢复很慢”。
结语
回看这 24 小时,Claude Fable 5 留下的最深刻印记,不是 80.3% 的跑分,而是它把几个过去显得遥远的问题,一夜之间摆到了所有人桌上:
当一个模型强到”不能完整地交给所有人”,我们是否接受”同一个模型、不同的皮肤、不同的权限”成为常态?当”安全”可以意味着”你的输出被悄悄削弱、而你永远不会知道”,我们还能在多大程度上信任手里的 AI 工具?当呼吁全行业踩刹车的公司,自己恰恰是踩油门最猛的那一个,这种姿态该如何解读?
Claude Code 负责人 Felix Rieseberg 说,“第三个 AI 时代”从今天开启——我们不再只是给 AI 派”任务”,而是开始向它赋予”职责”。这话有营销成分,但方向没错:模型越强,“它卖给谁、卖多贵、出了事谁负责、能不能被审计”就越不再是抽象问题。
神话已经走向大众。而真正的故事,才刚刚开始。
注:本文基准数据多数来自 Anthropic 官方发布,独立第三方验证仍在进行中;部分规格(如上下文窗口)来自第三方报告。文中涉及的争议事件以发布后首日信息为准,后续可能有更新。