Hunter Alpha:震动AI圈的万亿参数隐形大模型

发布于:2026-03-16 · #AI #LLM

Hunter Alpha 是一个匿名的万亿参数大语言模型,于2026年3月11日悄然出现在 OpenRouter 平台上,背后开发者身份未知——但AI社区普遍怀疑其出自中国AI实验室智谱AI(Zhipu AI)之手。 该模型拥有 100万 token 的上下文窗口,声称拥有约 1万亿参数,专为 Agentic(智能体)AI 工作流优化。它与一个名为 Healer Alpha 的多模态伴侣模型同步上线,二者目前均免费使用,但所有提示词和输出内容均由未知提供商记录。上线五天后,Hunter Alpha 的真实身份仍未获官方证实,使其成为近期AI史上讨论最热烈的神秘发布事件之一。


在 OpenRouter 上的隐秘亮相,规格令人咋舌

Hunter Alpha 于2026年3月11日以模型 ID openrouter/hunter-alpha 出现在 OpenRouter——一个流行的AI模型路由平台——上。它没有官方品牌、没有公司名称、也没有学术论文。其公示规格令人印象深刻:

规格详情
参数量约1万亿(声称,未经验证)
上下文窗口1,048,576 tokens(约100万)
最大输出32,000–65,536 tokens
输出速度约48 tokens/秒
输入模态文本和图像
输出模态仅文本
定价$0(测试期间免费)
知识截止日期2025年5月(社区测试推断)

该模型被明确描述为”为 Agentic 使用而构建”——即长程规划、复杂推理、持续的多步骤任务执行,以及在 OpenClaw 等框架中的工具调用。它支持函数调用、思维链推理 token,以及 temperature、top-p、响应格式等标准参数控制。值得注意的是,OpenRouter 的模型说明卡指出所有交互均被记录,并可能用于改进模型,表明这是一次收集数据性质的公开测试。

与此同时,同一匿名提供商还上线了伴侣模型 Healer Alpha。Healer Alpha 是一个全模态模型,支持视觉、音频和文本输入,上下文窗口为 26.2万 tokens,输出速度约为 93 tokens/秒——几乎是 Hunter Alpha 的两倍,暗示其激活参数可能更少。


破案游戏:为何智谱AI是最大嫌疑人

Hunter Alpha 最引人关注的问题,是谁构建了它。AI社区——尤其是知乎、LINUX DO、微博等中文社区——普遍指向智谱AI(Z.ai),少数人认为是 DeepSeek。

最有力的证据来自先例。OpenRouter 上的同一匿名提供商此前于2026年2月上线了一个名为 “Pony Alpha” 的模型,随后被证实是智谱的 GLM-5——一个744B参数的模型。那次隐秘发布遵循了完全相同的套路:匿名上架、免费使用、数据记录、最终公开揭晓。Hunter Alpha 似乎是这一策略的直接重演,可能代表智谱在 1万亿参数 级别的下一代旗舰。

更多间接证据强化了这一推断。社区研究人员发现,Hunter Alpha 的系统提示中包含”严格遵守中国法律法规”的指令——与中国AI实验室的风格高度一致。知名中文AI评测者 @karminski-牙医 也公开表示,该模型”不是 DeepSeek V4”,而来自智谱。按此推断,Healer Alpha 可能对应 GLM-5V 或某款新的全模态变体。

另一种假设——Hunter Alpha 是 DeepSeek V4——支持者较少。尽管万亿参数的规模与 DeepSeek V4 的传言相符,但分析人士指出,DeepSeek 历来不在 OpenRouter 上匿名测试,而是倾向于直接低调发布。同期在 Hugging Face 上泄露的 DeepSeek-V4-INT8 权重文件,也表明 V4 是另一条独立的时间线。截至2026年3月16日,任何公司均未作出官方确认


基准测试揭示:强大的推理者,但速度堪忧

来自 Benchable.ai 的独立基准测试显示,Hunter Alpha 能力突出,但速度明显偏慢。它在所有测试类别中均获得 100% 可靠性评分,在通用知识(100%)、推理(96%)、数学(95%)和代码(93%)上表现亮眼,幻觉抵抗得分为 94%,能力与可靠性均获五星评级。

最明显的短板是速度。Hunter Alpha 在吞吐量上仅排在 第16百分位,获评一星——对生产应用而言是重大缺陷。其指令遵循准确率为 77%(第86百分位),也落后于顶尖竞品。

真实测试结果喜忧参半。AI评论人 Ethan Mollick 于3月12日报告称,该模型在 Lem Test(逻辑推理)和 Sparks TiKZ 独角兽挑战(LaTeX图表生成)上表现”只能说还好”,未能全面超越 Claude Opus 4.6 或 GPT-5.4 等顶尖模型。知乎上的中文社区测试者发现,它在代码任务上与 Claude Opus 4.5 相当——在一项复杂的代码修改任务上甚至略胜一筹——但在网页游戏生成挑战中表现欠佳。一个值得注意的发现是:尽管声称拥有100万上下文窗口,测试者检测到其有效注意力质量约为 25.6万 tokens,表明上下文可能是通过扩展实现的,而非同步提升了架构能力。


OpenRouter 正成为隐形测试的主要战场

Hunter Alpha 的出现,符合一个愈发清晰的规律:主要AI实验室越来越多地将 OpenRouter 作为用代号发布模型的秘密试验场。该平台已接待过数个”伪装”模型,并最终被揭开真面目:

  • Pony Alpha → 确认为 GLM-5(智谱AI)
  • Quasar Alpha → 据报道为 GPT-4.1(OpenAI)
  • Sherlock Alpha → 据报道为 Grok 4.1 Fast(xAI)
  • Horizon Alpha/Beta → 尚未确认的隐形模型

这一模式对实验室大有裨益:他们可以收集真实使用数据、对基础设施进行压力测试,并在不承受正式发布所带来的舆论压力的情况下,观察社区反应。对 Hunter Alpha 而言,免费定价和数据记录条款清楚地说明了这场交换——用户以零成本获得强大模型的访问权,而提供商则积累训练信号。

该模型的社区影响力相当显著。上线三天内,Hunter Alpha 已处理超过 2260亿 tokens,跻身 OpenRouter 日榜第一。搜狐、新浪、17173、知乎、AIBase 及众多AI导航站纷纷报道,将其定性为中国AI迈入”万亿参数深水区”的有力证明。中文媒体普遍直接使用英文名”Hunter Alpha”,而非”猎手Alpha”或”猎手阿尔法”等中文译名。

该模型目前没有官方网站、GitHub 仓库或 arxiv 论文。Hugging Face 上已出现第三方衍生数据集,最典型的是 TeichAI/Hunter-Alpha-16k——一个包含16,356行、1.147亿 tokens 的推理数据集,涵盖代码、金融、法律和科学等领域,全部由 Hunter Alpha 的输出生成。


结语

Hunter Alpha 是前沿AI能力与战略匿名性的迷人交汇点。其声称的万亿参数架构和百万 token 上下文窗口,使其跻身当前可公开访问的最大语言模型之列;而其 Agentic 优化,则精准切入了AI部署中增长最快的应用场景。将其与智谱AI关联的间接证据颇具说服力——建立在 Pony Alpha 被证实为 GLM-5 的先例之上,辅以系统提示中的中国法规合规要求和一致的提供商指纹——但官方归属仍悬而未决。强大的推理得分与偏慢的推理速度并存,暗示其采用了一种重计算、重准确性而非重吞吐量的密集架构。或许更值得关注的,是 Hunter Alpha 所揭示的AI生态新常态:主要实验室正日益将匿名公测作为正式发布前收集真实数据的标准流程,而中西方前沿模型之间的差距也在持续缩小。当面具最终揭开——正如 Pony Alpha 那次——这一揭晓时刻,将大概率成为全球AI竞赛中的又一个重要里程碑。