Hunter Alpha 身份揭晓：小米万亿参数模型的隐秘首秀

Hunter Alpha 身份揭晓

Hunter Alpha 就是小米的 MiMo-V2-Pro。 2026年3月18日，小米正式确认，在全球AI圈掀起一周猜谜狂潮的匿名模型”Hunter Alpha”，正是其旗舰基础模型 MiMo-V2-Pro 的早期内测版本。伴侣模型”Healer Alpha”也同步揭晓，其真身为小米的全模态模型 MiMo-V2-Omni。此次官宣彻底推翻了两种主流猜测——Hunter Alpha 既非 DeepSeek V4，也非智谱AI的 GLM-6。长期以手机和消费电子著称的小米，就此以一款万亿参数模型向全球宣告：它已成为前沿AI领域的真正竞争者。该模型在 Artificial Analysis 全球智能指数中排名 第8位，并在 OpenRouter 一周内消耗了超过 1万亿 tokens 的真实用量。

一周匿名，引爆全球猜谜热潮

2026年3月11日，两个没有任何开发者署名的匿名模型——“Hunter Alpha”和”Healer Alpha”——悄然出现在 OpenRouter 平台，免费向所有人开放。Hunter Alpha 的唯一描述是：“一个拥有1万亿参数、100万 token 上下文的前沿智能模型，专为 Agentic 场景构建。“这次隐秘亮相立刻在 X（原推特）、Reddit 以及知乎、LINUX DO 等中文论坛引发大规模猜测，国际科技媒体也纷纷跟进报道。

四种主流猜测相继浮出水面。 最有力的说法是 Hunter Alpha 为 DeepSeek V4——依据是参数量（1T）、上下文长度（1M）和知识截止日期（2025年5月）均吻合，且 DeepSeek 官网在数日前曾短暂出现”V4 Lite”页面。路透社于3月18日发布重磅报道，进一步放大了这一猜测。第二种说法指向智谱AI，原因是 OpenRouter 上同一匿名提供商账户此前曾于2026年2月发布”Pony Alpha”，五天后被证实为智谱的 GLM-5。另有少数人认为是 OpenAI（毕竟 OpenRouter 上的 Quasar Alpha 最终被证实为 GPT-4.1）或腾讯混元。

最终破案的是中国最大开发者社区 LINUX DO 的侦探网友们。他们的突破口是分词器（Tokenizer）取证：通过分析 <|endoftext|> 等特殊控制 token，他们确认两款模型的分词器与 MiMo V2 系列完全吻合，而非 GLM、DeepSeek 或 Kimi 的分词器。与此同时，OpenClaw 代码仓库中出现了一个 PR，新增了两个小米模型——mimo-v2-pro（100万上下文）和 mimo-v2-omni（26.2万上下文），规格与 Hunter Alpha 和 Healer Alpha 完美对应。当系统提示被绕过后，Healer Alpha 还直接自报家门：“小米MiMo”。独立评测者 Umur Ozkul 也曾公开表示”分析表明 Hunter Alpha 很可能不是 DeepSeek V4”，理由是 token 行为存在差异——事实证明他的判断完全正确。

MiMo-V2-Pro：1万亿参数，420亿激活

MiMo-V2-Pro 采用混合专家（MoE）架构，总参数量超过 1万亿，推理时激活参数约420亿——约为早期 MiMo-V2-Flash（总参3090亿/激活150亿）的3倍。模型支持 1,048,576 tokens（约100万）的上下文窗口，最大输出3.2万 tokens，并采用滑动窗口注意力与全局注意力7

Hybrid Attention 机制，以提升 KV-cache 效率，同时配备多 Token 预测（MTP）层以加速生成。

在基准测试上，MiMo-V2-Pro 在 Artificial Analysis 全球智能指数中得分 49分，排名全球第8、中国大模型第2（仅次于智谱 GLM-5 的50分，领先 Kimi K2.5 的47分和 Qwen3.5 的45分）。在 PinchBench 上得分 84.0（全球第3，仅次于 Claude Sonnet 4.6 的86.9和 Claude Opus 4.6 的86.3）；在 ClawEval 上得分 61.5（全球第3，接近 Claude Opus 4.6 的66.3）。在真实 Agentic 任务评测（GDPval-AA）中，Elo 达到 1426，领跑全部中国模型。小米官方声称，其代码能力超越 Claude 4.6 Sonnet，通用智能体表现接近 Claude Opus 4.6，且成本约为后者的五分之一。

匿名测试阶段用户体验整体正面，但也有分歧。该模型在工具调用可靠性、指令遵循和 Agentic/结构化工作流方面表现出色，吸引了 OpenClaw、OpenCode、KiloCode、Blackbox、Cline 等主流代码工具的大量用户。主要不足包括：推理速度偏慢（约48 tokens/秒，约为 Healer Alpha 的一半）、数学能力不及预期、简单乘法出错、无法解码双重 base64 编码字符串，以及某测试者所称的”Claude 精神附体”现象。中文社区反响两极：有人欢呼”小米交作业了！“，也有人直言1万亿参数换来这个水平算不上突破，代码能力基础偏弱、常见bug频发。

API 定价方面，26.2万 token 以内上下文的输入/输出价格为 $1/$3（每百万 token），超过26.2万 token 的长文本为 $2/$6——整体定位为极具性价比的前沿模型，在 Artificial Analysis 不超过 $0.15/百万 token 的160款模型中排名第1，远超该价格段中位数水平（13分）。

Healer Alpha 揭晓为 MiMo-V2-Omni，小米全模态模型

Healer Alpha 的真身是 MiMo-V2-Omni，这是小米的全模态智能体模型，原生支持文本、图像、音频、视频的混合输入，上下文窗口达26.2万 tokens，输出速度约93 tokens/秒。在音频理解能力上，该模型表现亮眼：BigBench Audio 94.0、MMAU-Pro 69.4、FutureOmni 66.7，在多项测试中超越 Gemini 3 Pro 和 Claude Opus 4.6。模型还支持环境声音分类、多说话人分离、音视频联合推理，以及对超过10小时连续音频的理解。

此次同步发布的还有第三款模型 MiMo-V2-TTS——一个基于数亿小时音频数据训练的语音合成模型，支持多粒度情感控制和多方言。三款模型的集中发布，标志着小米下一代AI能力的全面亮相。

从手机厂商到前沿AI实验室：小米的快速崛起

小米进化为前沿AI研发者的速度令人惊叹。公司于2025年4月才发布第一款大语言模型 MiMo-7B——一个70亿参数的开源小模型，但在数学和代码任务上已超越 OpenAI 的 o1-mini。2025年12月，MiMo-V2-Flash（3090亿/150亿激活参数）以 MIT 协议开源，在 SWE-Bench Verified 上以73.4%的得分夺得开源模型第一。仅三个月后，MiMo-V2-Pro 便将参数规模突破万亿。在这些里程碑之间，小米还陆续发布了视觉语言模型（MiMo-VL）、音频模型（MiMo-Audio）、具身智能模型（MiMo-Embodied，在17个基准测试上刷新记录）和机器人大模型（Xiaomi-Robotics-0）。

推动这一跃升的核心人物是罗福莉，一位前 DeepSeek 核心开发者，于2025年11月加入小米，担任 MiMo 大模型团队负责人。生于1995年、被业界誉为”AI天才少女”的罗福莉，曾参与 DeepSeek-V2 的研发，据报道以数百万人民币年薪被雷军亲自招募。她在阿里巴巴达摩院和 DeepSeek 母公司幻方量化的经历，为小米带来了前沿模型研发的核心竞争力。在她的主导下，团队的技术理念聚焦于：代码与工具调用能力、极致推理效率、以及基于强化学习的后训练——这些都直接体现在 MiMo-V2-Pro 的优势之中。

小米的投入力度相当坚定：2026年仅AI研发和资本开支就超过160亿元人民币（约22亿美元），五年总研发预算超过2000亿元人民币（约280亿美元）。公司已采购约1万块GPU用于模型训练，并借助其持有的金山云10%股份获取额外算力。雷军于3月19日表示：“我们在AI方面一直比较低调，但实际进展可能远比大家看到的要快。”

战略逻辑清晰：小米将 MiMo 定位为**“通用智能基座”**——覆盖其 7.42亿月活用户、10.4亿联网IoT设备、SU7系列电动汽车以及更广泛的”人车家”生态的统一AI大脑，并已逐步整合至小米浏览器、WPS/金山办公、车载座舱系统和智能家居设备。

隐秘发布已成行业惯例

Hunter Alpha 的匿名亮相，印证了一种在 OpenRouter 上愈发普遍的模式——各大科技公司在正式发布前，以代号测试模型：

Quasar Alpha → OpenAI 的 GPT-4.1
Sherlock Alpha → xAI 的 Grok 4.1 Fast
Pony Alpha → 智谱AI 的 GLM-5
Hunter Alpha → 小米的 MiMo-V2-Pro
Healer Alpha → 小米的 MiMo-V2-Omni

对小米而言，这一策略的效果异常出色。模型在揭晓前累计处理了超过 1万亿 tokens，连续多日登顶 OpenRouter 日榜，同时引发路透社等国际主流媒体的大规模报道，以及数千名开发者和 AI 智能体框架的真实压力测试。社区甚至诞生了专门的”侦探网站”（hunteralphahub.com），号称汇聚”超过500名侦探共同寻找线索”。匿名测试期间，小米同时完成了产品营销、真实负载压测和口碑积累——等揭晓时，MiMo-V2-Pro 早已在生产环境中得到充分验证。

结语

小米以 Hunter Alpha 背后真凶的身份现身，是2026年AI格局迄今最大的意外之一。一家以平价手机和家电闻名的公司，在发布第一款大模型不到一年后，便推出了一款在 Agentic 基准测试上真正与 Claude 和 GPT 正面竞争的万亿参数模型。智谱AI的猜测——尽管有 Pony Alpha 先例支撑——落空了；路透社大力渲染的 DeepSeek V4 说法也落空了。真实的故事其实更加精彩：小米凭借招募前 DeepSeek 顶尖人才、巨额研发投入和庞大的生态整合野心，打造出一款在前沿性能上具有竞争力、同时使用成本大幅低于竞品的模型家族。MiMo-V2-Pro 能否在 DeepSeek V4（传闻将于2026年4月发布）和 Claude/GPT 持续迭代的压力下守住这一位置，是接下来最值得关注的悬念——但小米已无可争辩地在前沿AI的牌桌上占据了一席之地。