Hunter Alpha 身份揭晓:小米万亿参数模型的隐秘首秀

Hunter Alpha 就是小米的 MiMo-V2-Pro。 2026年3月18日,小米正式确认,在全球AI圈掀起一周猜谜狂潮的匿名模型”Hunter Alpha”,正是其旗舰基础模型 MiMo-V2-Pro 的早期内测版本。伴侣模型”Healer Alpha”也同步揭晓,其真身为小米的全模态模型 MiMo-V2-Omni。此次官宣彻底推翻了两种主流猜测——Hunter Alpha 既非 DeepSeek V4,也非智谱AI的 GLM-6。长期以手机和消费电子著称的小米,就此以一款万亿参数模型向全球宣告:它已成为前沿AI领域的真正竞争者。该模型在 Artificial Analysis 全球智能指数中排名 第8位,并在 OpenRouter 一周内消耗了超过 1万亿 tokens 的真实用量。
一周匿名,引爆全球猜谜热潮
2026年3月11日,两个没有任何开发者署名的匿名模型——“Hunter Alpha”和”Healer Alpha”——悄然出现在 OpenRouter 平台,免费向所有人开放。Hunter Alpha 的唯一描述是:“一个拥有1万亿参数、100万 token 上下文的前沿智能模型,专为 Agentic 场景构建。“这次隐秘亮相立刻在 X(原推特)、Reddit 以及知乎、LINUX DO 等中文论坛引发大规模猜测,国际科技媒体也纷纷跟进报道。
四种主流猜测相继浮出水面。 最有力的说法是 Hunter Alpha 为 DeepSeek V4——依据是参数量(1T)、上下文长度(1M)和知识截止日期(2025年5月)均吻合,且 DeepSeek 官网在数日前曾短暂出现”V4 Lite”页面。路透社于3月18日发布重磅报道,进一步放大了这一猜测。第二种说法指向智谱AI,原因是 OpenRouter 上同一匿名提供商账户此前曾于2026年2月发布”Pony Alpha”,五天后被证实为智谱的 GLM-5。另有少数人认为是 OpenAI(毕竟 OpenRouter 上的 Quasar Alpha 最终被证实为 GPT-4.1)或腾讯混元。
最终破案的是中国最大开发者社区 LINUX DO 的侦探网友们。他们的突破口是分词器(Tokenizer)取证:通过分析 <|endoftext|> 等特殊控制 token,他们确认两款模型的分词器与 MiMo V2 系列完全吻合,而非 GLM、DeepSeek 或 Kimi 的分词器。与此同时,OpenClaw 代码仓库中出现了一个 PR,新增了两个小米模型——mimo-v2-pro(100万上下文)和 mimo-v2-omni(26.2万上下文),规格与 Hunter Alpha 和 Healer Alpha 完美对应。当系统提示被绕过后,Healer Alpha 还直接自报家门:“小米MiMo”。独立评测者 Umur Ozkul 也曾公开表示”分析表明 Hunter Alpha 很可能不是 DeepSeek V4”,理由是 token 行为存在差异——事实证明他的判断完全正确。
MiMo-V2-Pro:1万亿参数,420亿激活
MiMo-V2-Pro 采用混合专家(MoE)架构,总参数量超过 1万亿,推理时激活参数约420亿——约为早期 MiMo-V2-Flash(总参3090亿/激活150亿)的3倍。模型支持 1,048,576 tokens(约100万)的上下文窗口,最大输出3.2万 tokens,并采用滑动窗口注意力与全局注意力7
Hybrid Attention 机制,以提升 KV-cache 效率,同时配备多 Token 预测(MTP)层以加速生成。在基准测试上,MiMo-V2-Pro 在 Artificial Analysis 全球智能指数中得分 49分,排名全球第8、中国大模型第2(仅次于智谱 GLM-5 的50分,领先 Kimi K2.5 的47分和 Qwen3.5 的45分)。在 PinchBench 上得分 84.0(全球第3,仅次于 Claude Sonnet 4.6 的86.9和 Claude Opus 4.6 的86.3);在 ClawEval 上得分 61.5(全球第3,接近 Claude Opus 4.6 的66.3)。在真实 Agentic 任务评测(GDPval-AA)中,Elo 达到 1426,领跑全部中国模型。小米官方声称,其代码能力超越 Claude 4.6 Sonnet,通用智能体表现接近 Claude Opus 4.6,且成本约为后者的五分之一。
匿名测试阶段用户体验整体正面,但也有分歧。该模型在工具调用可靠性、指令遵循和 Agentic/结构化工作流方面表现出色,吸引了 OpenClaw、OpenCode、KiloCode、Blackbox、Cline 等主流代码工具的大量用户。主要不足包括:推理速度偏慢(约48 tokens/秒,约为 Healer Alpha 的一半)、数学能力不及预期、简单乘法出错、无法解码双重 base64 编码字符串,以及某测试者所称的”Claude 精神附体”现象。中文社区反响两极:有人欢呼”小米交作业了!“,也有人直言1万亿参数换来这个水平算不上突破,代码能力基础偏弱、常见bug频发。
API 定价方面,26.2万 token 以内上下文的输入/输出价格为 $1/$3(每百万 token),超过26.2万 token 的长文本为 $2/$6——整体定位为极具性价比的前沿模型,在 Artificial Analysis 不超过 $0.15/百万 token 的160款模型中排名第1,远超该价格段中位数水平(13分)。
Healer Alpha 揭晓为 MiMo-V2-Omni,小米全模态模型
Healer Alpha 的真身是 MiMo-V2-Omni,这是小米的全模态智能体模型,原生支持文本、图像、音频、视频的混合输入,上下文窗口达26.2万 tokens,输出速度约93 tokens/秒。在音频理解能力上,该模型表现亮眼:BigBench Audio 94.0、MMAU-Pro 69.4、FutureOmni 66.7,在多项测试中超越 Gemini 3 Pro 和 Claude Opus 4.6。模型还支持环境声音分类、多说话人分离、音视频联合推理,以及对超过10小时连续音频的理解。
此次同步发布的还有第三款模型 MiMo-V2-TTS——一个基于数亿小时音频数据训练的语音合成模型,支持多粒度情感控制和多方言。三款模型的集中发布,标志着小米下一代AI能力的全面亮相。
从手机厂商到前沿AI实验室:小米的快速崛起
小米进化为前沿AI研发者的速度令人惊叹。公司于2025年4月才发布第一款大语言模型 MiMo-7B——一个70亿参数的开源小模型,但在数学和代码任务上已超越 OpenAI 的 o1-mini。2025年12月,MiMo-V2-Flash(3090亿/150亿激活参数)以 MIT 协议开源,在 SWE-Bench Verified 上以73.4%的得分夺得开源模型第一。仅三个月后,MiMo-V2-Pro 便将参数规模突破万亿。在这些里程碑之间,小米还陆续发布了视觉语言模型(MiMo-VL)、音频模型(MiMo-Audio)、具身智能模型(MiMo-Embodied,在17个基准测试上刷新记录)和机器人大模型(Xiaomi-Robotics-0)。
推动这一跃升的核心人物是罗福莉,一位前 DeepSeek 核心开发者,于2025年11月加入小米,担任 MiMo 大模型团队负责人。生于1995年、被业界誉为”AI天才少女”的罗福莉,曾参与 DeepSeek-V2 的研发,据报道以数百万人民币年薪被雷军亲自招募。她在阿里巴巴达摩院和 DeepSeek 母公司幻方量化的经历,为小米带来了前沿模型研发的核心竞争力。在她的主导下,团队的技术理念聚焦于:代码与工具调用能力、极致推理效率、以及基于强化学习的后训练——这些都直接体现在 MiMo-V2-Pro 的优势之中。
小米的投入力度相当坚定:2026年仅AI研发和资本开支就超过160亿元人民币(约22亿美元),五年总研发预算超过2000亿元人民币(约280亿美元)。公司已采购约1万块GPU用于模型训练,并借助其持有的金山云10%股份获取额外算力。雷军于3月19日表示:“我们在AI方面一直比较低调,但实际进展可能远比大家看到的要快。”
战略逻辑清晰:小米将 MiMo 定位为**“通用智能基座”**——覆盖其 7.42亿月活用户、10.4亿联网IoT设备、SU7系列电动汽车以及更广泛的”人车家”生态的统一AI大脑,并已逐步整合至小米浏览器、WPS/金山办公、车载座舱系统和智能家居设备。
隐秘发布已成行业惯例
Hunter Alpha 的匿名亮相,印证了一种在 OpenRouter 上愈发普遍的模式——各大科技公司在正式发布前,以代号测试模型:
- Quasar Alpha → OpenAI 的 GPT-4.1
- Sherlock Alpha → xAI 的 Grok 4.1 Fast
- Pony Alpha → 智谱AI 的 GLM-5
- Hunter Alpha → 小米的 MiMo-V2-Pro
- Healer Alpha → 小米的 MiMo-V2-Omni
对小米而言,这一策略的效果异常出色。模型在揭晓前累计处理了超过 1万亿 tokens,连续多日登顶 OpenRouter 日榜,同时引发路透社等国际主流媒体的大规模报道,以及数千名开发者和 AI 智能体框架的真实压力测试。社区甚至诞生了专门的”侦探网站”(hunteralphahub.com),号称汇聚”超过500名侦探共同寻找线索”。匿名测试期间,小米同时完成了产品营销、真实负载压测和口碑积累——等揭晓时,MiMo-V2-Pro 早已在生产环境中得到充分验证。
结语
小米以 Hunter Alpha 背后真凶的身份现身,是2026年AI格局迄今最大的意外之一。一家以平价手机和家电闻名的公司,在发布第一款大模型不到一年后,便推出了一款在 Agentic 基准测试上真正与 Claude 和 GPT 正面竞争的万亿参数模型。智谱AI的猜测——尽管有 Pony Alpha 先例支撑——落空了;路透社大力渲染的 DeepSeek V4 说法也落空了。真实的故事其实更加精彩:小米凭借招募前 DeepSeek 顶尖人才、巨额研发投入和庞大的生态整合野心,打造出一款在前沿性能上具有竞争力、同时使用成本大幅低于竞品的模型家族。MiMo-V2-Pro 能否在 DeepSeek V4(传闻将于2026年4月发布)和 Claude/GPT 持续迭代的压力下守住这一位置,是接下来最值得关注的悬念——但小米已无可争辩地在前沿AI的牌桌上占据了一席之地。