小米的新款MiMo 2.5 Pro AI 能看、能听、能行动——一体化模型

Decrypt · 2026-04-22T20:47:05+00:00

简要小米推出MiMo-V2.5和V2.5-Pro，将文本、图像、音频和视频能力融合到一个多模态AI模型中。 Pro版本在编码和具备代理（agentic）能力方面可与顶尖前沿模型相媲美

2026-04-22 20:47:05

简要概述

小米发布了MiMo-V2.5和V2.5-Pro，将文本、图像、音频和视频能力整合进一个多模态AI模型中。
Pro版本在编码和代理（agentic）基准测试中与顶级前沿模型竞争，同时显著提升了令牌效率与成本表现。
这些新模型标志着小米迅猛推进AI的举措：计划开源，并在OpenRouter等平台获得强劲采用后进行激进迭代。

小米刚刚推出了一组新的AI模型家族。又是如此。几周前，公司发布了MiMo-V2-Pro——一个拥有万亿参数的模型，它在小米公布真实身份之前，已经在OpenRouter上以“Hunter Alpha”的别名悄悄流传。它在一夜之间从默默无闻跃升为顶级水平。我们测试了它，效果令人印象深刻。现在，小米又带来了MiMo-V2.5和MiMo-V2.5-Pro：一个两模型组成的家族，把上一代从未在同一个包里提供的东西整合了进来——“眼睛、耳朵”，以及处理视频的能力。除此之外，公司还计划在不久的将来开源这些模型。

V2-Pro只支持文本和代码。它的兄弟模型MiMo-V2-Omni虽然也具备多模态能力，但那是一个基准分数更低的独立产品。MiMo-V2.5则将上述能力全部压缩进一个模型——更快、更强大，并从一开始就内置了原生的图像、视频与音频理解能力。这对普通用户而言，比听起来更重要。比如，现在你可以上传一张冰箱照片，让它给你推荐晚餐食谱。再加入一个视频教程，就能获得逐步总结。录制一场会议，让它提取行动事项。所有功能都集中在一个地方，无需在不同工具之间来回切换，也无需在不同定价策略的独立模型之间周旋。小米表示，MiMo-V2.5-Pro在“整体代理能力、复杂的软件工程以及长周期任务”方面相较MiMo-V2-Pro实现了“重大跃升”，并称其现在在大多数编码和代理基准测试中都与Claude Opus 4.6、GPT-5.4等前沿模型看齐。数据总体上也确实如此——但在更难的推理任务上仍能看出一些差距。

基础版与Pro版的用途不同。MiMo-V2.5-Pro是“重型选手”。小米表示，它可以“自主完成涉及1,000+次工具调用的专业任务，而这些工作需要人类专家花上数天时间。”这面向的是需要运行复杂、多步骤自动化工作流的开发者。其运行速度为每秒60–80个令牌，成本为每百万令牌输入$1.00 / 输出$3.00。 MiMo-V2.5是“日常版本”。速度更快(100–150个令牌每秒)，价格更便宜($0.40输入/ $2.00输出)，并支持所有模态——图像、音频和视频，而Pro-only这一层则跳过了其中的部分能力。两种模型都配备1M-token的上下文窗口，这意味着它们在一次对话中大约可以容纳75万词左右。在SWE-bench Pro上——一种编码基准：模型需要在真实的创业公司代码库中修复实际bug，并以满分100的通过率形式计分——MiMo-V2.5-Pro可以解决57.2%的任务。这几乎处于领域顶尖水平；平均模型大约在25%左右。τ3-bench和ClawEval上的情况也类似，仍落在Claude Opus 4.6与GPT-5.4的几个百分点以内。差距主要出现在“Humanity’s Last Exam”——一个横跨数十个学术领域的研究生级别问题考验：MiMo为48.0%，而GPT-5.4为58.7%——相差10个百分点，这样的缺口很难补齐。… 真正拉开差距的，是令牌效率本身。小米表示，MiMo-V2.5-Pro在相同基准分数下，相比Kimi K2.6能少用42%的令牌；而MiMo-V2.5在获得类似结果时，令牌用量几乎只有Muse Spark的一半。对于那些以规模化方式部署的用户——比如每天处理数千次请求的开发者——这笔差异是真金白银。在多模态任务上，MiMo-V2.5的测试结果显示其可与GPT-5.4和Gemini 3.1 Pro相当，并且非常接近Opus 4.6的标准。

自2025年12月起，小米已完成三次重大模型发布：首先推出了高效的MiMo-V2-Flash，然后在3月发布了V2-Pro/Omni/TTS这组组合方案，而今天则推出了V2.5系列。公司承诺在未来三年内至少投入$8.7 billion的AI投资，发布时间正是在V2-Pro发布后的第二天由CEO雷军宣布——而发布节奏也表明，这笔预算很可能已经在加速落地。速度同样也可以从背景中找到解释。根据Digital Applied的数据，截至4月初，小米的模型在OpenRouter上的总流量约占21%，并且在过去7天内增长了超过42%。当你的上一代模型已经成为全球最大的AI路由平台上最具竞争力的模型之一时，你既拥有资源，也承受着压力，因而必须更快地迭代。

这大概率与代理型AI工具Hermes的爆发以及其与小米的合作有关，使用户能在有限时间内免费访问MiMo v2 Pro。这个时间窗口已经结束了，但足以让小米进入竞争赛场。

感谢你们的喜爱 ❤️❤️ https://t.co/mA1WV1GAia

— 小米MiMo (@XiaomiMiMo) 2026年4月11日

想要现在免费使用Hermes的人士，可以用Nous API测试新的Step 3.5 flash，或使用OpenRouter的免费模型，但使用次数与频率会更受限制。令牌（token）计费方案也迎来了更新。MiMo-V2.5按1x额度比例计费；MiMo-V2.5-Pro为2x。小米不再对使用完整的100万令牌上下文窗口额外收取倍数费用，这使得长文档分析的成本明显更低。作为上线奖励，现有用户还将获得一次完整额度重置。小米表示，该模型已在其AI Studio中提供。我们在发布后立刻尝试在那儿访问——未能成功。不过，它已经通过小米MiMo API上线，而大多数开发者实际会在那里使用它。公司称，他们已经在训练下一代模型，重点在于“更深层次的推理、更紧密的工具集成以及更丰富的现实世界基础”。以小米当前的推进速度来看，这一公告或许比你想象的还要更近。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
Gate13周年现场直击
116.46万热度
#
WCTC交易赛瓜分800万USDT
78.2万热度
#
比特币反弹
20.18万热度
#
美伊二轮谈判进展
78.68万热度
#
Arbitrum冻结KelpDAO黑客ETH
4.32万热度

小米的新款MiMo 2.5 Pro AI 能看、能听、能行动——一体化模型

简要概述

热门话题

Gate13周年现场直击

WCTC交易赛瓜分800万USDT

比特币反弹

美伊二轮谈判进展

Arbitrum冻结KelpDAO黑客ETH

置顶