小米的新款MiMo 2.5 Pro AI 能看、能听、能行动——一体化模型

简要概述

  • 小米发布了MiMo-V2.5和V2.5-Pro,将文本、图像、音频和视频能力整合进一个多模态AI模型中。
  • Pro版本在编码和代理(agentic)基准测试中与顶级前沿模型竞争,同时显著提升了令牌效率与成本表现。
  • 这些新模型标志着小米迅猛推进AI的举措:计划开源,并在OpenRouter等平台获得强劲采用后进行激进迭代。

小米刚刚推出了一组新的AI模型家族。又是如此。 几周前,公司发布了MiMo-V2-Pro——一个拥有万亿参数的模型,它在小米公布真实身份之前,已经在OpenRouter上以“Hunter Alpha”的别名悄悄流传。它在一夜之间从默默无闻跃升为顶级水平。我们测试了它,效果令人印象深刻。 现在,小米又带来了MiMo-V2.5和MiMo-V2.5-Pro:一个两模型组成的家族,把上一代从未在同一个包里提供的东西整合了进来——“眼睛、耳朵”,以及处理视频的能力。除此之外,公司还计划在不久的将来开源这些模型。

V2-Pro只支持文本和代码。它的兄弟模型MiMo-V2-Omni虽然也具备多模态能力,但那是一个基准分数更低的独立产品。MiMo-V2.5则将上述能力全部压缩进一个模型——更快、更强大,并从一开始就内置了原生的图像、视频与音频理解能力。 这对普通用户而言,比听起来更重要。比如,现在你可以上传一张冰箱照片,让它给你推荐晚餐食谱。再加入一个视频教程,就能获得逐步总结。录制一场会议,让它提取行动事项。所有功能都集中在一个地方,无需在不同工具之间来回切换,也无需在不同定价策略的独立模型之间周旋。 小米表示,MiMo-V2.5-Pro在“整体代理能力、复杂的软件工程以及长周期任务”方面相较MiMo-V2-Pro实现了“重大跃升”,并称其现在在大多数编码和代理基准测试中都与Claude Opus 4.6、GPT-5.4等前沿模型看齐。数据总体上也确实如此——但在更难的推理任务上仍能看出一些差距。 

基础版与Pro版的用途不同。MiMo-V2.5-Pro是“重型选手”。小米表示,它可以“自主完成涉及1,000+次工具调用的专业任务,而这些工作需要人类专家花上数天时间。”这面向的是需要运行复杂、多步骤自动化工作流的开发者。其运行速度为每秒60–80个令牌,成本为每百万令牌输入$1.00 / 输出$3.00。 MiMo-V2.5是“日常版本”。速度更快(100–150个令牌每秒),价格更便宜($0.40输入/ $2.00输出),并支持所有模态——图像、音频和视频,而Pro-only这一层则跳过了其中的部分能力。两种模型都配备1M-token的上下文窗口,这意味着它们在一次对话中大约可以容纳75万词左右。 在SWE-bench Pro上——一种编码基准:模型需要在真实的创业公司代码库中修复实际bug,并以满分100的通过率形式计分——MiMo-V2.5-Pro可以解决57.2%的任务。这几乎处于领域顶尖水平;平均模型大约在25%左右。τ3-bench和ClawEval上的情况也类似,仍落在Claude Opus 4.6与GPT-5.4的几个百分点以内。差距主要出现在“Humanity’s Last Exam”——一个横跨数十个学术领域的研究生级别问题考验:MiMo为48.0%,而GPT-5.4为58.7%——相差10个百分点,这样的缺口很难补齐。… 真正拉开差距的,是令牌效率本身。小米表示,MiMo-V2.5-Pro在相同基准分数下,相比Kimi K2.6能少用42%的令牌;而MiMo-V2.5在获得类似结果时,令牌用量几乎只有Muse Spark的一半。对于那些以规模化方式部署的用户——比如每天处理数千次请求的开发者——这笔差异是真金白银。 在多模态任务上,MiMo-V2.5的测试结果显示其可与GPT-5.4和Gemini 3.1 Pro相当,并且非常接近Opus 4.6的标准。

自2025年12月起,小米已完成三次重大模型发布:首先推出了高效的MiMo-V2-Flash,然后在3月发布了V2-Pro/Omni/TTS这组组合方案,而今天则推出了V2.5系列。公司承诺在未来三年内至少投入$8.7 billion的AI投资,发布时间正是在V2-Pro发布后的第二天由CEO雷军宣布——而发布节奏也表明,这笔预算很可能已经在加速落地。 速度同样也可以从背景中找到解释。根据Digital Applied的数据,截至4月初,小米的模型在OpenRouter上的总流量约占21%,并且在过去7天内增长了超过42%。当你的上一代模型已经成为全球最大的AI路由平台上最具竞争力的模型之一时,你既拥有资源,也承受着压力,因而必须更快地迭代。

这大概率与代理型AI工具Hermes的爆发以及其与小米的合作有关,使用户能在有限时间内免费访问MiMo v2 Pro。这个时间窗口已经结束了,但足以让小米进入竞争赛场。

感谢你们的喜爱 ❤️❤️ https://t.co/mA1WV1GAia

— 小米MiMo (@XiaomiMiMo) 2026年4月11日

想要现在免费使用Hermes的人士,可以用Nous API测试新的Step 3.5 flash,或使用OpenRouter的免费模型,但使用次数与频率会更受限制。 令牌(token)计费方案也迎来了更新。MiMo-V2.5按1x额度比例计费;MiMo-V2.5-Pro为2x。小米不再对使用完整的100万令牌上下文窗口额外收取倍数费用,这使得长文档分析的成本明显更低。作为上线奖励,现有用户还将获得一次完整额度重置。 小米表示,该模型已在其AI Studio中提供。我们在发布后立刻尝试在那儿访问——未能成功。不过,它已经通过小米MiMo API上线,而大多数开发者实际会在那里使用它。 公司称,他们已经在训练下一代模型,重点在于“更深层次的推理、更紧密的工具集成以及更丰富的现实世界基础”。以小米当前的推进速度来看,这一公告或许比你想象的还要更近。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论