小米的 MiMo-V2.5 系列开源:1T 参数,相较 GPT-5.4 令牌效率更优

Gate News message, April 27 — Xiaomi’s MiMo team has open-sourced the MiMo-V2.5 series of large language models under MIT license, supporting commercial deployment, continued training, and fine-tuning. Both models feature a 1 million token context window. MiMo-V2.5-Pro is a pure-text mixture-of-experts (MoE) model with 1.02 trillion total parameters and 42 billion active parameters, while MiMo-V2.5 is a native multimodal model with 310 billion total parameters and 15 billion active parameters, supporting text, image, video, and audio understanding.

MiMo-V2.5-Pro targets complex agent and programming tasks. In ClawEval benchmarks, it achieved 64% Pass@3 while consuming approximately 70,000 tokens per task trajectory—40% to 60% fewer tokens than Claude Opus, Gemini 3.1 Pro, and GPT-5.4. The model scored 78.9 on SWE-bench Verified. In a demonstration, V2.5-Pro independently implemented a complete SysY-to-RISC-V compiler for a Peking University compiler course project in 4.3 hours with 672 tool calls, achieving a perfect score of 233/233 on hidden test sets.

MiMo-V2.5 is designed for multimodal agent scenarios, equipped with a dedicated vision encoder (729 million parameters) and audio encoder (261 million parameters), scoring 62.3 on the Claw-Eval general subset. Both models employ a hybrid architecture combining sliding window attention (SWA) and global attention (GA), paired with a 3-layer multi-token prediction (MTP) module for accelerated inference. Model weights are available on Hugging Face.

Alongside the open-source release, the MiMo team launched the “Orbit Quadrillion Token Creator Incentive Program,” offering 100 quadrillion tokens free over 30 days to global users. Individual developers, teams, and enterprises can apply via the program page with an evaluation cycle of approximately 3 business days; approved benefits are distributed as Token Plans or direct credits, compatible with tools like Claude Code and Cursor.

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

霍斯金森在 The Breakdown 上讨论了 Midnight 在 Cardano 生态系统中的作用

Cardano 创始人、以太坊联合创始人 Charles Hoskinson 作为嘉宾出现在 David Gokhshtein 主持的播客《The Breakdown》第 701 集中,讨论 Midnight 项目、加密货币中的用户体验挑战以及他对区块链未来的愿景。在采访期间,Hoskinson

Crypto Frontier2小时前

伯克希尔能源业务因 AI 驱动的电力需求而看到增长机会

据 Beating 称,在伯克希尔的股东大会上,CEO Abel 强调,由 AI 驱动的电力需求正在为公司能源业务创造新的增长机会,其一半的能源公用事业单位已在处理与 AI 相关的电力需求。 在爱荷华,数据中心现在占据

GateNews4小时前

Musk 与 Altman 诉讼首周证词:自承 XAI 蒸馏 OpenAI,警告 AI 像终结者

马斯克在奥克兰联邦法院首周诉讼证词中指控奥特曼与 Brockman 骗取早期非营利资金,警告 AI 末日风险,并自承 xAI 部分蒸馏自 OpenAI 模型;他自述投入 3,800 万美元,见证 OpenAI 从非营利转为估值 8 千亿 美元。Microsoft 2022 投资被视为信任崩坏的转折点。OpenAI 辩称马斯克企图挖角、并以竞争对手动机抗辩。随后在第二周证人包括 Russell 与 Brockman。

鏈新聞abmedia6小时前

与特朗普有关的 AI 金融收购 Block Street,金额 4300 万美元

据《财富》,AI Financial,这家与特朗普家族有关的加密货币公司此前名为 Alt5 Sigma,上周以 4300 万美元收购了 Block Street,一家加密基础设施公司。AI Financial 的顾问兼 Block Street 的首席执行官 Matthew Morgan 表示,该收购并非一项

GateNews7小时前

Riot 的股价在扩大 AMD 数据中心合作后上涨 8%

比特币矿企 Riot 的股价在其与 AMD 的数据中心协议扩展后上涨 8%。扩展后的合作包括改善的融资条款,凸显 Riot 正在从比特币挖矿转向人工智能数据中心运营的战略转变。此举表明信心日益增强

GateNews9小时前

明尼苏达州禁止 AI 非自愿色情影像工具,并处以最高 $500K 罚金

据 Decrypt 称,明尼苏达州议会于 5 月 2 日通过了一项法案,禁止网站和应用程序提供可生成未经同意的亲密图像的 AI 工具,且这些图像涉及可识别的个人。该法律禁止平台允许用户访问或使用此类“深度伪造”工具,并禁止

GateNews11小时前
评论
0/400
暂无评论