智快网
快讯 行业 产业 汽车 科技 AI+ 热点

小米MiMo-V2-Flash新模型发布:创新架构,性能超绝性价比拉满

2025-12-18来源:快讯编辑:瑞雪

小米近日正式推出全新开源大模型MiMo-V2-Flash,凭借3090亿总参数与150亿活跃参数的规模,采用专家混合架构(MoE)设计,在性能表现上与DeepSeek-V3.2、Kimi-K2等头部开源模型形成有力竞争。该模型最引人注目的突破在于将推理速度提升至每秒150 tokens,同时将输入成本压缩至每百万token仅0.1美元,输出成本0.3美元,在性价比维度树立了新标杆。

在基准测试中,MiMo-V2-Flash展现惊人实力:AIME 2025数学竞赛与GPQA-Diamond科学知识测试均位列开源模型前两名,编程能力尤为突出——在SWE-bench Verified真实软件修复测试中取得73.4%的得分,超越所有开源竞品,直逼GPT-5-High水平。多语言编程测试SWE-Bench Multilingual中,该模型以71.7%的解决率证明其跨语言开发能力。智能体任务测试显示,其在通信类任务获得95.3分,零售类79.5分,航空类66.0分,搜索代理任务在启用上下文管理后得分从45.4跃升至58.3。

技术团队通过两项核心创新实现性能突破。混合滑动窗口注意力机制采用5层滑动窗口与1层全局注意力的激进配比,滑动窗口固定为128 token长度,使KV缓存存储量减少近6倍,却仍能支持256k超长上下文窗口。项目负责人罗福莉特别指出,实验发现128窗口大小是性能与效率的最佳平衡点,盲目扩大窗口反而导致性能下降,同时强调实施该机制时sink values的必要性。另一项轻量级多Token预测(MTP)技术则打破传统逐token生成模式,通过原生集成模块实现并行预测,实测平均接受2.8-3.6个连续token,推理速度提升2-2.6倍,有效解决强化学习中长尾样本导致的GPU空转问题。

训练阶段采用FP8混合精度技术,在27万亿token数据上完成预训练,原生支持32k序列长度。后训练阶段创新提出多教师在线策略蒸馏(MOPD),通过学生模型自主采样、多专家教师实时反馈的方式,将训练算力需求降至传统方法的1/50。该架构支持动态接入新教师模型,形成"教学相长"的闭环进化系统。智能体强化学习扩展方面,研究团队基于真实GitHub问题构建超10万个验证任务,在Kubernetes集群部署并发超万个Pod,环境部署成功率达70%,并开发多模态验证器通过视频录制确保代码执行准确性。

对于开发者群体,MiMo-V2-Flash提供256k上下文窗口支持数百轮智能体交互,可无缝集成Claude Code、Cursor等主流开发环境。模型权重已在Hugging Face平台以MIT协议开源,包含完整技术报告与推理代码。目前该模型已通过API Platform限时免费开放,所有优化经验同步分享至LMSYS博客,相关代码贡献给SGLang社区。这种全链条开源策略在国内科技企业中实属罕见,为行业技术演进提供了重要参考。

荣耀GT升级WIN系列:聚焦电竞体验,性能旗舰赛道迎新活力
12 月 16 日,荣耀召开媒体沟通会,正式官宣荣耀 GT 系列手机升级为荣耀 WIN系列,首款产品定位“年度夯机”,主打移动电竞场景,标志着该品牌在性能旗舰领域的战略升级。 续航方面,新机传出将搭载超大容…

2025-12-17

小米短剧战略显成效:千部S级作品储备,人均消费70分钟
刘婵在演讲中强调,小米互联网已构筑起真正的全局生态,其优势在于 “多市场、多终端、多场景的深度融合”。早在今年10月,小米旗下独立短剧应用“围观短剧” 就已正式登陆其应用商城,主打 “无广告、全免费、轻量…

2025-12-17

小米17 Ultra或推徕卡特别版 国内海外双命名 摄影性能再升级
此前就有爆料,小米不仅会正常推出17Ultra,还可能会推出型号里带S的徕卡特别版,因为GSMA数据库中出现了不同的型号,被标注为“Leitzphone powered byXiaomi”。 本次爆料显…

2025-12-17

小米MiMo大模型性能媲美主流,低价策略加速生态构建,AI路线前景可期
小米发布最新MiMo大模型测试成绩和主流模型相当,但价格定得很低,大概只有同类高性能模型的2.5%。这明显是想降低使用门槛,吸引更多开发者用起来,快速构建生态。 小米的AI路线越来越清晰了:通过开源、好用的…

2025-12-17

LifeSmart智能家居深度评测:稳定性、颜值与性价比的完美融合
如果是初次接触智能家居产品,可以选择一些基础的套餐,如智能照明系统、智能开关系统等;如果对智能家居有较高的要求,可以选择全屋智能解决方案,实现家居的全面智能化。其自主研发的CoTP™ 有线通讯协议为产品的稳…

2025-12-17