智快网
快讯 行业 产业 汽车 科技 AI+ 热点

小米MiMo大模型API价格大跳水:最高降99%,国产大模型开启规模化使用新篇章

2026-05-28来源:快讯编辑:瑞雪

国内大模型市场近日迎来新一轮价格风暴。小米科技宣布对其MiMo-V2.5系列大模型API实施永久性降价,最高降幅达99%,同时取消上下文长度区分机制。这一举措紧随DeepSeek上周将V4-Pro价格降至原价25%之后,标志着国产大模型正式进入"成本战"阶段。

根据最新定价体系,MiMo-V2.5-Pro的百万tokens输入价格分为两种场景:缓存命中时仅需0.025元,未命中时为3元,输出价格则统一为6元。更引人注目的是Token Plan的升级方案——在Agent和Code开发场景下,用户可获得的免费Token数量将提升至原有水平的5-8倍。小米特别强调,新计价规则采用"所见即所得"模式,彻底消除了此前因单位换算带来的复杂计算问题。

与海外竞争对手相比,国产模型的价格优势愈发明显。OpenAI的GPT-4o输入价格为每百万tokens 2.5美元(约合人民币18元),输出达10美元(约72元);Claude Sonnet 4.6的输入输出价格则分别为3美元(21.6元)和15美元(108元)。即便考虑汇率因素,国内模型的价格仍不足国际主流产品的1/3。

小米技术团队透露,此次降价并非简单让利,而是源于底层架构的突破性优化。通过SGLang HiCache技术对滑动窗口注意力机制(SWA)的完整支持,KV Cache在GPU显存、CPU内存和SSD之间的数据搬运量减少至原来的1/7,可缓存token数量则提升近5倍。配合专家模型优化和输入长度分桶策略,集群输入吞吐能力得到显著提升。这种技术路线与DeepSeek的降本逻辑高度契合,均通过工程化创新实现单位服务成本的结构性下降。

行业观察人士指出,本轮降价潮折射出大模型应用场景的深刻变迁。随着技术从对话交互向任务执行延伸,开发者和企业用户更关注Agent在多轮推理、API调用和自动化工作流中的持续消耗。当百万tokens价格被压缩至分厘级别,模型竞争的焦点正从单纯的参数规模转向推理效率、算力调度和生态建设等综合实力。

对于开发者社区而言,成本下降将直接催生应用爆发。更低的使用门槛意味着更多Agent、智能助手等创新产品有望涌现,形成"降价-应用增长-生态完善"的良性循环。而对模型厂商来说,低价策略既是技术实力的证明,也是构建长期竞争力的战略选择——只有具备更高推理效率、更强算力调度能力的企业,才能在持续的价格战中占据主动。

vivo新品发布会三箭齐发!S60影像旗舰领衔,耳机双雄重塑全场景影音体验
5月29日19:30,vivo新品发布会重磅来袭,一口气推出三款硬核新品:vivo S60系列、TWS 5e真无线耳机、首款无线头戴降噪耳机,覆盖手机、便携入耳、专业头戴音频三大场景,全方位升级影音穿戴体验。…

2026-05-27

2026年Q1欧洲智能手机市场:荣耀领涨超60% 平均售价创新高
【CNMO科技消息】5月27日,Omdia最新研究显示,2026年第一季度,欧洲智能手机市场(不含俄罗斯)同比增长2%至3300万部。 据CNMO科技了解,三星以1260万部出货量、同比增长3%,继续保持欧洲…

2026-05-27

英伟达Vera处理器首批基准测试成绩揭晓,性能较前代Grace显著提升63%
IT之家 5 月 27 日消息,科技媒体 Phoronix 昨日(5 月 26 日)发布博文,披露了英伟达 Vera CPU首批基准测试成绩,在综合平均成绩上,比上一代 72 核 Grace 快 63%。 …

2026-05-27

2026年Q1荣耀海外市场强势增长 中高端机型表现亮眼成新增长极
2026年第一季度,荣耀海外市场延续强劲增长势头,在中东、南非、拉美、南太、东南亚等核心市场全面突破,并加码发力中高端市场,为全球消费者带来更高体验价值的产品。 据权威分析机构Omdia数据显示,荣耀Q1在中…

2026-05-27