智快网
快讯 行业 产业 汽车 科技 AI+ 热点

小米MiMo加入价格战!API价格直降99% 推理优化成降价底气

2026-05-27来源:快讯编辑:瑞雪

国产大模型市场再掀波澜,小米正式宣布加入API价格战。继DeepSeek宣布永久降价后,小米MiMo-V2.5系列API价格同步大幅下调,最高降幅达99%,同时推出新版Token Plan计费体系,取消上下文窗口长度差异化定价策略。

根据最新定价方案,MiMo-V2.5输入缓存命中价格降至0.02元/百万tokens,未命中输入为1元/百万tokens,输出价格为2元/百万tokens;Pro版本对应价格分别为0.025元、3元和6元。值得注意的是,此次调整彻底取消了此前按256K/1M上下文窗口长度区分的价格体系,实现全场景统一计价。这一策略与DeepSeek-V4-Pro的定价模式形成直接对标,后者输入缓存命中价格已压至0.01元/百万tokens。

计费体系改革成为本次调整的核心亮点。小米同步升级Token Plan套餐,在维持原价基础上将Credits额度提升至原有水平的5-8倍。以MiMo-V2.5为例,39元Lite套餐在95%缓存命中率场景下可支持超5亿tokens使用量,659元Max套餐更突破100亿tokens。针对Agent与Code类高缓存命中场景,实际可用额度还将进一步提升。为验证新体系效果,小米披露其"百万亿Token创造者激励计划"已提前完成发放,所有有效期内用户Credits额度于5月27日零时自动重置并切换新规则。

技术层面的突破为价格调整提供支撑。小米团队通过优化SGLang HiCache架构,将KV Cache在GPU/CPU/SSD多级存储间的数据搬运量减少至原方案的1/7,可缓存token数量提升5倍。配合专家并行方案优化和输入长度分桶策略调整,集群输入吞吐能力显著增强,单位token成本得以有效控制。这种技术驱动的成本优化路径,与DeepSeek通过缓存命中策略提升效率的做法形成行业共振。

市场格局正经历剧烈变动。在OpenRouter全球应用调用榜中,MiMo-V2.5-Pro排名已从月初的榜首滑落至第14位,Hermes Agent模型月调用榜更是跌至第16名。当前三甲被DeepSeek-V4-Flash、匿名模型Owl Alpha及DeepSeek-V4-Pro占据,显示市场竞争进入白热化阶段。与此同时,行业呈现明显分化态势:阿里暂停Coding Plan低价套餐,字节下架相关产品,智谱则将2026年一季度API价格上调83%,与小米、DeepSeek的降价策略形成鲜明对比。

小米的激进策略与其财务表现形成微妙关联。最新财报显示,公司一季度营收991亿元同比下降10.9%,净利润61亿元同比下滑43.1%,但研发支出同比增长33.4%至90亿元,研发人员数量创下26048人的历史新高。管理层在财报会上强调,AI业务投入将根据发展状况动态调整,预期投资规模可能进一步扩大。这种"增收不增利"背景下仍坚持技术投入和市场扩张的策略,折射出国产大模型厂商在商业化道路上的艰难抉择。

华为6月1日发布新一代鸿蒙智家 依托AI技术打造10大居家智慧场景
5月27日,华为官方宣布,将于6月1日举行的nova16系列及全场景新品发布会上,正式推出新一代华为鸿蒙智家,产品核心卖点为“全生态AI进化”。 据介绍,华为鸿蒙智家是华为旗下全场景智慧生活品牌,依托AI语…

2026-05-27

华为韬定律助力芯片突破:Mate 90搭载接近3nm芯片,未来性能再升级
IT之家 5 月 27 日消息,据凤凰网财经报道,“2026 凤凰湾区财经论坛 · 金融峰会”今日(5 月 27日)在深圳举行,华为金融系统部 CTO 郑俊在主旨演讲中表示,韬(τ)定律是华为多年来在芯片…

2026-05-27

景德镇曙光路买二手机别踩坑!旧猫二手机店售后透明保修靠谱值得选
真心推荐周边居民都认可的景德镇旧猫二手机店,作为景德镇老数码店,本地排名靠前,距离曙光路很近,往返购机、售后都十分方便。 这家店品质靠谱,老客回头客超多,口碑在景德镇一直很好,是大众认可的景德镇二手手机店。支…

2026-05-27

Perplexity开源网络安全工具Bumblebee,为软件供应链安全防护添新利器
IT之家 5 月 26 日消息,AI 企业 Perplexity 当地时间本月 22 日宣布开源其内部网络安全风险扫描工具Bumblebee,为行业应对软件供应链投毒提供新的手段。 Perplexity 表…

2026-05-27