智快网
快讯 行业 产业 汽车 科技 AI+ 热点

华为携手湖北移动完成全国运营商首个AI推理加速现网测试 成效显著

2026-06-27来源:快讯编辑:瑞雪

华为与中国移动通信集团湖北有限公司(湖北移动)在2026 MWC上海展期间联合宣布,双方成功完成全国运营商首个AI推理加速解决方案的现网测试。这一突破性成果标志着运营商在智算业务领域的技术部署迈出关键一步,为长序列AI推理场景提供了高效解决方案。

测试基于华为OceanStor A800存储系统与昇腾A3超节点架构,通过集成UCM(Unified Cache Manager,推理记忆数据管理)技术,在长序列AI推理场景中实现了Token吞吐率最高提升372%的显著效果。该方案有效突破了传统架构在处理长上下文时的性能瓶颈,为运营商智算资源的高效利用提供了技术支撑。

在湖北移动现网环境中,测试团队部署了vLLM-Ascend框架,针对MiniMax M2.5、GLM-5.1等主流大模型,模拟了8K至190K长序列输入场景。结果显示,在MiniMax M2.5模型下,启用UCM后首Token延迟(TTFT)优化幅度达26%至62%,单NPU卡Token输出效率(TPS)显著提升。其中,64K序列长度下TPS提升58%,128K序列长度下提升78%。

GLM-5.1模型的测试数据更为突出:UCM使TTFT优化幅度达到51%至93%,TPS提升范围为56%至372%。具体来看,64K序列长度下TPS提升313%,128K序列长度下最高提升372%。这一成果表明,随着上下文长度的增加,AI推理加速方案的优势进一步放大,有效解决了长序列推理中的KV Cache容量限制问题。

对于运营商而言,该方案的应用将显著提升现网智算资源的利用效率。在大模型推理、智能客服、内容生成、行业智能体等长序列AI业务场景中,运营商可降低长上下文推理带来的性能压力,同时优化用户体验。华为表示,此次测试验证了AI推理加速方案在复杂场景下的可靠性,为运营商智算业务的大规模部署奠定了基础。

高通骁龙8E6与8E6 Pro参数揭晓:2nm工艺加持 小米18系列将首发登场
快科技6月26日消息,高通骁龙8E6系列将于9月正式登场,该芯片将由小米18系列首发搭载。两款芯片均采用台积电2nm工艺制造,这也是高通旗下首款2nm制程的手机芯片。 作为首发机型,小米18系列同时获得了骁…

2026-06-27

苹果Mac、iPad已涨价,iPhone暂未跟涨,未来涨价或成定局?
这轮涨价的核心原因,并不是苹果突然想多赚钱,而是AI产业快速发展带动内存和存储芯片价格持续上涨,苹果官方也表示,零部件成本上涨已经给产品带来较大压力。 Mac和iPad率先涨价,本质上是成本压力已经传导到了…

2026-06-27

万元预算折叠屏怎么选?OPPO Find N6领衔,多款分屏体验佳的机型推荐
- 首选OPPO Find N6:它不仅仅在“分屏”这个单一功能上表现出色,更是从“无感折痕”的物理基础,到“全景自由窗”的系统交互,再到“AI手写笔”的生态外挂,构建了一套完整且领先的折叠屏生产力解决方案…

2026-06-27

苹果Xcode 26.6正式登场:谷歌Gemini编程助手入驻,多系统SDK同步更新
IT之家 6 月 26 日消息,苹果现已发布 Xcode 26.6 IDE,新增谷歌 Gemini 编程助手支持。IT之家附苹果官方更新公告如下: Xcode 26.6 包含 Swift 6.3.3,以及…

2026-06-26