智快网
快讯 行业 产业 汽车 科技 AI+ 热点

华为数据存储携手中科弘云 推出AI推理加速方案 赋能多行业应用

2025-12-23来源:快讯编辑:瑞雪

华为数据存储与中科弘云近日联合推出了一项AI推理加速解决方案,旨在通过软硬件深度协同优化,为长序列推理场景提供高效算力支撑。该方案以华为OceanStor A系列存储为核心数据底座,结合中科弘云自主研发的HyperCN智算互联网云服务平台,构建起覆盖数据存储、算力调度、推理加速的全栈能力体系。

在技术架构层面,方案创新性地融合了华为UCM推理记忆数据管理技术与中科弘云平台能力。通过KV Cache多级缓存管理机制,将推理过程中的关键数据持久化存储于OceanStor A系列设备,实现推理记忆的全量保存与快速调用。这种设计有效减少了重复计算开销,配合Prefix Cache与GSA稀疏加速算法,在长序列推理场景中可显著降低首Token生成时延(TTFT)。实测数据显示,在智能问答典型场景中,该方案使TTFT降低57.5%,且序列长度与优化效果呈正相关关系。

针对复杂算力环境,方案构建了异构资源管理体系。系统支持英伟达、华为昇腾、寒武纪等多品牌AI芯片的协同调度,兼容MindSpore、vLLM、SGLang等主流开发框架,并通过Kubernetes容器编排技术实现与存储系统的无缝对接。这种设计使得能源电力、智能制造等行业的用户能够灵活整合现有算力资源,避免硬件锁定带来的技术风险。

在算力调度方面,方案采用细粒度资源池化策略,可根据业务需求动态分配计算资源。系统具备集群作业调度、实时健康监测、故障自动恢复等运维能力,支持分钟级任务重启与系统自愈。特别是在长文档处理场景中,结合GSA稀疏加速算法后,当序列长度达到39K时,系统并发处理能力提升86%,整体推理吞吐量增长36%,有效提升了复杂模型的生产部署效率。

为降低AI开发门槛,方案提供覆盖全流程的端到端工具链,涵盖数据标注、模型训练、推理部署等关键环节。工具链同时支持传统机器学习与深度学习开发模式,实现AI资产的标准化管理。目前该方案已在国家实验室、能源电力、智能制造等领域启动试点应用,通过实际场景验证了其在复杂业务环境中的技术可行性。

realme真我16 Pro及Pro+影像参数揭晓,2亿像素主摄,明年1月6日登场
IT之家 12 月 23 日消息,realme 真我昨天在 Instagram 平台公布了 16 Pro/16 Pro+手机的影像参数,两台手机都将搭载 2 亿像素主摄,明年 1 月 6 日正式发布。 据介…

2025-12-23

vivo手机外语语音听不懂别发愁!3种实用翻译方法,轻松打破沟通障碍
其实,你的vivo手机里藏着不少“黑科技”,配合专业的工具,可以轻松搞定语音翻译。 如果你收到的不是简单的几秒钟语音,而是一段较长的录音文件,或者是会议记录、课程录音,甚至是对准确度要求极高的商务语音,系统自…

2025-12-23

阿里千问再发力!1999元G1 AI眼镜登场,性能拉满开启亲民新篇章
与S1不同的是,G1不带显示能力,这一方面对近视用户群体更友好,其可以自由选择配镜功能,另一方面也能缩短发货周期,更快铺货。 在吴嘉看来,用户选择夸克AI眼镜,其实相当于选择了阿里巴巴千问大模型和整个阿里巴…

2025-12-23

小米17 Ultra星空绿登场!纤薄机身超大直屏 夜神长焦创新升级
快科技12月22日消息,今日,小米17 Ultra全新配色星空绿亮相,官方同步公布新机设计细节,号称是小米最惊艳的Ultra手机。据介绍,小米17 Ultra星空绿融入矿石颗粒,采用分段式音量键+包裹式中框…

2025-12-23

国产手机Air化热潮背后:跟风还是创新?轻薄与体验如何权衡?
其次,iPhone Air的发布本质上完成了对轻薄手机的“品类定义”,为分散的市场探索提供了统一的价值锚点,这也是Air版快速普及的关键前提。 从目前市场表现来看,部分国产Air机型仅仅停留在“命名跟风”层…

2025-12-23