智快网
快讯 行业 产业 汽车 科技 AI+ 热点

DeepSeek新动向:MoE模型利器DeepEP通信库震撼开源!

2025-02-25来源:ITBEAR编辑:瑞雪

近日,DeepSeek在其备受瞩目的“开源周”活动中,迎来了第二天的重要发布——DeepEP,这是一个专为混合专家(MoE)模型训练和推理设计的开源EP通信库。

DeepEP的开源地址已经公布,感兴趣的开发者和研究人员可以访问此链接获取更多信息。

据官方介绍,DeepEP具备多项显著特征,使其成为处理MoE模型时的理想选择。首先,它采用了高效优化的全到全通信方式,确保了数据传输的高效性。其次,DeepEP支持节点内外的通信,并且兼容NVLink和RDMA技术,这为用户提供了更多的灵活性和兼容性。

DeepEP还提供了高吞吐量的内核,这些内核在训练和推理的前期填充阶段能够显著提升效率。同时,对于推理解码任务,DeepEP则提供了一套低延迟内核,这些内核采用纯RDMA技术,最大限度地减少了延迟,从而优化了推理解码速度。

DeepEP完全支持FP8数据格式的调度,这对于低精度计算的需求来说无疑是一个重要的优势。该库还提供了灵活的GPU资源管理功能,支持计算与通信的重叠执行,这进一步提高了资源利用效率和整体性能。

DeepEP的设计初衷是为了满足混合专家(MoE)和专家并行(EP)模型的特殊需求。它提供了高吞吐量和低延迟的all-to-all GPU内核,这些内核常用于MoE的派发和合并操作。为了与DeepSeek-V3论文中提出的组限制门控算法兼容,DeepEP还进行了一些针对不对称带宽转发优化的内核设计。

例如,它能够将数据从NVLink域转发到RDMA域,这些优化的内核提供了高吞吐量,非常适合用于训练和推理的预填充任务。同时,DeepEP还支持SM(流式多处理器)数量控制,这为用户提供了更多的控制和灵活性。

对于延迟敏感型的推理解码任务,DeepEP的低延迟内核无疑是一个重要的亮点。这些内核采用纯RDMA技术,最大限度地减少了延迟,从而确保了推理解码任务的高效执行。DeepEP还采用了一种基于Hook的通信与计算重叠方法,这种方法不会占用任何SM资源,进一步提高了整体性能。

当然,要使用DeepEP,还需要满足一些硬件和软件的要求。例如,需要配备Hopper GPUs(未来可能会支持更多架构或设备),以及Python 3.8及以上版本、CUDA 12.3及以上版本和PyTorch 2.1及以上版本。还需要使用NVLink或基于RDMA网络的节点间通信。

荣誉加冕 东软入选福布斯中国2025出海全球化领军品牌榜
11月7日,2025福布斯中国出海全球化3030榜单正式揭晓。东软集团全资子公司东软云科技以卓越的数字服务赋能能力与全球化实践,入选2025出海全球化领军品牌Top30,成为唯一上榜的综合数字服务科技企业。这一殊荣是对东

2025-11-13

AI迎“效果涌现时刻”,李彦宏:AI产业结构正转变为健康的“倒金字塔”
“当AI能力被内化,成为一种原生的能力,智能就不再是成本,而是生产力。”11月13日举办的2025百度世界大会上,百度创始人李彦宏演讲时表示,更应关心如何让AI跟每一项任务有机结合,“让AI成为企业发展和个人成长的

2025-11-13

重构智能边界:宠智灵宠物AI大模型的技术范式与产业影响
在人工智能产业快速发展的今天,垂直领域大模型正在成为产业智能化的核心驱动力。宠智灵科技正是其中的代表者之一。其自研的“宠生万象”宠物AI大模型,凭借超大规模数据训练体系、深层语义理解能力与跨模态融合算法

2025-11-08

东软出席中国卫生经济学会公立医院高质量发展分会学术年会
近日,由中国卫生经济学会主办的中国卫生经济学会第二十六次学术年会分论坛六暨公立医院高质量发展分会学术年会在北京举办,本次会议以“智慧管理推动公立医院高质量发展”为主题,围绕智慧管理在优化医疗服务流程、

2025-10-30

未来视界的「红楼入梦」:科技、美学与家的三重奏
当古典文学巅峰《红楼梦》邂逅现代显示科技,一场跨越时空的东方美学对话就此展开。2025年10月25日,知乎携手京东电视,于河北廊坊「只有红楼梦·戏剧幻城」举办「十二金钗·十二金吋」主题活动。行业专家、艺术家与

2025-10-27

OPPO Find X9系列首销火爆:“追光红”售罄,高端市场接受度持续攀升
OPPO Find系列产品负责人周意保在社交媒体发文确认Find X9系列首销成绩优于预期,并表示线下门店客流及线上热度均表现突出。市场研究机构人士透露,OPPO Find X9系列首销表现较上一代产品有…

2025-10-23

2025年Q3全球PC市场稳健增长 联想惠普华硕等头部厂商表现亮眼
2025-10-22 17:41:32 作者:狼叫兽 总体来看,全球PC市场在2025年第三季度延续了增长趋势,前五大厂商均实现同比增长,其中联想、惠普和华硕增幅显著,反映出主流品牌在产品更新与市场需求回暖…

2025-10-23

网友苦等一加15终有回应 李杰承诺不辜负期待 165帧游戏新体验即将登场
快科技10月23日消息,有网友给一加中国区总裁李杰留言:前面那么多新机都没买,就一直等着一加15。李杰回复:“等等党不会输”。 从120帧到165帧,游戏帧率的突破不仅是参数上的跃升,更是手游体验的一次大换代…

2025-10-23

Wi-Fi 7时代来临,BAW滤波器如何助力无线连接体验升级?
针对国内Wi-Fi7路由器频段需求,可实现精准频段划分与干扰抑制;面向海外6GHz频段应用,产品也通过相关认证,为国产设备出海提供关键元器件支持。 开元通信BAW滤波器成功导入多家头部客户并实现量产,不仅积…

2025-10-22

华为Mate 70 Air登场!“Air”赛道上,华为与苹果的轻薄新较量
苹果那边的iPhone Air还没捂热乎呢,这边华为的“Mate 70 Air”就在电信终端产品库里亮了相。 这种设计不只是为了好看,它对手感的提升是巨大的,拿在手里,没有了那种硌手的棱角感,整个机器会感觉更…

2025-10-22