智快网
快讯 行业 产业 汽车 科技 AI+ 热点

DeepSeek联合顶尖高校发布新论文,DualPath架构破解LLM推理性能瓶颈

2026-02-28来源:互联网编辑:瑞雪

研究团队通过实证分析发现,在典型编程任务场景中,智能体平均需要完成157轮交互,上下文长度累计达32.7K个语言单元,但每轮新增内容仅429个单元。这种"长上下文、短增量"的特性,使得键值缓存(KV-Cache)的加载效率成为决定系统性能的关键因素。实验数据显示,现有架构中存储带宽利用率存在严重失衡——预填充引擎的带宽资源长期处于满负荷状态,而解码引擎的带宽资源却有90%以上处于闲置状态。

硬件发展趋势进一步加剧了这种矛盾。以英伟达GPU架构演进为例,从Ampere到Blackwell架构,计算性能提升了14.4倍,但存储带宽和显存容量的增长幅度不足3倍。这种计算与存储能力发展的非对称性,导致传统预填充-解码分离架构的吞吐量提升遭遇天花板。

该架构的实现面临三大技术挑战:首先是数据传输粒度控制,研究团队设计了分层块传输机制,将缓存数据切割为不同粒度的传输单元,使网络开销降低60%;其次是流量隔离技术,通过引入中心化网络控制器和InfiniBand虚拟通道,确保关键计算任务不受数据加载影响;最后是动态调度算法,系统实时监测GPU负载、网络状态和任务特征,自动调整预填充与解码模块的资源分配比例。

性能评估显示,在包含6600亿参数的DeepSeek-V3.2模型测试中,新架构在离线批处理场景下实现1.87倍吞吐量提升,在线服务场景的智能体处理能力提升近2倍。更值得关注的是其扩展性表现:在由1152块GPU组成的集群测试中,系统从8节点扩展到144节点时,性能提升幅度达到理论值的92%,且延迟波动控制在5%以内。在44个预填充引擎+88个解码引擎的配置下,系统吞吐量较基线系统提升22倍。

14亿年薪难留人才!庞若鸣跳槽OpenAI,顶级人才究竟追寻什么?
当庞若鸣的名字和“OpenAI新成员”绑定在一起时,整个AI圈都在倒吸冷气——不是因为钱少了,而是因为这数字背后藏着一个更扎心的真相:在顶级人才眼里,有些东西,比2亿美金(约14亿人民币)更值钱。 在谷歌1…

2026-02-27

春节新景:县城老人借AI视频带娃社交,解锁创作新技能
从我妈用奥特曼哄孙子,到大姨的家庭群社交,这些案例没有任何一个发生在一线城市,没有任何一个使用者能解释“大模型”的原理,但他们共同构成了AI视频最真实的用户画像。 AI视频可能正在经历同样的“预期修正”,它…

2026-02-27

华为马德里发布会:Mate 80 Pro领衔,全场景新品开启全球化新征程
对于行业而言,这是一个“奔跑”规则的重塑信号:HUAWEI Mate80 Pro的海外回归,让全球消费者和行业清晰地看到,华为已走出技术突破的关键阶段,进入凭借自主创新引领用户体验“奔跑”的全新阶段,它证明…

2026-02-27

AMD发布Adrenalin Edition 26.2.2版驱动,支持新游并修复RX 7000系列显卡问题
IT之家 2 月 27 日消息,AMD 昨日(2 月 26 日)发布 Adrenalin Edition 26.2.2版显卡驱动,新增支持《生化危机:安魂曲》和《失落星船:马拉松》游戏。 针对卡普空的恐怖生…

2026-02-27

AI文生视频领域新突破:快手可灵3.0系列登顶全球榜单引领变革
IT之家 2 月 27 日消息,AI 基准测试机构 Artificial Analysis发布最新一期全球视频生成大模型榜单,在文生视频赛道上,快手可灵 3.0 系列模型(Kling 3.0 Pro)以 1…

2026-02-27

石头科技再获清洁新专利:模块化设计解锁智能清洁新场景,引领行业升级
根据行业监测数据,石头科技在2025年参与了14次招投标项目,中标率高达71%,在高端商用清洁设备市场的占有率突破了18%。石头科技此次的专利布局,不仅巩固了其在智能清洁领域的技术领先地位,更为行业树立了新的…

2026-02-27