智快网
快讯 行业 产业 汽车 科技 AI+ 热点

DeepSeek新突破:Engram模块破解Transformer记忆难题,V4架构或迎跃迁

2026-01-14来源:快讯编辑:瑞雪

近日,DeepSeek团队联合北京大学发布了一项突破性研究,提出了一种名为Engram的创新模块,旨在解决Transformer架构中长期存在的记忆瓶颈问题。该研究通过引入条件记忆机制,使模型在保持计算效率的同时显著提升了知识存储与检索能力,为大语言模型(LLM)的发展开辟了新路径。

当前主流的稀疏模型架构,如混合专家模型(MoE),虽通过条件计算降低了计算成本,但仍依赖大量参数模拟知识检索过程,导致效率低下。研究团队指出,Transformer缺乏原生知识查找机制,使得许多本应通过简单检索完成的任务被迫依赖复杂计算,既浪费资源又限制性能。针对这一问题,Engram模块通过将静态模式存储与动态计算分离,为模型提供了近似O(1)复杂度的确定性知识查找能力。

Engram的核心设计包含两大关键组件:基于哈希N-gram的稀疏检索机制和上下文感知门控系统。前者通过分词器压缩和确定性哈希函数,将局部上下文映射至预存储的记忆条目;后者则利用动态查询与记忆嵌入的交互,解决哈希冲突和多义词干扰问题。实验表明,该模块在实体识别、固定短语匹配等任务中表现出高度选择性激活,且行为可跨语言泛化。

研究团队通过系统实验验证了Engram与MoE的互补性。他们发现,当模型总参数固定时,合理分配MoE计算资源与Engram记忆容量存在最优比例,形成独特的"U型扩展法则"。在270亿参数规模下,Engram架构模型在严格等参数、等计算量条件下,较纯MoE基线在知识密集型任务(MMLU、CMMLU)中提升达4%,在推理、代码和数学任务(BBH、Humaneval、GSM8K)中提升更显著,最高达5%。

长上下文处理能力是Engram的另一重要优势。通过将局部依赖建模任务卸载至静态查找模块,模型得以保留更多注意力资源处理全局信息。在32K上下文窗口的实验中,Engram架构模型在长程检索和推理任务上展现出显著优势,尤其在等损失和等计算量设定下,性能全面超越MoE基线,甚至在仅使用82%计算量的极端设定下仍保持竞争力。

该研究的工程价值同样突出。Engram的确定性检索机制支持参数存储与计算资源的解耦,为模型优化提供了新思路。训练阶段可采用标准模型并行策略处理大规模嵌入表;推理阶段则可通过预取和重叠策略提升效率。这种设计使得模型在扩展内存容量时无需增加计算成本,为构建更大参数、更高吞吐的LLM提供了可行路径。

据悉,该研究主要由北京大学博士生Xin Cheng领衔完成。作为自然语言处理领域的新锐研究者,Xin Cheng已在NeurIPS、ACL等顶级会议发表多篇一作论文,专注于大语言模型与检索增强生成技术研究。此次提出的Engram架构,已被业界视为稀疏模型发展的重要里程碑,有望在下一代模型中得到广泛应用。

苹果iOS 26普及率统计存误?Safari策略致数据偏差引关注
同时,这也解释了为何 StatCounter 仍能识别出一部分 iOS 26 用户:这些数据实际上来自 Chrome、Firefox 等第三方浏览器,它们仍然会在用户代理中正确标注当前系统版本。Johnso…

2026-01-14

花旗报告:英伟达Vera Rubin架构或拉动PB级SSD需求 加剧NAND供应短缺
根据 @Jukan 获取到的最新花旗分析报告,英伟达下一代 Vera Rubin 架构的 AI 服务器未来几年内可能会对固态硬盘(SSD)和NAND 闪存市场形成显著拉动,并进一步加剧当前已存在的供应紧张…

2026-01-14

2025全球智能手机出货微涨2%,苹果首超三星登顶,高端化成关键驱动力
1月13日消息,研究机构Counterpoint Research发布《2025年全球智能市场报告》,数据显示2025年全球智能手机出货量同比增长2%,实现连续第二年增长;苹果凭借20%的市场份额及10%的同…

2026-01-14

移远通信CES 2026亮相RG660Qx系列5G-A模组,为下一代5G应用提供强劲支撑
IT之家 1 月 13 日消息,移远通信 (Quectel) 在本月初的 CES 2026 上推出了符合 3GPP R18 标准的RG660Qx 系列 5G-Advanced 模组,其中 RG660QA 基…

2026-01-14

LG电子进军HBM领域:混合键合堆叠设备早期版已出,2029年目标精度存挑战
【环球网科技综合报道】1月13日消息,据TheElec报道,LG电子正在开发用于高带宽存储器(HBM)的混合键合堆叠设备(键合机)早期版本。其中,混合键合工艺的测试是重点之一,团队使用模块和键合头进行相关测试…

2026-01-14

虹觅、小米、华为开放式耳机大比拼!哪款才是你的心头好?
华为 FreeArc:为了保证耳机连接性,这款耳机内置了蓝牙 5.2芯片,逆声声学系统通过减少漏音实现了定向传声,保护了用户的隐私性,而IPX7级防水设计则让它具备出色的抗水能力,无论是应对雨天还是运动场景…

2026-01-14

解锁小米手机隐藏扫描技能!从文档到试卷,办公学习效率飙升秘籍
3.多页扫描:如果你有一份几十页的合同需要扫描成一个PDF文件,在这个App里开启“连续拍摄”模式,拍完所有页面后,一键导出为PDF,效率极高。 有时候我们扫描文档并不是为了要图片,而是想要上面的文字内容…

2026-01-14

苹果谷歌携手合作:借Gemini模型与云技术,共筑苹果AI新未来
【太平洋科技】1 月 13 日消息,苹果公司官宣将与谷歌联手,利用谷歌的大模型技术为其人工智能功能提供支持。苹果计划支付约 10亿美元年费,利用 Gemini 在后台协助训练和增强自研基础模型,但所有用…

2026-01-13

2026游戏手机怎么选?三款性能续航双在线机型,助你畅玩不纠结
如果你正在寻找一台能畅玩3A大作又不伤钱包的设备,这三款搭载顶级芯片、拥有极致散热和超长续航的机型绝对值得一看——尤其是首推的荣耀WIN系列,以185Hz电竞屏、10000mAh巨无霸电池和第五代骁龙8至尊版…

2026-01-13