智快网
快讯 行业 产业 汽车 科技 AI+ 热点

DeepSeek新年首篇论文问世:mHC新架构登场 梁文锋位列作者团队

2026-01-01来源:互联网编辑:瑞雪

近日,人工智能领域迎来一项重要突破,DeepSeek团队公布了一篇关于新型神经网络架构的研究论文,提出名为“流形约束超连接”(mHC)的创新框架。该研究针对传统超连接技术在大规模模型训练中存在的稳定性问题展开探索,旨在通过结构优化实现性能与效率的双重提升。

论文核心团队由三位年轻研究者主导,分别是解振达、韦毅轩与曹焕琦,DeepSeek创始人梁文锋亦参与其中。研究指出,近年来以超连接(HC)为代表的技术通过拓宽残差流路径、丰富连接模式,显著提升了模型性能,但这种复杂化设计破坏了残差连接固有的恒等映射特性,导致训练过程易出现不稳定现象,同时伴随高昂的内存访问成本,限制了技术的进一步扩展。

针对上述痛点,mHC框架通过数学投影将超连接的残差空间约束至特定流形结构,在保留多样化连接优势的同时,重构了恒等映射的稳定性基础。研究团队同步开发了配套的基础设施优化方案,确保新架构在硬件层面的高效运行。实验数据显示,该技术在大规模训练场景中表现出色,不仅实现了性能的实质性提升,更展现出优异的扩展能力。

这项成果被视为对神经网络拓扑设计的重要补充。研究团队认为,mHC作为超连接技术的实用化延伸,为理解复杂架构的内在机制提供了新视角,其设计理念或可推动基础模型向更高效、更稳定的方向演进。目前,相关代码与实验细节已通过论文形式公开,供学术界与产业界验证参考。

太空高温炉助力芯片制造:失重环境打造高纯度,未来应用前景广阔
快科技1月1日消息,近日,来自英国SpaceForge团队的微波炉大小的高温炉在太空中成功启动,并达到了1000°C的高温,在验证太空中制造半导体的可行性方面迈出一大步。Space Forge高管Veron…

2026-01-01

2nm工艺成本高昂,高通骁龙8至尊Pro版或成高端专属,标准版更亲民
其中 Pro 版本的定价预计将突破 300 美元(IT之家注:现汇率约合 2100 元人民币)大关,其中一个亮点是支持最新的 LPDDR6 内存,这一前所未有的高价意味着,该芯片极有可能仅被用于各品牌最高端…

2026-01-01

百元机新标杆!酷派锋尚50 Lite以均衡实力诠释高性价比之选
今天要介绍的这款酷派锋尚50 Lite,用不到千元的价格,提供了远超预期的使用体验。拿在手中,你会忘记这是一款百元机——纤薄的金属边框配合2.5D弧面玻璃,手感完全不输中端机型。对于那些只需要一部"够用就好"…

2026-01-01

英国Space Forge太空启动熔炉验证工艺 太空芯片制造竞争升温
相比之下,太空环境为芯片制造提供了独特的物理优势。 得益于太空的特殊环境,Space Forge 致力于打造远超地面工艺的超纯半导体。Space Forge 于 2025 年 6 月搭乘 SpaceX 的“…

2026-01-01

稚晖君携上纬启元亮相:全球最小力控人形机器人启元Q1开启共创时代
它重新定义了小型化人形机器人的可能性,旨在打造个人可拥有、可使用、可创作的机器人形态,为个人机器人市场注入全新活力,也为未来的商业场景提供了更多想象空间。新品牌“上纬启元”将明确聚焦“个人机器人”方向,致力于…

2026-01-01

VGN与WPS联名V98Pro V3机械键盘来袭!复古风设计,首发389元还赠特色键帽轴体
IT之家 12 月 31 日消息,VGN 今日正式推出了 V98Pro V3 三模机械键盘的 WPS 联名版本,首发价 389 元并附赠三颗"W" "P" "S" 经典主题色联名增补键帽和对应增补轴体。 该…

2026-01-01