智快网
快讯 行业 产业 汽车 科技 AI+ 热点

蚂蚁集团发布万亿参数思考模型Ring-2.5-1T 长文本生成与推理能力再上新台阶

2026-02-13来源:互联网编辑:瑞雪

蚂蚁集团近日宣布开源全球首个采用混合线性架构的万亿参数思考模型——Ring-2.5-1T。该模型在长文本生成、数学推理及智能体任务执行等复杂场景中展现出开源领域的领先优势,为智能体时代的高性能任务处理提供了重要技术支撑。其突破性成果不仅体现在参数规模与架构创新上,更通过多项权威测试验证了实际应用价值。

在核心性能方面,Ring-2.5-1T通过优化注意力机制显著提升了长序列推理效率。相较于前代模型,其在32K以上长文本生成场景中访存规模降低超10倍,生成吞吐量提升3倍以上。模型激活参数从510亿扩展至630亿,但得益于混合线性架构的支撑,推理效率不降反升。对比仅拥有320亿激活参数的KIMI K2架构,Ring-2.5-1T在1万亿总参数量下仍保持显著吞吐优势,且随着生成长度增加,效率差距持续扩大。

数学推理能力成为该模型的重要亮点。在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测中,Ring-2.5-1T分别达到35分和105分的金牌标准。在深度思考模式下,该模型在IMOAnswerBench、HMMT-25等数学竞赛推理基准测试中超越DeepSeek-v3.2-Thinking、GPT-5.2-thinking-high等主流开源与闭源模型,同时在LiveCodeBench-v6代码生成基准中展现跨任务泛化能力。

智能体框架适配性方面,Ring-2.5-1T支持Claude Code等主流智能体框架及OpenClaw个人AI助理,可实现多步规划与工具调用。在逻辑推理、代码生成等高难度场景中,该模型与Kimi-K2.5-Thinking、Gemini-3.0-Pro-preview-thinking-high等竞品对比时,仍保持开源领域的领先地位。其设计目标直指当前AI应用从短对话向长文档处理、跨文件代码理解等场景扩展的需求,有效缓解了长输出场景下的计算开销与推理延迟问题。

技术实现层面,Ring-2.5-1T基于Ling 2.5架构构建,通过创新混合线性注意力机制平衡了模型规模与推理效率。蚂蚁百灵团队在模型训练过程中,同步优化了大规模训练基础设施、算法设计与工程落地能力,确保万亿参数模型的可扩展性与稳定性。目前,该模型的权重文件与推理代码已在Hugging Face、ModelScope等开源平台开放下载,官方交互体验页面与API服务计划于近期上线。

宇树王兴兴谈具身智能:未来热度或远超移动互联网,拐点一两年内将至
IT之家 2 月 13 日消息,宇树科技创始人、CEO王兴兴今日在接受央视采访时表示具身智能未来热度或远超移动互联网,但目前具身智能还不够热。这个热度,我觉得会远超移动互联网。 据IT之家此前报道,王兴兴还…

2026-02-13

摩托罗拉或入局阔屏手机市场 7英寸巨屏方案引发行业新期待
该博主所指的「阔屏手机」预计指类似华为 Pura X 屏幕比例的手机,参考IT之家此前报道,后者发布于今年 3 月 20 日,是首款全面搭载HarmonyOS 5 系统的手机,配备了一块分辨率为 2120…

2026-02-13

索尼WF - 1000XM6旗舰TWS耳机来袭:降噪音质双升级,佩戴体验再优化
配置方面,XM6 搭载新一代 HD Noise Cancelling Processor QN3e芯片,可对多麦克风进行更精细的控制;同时每只耳机配备 4 颗麦克风,相比上一代的 3 颗进一步增强了降噪能…

2026-02-13

索尼旗舰WF-1000XM6耳机登场:降噪音质双升级,续航防水表现亮眼
音质上,QN3e芯片带来DAC放大器性能提升,让声音细节更清晰,同时搭载Integrated ProcessorV2,支持32-bit音频处理,对比上一代的24-bit实现更高解析度和更丰富的声音表现。 …

2026-02-13

石头科技再获新专利:柔轮设计赋能谐波减速器,推动智能清洁新发展
这种设计使得柔轮在谐波减速器中的应用实现了轻量化,从而提升了设备的整体性能。这一创新无疑将为智能清洁设备的普及和升级提供有力支持。 总的来说,石头科技的“柔轮、谐波减速器、机械臂和清洁设备”专利是其在智能清洁…

2026-02-13