智快网
快讯 行业 产业 汽车 科技 AI+ 热点

蚂蚁技术研究院发布LLaDA2.0 扩散语言模型 参数达100B且开源共享

2025-12-12来源:快讯编辑:瑞雪

蚂蚁技术研究院近日正式发布全新离散扩散大语言模型系列——LLaDA2.0,同步公开的技术报告显示,该系列包含100B参数的"flash"版本与16B参数的"mini"版本,成为全球首个突破百亿参数的扩散语言模型。这一突破性成果标志着扩散模型在参数规模扩展领域取得重大进展,成功打破业界对扩散模型难以规模化应用的固有认知。

研发团队创新采用混合专家(MoE)架构,通过模块化设计实现模型性能与计算效率的平衡。在训练策略方面,提出的Warmup-Stable-Decay(WSD)持续预训练方法,使新模型能够直接继承现有自回归(AR)模型的知识体系,避免了传统从头训练带来的高昂成本。配合置信度感知并行训练(CAP)与扩散模型专用DPO技术,在保证生成质量的同时,将推理速度提升至AR模型的2.1倍。

多维度评估数据显示,LLaDA2.0在结构化生成任务中表现尤为突出。在代码生成、数学推理及智能体交互等场景下,其性能指标全面超越同级别AR模型,而在自然语言理解等基础能力方面则与开源AR模型持平。这种"专长强化+基础稳固"的特性,为特定领域的大模型应用开辟了新路径。

为推动技术生态发展,研究院已将16B与100B两个版本的模型权重及完整训练代码开源至Huggingface平台。开发者可通过公开资源复现训练过程,或基于现有模型进行二次开发。此次开源不仅降低了超大规模模型的技术门槛,更为学术界提供了研究扩散模型规模化应用的重要样本。

华为登顶全球OWS榜首:开放式耳机市场高增长,新玩家仍有突围机会
快科技12月12日消息,Omdia2025年Q3个人智能音频设备数据显示,全球OWS(开放式耳机)本季度总出货量达1030万台,同比飙升69%。 其中华为以90万台的出货量、8%的市场份额登顶全球OWS厂商…

2025-12-12

苹果2026年入局折叠屏,三星份额或大增,大折叠将主导市场?
而根据CounterPoint的调研数据,由于苹果折叠屏iPhone面板采购需求强劲,2026年全球折叠屏手机面板出货量预计将同比增长46%。 2025年,三星在折叠屏手机面板的市场份额为43%,而第二…

2025-12-12

荣耀X8d新机现身吉尔吉斯斯坦:7000mAh大电池+亿级主摄成亮点
【CNMO科技消息】CNMO从外媒获悉,荣耀X8d新款手机已正式现身,尽管尚未举行官方发布会,但该机已在吉尔吉斯斯坦的零售网站上亮相。其核心配置包括一块6.77英寸、分辨率为1080×2392的AMOLED屏…

2025-12-12

三星2026年初或连发三款5G新机 A57领衔A37与A07同步登场
【CNMO科技消息】据外媒“gizmochina”报道,三星正加快其A系列中低端手机的更新节奏,计划在2026年初集中推出三星A575G、三星A37 5G以及三星A07 5G三款新机。 同期登场的三星A37…

2025-12-12

大疆Pocket 4爆料来袭:多摄方案续航升级,或明年一月登场?
至于大家最关心的相机规格方面,根据前期的一些供应链泄露和近期流出的几张户外谍照来看,目前有一点是可以确定的:Pocket 4大概率要采用多摄像头方案了。 现阶段关于这颗新长焦的消息非常有限,有推测说大疆会…

2025-12-12

2000元预算选机不纠结!这四款高性价比全能手机闭眼入
1荣耀500作为一款售价2699元的手机,荣耀500搭载了2亿像素主摄像头与1200万像素超广角微距摄像头,配合5000万像素前置摄像头,为用户带来出色的影像体验。 影像是魅族22的核心卖点,其配备一套堪…

2025-12-12

ZAO 2025年度推荐:vivo Y500续航强劲耐用,实用型用户优选之选
vivo Y500适合对续航、耐用性和基础体验有高要求的大众用户,尤其契合外卖骑手、网约车司机、户外工作者及长辈群体。其超长续航可支撑全天高强度使用,满级防水与抗摔设计无惧复杂环境,而简洁直观的Origin…

2025-12-12