阿里开源千问Qwen3.5-Plus：性能媲美Gemini 3 Pro，推理效率与多模态能力双飞跃-AI+-智快网

阿里巴巴近日宣布开源全新一代大模型千问Qwen3.5-Plus，该模型在性能上与Gemini 3 Pro不相上下，成为全球开源模型中的佼佼者。此次发布的Qwen3.5-Plus版本总参数高达3970亿，但激活参数仅为170亿，实现了以小博大的技术突破。其性能不仅超越了万亿参数的Qwen3-Max模型，还在部署显存占用上降低了60%，推理效率大幅提升，最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API价格极具竞争力，每百万Token仅需0.8元，仅为Gemini 3 Pro的1/18。

与前几代千问大语言模型相比，Qwen3.5-Plus实现了从纯文本模型到原生多模态模型的重大转变。千问3主要在纯文本Tokens上进行预训练，而Qwen3.5-Plus则基于视觉和文本混合token进行预训练，并大幅增加了中英文、多语言、STEM和推理等数据。这使得模型能够“睁开眼睛”看世界，掌握更密集的世界知识和推理逻辑。在推理、编程、Agent智能体等全方位基准评估中，Qwen3.5-Plus均表现出色，例如在MMLU-Pro知识推理评测中得分87.8分，超越GPT-5.2；在博士级难题GPQA测评中斩获88.4分，高于Claude 4.5。

原生多模态训练也显著提升了Qwen3.5-Plus的视觉能力。在多模态推理、通用视觉问答VQA、文本识别和文件理解、空间智能、视频理解等众多权威评测中，Qwen3.5-Plus均取得了最佳性能。特别是在视频理解方面，该模型支持长达2小时的视频直接输入，适用于长视频内容分析与摘要生成。同时，Qwen3.5-Plus还实现了视觉理解与代码能力的原生融合，能够将手绘界面草图直接转为可用的前端代码，一张截图就能定位并修复UI问题，极大地提高了视觉编程的效率。

Qwen3.5-Plus性能的飞跃，得益于对Transformer经典架构的重大创新。千问团队自研的门控技术成果曾获得全球AI顶会2025 NeurIPS最佳论文，该技术已融入到Qwen3.5-Plus的创新混合架构中。团队结合线性注意力机制与稀疏混合专家MoE模型架构，实现了397B总参数激活仅17B的极致模型效率。通过训练稳定优化以及多token预测等系列技术，Qwen3.5-Plus的性能与Qwen3-Max模型持平，并进一步提升了推理效率。在常用的32K上下文场景中，推理吞吐量可提升8.6倍；在256K超长上下文情况下，推理吞吐量最大可提升至19倍。

Qwen3.5-Plus的原生多模态训练是在阿里云AI基础设施上高效完成的。通过系列基础技术创新，该模型在文本、图像、视频等混合数据训练吞吐量上，几乎与纯文本基座模型训练持平，大大降低了原生多模态训练的难度门槛。同时，通过设计精巧的FP8、FP32精度应用策略，在训练稳定扩展到数十万亿个token时，激活内存减少约50%，训练还能提速10%，进一步节约了模型训练成本、提升了训练效率。

基于强大的视觉能力，Qwen3.5-Plus在Agent框架和应用方面也取得了新突破。该模型可自主操作手机与电脑，高效完成日常任务，在移动端支持更多主流APP与指令，在PC端可处理更复杂的多步骤操作，如跨应用数据整理、自动化流程执行等。千问团队还构建了一个可扩展的Agent异步强化学习框架，端到端可加速3到5倍，并将插件式智能体Agent支持扩展至百万级规模。1月15日，千问App发布了全球首个消费级AI购物Agent，春节期间6天时间帮用户完成了1.2亿笔订单，在全球首次实现大规模真实世界任务执行和商业化验证。

自2023年开源以来，阿里巴巴已开源400多个千问模型，覆盖全尺寸、全模态，全球下载量突破10亿次。单月下载量方面，千问是DeepSeek、meta、OpenAI、智谱、Kimi、MiniMax等2到8名总和，开发者基于千问开发的衍生模型超20万，成为公认的全球第一开源模型，也是开发者最友好的开源大模型。面向不同国家的AI开发者和企业的需求，千问大模型还在持续演进，Qwen3.5-Plus已扩展支持201种语言，将词表大小从15万扩展到25万，可最高提升小语种60%的编码效率。据悉，千问APP、PC端已第一时间接入Qwen3.5-Plus模型，开发者可在魔搭社区和HuggingFace下载新模型，或通过阿里云百炼直接获取API服务。阿里巴巴还将继续开源不同尺寸、不同功能的千问3.5系列模型，性能更强的旗舰模型Qwen3.5-Max不久也将发布。

阿里今日或开源Qwen3.5大模型架构创新有望成国产新里程碑

2026-02-16

字节跳动豆包大模型2.0来袭，多款模型适配多样场景，Seedance 2.0同步接入

这次的豆包2.0包括Pro、Lite、Mini三款通用Agent模型和Code模型，灵活适配各类业务场景。具体来看，豆包 2.0 全面升级了多模态能力，在各类视觉理解任务上均达到世界顶尖水平，视觉推理、感…

2026-02-16

北京大学团队突破：纳米栅铁电晶体管实现超低功耗数据存储新飞跃

IT之家 2 月 16 日消息，据北京大学官方账号昨日分享，该校在非易失性存储器领域取得突破性进展，电子学院邱晨光-彭练矛团队首次提出“纳米栅超低功耗铁电晶体管”，真正实现了超低功耗下的数据高效存储，相关成果…

2026-02-16

苹果平价版MacBook或3月登场：多彩铝壳设计搭载A系列芯片主打年轻市场

IT之家 2 月 15 日消息，彭博社记者马克 · 古尔曼今天在最新一期《Power On》通讯中表示，苹果即将推出的平价版 MacBook将搭载更加活泼的外壳，吸引更多年轻用户。古尔曼表示，苹果本来可以…

2026-02-16