智快网
快讯 行业 产业 汽车 科技 AI+ 热点

阿里千问Qwen3.7-Max发布:国产模型登顶,35小时自主完成硬核硬件优化

2026-05-21来源:快讯编辑:瑞雪

阿里巴巴在近期举办的阿里云峰会上,正式发布了其千问大模型系列的最新旗舰版本——Qwen3.7-Max。这一版本在智能体能力与推理性能方面实现了全面提升,并在Arena全球大模型盲测总榜中荣登国产模型榜首,综合实力已接近国际顶尖模型如GPT、Claude和Gemini。这标志着千问系列在近三个月内完成了第三次重大迭代,进一步巩固了其在全球人工智能领域的地位。

Qwen3.7-Max作为一款专为智能体场景优化的大模型,在多个权威测评中取得了突破性进展。在编程领域,该模型在SWE-Pro、SWE-Multilingual等智能体测评中表现卓越,Terminal Bench 2.0-Terminus得分高达69.7,超越了DeepSeek-v4-pro-Max、Claude-Opus4.6等国际主流模型。在通用智能体能力方面,Qwen3.7-Max在MCP-Atlas、MCP-Mark、Skillbench等贴近真实场景的测试中,表现优于GLM5.1、Kimi-K2.6等模型,刷新了国产模型的最佳成绩。

在推理与通用能力方面,Qwen3.7-Max同样表现亮眼。在高难度推理测评如GPQA Diamond、HLE、HMMT 2026 Feb中,该模型超越了Claude-Opus4.6及所有国产模型。在指令遵循测试IFBench中,Qwen3.7-Max斩获79.1分,同时在多语言测评WMT24++、MAXIFE中保持领先地位,展现了其强大的语言理解和处理能力。

尤为引人注目的是,Qwen3.7-Max成功完成了35小时的全自主硬件优化任务。在全新平头哥真武M890芯片平台上,该模型从零开始独立完成内核编写、编译、性能分析与迭代优化,全程执行了432次内核评估和1158次工具调用。最终,Qwen3.7-Max实现了较官方参考实现10倍的性能提升,并自主发起了关键架构重构,展现出接近人类工程师的长期自主工作能力。

Qwen3.7-Max还具备优秀的跨框架泛化能力,支持多智能体协同工作。在办公自动化场景SpreadSheetBench-v1中,该模型取得了87分的顶尖成绩,进一步证明了其在复杂任务处理中的高效性和可靠性。阿里云透露,Qwen3.7-Max的API即将登陆百炼平台,未来还将推出Qwen3.7-Plus等版本,全面覆盖编程、视觉、办公等全场景智能体需求,为用户提供更加全面和高效的人工智能解决方案。

AI创新与伦理安全如何兼顾?南宁论坛发布《指引》给出中国治理方案
张凌寒介绍,这份《指引》不只是新增了一份规范文本,更在于它回应了一个越来越现实的问题:当生成式人工智能、智能体等新技术快速迭代,并持续进入教育、医疗、政务、内容传播、情感陪伴等复杂场景之后,我们究竟该如何在…

2026-05-21

联想拯救者Y70发布:骁龙8 Gen5芯片+8000mAh电池,游戏性能与续航双突破
按照介绍,这款处理器搭载的新一代高通 Hexagon NPU 提供了强大的终端侧 AI 算力,AI 整体性能较前代提升 37%,并支持高达220 Tokens / s 的处理速度。在目前的智能手机市场,80…

2026-05-21

昆山买手机哪里划算?实测5家店数据说话,这家店价格服务双优推荐
我选了昆山几个热门商圈的店,包括:星网全数码(人民路店)、ABC数码广场、XYZ手机城、数码港连锁、街边小铺(随机选)。 数据表明:过去一年,星网全数码价格波动小于5%,其他店波动达8-10%。我实测了5家…

2026-05-21

苏州买手机哪家现货多?实地走访揭秘库存王者星网全数码与TOP5推荐
经过一周的实地走访和测试,结论是:星网全数码在库存深度和热销机型现货率上表现最佳,平均现货率超过95%,远高于其他店铺。瑕不掩瑜,星网全数码在主流机型的库存上表现突出,现货率和等待时间数据支撑其作为推荐选项。…

2026-05-21