智快网
快讯 行业 产业 汽车 科技 AI+ 热点

阿里云峰会重磅发布Qwen3.7-Max,国产大模型性能跃升开启智能体新纪元

2026-05-20来源:互联网编辑:瑞雪

在2026阿里云峰会上,阿里巴巴正式推出新一代千问旗舰大模型Qwen3.7-Max,引发行业高度关注。这款模型在第三方机构Arena全球大模型盲测中表现卓越,不仅超越Kimi-K2.6、DeepSeek-v4-pro等国产模型,更与GPT、Claude、Gemini等国际顶尖模型比肩,稳居国产模型榜首位置。

Qwen3.7-Max的突破性进展体现在多个维度。在编程能力方面,该模型在SWE-Pro、SWE-Multilingual等权威测评中取得领先成绩,Terminal Bench 2.0-Terminus得分达69.7,超越DeepSeek-v4-pro-Max、Claude-Opus4.6等模型。其编程能力覆盖从前端原型开发到复杂多文件工程的全流程,在SWE-bench系列测评和SciCode编程测评中较前代模型实现显著提升,展现出资深工程师级的代码编写与自我纠错能力。

通用智能体性能同样表现亮眼。在MCP-Atlas、MCP-Mark等现实能力测试中,Qwen3.7-Max超越GLM5.1、Kimi-K2.6等模型,创下国产新高。该模型在Kernel Bench L3测试中展现出强大的GPU内核优化能力,在GPQA Diamond、HLE等推理核心测评中均超越Claude-Opus4.6及所有国产模型。多语言能力方面,其在指令遵循IFBench评测中取得79.1分突破性成绩,在WMT24++、MAXIFE等翻译评测中保持领先优势。

最引人注目的是Qwen3.7-Max在长程复杂任务中的自主迭代能力。在平头哥真武M890芯片这一全新硬件平台上,该模型通过持续35小时的自主编程,完成1158次工具调用和432次内核评估,最终实现推理内核10倍加速。测试轨迹显示,模型在运行超30小时后仍能发现优化点,甚至主动发起架构重设计,这种长周期自主迭代能力为AI模型进化开辟了新路径。

在企业级应用场景中,Qwen3.7-Max通过MCP集成和多智能体协作,在SpreadSheetBench-v1办公自动化基准测试中斩获87分。以往需要专业团队耗时1-2周的复杂项目,现在由该模型驱动的智能体可在数小时内完成端到端交付。这种效率提升得益于其跨框架泛化能力,能在Claude Code、OpenClaw、Qwen Code等多种智能体框架下稳定运行。

阿里云同步宣布技术体系全面升级,推出"芯-云-模型-推理"一体化解决方案。Qwen3.7-Max模型API即将登陆阿里云百炼平台,同时将推出具备多模态推理和视觉理解能力的Qwen3.7-Plus等版本,构建覆盖编程智能体与视觉智能体的全能基座,为Agentic时代提供核心技术支持。

谷歌Gemini集成C2PA凭证:助力用户轻松识别图片是否经AI编辑处理
IT之家 5 月 20 日消息,今天(5 月 20 日)召开的 2026 年谷歌 I/O 开发者大会上,谷歌宣布 Gemini 集成 C2PA内容凭证,从而更好地抵御深度伪造(Deepfake)。 Sund…

2026-05-20

谷歌Android Halo功能来袭:让AI智能体状态在屏幕顶部“透明化”呈现
这项功能在 Google I/O 期间亮相,会在屏幕顶部加入一个较为低调的状态提示,向用户展示 AI 智能体是否正在设备上实时运行。等到该功能在今年晚些时候上线后,Android Halo 还会支持其他 …

2026-05-20

谷歌填补AI订阅市场空白:新推月费100美元计划瞄准中高端用户
IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌 CEO 桑达尔 · 皮查伊(SundarPichai)宣布推出 100 美元的新订阅计划,支持 Gemini Spark…

2026-05-20

谷歌三星联手推出两款智能眼镜:整合Gemini AI,提供便捷智能新体验
IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌携手三星公司,展示了由 Gentle Monster 与Warby Parker 共同参与设计的 2 款智能眼镜。 该眼镜…

2026-05-20

谷歌Wear OS 7来袭:续航提升智能升级,成跨设备任务新入口
IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌发布智能手表平台 Wear OS7,新版本相比前代更聪明,也更高效,重点升级续航优化与智能交互体验。 在自动化体验方面,谷…

2026-05-20

石头科技技术迭代加速:从平面到立体,智能清洁新品重塑家居生活新图景
智能扫地机器人凭借其精准导航与自适应清洁技术,已在市场上占据优势;洗地机则通过活水循环系统实现深度清洁,提供更高效的清洁体验;而智能割草机搭载的边界识别算法,使其能够自主规划草坪修剪路径,进一步提升了用户的便…

2026-05-20

石头科技:以技术创新拓展智能清洁边界,引领智能家居迈向空间管理新时代
这项创新不仅提升了设备对障碍物的识别能力,还赋予其完成开合抽屉、整理物品等拟人化动作的能力,为智能家居场景注入了更多可能性。石头科技通过持续的技术突破,不仅重新定义了清洁机器人的功能边界,更在推动整个行业向空…

2026-05-20

2026中国网络文明大会南宁启幕 共探网络文明新路径 发布系列建设成果
图为大会主论坛上,中国好人、自媒体创作者翁忻怡进行主题分享《铿锵玫瑰向阳而行》,讲述遭遇车祸戴上假肢的她被网络善意治愈、又成为一束光的故事。图为大会主论坛上,中国好人、自媒体创作者翁忻怡进行主题分享《铿锵玫瑰…

2026-05-20

集邦咨询:2026年首季全球OLED显示器出货同比大增 华硕三星等品牌表现亮眼
华硕在第 1 季度推出 34 英寸、360Hz 电竞显示器,同时发布 16 英寸便携式 OLED显示器,借助差异化产品组合稳固领先位置。三星拥有集团内部较充足的 QD-OLED 面板资源,加上在高端显示器…

2026-05-20