智快网
快讯 行业 产业 汽车 科技 AI+ 热点

阿里Qwen3.7-Max模型在Code Arena编程榜居第二,Design Arena亦获佳绩

2026-05-26来源:快讯编辑:瑞雪

全球人工智能领域权威编程评测榜单Code Arena近日完成更新,阿里巴巴自主研发的旗舰大模型Qwen3.7-Max以1541分的成绩跻身全球前列。该模型在编程能力评估中位列全球第四,仅次于Claude系列的三款模型,在大模型厂商中稳居第二把交椅。

作为人工智能领域最具公信力的编程能力评估平台,Code Arena的评测体系突破传统学术测试框架,重点考察模型处理复杂代码生成、调试与重构任务的实际能力。为确保评测结果的真实性,平台采用用户随机盲测机制,模型需在未知考题的情况下即时完成编程任务,有效杜绝了数据泄露与针对性优化等作弊行为。

在最新公布的榜单中,Qwen3.7-Max不仅超越了Claude-opus-4-6模型,更在综合实力上领先GLM-5.1、Kimi-k2.6等知名模型。评测数据显示,该模型在代码逻辑严谨性、功能实现完整度等核心指标上表现突出,展现出处理工业级编程任务的强大潜力。

值得关注的是,阿里巴巴在AI模型评测领域持续取得突破。在同期发布的Design Arena榜单中,Qwen3.7-Max同样表现优异,位列全球第十。这个被业界誉为"AI奥林匹克"的评测平台,通过真实用户盲测机制对模型进行多维评估,其结果被广泛视为衡量AI模型综合实力的重要标准。

Design Arena及其衍生评测体系(包括图像侧的Image Arena/LMArena)构建了覆盖代码生成、视觉理解等多领域的评估框架。该平台通过动态更新的测试用例库和严格的防作弊机制,确保评测结果能够真实反映模型在真实应用场景中的表现,其权威性得到全球AI研究机构的广泛认可。

荣耀600系列闪耀登场:4K Live直出、大电池与护眼屏引领新潮流
此外,荣耀600 Pro行业首发全大核天玑8550Elite芯片,同时,依托底层硬件实力与系统深度调校,实现72个月持久流畅的使用体验;荣耀600系列全系还带来了HONOR Turbo X存储压缩黑科技,…

2026-05-26

华为6月1日新品盛宴:FreeClip 2典藏版耳机携手nova 16系列及MatePad Pro Max齐亮相
5月26日消息,华为官宣FreeClip 2典藏版耳夹耳机将于6月1日与nova 16系列手机同台发布。 FreeClip系列是华为在开放式音频领域的旗舰产品线,采用创新的耳夹佩戴方式,无需塞入耳道即可获得高…

2026-05-26

2026年6月手机市场“盛宴”开启!华为、小米等多品牌新机扎堆发布
迈入 2026 年 6月,手机市场迎来新一轮密集发布会,各大主流品牌轮番登场,从中端潮流机型、旗舰直屏手机,到性能旗舰、高端折叠屏全线布局,覆盖不同价位与使用需求,一场精彩纷呈的数码盛宴正式拉开帷幕。 本月…

2026-05-26

智能汽车ETF富国(515250)5月25日收涨1.05%,规模份额双降年内表现如何?
规模方面,截止5月22日,智能汽车ETF富国(515250)最新份额为4.76亿份,最新规模为5.45亿元。回顾2025年12月31日,智能汽车ETF富国(515250)份额为5.88亿份,规模为6.80亿元…

2026-05-26

中国芯片突破西方封锁:以创新架构与场景深耕开辟自主发展新路径
西方坚守 “摩尔定律 + 极致制程 + EUV 垄断”,陷入 2nm/1nm 物理极限与成本陷阱;中国另辟蹊径,走出 **“韬定律 + 架构创新+ 成熟产能 + 场景深耕”** 的特色道路,不拼极致制程,靠…

2026-05-26

华为“韬定律”破局芯片发展困境,新路径引领国产芯片未来方向
晶体管密度本身已经不再是制约频率的主要因素了,未来如何通过其他综合手段降低 τ 值,才是提升芯片频率和效能的新追求。而首款采用逻辑折叠技术的麒麟芯片将在今年秋季发布,大概率是 Mate 90 系列产品,可…

2026-05-26