智快网
快讯 行业 产业 汽车 科技 AI+ 热点

全球AI编程大模型盲测揭晓 阿里Qwen3.6-Plus跻身全球第二成中国标杆

2026-04-03来源:天脉网编辑:瑞雪

在AI编程能力的全球竞技场上,中国大模型正以强劲势头崭露头角。近日,国际权威盲测平台LMArena旗下Code Arena榜单公布最新排名,阿里巴巴自主研发的Qwen 3.6-Plus大语言模型以1452分的成绩跃居全球第二,在React专项技术方向上超越OpenAI、Google等国际科技巨头,成为该榜单中排名最高的中国模型。

作为AI领域最具公信力的性能评估平台之一,LMArena通过真实用户盲测与实时对抗机制,为全球大模型提供客观对比。随着AI Agent技术兴起,编程能力已成为衡量模型综合实力的核心指标。本次React专项榜单聚焦Web开发场景下的自主编码能力,要求模型独立完成从项目初始化到调试运行的全流程,对工程思维与端到端开发能力提出极高要求。Qwen 3.6-Plus的突破性表现,标志着中国大模型在复杂工程任务处理领域达到世界领先水平。

该模型于4月2日正式发布,具备原生多模态理解与推理能力,尤其在代码生成与Agent技术方面表现卓越。在多项权威评测中,Qwen 3.6-Plus以更少的参数量超越参数量达其2-3倍的GLM-5、Kimi-K2.5等模型,展现出高效能的技术架构。发布首日即引发全球开发者社区广泛关注,次日便以显著优势登顶React榜单次席,仅落后于Anthropic的Claude-Opus-4.6-Thinking(1540分),领先OpenAI最新发布的GPT-5.0-High(1448分)4分,较Google的Gemini 3.1 Pro Preview(1440分)高出12分。

在全面评估AI编程能力的Code Arena总榜单中,Qwen 3.6-Plus同样稳居中国模型首位。这一成绩推动阿里巴巴在全球AI实验室排名中升至第四,紧随Anthropic、OpenAI和Google之后。据技术团队透露,Qwen 3.6-Plus作为千问3.6系列的首发模型,后续将开源不同参数规模的版本,性能更强的旗舰模型Qwen3.6-Max也计划于近期发布,为开发者提供更丰富的技术选择。

第二届“数龙杯”启幕在即,AI智能体赛道开启,共赴创新盛宴!
除了各类AI游戏与AI应用以外,本届大赛专门新增了AI智能体赛道,希望挖掘在这个领域真正有创造力、能解决实际问题的优秀项目。活动将聚焦AI应用落地、商业化路径、大赛参赛赋能,邀请AI开发者、“数龙杯”潜在参赛…

2026-04-03

淮北市科技馆举办“热爱科学 创新成长”活动 百名学子共探机器人奥秘
4月2日上午,由淮北市科协、淮北市妇联主办,淮北市科技馆、淮北市妇女儿童活动中心承办的“热爱科学创新成长”2026基层科普行动计划第二期活动在市妇女儿童活动中心一楼活动室举办,共100多名学生与家长参加。 …

2026-04-03

OpenAI天量融资:资本狂欢下的AI产业变局与未来启示
面对全球AI领域日益激烈的资本竞争,我国应进一步发挥创业投资、私募股权投资支持科技创新的作用,引导资本向核心技术攻关和产业化落地倾斜,同时完善监管框架,防范资本无序扩张与估值泡沫风险。 OpenAI的天量融资…

2026-04-03

谷歌9月起推行新规:Wear OS手表应用须支持64位,开发者需及时适配
谷歌表示,从今年 9 月开始,所有包含原生代码的 Wear OS 新应用和应用更新在发布到 Play 商店时,必须同时提供 32 位和 64位版本。 不过谷歌官方表示,32 位应用的支持政策暂时不会调整,…

2026-04-03

2026年W12国内手机畅销榜:iPhone17系列领跑,OPPO Find N6折叠屏入榜
除了华为Nova15以外,还有6款华为手机上榜,并且几乎都是中高端机型:其中仅有一款千元机,它就是华为畅享70X尊享版,如果对续航有更高的追求,可以看看华为畅享90Pro Max。除此之外,还有4款小米手机…

2026-04-03

iPhone 18 Pro模具曝光:灵动岛瘦身 性能影像续航全升级,或成最强一代
这一代Pro系列要直接跳过3nm,首发搭载台积电2nm工艺的A20 Pro芯片,性能预计提升15%到20%,关键是功耗能猛降30%。 有消息预测,这可能是史上最贵的一代iPhone,顶配版甚至有望冲击2万元…

2026-04-03

苹果50周年:库克揭秘iPod量产背后如何锻造强大供应链体系
库克坦言,为了筹备 50 周年庆典,许多内部档案连他本人也是首次见到。 库克还在专访中透露了一个有趣的细节,当他拿到第一台 iPod原型机后,戴上耳机试听的第一首歌曲,是披头士乐队的经典名作《Hey Jud…

2026-04-03