智快网
快讯 行业 产业 汽车 科技 AI+ 热点

AI编程成新战场?试了千问3.6-Plus,我找到了国产大模型弯道超车的秘密

2026-04-03来源:天脉网编辑:瑞雪

最近,人工智能领域掀起了一股编程热潮,各大科技公司纷纷将研发重点转向提升模型的编程能力。从Claude到国产的GLM、MiniMax,再到OpenAI调整战略聚焦生产力工具,这一趋势愈发明显。就连OpenAI也做出了重大调整,砍掉了耗资巨大的Sora视频业务,将算力资源集中投入到编程和企业服务领域。

年初,Anthropic发布的《2026 Agentic Coding Trends Report》预测,今年开发者将逐步从亲自动手编写代码转变为指挥AI完成编程任务。这种被称为Agentic Coding的新模式,不仅帮助用户生成代码,还能自主完成理解需求、拆解任务、编写测试、修复漏洞等全流程工作,最终交付可直接使用的成品。

在这股浪潮中,阿里巴巴近期连续推出多款大模型产品引发关注。继春节前发布Qwen3.5后,该公司又陆续推出3.5-Omni图片模型和Qwen3.6-Plus编程模型,旗舰版Qwen3.6-Max也正在筹备中。这种密集的更新节奏,在行业内实属罕见。据权威评测机构数据显示,Qwen3.6在SWE-bench系列和Claw-eval等测试中表现优异,以更小的参数量实现了超越前代3.5的性能,成为国内最接近Claude水平的编程模型。

值得关注的是,阿里选择在技术负责人离职传闻引发业界猜测的节点加速模型迭代。面对"Qwen是否还会持续更新"的质疑,团队用实际行动给出了肯定答案,并将研发方向精准锁定在当下最热门的编程领域。这种战略选择,既是对行业趋势的回应,也是展示技术实力的关键举措。

实际测试显示,Qwen3.6展现出强大的多模态处理能力。在视频理解测试中,研究人员用手机录制包含网站操作和功能需求的视频,模型成功解析抽象指令,复现了包含特效的网页界面。虽然首次生成存在元素布局、交互设计等瑕疵,但经过第二轮反馈优化后,最终成果达到了专业评选标准。这种视频交互方式,相比传统文本输入具有更高的自然性和效率。

在处理复杂代码仓库时,Qwen3.6的表现同样令人印象深刻。研究人员将开源重制版Claude Code项目克隆到本地后,模型不仅自主定位到项目目录,还深入分析代码结构,最终生成了包含渐变动画、GitHub跳转等功能的展示网站。更关键的是,当要求用中文解释项目技术细节时,模型能够自动提取关键代码,翻译成通俗语言,帮助非专业人士理解项目核心逻辑。

针对开发者普遍面临的token限制问题,测试团队展示了模型的实用改造能力。以DeepSeek V3的tokenizer工具为基础,模型不仅将其打包成可执行文件,还根据用户提供的聊天界面截图,重新设计了交互界面。经过两轮优化,最终产品实现了与原型相似的视觉效果,并额外添加了模型切换等细节功能,展现出强大的定制化开发潜力。

这些测试案例表明,AI编程工具的能力边界正在不断扩展。从视频内容解析到复杂代码库理解,从界面设计到功能实现,Qwen3.6的进化标志着Agentic Coding模式进入实用阶段。这种转变与行业报告数据相呼应——目前已有60%的开发者在日常工作中使用AI工具,但真正实现全流程自主开发的比例不足20%。

阿里巴巴近期进行的组织架构调整,为模型研发提供了更系统的支持。新成立的ATH事业群整合了模型研发、平台建设和应用开发团队,形成从基础能力到商业落地的完整链条。这种战略布局,配合Qwen系列模型在性价比、迭代速度和生态兼容性方面的优势,为国产AI工具在编程领域占据一席之地创造了有利条件。

目前,新模型已通过阿里云百炼平台提供API服务,并接入悟空、Qoder和Qwen Chat等应用。开发者和普通用户均可通过这些渠道体验最新功能,实际检验模型是否符合自身需求。这种开放态度,或将推动AI编程工具从专业领域向大众市场加速渗透。

智谱GLM-5V-Turbo发布:视觉编程新突破,一眼识图生成代码
这一次,模型在还原界面整体布局的基础上,进一步呈现了交互能力,使页面不再停留在静态展示层面,而具备了初步的可操作性。我们进一步观察到,GLM-5V-Turbo 的多模态 Coding 能力并没有止步于单一…

2026-04-03

阿里Qwen3.6-Plus实测:8分钟建站显实力,复杂路径规划待优化
目前,Qwen3.6-Plus的API已经开放调用,用户可在Qwen Chat中体验到这一模型。 在实测中,我们的这一案例融合考察了编程与工具调用能力,要求Qwen3.6-Plus统计A股目前股价最高的10…

2026-04-03

词元:智能经济新引擎 驱动应用爆发与商业逻辑加速演进
吴迪说,我国的大模型厂商做了非常多的算法创新,在推理成本、响应速度上不断优化,能以更少的词元完成复杂任务。黄山表示,要构建起安全、高效、普惠的人工智能基础设施,持续提升大模型推理效率、降低单个词元成本,让人工…

2026-04-03

AI算力需求井喷引爆GPU市场:H100租金半年飙升40% 产业链供需博弈持续升级
综合来看,SemiAnalysis在报告中给出明确给出判断:当前多重因素支撑下,GPU租赁价格大概率将继续上行,且这一趋势已形成自我强化的循环——新云厂商在供给收紧、价格上涨的预期下,会提前锁定更多硬件产能…

2026-04-03

华为畅享90 Pro Max首销火爆:1699元主打实用,8500mAh电池成千元机续航标杆
现在很多人买手机,其实早就不是为了跑分第一,也不是天天拿着手机去剪4K视频、玩大型原神类游戏,更多人想要的就是一台省心的机器:电池要大,续航要稳,信号要强,屏幕别太差,系统别乱卡,最好再把一些实用功能给全了。…

2026-04-03

Allen人工智能研究所推出MolmoWeb:开源视觉网络智能体新选择
让MolmoWeb在众多网络智能体中脱颖而出的不仅是其小尺寸,还有一个事实:Ai2并没有通过从专有的基于视觉的智能体进行蒸馏来训练模型。 不过,大体而言,来自Anthropic、谷歌、OpenAI等公司的专…

2026-04-03

华为WATCH Ultimate 2新色“旷野绿”来袭,4月10日开售,顶配体验值不值?
新表亮点突出,比如专业高尔夫功能、海豚声呐通信、卫星通信、独立通信、X-TAP智感窗等方面,对比常规手表,多方面进行大升级,而且是直接满级。 户外探险,首要核心自然是通信能力,新表采用环隙天线,支持北斗卫星…

2026-04-03