智快网
快讯 行业 产业 汽车 科技 AI+ 热点

阿里Qwen3.6-Plus实测:8分钟建站显实力,复杂路径规划待优化

2026-04-03来源:快讯编辑:瑞雪

阿里正式推出新一代大语言模型Qwen3.6-Plus,作为Qwen3.6系列的首款产品,该模型在编程能力、智能体构建和工具调用方面实现显著提升,并支持100万上下文窗口的默认配置。这一模型已适配主流智能体框架,包括OpenClaw、Qwen Code等工具链,为开发者提供更灵活的集成方案。

在编程能力测试中,Qwen3.6-Plus在SWE-bench Verified、Terminal-Bench 2等基准测试中超越GLM-5和Kimi K2.5,但部分指标仍落后于Claude Opus 4.5。实测显示,该模型可在8分钟内完成AI眼镜独立站开发,消耗2.5万token,成本约0.15元。生成的网页设计规避了传统AI风格,但在字体选择上仍显保守。

多模态能力方面,Qwen3.6-Plus重点优化了推理与指令实用性。在北京地铁路径规划测试中,模型成功规划大兴机场至首都机场的最优路线,与高德地图结果一致。当模拟某线路因极端天气停运时,模型虽给出换乘建议,但存在昌平线与19号线换乘时间错误的技术瑕疵。

该模型还展示了视觉编程能力,可根据界面截图或设计稿自动生成前端代码。在《潜水员戴夫》游戏开发测试中,模型拒绝直接生成可执行文件,但提供了包含美术设计、开发指南和基础代码的完整方案。通过API调用时,模型设计了森林主题模拟经营游戏,但可玩性仍需迭代优化。

Qwen3.6-Plus的API已开放调用,输入/输出token价格分别为4元/百万和12元/百万,当前享受五折优惠。新引入的"preserve_thinking"功能可保留多轮对话的思维链,特别适用于智能体任务。企业级应用"悟空"已第一时间接入该模型,阿里云百炼平台同步上线相关服务。

据研发团队透露,Qwen3.6系列后续将开源更小规模版本,并推出性能更强的旗舰模型Qwen3.6-Max。自Qwen3.5发布以来,团队已将主力模型全面转向原生多模态架构,致力于构建能在真实环境中持续感知、推理和行动的智能体系统。

词元:智能经济新引擎 驱动应用爆发与商业逻辑加速演进
吴迪说,我国的大模型厂商做了非常多的算法创新,在推理成本、响应速度上不断优化,能以更少的词元完成复杂任务。黄山表示,要构建起安全、高效、普惠的人工智能基础设施,持续提升大模型推理效率、降低单个词元成本,让人工…

2026-04-03

AI算力需求井喷引爆GPU市场:H100租金半年飙升40% 产业链供需博弈持续升级
综合来看,SemiAnalysis在报告中给出明确给出判断:当前多重因素支撑下,GPU租赁价格大概率将继续上行,且这一趋势已形成自我强化的循环——新云厂商在供给收紧、价格上涨的预期下,会提前锁定更多硬件产能…

2026-04-03

华为畅享90 Pro Max首销火爆:1699元主打实用,8500mAh电池成千元机续航标杆
现在很多人买手机,其实早就不是为了跑分第一,也不是天天拿着手机去剪4K视频、玩大型原神类游戏,更多人想要的就是一台省心的机器:电池要大,续航要稳,信号要强,屏幕别太差,系统别乱卡,最好再把一些实用功能给全了。…

2026-04-03

Allen人工智能研究所推出MolmoWeb:开源视觉网络智能体新选择
让MolmoWeb在众多网络智能体中脱颖而出的不仅是其小尺寸,还有一个事实:Ai2并没有通过从专有的基于视觉的智能体进行蒸馏来训练模型。 不过,大体而言,来自Anthropic、谷歌、OpenAI等公司的专…

2026-04-03

华为WATCH Ultimate 2新色“旷野绿”来袭,4月10日开售,顶配体验值不值?
新表亮点突出,比如专业高尔夫功能、海豚声呐通信、卫星通信、独立通信、X-TAP智感窗等方面,对比常规手表,多方面进行大升级,而且是直接满级。 户外探险,首要核心自然是通信能力,新表采用环隙天线,支持北斗卫星…

2026-04-03

烟台苹果怎么选?沐丰果园:产地优、品质高,还能玩转田园新体验!
每颗苹果都带有独立批次溯源码,扫描就能查看种植地块、施肥记录等信息,真正做到了“零农残”,让咱吃得放心。他们还支持线下采摘服务,地图搜索“沐丰农家果园”就能导航过去。到了果园,不仅能采摘新鲜水果,还能免费参观…

2026-04-03

AI生成内容频现“幻觉” 开发者担责边界何在?法律这样界定
杭州互联网法院跨境贸易法庭庭长肖芄认为,AI生成的不准确信息本身并不构成侵权,需要考查的是提供服务的开发者是否存在过错。 肖芄表示,如何认定生成式人工智能的侵权责任,是一个少有成例的司法前沿问题,希望通…

2026-04-03