智快网
快讯 行业 产业 汽车 科技 AI+ 热点

阿里发布Qwen3-Max-Thinking:性能比肩国际顶尖,推理能力创新高

2026-01-27来源:天脉网编辑:瑞雪

阿里近日正式推出其最新一代千问旗舰推理模型——Qwen3-Max-Thinking,该模型在多项权威评测中创下全球新纪录,性能比肩国际顶尖的GPT-5.2和Gemini 3 Pro,成为国内AI大模型领域的新标杆。

作为阿里目前规模最大、能力最强的推理模型,Qwen3-Max-Thinking的总参数量超过万亿级别,预训练数据量高达36T Tokens。通过大规模扩展总参数、强化学习以及推理计算,新模型在科学知识、数学推理、代码编程等关键性能基准测试中刷新了全球纪录,展现了强大的技术实力。

在推理能力提升方面,Qwen3-Max-Thinking引入了一种创新的测试时扩展(Test-time Scaling)机制。这一机制通过提炼此前推理的“经验”,并进行多轮自我迭代,在相同上下文中实现更高效的推理计算,从而获得更智能的结果。相比业界普遍采用的冗余推理方式,该机制显著提升了推理效率和性能。例如,在“人类最后的测试”(HLE)中,Qwen3-Max-Thinking以58.3分的成绩超越了GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,成为当前所有模型中的最高分。

针对即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。通过基于规则奖励与模型奖励的联合强化学习训练,模型能够更智能地结合工具进行思考。这种自适应的工具调用能力已在QwenChat上实现,用户可以体验到模型自主选用搜索、个性化记忆和代码解释器等核心Agent工具功能,获得更专业、更贴合需求的回答,同时模型幻觉问题也显著减少,为解决复杂任务奠定了基础。

目前,开发者可以在QwenChat上免费体验Qwen3-Max-Thinking模型,企业用户则可通过阿里云百炼获取新模型的API服务。普通用户也可以通过千问的PC端和网页端试用该模型。据悉,千问App即将接入这一新模型,届时所有用户均可免费体验这款国内最强的AI大模型。

ChatGPT冲击谷歌搜索霸权:七成多订阅者将其设主页成关键变量
2024 年,一名美国联邦法官裁定谷歌在搜索市场非法维持垄断地位,而谷歌这边仍在就此裁决提起上诉。 Bango 调查发现,多数 ChatGPT 订阅用户会将这一聊天机器人设为默认主页,这意味着可能有数以亿计的…

2026-01-27

华为多款机型通过星闪认证,涵盖车钥匙协议及L2HC编解码等多项测试
IT之家 1 月 26 日消息,国际星闪联盟官网显示,华为多款手机新通过了星闪认证,主要覆盖车钥匙协议一致性、L2HC 编解码等测试。根据产品型号,IT之家附此次通过测试的机型如下: SLY-AL00:华…

2026-01-27

一加15T入网引关注:6.32英寸小屏配100W快充,春节后发布或成换机新选择
并且,机身细节上,爆料信息显示一加15T这款智能手机采用金属中框提升质感,3D超声波指纹识别技术则优化了解锁体验。在业内人士看来,一加 15T这款智能手机在延续小屏路线的同时,显然将在性能与续航方面进一步强化…

2026-01-27

三星Galaxy S26 Ultra或推纯白版 配色丰富还有新一代大猩猩玻璃加持
IT之家 1 月 26 日消息,消息人士@UniverseIce 前天在 X 平台透露,三星 Galaxy S26 Ultra手机将拥有纯白色版本,“非常迷人”。随后另一位爆料人 Max Jambor 也认…

2026-01-26

美国团队攻克技术难题:140GHz超高频Wi-Fi芯片实现120Gbps高速传输
1月26日消息,近日,美国加州大学的研究团队宣布成功研发出一款140GHz超高频Wi-Fi芯片,通过结合数字与模拟信号处理技术,实现了高达120Gbps的传输速度,即每秒约15GB。 相比之下,目前市场上最快…

2026-01-26

库克卸任苹果CEO倒计时?外媒聚焦其继任者与交接时间线
几个月前,《金融时报》报道称,苹果公司正在为库克最早于2026年初卸任做准备。 有传言称,库克卸任首席执行官后可能会成为苹果公司董事会主席,但这一过渡似乎不会很快发生,因为苹果公司现任董事长亚瑟·D·莱文森…

2026-01-26

智能学习机怎么选?科大讯飞LUMIE 10Pro等热门品牌全方位对比解析
今天,我们将对比几款市场上热门的智能学习机,包括科大讯飞的LUMIE10Pro、平板学习机、海尔的学习机、华为的MatePad教育版以及小米的学习平板,帮助家长和学生更好地选择适合自己的学习工具。无论是大屏幕…

2026-01-26

机器人ETF嘉实(159526)开盘微涨,重仓股表现分化,中控技术涨幅居前达6.95%
来源:新浪基金∞工作室 1月26日,机器人ETF嘉实(159526)开盘涨0.67%,报1.659元。机器人ETF嘉实(159526)重仓股方面,科大讯飞开盘涨1.62%,汇川技术涨0.15%,拓普集团涨0.…

2026-01-26

Apple Pencil平替怎么选?十大高性价比电容笔实测推荐,帮你告别选择困难!
此外,它采用了“双充”方案,兼容磁吸无线充电与Type-有线快充,仅需35分钟即可满血复活,应对紧急创作也毫无压力,而且一次满电可连续使用约 8小时,无论是课堂记录还是日常办公,都能轻松应对,还支持自定义调节…

2026-01-26