智快网
快讯 行业 产业 汽车 科技 AI+ 热点

OpenAI推出GPT-5.3-Codex:基准测试创新高,成开发者协作新利器

2026-02-06来源:互联网编辑:瑞雪

OpenAI 正式推出新一代编程模型 GPT-5.3-Codex,宣称其在编程能力与开发者协作体验上实现重大突破。该模型在多项基准测试中刷新纪录,同时支持任务执行过程中的实时交互,标志着人工智能从单一编程工具向通用计算机协作者转型。

在性能测试中,GPT-5.3-Codex展现出显著提升。SWE-bench Pro(公开版)测试显示其得分达56.8%,较前代56.4%微幅增长;Terminal-Bench 2.0测试中,成绩从64.0%跃升至77.3%;最引人注目的是OSWorld-Verified智能体计算机操作测试,得分从38.2%飙升至64.7%,证明其在复杂系统环境中的操作能力实现质的飞跃。官方特别强调,新模型运行速度较GPT-5.2-Codex提升25%,在保持精度的同时显著优化效率。

开发者协作模式迎来革命性升级。新模型支持用户在任务执行过程中随时介入引导,通过高频进度更新实现双向对话。开发者可实时提问、调整方案或修正方向,系统能够完整保留上下文信息,避免传统交互中常见的断层问题。这种设计使Codex从被动执行工具转变为具备主动协作能力的智能伙伴,大幅降低应用开发的技术门槛。

技术实现层面,OpenAI重构了模型的任务处理架构。通过动态上下文管理机制,系统在保持长序列记忆能力的同时,实现多轮交互的精准响应。在代码生成测试中,新模型展现更强的环境适应能力,能够根据开发者反馈动态优化输出策略,在复杂项目开发中表现出更强的稳定性。

产品落地方面,GPT-5.3-Codex已全面开放给ChatGPT付费用户,覆盖Plus、Team及Enterprise等订阅层级。用户可通过Codex专用应用、命令行工具、IDE扩展插件及网页端四种方式访问,API接口计划于近期上线。这种多端协同的部署策略,使不同技术背景的开发者都能找到适合的接入方式。

行业观察人士指出,该模型的突破在于重新定义了AI与开发者的协作边界。通过将编程任务分解为可交互的模块化流程,GPT-5.3-Codex使非专业开发者也能参与复杂系统开发,这可能引发软件开发领域的范式转变。随着API接口的开放,预计将催生大量基于该模型的垂直领域应用。

互联网赋能发展新图景:网民规模破11.25亿,AI助力产业与文化加速出海
《中国互联网络发展状况统计报告》显示,目前我国中小企业数量超6000万家,已累计培育专精特新“小巨人”企业超1.76万家,从行业分布看,超六成“小巨人”企业深耕工业基础领域,量子科技、人工智能、低空经济等未…

2026-02-06

三星Exynos 2600光线追踪测试夺冠 2nm工艺助力性能超越骁龙旗舰一成多
【太平洋科技】2月5日消息,据外媒Wccftech报道,三星首款2nm芯片Exynos 2600在近期Basemark光线追踪基准测试中登顶,其性能领先高通最新旗舰芯片第五代骁龙8至尊版约10%-15%。…

2026-02-06

马斯克“商业帝国”再升级:特斯拉机器人或成星际文明“开拓者”?
特斯拉创始人马斯克此前还曾表示,旗下Optimus人形机器人有望在三年内超越全球顶尖人类外科医生。 载体端:特斯拉汽车与 Optimus人形机器人,成为AI落地物理世界的重要触角; 未来人们驾驶特斯拉汽车…

2026-02-06

宫菱VS德施曼智能锁深度测评:从安全便捷到耐用性,哪款更值得入手?
芯片相当于智能锁的“大脑”,锁芯是物理安全的核心,芯片技术和抗干扰率,直接决定了锁具能不能防破解、运行会不会卡顿。 宫菱AMP:对性能抗衰减有明确且严苛的要求,承诺10年内安全性能不得低于标准要求,也就是说…

2026-02-06

十四五”收官:我国网民破11亿,互联网赋能中小企业出海新篇
《中国互联网络发展状况统计报告》显示,目前我国中小企业数量超6000万家,已累计培育专精特新“小巨人”企业超1.76万家,从行业分布看,超六成“小巨人”企业深耕工业基础领域,量子科技、人工智能、低空经济等未…

2026-02-05

三星Galaxy S21系列完成四年系统更新维护 后续将不再推送常规安全更新
IT之家 2 月 5 日消息,科技媒体 SamMobile 昨日(2 月 4 日)发布博文,报道称在 2026 年 2 月补丁更新后,三星把Galaxy S21 系列移除出支持名单,影响 Galaxy S2…

2026-02-05