OpenAI发布GPT-5.3-Codex，AI编程与智能体平台开启生产力新篇-科技-智快网

OpenAI今日正式推出全新编程模型GPT-5.3-Codex，宣称其具备全球领先的智能体编程能力。该模型在SWE-Bench Pro和Terminal-Bench 2.0两项编程基准测试中刷新纪录，同时在OSWorld和GDPval等智能体能力评估中较前代版本实现显著提升。据测试数据显示，GPT-5.3-Codex在Terminal-Bench 2.0的得分领先Claude Opus 4.6达11.9个百分点。

为直观展示技术实力，OpenAI发布了一款由GPT-5.3-Codex开发的赛车游戏。该游戏支持8张不同赛道地图，允许玩家使用空格键触发道具功能，尽管画面风格较为简约，但实际体验显示其完成度已达较高水准。开发团队特别强调，该模型在代码库维护方面展现突破性能力，可自主处理数百万token规模的代码修改任务，并在执行过程中主动向人类开发者汇报工作进展。

技术整合层面，GPT-5.3-Codex融合了GPT-5.2-Codex的编程专长与GPT-5.2的逻辑推理能力，运算速度提升25%。该模型突破传统编程工具局限，覆盖从需求分析、代码编写到系统部署的全流程工作，甚至能完成PPT制作、Excel数据处理等办公任务。在Web开发测试中，当接收到"修复漏洞"或"优化体验"等模糊指令时，模型可自主迭代游戏版本，展现出较强的上下文理解能力。

企业服务领域同步推出Frontier智能体平台，该系统通过统一业务语义层整合企业数据资源，提供可定制的智能体执行环境。平台内置安全治理模块，支持为每个AI智能体设定操作权限与防护边界，同时配备任务监控仪表盘，实时显示活跃智能体数量及资源消耗情况。惠普、Uber等企业已启动试点应用，利用该平台构建客户支持、数据分析等业务场景的自动化解决方案。

尽管技术指标亮眼，但市场反响呈现分化态势。社交媒体监测显示，GPT-5.3-Codex相关推文的互动量不足Claude Opus 4.6同期数据的一半。专业开发者指出，模型在复杂系统调试和安全防护机制方面仍需改进，而创意工作者则担忧OpenAI逐步弱化消费级应用开发。这种争议反映出人工智能技术在专业领域落地时面临的平衡挑战，既要满足企业级用户的深度需求，又要维持开发者社区的活跃生态。

红魔11 Pro+鸣潮限定版来袭！从外到内深度定制，游戏党不容错过

此次联名深度围绕《鸣潮》中的人气角色“千咲”展开，不仅在外观设计上全方位定制，更在系统交互、配件生态乃至性能调校上进行了深度适配，为喜欢《鸣潮》的游戏爱好者带来一款从外到内高度沉浸的联名手机。红魔 11 …

2026-02-07

云计算ETF华夏（516630）2月6日开盘走低，重仓股多数下跌仅中科曙光持平

来源：新浪基金∞工作室 2月6日，云计算ETF华夏（516630）开盘跌1.26%，报1.721元。云计算ETF华夏（516630）重仓股方面，科大讯飞开盘跌0.90%，金山办公跌0.82%，中际旭创跌2.4…

2026-02-07

2026春节档8部影片定档！受众差异大，“成熟女性”或成选片关键角色

2026-02-06

11.25亿网民共绘数字蓝图，生成式AI渗透生活生产新图景
2026-02-06

智能手表表壳检测新方案：思看科技三维扫描+机器人集成，高效精准全检

对于研发和小批量生产：优先选用SIMSCAN GEN2手持式扫描仪，灵活高效且投资较低对于大规模生产线：采用集成机器人的自动化检测系统，最大限度提升效率和一致性对于具有复杂曲面和特殊材质的高端表壳：可…

2026-02-06

苹果4月迎50周年庆典，库克谈AI战略与继任规划展望未来

2026-02-06