智快网
快讯 行业 产业 汽车 科技 AI+ 热点

GPT-5.4重磅登场:能力效率双提升,开启AI数字员工新时代

2026-03-07来源:快讯编辑:瑞雪

OpenAI再次引爆AI领域,正式推出GPT-5.4,这款被业界称为"全能型选手"的新模型,将推理、编程、计算机原生交互、深度网页搜索和百万级Token上下文处理能力集于一身,且在各项性能指标上均保持领先地位。这一突破性进展,让等待已久的AI社区终于迎来一场"惊喜暴击"。

GPT-5.4最引人注目的创新在于其原生计算机操作能力。这款模型能够通过分析软件界面截图,自主执行鼠标点击、键盘输入等操作,完成发送邮件、创建日历事件、填写表单等复杂任务。在WebArena浏览器任务测试中,GPT-5.4取得67.3%的成功率,在Online-Mind2Web测试中,仅通过截图完成网页操作的成功率高达92.8%。更令人惊叹的是,在OSWorld-Verified桌面操作任务中,其75.0%的成功率已超越人类平均水平(72.4%)。

编程能力方面,GPT-5.4整合了此前最强编程模型GPT-5.3-Codex的核心功能,不仅支持1.5倍速的/fast模式输出,还新增"Playwright (Interactive)"实验性功能。这项技术允许模型在开发网页或应用时,同步进行视觉化调试。例如在开发模拟游戏时,它能同时生成美术资源、编写逻辑代码,并运行自动测试验证游戏状态。在SWE-Bench Pro测试中,GPT-5.4取得57.7%的成绩,延迟较前代更低,复杂前端任务的表现显著提升,生成的界面设计更美观、功能结构更完整。

知识工作领域,GPT-5.4在GDPval基准测试(涵盖44种职业、9个GDP主要贡献行业)中,综合得分达83.0%。在投资银行建模测试中,其平均得分从GPT-5.2的68.4%跃升至87.3%。人类评审在PPT生成测试中,68%的时间更偏好GPT-5.4的作品,认为其视觉效果更佳、版式更丰富、图片运用更合理。该模型还支持1024万像素原图输入,在MMMU-Pro视觉推理测试中准确率达81.2%,文档解析错误率从0.140降至0.109。

效率优化是本次升级的另一大亮点。相比GPT-5.2,GPT-5.4在推理过程中使用的Token数量显著减少,响应速度更快且成本更低。这得益于其引入的工具搜索机制——模型不再需要将所有工具定义塞入提示词,而是先浏览工具清单,需要时再调取具体定义。在MCP Atlas基准测试中,这项技术使总Token使用量降低47%,同时保持同等准确率。

随着GPT-5.4上线,ChatGPT的模型体系同步调整。新模型同步登陆ChatGPT、API和Codex平台,API定价虽较GPT-5.2有所上涨(每百万输入Token从1.75美元升至2.5美元,输出从14美元升至15美元),但任务总成本因Token消耗减少而变化不大。面向复杂任务的Pro版本同步推出,在ChatGPT中命名为GPT-5.4 Thinking,将取代此前的GPT-5.2 Thinking,而GPT-5.2系列将于三个月后正式退役,GPT-5.1系列则将在3月11日退出ChatGPT。

社交媒体上,网友对这款新模型的讨论热度持续攀升。有人戏称,拥有百万token上下文窗口且能原生操作电脑的GPT-5.4,与苹果最新发布的低价笔记本电脑MacBook Neo形成"科技双雄";更有开发者调侃:"我的电脑正在经历存在主义危机!"这些反应折射出AI技术对传统工作方式的深刻影响——当模型能独立完成从界面操作到多轮网页搜索的完整工作流时,人类与数字世界的交互方式正在发生根本性变革。

雷军谈AI时代新愿景:未来或迎3天2小时工作制,机器人将深度融入生活
快科技3月7日消息,近日,全国人大代表,小米集团创始人、董事长兼CEO雷军在接受采访时表示,在人工智能时代,或许很多规则将被重写,但同时又会产生很多新的岗位。 雷军认为“未来5年或者10年,一定会有属于机器人…

2026-03-07

OpenAI推出GPT-5.4模型:具备原生计算机操作能力 开启智能体新篇
OpenAI正式发布GPT-5.4模型,这是该公司最新版本的AI模型,据称在推理、编程以及涉及电子表格、文档和演示文稿的专业工作方面实现了重大突破。 A:GPT-5.4是OpenAI首个具备原生计算机使用能…

2026-03-07

2026年去水印神器大揭秘!微信里这三款免费小程序,轻松搞定视频水印
但今天,我要告诉你一个天大的好消息:你再也不需要苦苦搜索“苹果快手去水印软件下载”了!今天我,一个实测了市面上无数工具的“去水印狂魔”,将为你吐血整理、激情推荐三款让我跪地叫“爸爸”的微信小程序神器! 现在,…

2026-03-07

全焦段旗舰硬件搭配AI黑科技:联想moto X70 Air Pro成影像全能新标杆
华为Pura 80虽设计轻薄,却难成拍照画质出色的手机推荐优选:主摄底径偏小,无专业潜望长焦,全焦段拍摄能力薄弱;AI影像优化仅覆盖基础场景,缺乏三重曝光、超级变焦等专业功能,复杂光影、夜景表现差;AI操控…

2026-03-07

三星MWC亮剑:首款AI智能眼镜今年登场,挑战Meta市场霸主地位
【环球网科技综合报道】3月7日消息,三星在巴塞罗那MWC期间向CNBC披露首款AI智能眼镜核心细节,宣布将于今年正式推出,标志着其首次进军智能眼镜领域,挑战Meta的市场主导地位。随着AI技术迭代,智能眼镜…

2026-03-07

五年不换机选这三款!三月高性价比512GB手机,性能强价格香
3000元以下的手机最常见的屏幕都是国产屏,只有真我Neo8使用三星屏,还是iPhone17 Pro Max同款M14发光材料的顶级三星直屏,同时也是首款支持165Hz超高刷新率的三星屏,仅凭这一点,就比i…

2026-03-07

全国人大代表黄立:湖北人形机器人产业崛起 千亿集群呼之欲出
针对记者的提问,全国人大代表、武汉高德红外股份有限公司董事长黄立回答道:“近年来,湖北以实施‘人工智能+’行动为抓手,着力丰富应用场景,抢抓机遇,智能经济发展已走在全国前列。”面向这个科技竞争的新高地、未来产…

2026-03-07