智快网
快讯 行业 产业 汽车 科技 AI+ 热点

GPT-5.4来袭:原生操控电脑能力升级,多维度突破重塑AI工作助手新体验

2026-03-06来源:快讯编辑:瑞雪

OpenAI 近日正式推出新一代大模型 GPT-5.4,这款被定位为“专业领域最强前沿模型”的产品,在上下文处理能力、推理性能及多模态交互方面实现突破性升级。该模型不仅支持单次处理百万级 token 的超长文本,更首次集成原生计算机操控功能,标志着通用人工智能向复杂任务自动化迈出关键一步。

在核心参数方面,GPT-5.4 将上下文窗口扩展至 100 万 token,较前代提升近 4 倍。不过当输入超过 27.2 万 token 时,费用将按阶梯式计费——输入价格翻倍至每百万 token 5 美元,输出成本增加 50%。尽管基础输入单价较 GPT-5.2 上涨 43%,OpenAI 强调模型效率提升使实际使用成本可能不升反降,其 Pro 版本定价甚至高于 Anthropic 同级别产品 Claude Opus 4.6。

性能测试数据显示显著进步:在 OSWorld-Verified 基准测试中,该模型以 75% 的成功率超越人类专家 72.4% 的表现;电子表格建模任务准确率从 68.4% 跃升至 87.3%;BrowseComp 网页信息检索能力提升 17 个百分点,Pro 版本达 89.3%。更引人注目的是其原生计算机操控能力,通过 Playwright 库或屏幕截图指令,模型可自主完成“构建-运行-验证-修复”的完整工作流,在演示中仅凭单条提示词即生成包含路径规划、设施建造的乐园模拟游戏。

针对开发者痛点,新引入的 Tool Search 机制实现工具检索动态化。模型仅需加载轻量级工具列表,使用时再实时调取完整定义,在 MCP Atlas 基准测试中使 token 消耗降低 47%,同时保持准确率。这项优化使构建大型智能体系统的成本显著下降,响应速度提升 30% 以上。

金融行业成为首批重点应用场景。配套发布的 ChatGPT for Excel 测试版,可直接嵌入电子表格完成复杂财务模型构建与分析。通过与 FactSet、MSCI 等数据服务商的深度集成,模型可自动化执行盈利预览、DCF 分析等标准化任务。内部测试显示,其在投资银行基准测试中的表现从 43.7% 飙升至 88%,较前代提升近一倍。

尽管整体性能提升显著,模型仍存在特定领域短板。在 HealthBench 医疗评测中得分 62.6%,较前代下降 0.7 个百分点;平均回复长度增加 24% 虽提升信息密度,但也可能导致冗余。早期测试者指出,其前端设计能力弱于 Claude Opus 4.6,且在现实场景理解方面偶发失误,如规划旅行时推荐热门景点导致体验下降。

该模型采用差异化授权策略:标准版 GPT-5.4 Thinking 面向 Plus 用户开放,Pro 版本仅限月费 200 美元的 ChatGPT Pro 和 Enterprise 订阅者使用。免费用户仅在系统自动路由时可能体验基础功能。OpenAI 表示,此次升级标志着 AI 从单一任务处理向跨应用工作流管理的范式转变,为智能体框架提供更强大的底层引擎。

苹果美国官网暖心操作:M5新品发布前M4订单用户免费获升级“礼包”
PChome3月6日消息,部分在苹果美国官网临近M5系列新品发布前下单M4款MacBook的用户,近期意外收到了免费升级至M5机型的订单变更通知。 PChome获悉,苹果美国针对2026年3月3日M5系列M…

2026-03-06

松下高管力挺M43卡口:双卡口策略显优势 未来新品值得期待
IT之家 3 月 6 日消息,松下影像事业部总经理津村敏行本周(3 月 2 日)接受摄影媒体 CineD 采访,谈及 M43 卡口的现状、未来。随着全画幅 L 卡口的 LUMIX S 系列相机获得大量关注,…

2026-03-06

AI狂飙时代:Scaling Law未遇瓶颈 2026年将迎指数级加速浪潮
但说这话的人,是全球估值最高的AI公司之一的掌门人,手里握着Claude系列模型,公司年化收入已经被外界估计达到了190亿美元量级(已经快追上OpenAI了)。Dario说,他们对团队的态度是: 你来An…

2026-03-06

卢伟冰透露小米手机芯片或开启年更模式,还将为电动车推国际版AI助手
在去年,小米发布了一款基于3nm工艺制成的手机芯片玄戒O1,不过在此之后小米新手机芯片再没有下文。而在MWC2026展会间隙,卢伟冰向CNBC表示,“这是(玄戒O1)我们的首款芯片产品。 除了手机芯片一年一…

2026-03-06

ChatGPT新功能上线:上传示例一键克隆写作风格,邮件编辑更便捷
消息称 OpenAI 为了解决 ChatGPT 经常误解用户写作基调的痛点,将支持用户直接上传过去的电子邮件、文章或其他文档作为参考示例。 用户点击该按钮后,系统会自动跳转至视频生成工具,将当前图像作为参考…

2026-03-06

三星展示无折痕OLED面板,Galaxy Z Fold8与苹果折叠iPhone或率先搭载
参考新浪科技的报道来看,三星显示在CES 2026上展示了全球首款无折痕的OLED面板,消息称这块屏幕将由自家的Galaxy ZFold8首发搭载,苹果首款折叠屏iPhone Fold也可能使用这块屏幕。…

2026-03-06

LS30 2025:京东方LTPO技术革新 驱动中国OLED产业体验与价值双提升
此外,京东方与荣耀携手打造折叠屏旗舰荣耀Magic V5,为其配备7.95英寸柔性OLED显示内屏,这块屏幕不仅拥有2352 x2172的超高分辨率和5000nits的峰值亮度,还采用京东方4320Hz …

2026-03-06