智快网
快讯 行业 产业 汽车 科技 AI+ 热点

GPT-5.5凌晨发布,性能飙升引关注,Anthropic紧急应对竞争压力

2026-04-25来源:快讯编辑:瑞雪

OpenAI今日凌晨正式推出其最新智能体编程模型GPT-5.5,这款被团队称为"迄今为止最智能、最直观易用"的模型,标志着人工智能在计算机辅助工作领域迈出关键一步。OpenAI首席执行官Sam Altman评价称,该模型展现出"知道该做什么"的卓越判断力。

在核心性能方面,GPT-5.5在智能体编码、计算机操作、知识型工作及早期科学研究等需要跨上下文推理的领域表现尤为突出。第三方评估机构Artificial Analysis的智能指数显示,该模型在10项关键评估中综合排名第一,特别是在Terminal-Bench Hard、GDPval-AA等复杂任务测试中领先同类产品。值得注意的是,其运营成本仅为前沿编码模型的一半,展现出显著性价比优势。

编程能力是此次升级的最大亮点。测试数据显示,GPT-5.5在代码编写、调试及多工具协同等维度全面超越Gemini 3.1 Pro,在专业任务处理和抽象推理测试中多数指标优于Claude Opus 4.7。实际案例中,开源项目Claude Engineer创始人Pietro Schirano利用该模型在20分钟内完成代码差异对比、分支创建及完美合并,更成功生成操作流畅的3D射击游戏,所有图形均通过Three.js实时渲染。

知识工作场景下,GPT-5.5展现出强大的自主操作能力。在未经提示优化的客服测试中取得98%的准确率,在真实计算机操作测试OSWorld-Verified中达到78.7%的完成度。OpenAI财务团队使用该模型处理24771份税务表格时,通过自动化流程节省了两周工作时间。更引人注目的是,波兰数学家Bartosz Naskręcki仅凭单条提示词,就在11分钟内构建出能可视化二次曲面交线的代数几何应用。

科学研究领域同样取得突破性进展。在遗传学基准测试GeneBench中,GPT-5.5相比前代模型有显著提升,在生物信息学评估BixBench中领先所有已公布模型。该模型能协助研究人员完成从假设检验到成果产出的全流程工作,包括反复审阅稿件、压力测试技术论证、协同处理多格式文档等复杂任务。

安全防护体系经过全面强化,OpenAI通过与内外红队合作,针对高级网络安全和生物技术能力增加专项测试,并收集近200个早期合作伙伴的实际使用反馈。在保持与GPT-5.4相当的响应延迟同时,新模型通过优化token使用效率,在相同任务中消耗的资源显著减少。

商业应用方面,GPT-5.5提供两个版本:标准版定价为每百万输入token 5美元、输出token 30美元;Pro版定价为每百万输入token 30美元、输出token 180美元。该模型正逐步向ChatGPT和Codex的Plus、Pro、企业级用户开放,API开发者可通过Responses API和Chat Completions API接入服务。此次发布恰逢竞争对手Claude Code性能争议,Anthropic随即宣布完成模型优化并重置用户使用限制。

华为昇腾超节点全系产品适配DeepSeek V4系列 上下文处理能力实现近10倍跃升
4月24日,DeepSeek V4-Pro和DeepSeekV4-Flash正式发布并开源。华为计算官方表示,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。 据介…

2026-04-25

苹果高层变动:蒂姆·库克卸任CEO 约翰·特纳斯接棒开启新篇章
A:约翰·特纳斯是苹果公司现任硬件工程高级副总裁,在苹果工作已超过25年,长期主导苹果硬件产品的研发与工程方向。库克表示,斯鲁吉是推动苹果芯片战略的核心人物,其影响力已超出苹果公司本身,延伸至整个科技行业,…

2026-04-25

OpenAI推出GPT-5.5:自主规划任务流程,安全与效率双提升
就在上个月,OpenAI才刚刚发布了GPT-5.4,而此次推出的GPT-5.5在代码编写与调试、在线研究、表格与文档处理,以及跨工具协同工作等任务上均表现出色。 A:GPT-5.5将从发布当日起面向ChatG…

2026-04-25

前OpenAI核心人物自立门户:以持续学习与自动化研究,挑战AI现有格局
他在 OpenAI 待了近 7 年,2019 年加入时公司只有 30 来人,离开时是研发副总裁,主导过 o1 和 o3 两代推理模型,深度参与GPT-4 的后训练与 2025 年 GPT-5 的部署,也是 …

2026-04-25

OpenAI连发新模型夺回AI领域首位,但万亿估值对手紧追不舍
距离 OpenAI 上次发布GPT 5.4仅不到两个月时间,从网友的实测来看GPT-5.5已经有了不小的进步,更会说“人话”了、更快了、编程更强了,“OpenAI仍在创新”,但同时,价格也翻倍了。官方表示,…

2026-04-25

DeepSeek-V4预览版开源上线:创新技术引领AI大模型进入百万上下文新阶段
模型分为两个版本:DeepSeek-V4-Pro拥有1.6万亿参数,在Agent能力、世界知识和推理性能上均达到国内与开源领域的领先水平;DeepSeek-V4-Flash则以更小的参数量提供接近的推理能力,…

2026-04-25