智快网
快讯 行业 产业 汽车 科技 AI+ 热点

Claude Opus 4.5重磅登场!复刻《我的世界》,多领域能力实现新突破

2025-11-26来源:快讯编辑:瑞雪

全球AI编程领域迎来重要突破,Anthropic公司正式推出新一代旗舰编程模型Claude Opus 4.5。该模型在编程能力、多智能体协作及复杂任务处理方面展现显著优势,被业界视为推动软件开发范式变革的关键力量。在权威测试平台SWE-bench Verified中,Claude Opus 4.5以超过80%的得分率成为首个突破该阈值的AI模型,其表现不仅超越前代产品,更领先于同期发布的Gemini 3 Pro和GPT-5.1 Codex-Max。

技术测试显示,Claude Opus 4.5在处理模糊指令和复杂系统错误时表现出色。当面对需要权衡利弊的决策场景时,该模型能自主生成创新解决方案。例如在模拟航空公司客服场景中,面对无法直接修改经济舱机票的规则限制,模型创造性地提出"先升舱再改签"的解决方案。这种突破性表现虽在传统基准测试中被误判为失败,却印证了模型具备超越预设框架的推理能力。安全评估数据显示,其出现不当行为的概率较同类产品降低50%,对提示词注入攻击的抵御能力达到行业领先水平。

在编程语言适应性方面,Claude Opus 4.5在SWE-bench Multilingual测试中展现跨语言开发优势,在8种主流编程语言中的7种实现性能领先。开发者社区的实践案例进一步验证其能力边界:前端开发者利用该模型一次性生成具备专业水准的购物网站,包含精心设计的字体排版和响应式布局;更有开发者成功复刻《我的世界》核心机制,生成的3500行代码完整实现生物群系生成、物品合成系统及云朵渲染效果,这在同类模型中尚属首次。

成本优化成为该模型另一亮点。Claude Opus 4.5的定价策略较前代产品下降67%,输入输出价格分别降至每百万tokens 5美元和25美元,同时取消专属用量限制。开发者平台新增的"思考强度"参数允许用户根据任务需求调节模型性能,在中等强度设置下,模型在保持SWE-bench Verified测试成绩的同时,输出token减少76%。这种灵活配置机制使模型既能处理即时性任务,也可应对需要深度推理的复杂工程。

伴随模型升级,Claude开发者平台推出多项创新功能。计划模式(Plan Mode)通过生成可编辑的plan.md文件实现精准操作规划,现已支持桌面端多会话并行处理。针对长对话场景,系统自动压缩早期对话内容以维持上下文连贯性。在办公软件集成方面,Claude for Excel的测试权限扩展至企业级用户,Claude for Chrome实现跨标签页任务处理。这些改进得益于模型在电子表格操作和长时序任务管理方面的能力提升。

行业观察人士指出,Claude Opus 4.5的发布标志着AI编程工具进入新阶段。其突破性不仅体现在绝对性能提升,更在于对软件开发流程的重构能力。从代码补全到端到端开发协作,从单任务处理到多智能体系统构建,这类模型正在重塑程序员的工作方式。随着使用成本持续下降,AI辅助编程有望从专业领域向更广泛的开发场景渗透。

乔纳森・伊夫与奥特曼联手,首款AI硬件原型机问世,两年内投产在即
【环球网科技综合报道】11月25日消息,据CNBC报道,在近日由劳伦・鲍威尔・乔布斯主持的 Emerson Collective DemoDay 活动上,苹果前首席设计师乔纳森・伊夫(Jony Ive)与 …

2025-11-26

蚂蚁“灵光”AI助手上线4天下载量破百万 创中国AI应用增速新纪录
【CNMO科技新闻】2025年11月18日,蚂蚁集团推出全模态通用AI助手“灵光”。截至11月22日,该App上线仅4天,下载量就突破100万,创下中国AI应用增速新纪录,并引发行业广泛关注。灵光拥有灵光对话…

2025-11-25