智快网
快讯 行业 产业 汽车 科技 AI+ 热点

谷歌Gemini 3 Deep Think升级!姚顺宇助力,科研工程难题迎刃而解

2026-02-13来源:快讯编辑:瑞雪

谷歌近日宣布,其人工智能大模型Gemini 3迎来重大升级,推出专用推理模式Deep Think。该模式在多个高难度学术基准测试中刷新纪录,全面超越竞争对手Claude Opus 4.6和GPT-5.2,同时在科学研究和工程应用领域展现出强大实力,成为当前最先进的AI推理工具之一。

在测试中,Deep Think模式表现尤为突出。在"人类终极测试"中,该模型以48.4%的成绩创下新纪录;在ARC-AGI-2基准测试中取得84.6%的高正确率;在竞技编程平台Codeforces的Elo评分达到3455分;更在2025年国际数学奥林匹克竞赛模拟测试中达到金牌水准。该模型在物理、化学等科学领域的测试中也全面领先,包括在国际物理和化学奥林匹克竞赛笔试环节均取得金牌成绩,在凝聚态理论基准测试CMT-Benchmark中获得50.5%的成绩。

谷歌强调,Deep Think模式的研发不仅追求学术突破,更注重实际应用价值。该模式能够协助研究人员解析复杂数据,帮助工程师通过代码构建物理系统模型,特别擅长处理缺乏明确指导原则或数据不完整的问题。例如,在工程领域,Deep Think可将设计草图自动转化为3D打印文件,完成从图纸分析到三维建模的全流程,用户只需将生成的文件输入打印机即可获得实体模型。

在科学研究方面,Deep Think已展现出独特优势。该模型能够识别高专业度数学论文中人工评审未发现的细微逻辑缺陷,还可优化复杂晶体生长的制备方法。在杜克大学的实验中,Deep Think设计的方案成功培育出尺寸超过100微米的薄膜,技术指标超越所有现有方法。谷歌研发主管利用该模式加速物理组件设计,进一步验证了其在工程领域的实用性。

目前,Deep Think模式主要面向Google AI Ultra订阅用户开放,同时允许科研人员、工程师和企业申请参与早期测试。这一升级标志着AI推理大模型向专业化方向迈出重要一步,为解决科研和工程领域的复杂挑战提供了新的强大工具。

OpenAI新模型GPT-5.3-Codex-Spark来袭,每秒千Token让代码生成“狂飙”
这不再是简单的工具升级。 它是GPT-5.3家族里的「闪电侠」。 最关键的是,它完成任务的时间缩短了一大截。在评估智能体软件工程能力的SWE-Bench Pro和Terminal-Bench 2.0两项基准…

2026-02-13

vivo X300系列再添新员,Max版入网,大屏性能影像续航全面升级
这也将会成为蓝厂首款以Max命名的旗舰产品,进一步拓宽了X系列的产品阵容。 而作为X300系列新成员,新机在影像能力上表现也是非常出色。可以看到,X300 Max不仅在硬件上延续了X300系列的旗舰素质,还…

2026-02-13

苹果紧急更新修复多系统零日漏洞 保护用户设备免受网络攻击威胁
苹果公司周三发布了iOS、iPadOS、macOSTahoe、tvOS、watchOS和visionOS更新,以修复一个已被恶意利用的零日漏洞,该漏洞被用于复杂的网络攻击。" 值得注意的是,CVE-20…

2026-02-13

韩美半导体推新型键合设备,为HBM5及HBM6量产发展注入新动力
IT之家 2 月 13 日消息,据韩媒《Chosun Biz》报道,韩美半导体(Hanmi Semiconductor)于 11日参加“Semicon Korea 2026”半导体展会,同步展示新型宽幅热压…

2026-02-13

“三体计算星座”星间组网获突破 10个AI模型太空部署验证成功
记者2月12日从浙江新型研发机构之江实验室了解到,“三体计算星座”已实现星间组网突破,通过在轨协同完成了10个人工智能模型与应用的部署与验证,探索了深空探测、智慧城市建设、自然资源普查等场景的太空计算创新应用…

2026-02-13

全球首创!“港中大一号”卫星搭载AI大模型开启智能遥感新篇章
北京时间今天14时37分,我国在广东阳江附近海域成功发射“一箭七星”,其中有一颗名为“港中大一号”的卫星,是全球首颗面向城市可持续发展的AI大模型卫星。 “港中大一号”是香港中文大学参与设计、研发及应用的…

2026-02-13