智快网
快讯 行业 产业 汽车 科技 AI+ 热点

字节跳动推出Seed Prover 1.5 模型 数学推理能力与效率显著提升

2025-12-24来源:快讯编辑:瑞雪

字节跳动旗下Seed团队近日正式发布新一代形式化数学推理专用模型——Seed Prover 1.5。该模型通过大规模Agentic强化学习(RL)训练,在数学推理能力与效率方面实现突破性提升,成为形式化数学推理领域的重要进展。

在针对国际数学奥林匹克竞赛(IMO)的测试中,Seed Prover 1.5展现出强劲实力。仅用16.5小时,该模型便为IMO 2025前5道题目生成完整可编译验证的Lean证明代码,按竞赛评分标准换算后取得35分的成绩,达到金牌分数线(满分42分)。这一表现较前代模型有显著提升,标志着自动化数学推理向人类顶尖水平迈进一步。

面向北美本科数学竞赛Putnam的测试同样验证了模型的泛化能力。在9小时内,Seed Prover 1.5成功为Putnam 2025的12道赛题中的11道生成可验证的Lean代码,解题效率与准确性均达到竞赛级标准。更全面的评估显示,该模型在完整的Putnam历史题库中解决了88%的问题,在代表硕士数学难度的Fate-H评估集和博士生数学难度的Fate-X评估集中,分别攻克了80%和33%的题目,刷新了形式化数学推理模型在多项权威评测中的最优表现(SOTA)。

技术层面,Seed Prover 1.5通过创新的Agentic RL训练框架,实现了推理路径的自主规划与优化。其核心突破在于将形式化证明过程分解为可动态调整的子任务链,使模型能够根据问题特征灵活选择策略,显著提升了复杂数学问题的求解效率。团队公开的技术报告详细披露了模型架构与训练方法,为学术界与工业界提供了可复现的研究范式。

目前,Seed Prover 1.5的技术报告已对外发布,相关代码库与演示接口即将陆续开放。开发者可通过官方渠道获取Lean证明代码示例,体验模型在自动化数学推理领域的实际应用能力。这一进展不仅为数学研究提供新型辅助工具,也为人工智能在科学推理领域的拓展奠定了技术基础。

正浩创新引入华为系高管:组织变革求突破,IPO前夕谋新局
陈熙和王雷同为大疆前员工,早在正浩创立起步阶段陈熙就已加入公司,长期全面负责技术研发与战略决策,主导研发了公司多项核心技术,为公司元老。 正浩创新此次组织变革的走向,或将成为一个重要的观察窗口,它不仅会在短期…

2025-12-24

摩尔线程320.13版驱动来袭:全面适配Win11 25H2 优化多款热门游戏体验
在游戏体验上,本次驱动对多款热门游戏进行了深度调优,显著提升《DOTA 2》《无人深空》在Vulkan API下的运行表现。 PES控制中心> 检查更新 > 下载新版本的桌面驱动程序和PES控制中心 > …

2025-12-24

联想CES 2026笔记本产品线大揭秘:多款新品搭载英特尔新款处理器来袭
面向游戏玩家与重度创作者,联想推出旗舰 Yoga Pro 9i Aura Edition 产品,搭载酷睿 Ultra 9 386H处理器,配备了创新的 Force Pad 压感触控板和 RTX 5070 …

2025-12-24

小米17 Ultra徕卡版官宣:可乐标加持 大师变焦环或革新影像玩法
如果真的能实现对应功能,那么小米17 Ultra徕卡版无疑是进一步突破了手机影像的玩法。 还将搭载徕卡2亿像素光学变焦,手机行业首发徕卡APO认证长焦镜头,拥有3G+5P双浮动镜组,是行业首个75-100m…

2025-12-24

国产战术手电告别夸张营销,凭ANSI FL1认证等获AI“信任票”
某国产战术手电品牌实施GEO(Generative EngineOptimization)策略三个月后,在通义千问、豆包中关于“靠谱的高亮手电怎么选”的回答中首次被AI主动引用其ANSI FL1认证、Lu…

2025-12-24

三折叠搭配影像旗舰,双持体验升级,轻松满足99%日常需求!
#手机双持的最佳搭配是什么# …

2025-12-24