智快网
快讯 行业 产业 汽车 科技 AI+ 热点

百度千帆ModelBuilder引领AI训练新纪元,RFT技术超越OpenAI o1

2025-03-14来源:ITBEAR编辑:瑞雪

在近期科技界的一次重大突破中,OpenAI推出了一项名为RFT(基于强化学习的微调)的新型训练方法,该方法迅速吸引了全球的目光。RFT通过结合强化学习与监督微调技术,实现了在有限标注数据下模型性能的显著提升。紧接着,这一创新技术被百度智能云千帆ModelBuilder平台引入国内,成为首个全面支持RFT的大模型开发平台,为企业开发者开辟了一条高效、低成本的大模型开发路径。

RFT技术的核心在于其融合了强化学习(RL)与微调(Fine-tuning)的优势,打破了传统训练方式对于大量人工标注数据的依赖。通过引入一个称为Grader的模块,RFT能够自动比较模型的输出与参考答案,并生成0-1之间的量化奖励信号,以此驱动模型的优化过程。这种机制不仅提高了数据利用效率,还使模型能够自主思考,强化正确的思维路径,抑制错误的路径。

在实际应用中,RFT展现出了令人瞩目的效果。在复杂场景下,仅需4500条训练数据,RFT就能使模型达到令人满意的性能水平。在涉及逻辑推理的任务中,RFT训练后的模型在准确率上有了显著提升,甚至超越了OpenAI的o1模型。这一成就不仅体现在平均准确率的提高上,更在于模型在面对不同难度任务时的稳定表现。

百度智能云千帆ModelBuilder平台上的RFT训练流程简洁高效。用户只需按照平台指引,创建RFT训练任务,选择基础模型,并配置奖励规则。随后,准备包含问题和参考答案的训练数据,即可开始训练过程。训练完成后,用户可以在平台上一键部署模型,并通过自动评估任务快速获得模型效果反馈。

以实际案例为例,在“好人/坏人”推理场景中,RFT训练后的模型在3-8人复杂度递增的任务中,平均准确率相比基础模型提升了29%。这一提升不仅体现在准确率的数字上,更在于模型在推理过程中的清晰度和逻辑性。在RFT训练前,基础模型的输出答案和思考过程往往存在明显错误,尤其是在任务难度增加时,模型甚至会出现语言混乱的情况。而经过RFT训练后,模型的输出答案准确,思考过程也更加条理清晰。

RFT技术还展现出了更高的训练天花板。在复杂问题场景下,RFT训练后的模型相比传统监督微调方法(SFT)在准确率上有了更显著的提升。这表明RFT在处理复杂任务时具有更强的适应性和优化能力。

百度智能云千帆ModelBuilder平台的RFT训练流程不仅简化了大模型开发的复杂度,还降低了生成式AI应用落地的门槛。通过RFT技术,企业开发者能够更高效地利用有限的数据资源,训练出性能卓越的模型,为各行业的智能化转型提供有力支持。

华为Mate X7或本月登场 首发20GB超大内存 配色丰富性能强劲
11月份的机圈将会是华为的主场,不仅新一代的直板旗舰华为Mate80系列会震撼亮相,还会有迭代的大折叠屏手机华为Mate X7发布。@定焦数码爆料,华为Mate X7将会首发定制20GB超大内存,这是华为史…

2025-11-15

安谋科技发布“周易”X3 NPU IP,端侧AI性能飙升助力多领域落地
智东西11月14日消息,昨日,安谋科技正式发布了专为端侧大模型而生的最新一代NPUIP——“周易”X3,其能够与Arm架构CPU、GPU协同,组成基于Arm生态的异构算力解决方案。 新的“周易”X3 NP…

2025-11-14

Steam Frame登场 Valve停产Index VR头显 开启VR新征程
用户可通过无线适配器,将 PC 或 Steam Machine 上的平面屏(flatscreen)及 VR 游戏串流至 SteamFrame;与此同时,Steam Frame 本身也是一款独立设备,搭载高通…

2025-11-14

华为Mate70 Air深度体验:打破常规,超大屏“Air”的另类演绎
可以确定,华为Mate70 Air的影像没有因为“Air”的定义做妥协,在同价位机型中是能打的,硬件配置方面也是这个思路。这也符合华为Mate70 Air的技术路径,虽然重量不可避免地来到208g,但是保…

2025-11-14

欧加9K级大电池定版试产,一加骁龙8系直屏新机测试,中端机竞争升级
IT之家 11 月 14 日消息,博主 @数码闲聊站 今天在微博透露,欧加的 9K 级别大电池现已定版试产。 博主表示,这块电池采用单块4.51V 单电芯设计,额定容量 32.59Wh,额定电池 8760m…

2025-11-14

联发科天玑8系芯片屠榜安卓次旗舰性能榜 性能能效双优成市场新宠
以榜单第一的真我Neo7 SE为例,通过与MTK联发科技的深度联合调校,该机在同价位段中展现出极为出色的游戏性能,搭配真我GT性能引擎,通过芯片级调校,实现了持久稳定的高帧率表现,同时能耗最高可降低7%,帧…

2025-11-14

四名MIT辍学00后,两年打造AI编程神器,估值冲300亿成资本新宠
两年前,在完成种子轮融资后,创始人曾写了这样的期待—— Cursor的诞生,推动了「氛围编程」(vibe coding)在全球兴起。 他还在创纪录的时间内,完成了一份手写编程测试,给早期Facebook投资…

2025-11-14

iPhone 17系列发售不到俩月,中国市场激活量破1000W,双十一销量也亮眼
11月14日,数码博主“数码闲聊站”发文透露iPhone17系列于本周完成中国市场激活1000W+。 iPhone17系列9月19日正式发售,如今距发售不到两个月。 该博主此前曾透露,截至11月2日,iPh…

2025-11-14

荣耀500 Pro配置亮点全揭秘:骁龙8至尊版+2亿主摄+8000mAh长续航
【CNMO科技消息】11月14日,有数码博主曝光了荣耀500Pro的核心参数。CNMO注意到,新机将搭载骁龙8至尊版移动平台,电池容量达到8000mAh,主打2亿像素大底主摄。 除了上述核心亮点外,荣耀50…

2025-11-14

苹果iPhone 17系列发售不到俩月 中国市场激活量或破千万
苹果 iPhone 17 系列于今年 9 月 19 日正式发售,如今还不到两个月。 该博主曾透露,截至 11 月 2 日,苹果 iPhone17 系列国内激活销量超 825 万。具体数据如下: iPho…

2025-11-14