智快网
快讯 行业 产业 汽车 科技 AI+ 热点

Harness工程崛起:百度伐谋登顶MLE-Bench,AI工程化迈入新阶段

2026-04-13来源:天脉网编辑:瑞雪

在人工智能领域,一场关于技术落地与工程化能力的较量正悄然展开。当行业还在为模型参数规模争论不休时,一批先行者已将目光投向系统编排工程——这个被视为AI从实验室走向产业化的关键环节。近日,百度自主研发的算法优化智能体"伐谋"在国际权威评测平台MLE-Bench上再次登顶,以64.44分的成绩刷新全球纪录,其背后折射出的技术路线变革引发业界高度关注。

这场技术竞赛的转折点出现在今年初。当某初创公司凭借77.78分的"完美成绩"引发质疑时,评测机构发现其智能体通过机制漏洞获取测试集信息,甚至调用外部网络数据。这场风波最终促使MLE-Bench设立"清洁赛道",将数据泄漏嫌疑者隔离。百度团队选择用实力回应质疑:他们换上最新基座模型重新提交,在完全合规的条件下取得64.44分,以无可争议的优势重返榜首。这个分数背后,是拒绝投机取巧的技术坚守,更是对AI工程化本质的深刻理解。

支撑百度伐谋的核心技术,正是被Anthropic泄露事件意外带火的"Harness Engineering"。这项新兴工程学科专注于构建AI智能体的"操作系统",通过权限控制、记忆管理、工具编排等模块,确保大模型在复杂任务中保持稳定输出。就像为赛车配备专业导航系统,Harness Engineering让AI在长链条任务中不再"迷路",而是能像人类工程师般进行全流程规划。

在汽车设计领域,这套技术已展现出颠覆性潜力。亚洲最大独立汽车设计公司阿尔特与百度合作开发的"御风"系统,将新能源车气动验证时间从10小时压缩至数分钟。通过智能体自主演化,设计师在绘制草图阶段即可获得可视化风阻数据,使整车研发周期缩短25%。这种"边设计边验证"的并行模式,彻底改变了传统"设计-验证-修改"的串行流程。

金融风控场景的实践更具启示意义。中信百信银行引入伐谋智能体后,特征挖掘效率提升100%,风险模型区分度提高2.41%。这个不知疲倦的"策略演化大师",能在7×24小时内从海量数据中捕捉人类难以发现的风险信号,将普惠金融的边界向外拓展。更值得关注的是,这些产业突破均基于百度智能云的全栈优化,在计算资源调度、任务并行执行等底层环节实现质的飞跃。

当AI竞赛进入深水区,技术路线的选择愈发关键。百度伐谋团队选择了一条看似"笨拙"的道路:在2.0版本升级中,他们放弃使用最新基座模型,转而专注优化系统编排能力。这种反直觉决策背后,是对工程化本质的清醒认知——再强大的模型,也需要合理的框架才能释放潜力。正如建筑领域,混凝土强度固然重要,但结构设计才是决定大楼高度的关键因素。

在科研前沿,这种技术范式正在创造新的可能。北京工业大学将伐谋应用于空间站空气监测设备研发,通过智能体自主演化突破传统设计极限,使气体分离效率大幅提升。天津大学在灾害预警模型选优中,将原本需要数周的试验周期压缩至6小时。这些案例揭示着一个趋势:当AI承担起繁琐的算法演化工作,人类科学家得以回归本质——定义科学问题、提炼核心规律。

YC总裁开源“第二大脑”GBrain:13年知识沉淀,让AI记忆随对话持续进化
在 SKILLPACK 文档的开篇,Tan 聊到了这个“第二大脑”的灵感来源——Vannevar Bush 1945年发表在《大西洋月刊》上的经典论文《As We May Think》中描述的 Memex…

2026-04-12

马斯克“西方微信”XChat将上线:端到端加密无广告,集成Grok AI成亮点
目前,中国大陆App Store已开启预约下载(预计届时可能无法正常使用)。 功能方面,XChat提供全场景通讯能力:支持一对一/群组聊天、高清音视频通话、大文件共享(Premium用户最高可传4GB),还…

2026-04-12

黄金产区有机小米怎么选?高性价比品牌推荐,品质安心又实惠
二、不同有机小米品牌的特点对比 目前国内有机小米品牌大多聚焦单一品类深耕,和全品类粮油品牌相比,专注单品的企业往往能把产品打磨得更精细。 4.服务与溯源:让消费更放心 企业搭建了全流程溯源体系,从田间…

2026-04-12

国家档案局发布新意见:推动人工智能深度融入档案工作各环节
加强人工智能基础设施建设,探索智能算力基础设施共建共用,鼓励有条件的档案部门建设区域档案智能算力平台,为档案工作提供算力支持、模型训练、语料处理和推理研究等服务。围绕系统框架、功能要求、应用场景、数据管理、评…

2026-04-12

工业和信息化部多举措推进,全面加速人工智能与制造业深度融合
杜广达表示,下一步将实施“模数共振”行动、人形机器人实景实训行动、人工智能应用服务商培育行动等,打造“模型—数据—场景”的良性互促,激发产业发展动能;分级分类推动人工智能重点标准研制;推动人工智能伦理治理技…

2026-04-12

OpenAI CEO奥尔特曼住所遇袭后发声:呼吁AI民主化并反思自身行为
“外界对我们行业的诸多批评,源于对这项技术极高潜在风险的真切担忧。”他呼吁通过全社会的政策响应和AI民主化来应对,坚决反对少数实验室独占未来控制权。 与此同时,奥尔特曼还进行了深刻的个人反思,他承认在冲突处理…

2026-04-12

OPPO A6s Pro来袭!4月14日发布,多种配色大内存配置任你选
IT之家 4 月 11 日消息,OPPO A6s Pro 手机现已在京东开启新品预约,4 月 14 日下午 14:30 发布。商品页面显示,OPPO A6s Pro 手机一共有青云直上、好运莲莲、夜月生辉三…

2026-04-12