智快网
快讯 行业 产业 汽车 科技 AI+ 热点

DeepSeek陈德里携AI合著论文:人类仅需2小时构思 智能体完成研究全流程

2026-05-27来源:快讯编辑:瑞雪

DeepSeek研究员陈德里近日在个人博客发布了一篇关于自动研究智能体的研究综述论文,引发科技界关注。这篇论文采用人机协作模式完成,其中仅1%内容由他亲自撰写,其余99%由AI Agent完成,整个创作过程历时6天,历经6次迭代,调用Agent约108次,消耗64.8万token,最终生成2234行LaTeX代码。

论文核心贡献在于提出L1-L5自主分级体系,该体系借鉴自动驾驶领域的SAE标准,为混乱的AI Agent领域建立了清晰的发展脉络。L1级对应基础代码补全功能,如早期GitHub Copilot;L2级实现任务分解执行,需人类逐项审批;L3级可自主完成10-100步操作,仅在关键节点请求人类介入;L4级能在限定领域内独立完成从实验设计到论文撰写的全流程,但研究选题仍需人类指定;L5级作为终极目标,要求智能体具备自主选题、资源分配和跨领域研究能力,目前尚未实现。

研究团队通过六维特征矩阵对17个主流系统进行横向对比,发现当前行业前沿已接近L4水平。论文特别指出,制约L5级突破的关键因素并非模型算力,而是持续知识积累和可靠自我评估机制。陈德里在接受采访时表示:"现有系统在长时程研究中容易陷入认知循环陷阱,且缺乏有效的创新性评估方法,这导致自主研究能力存在明显天花板。"

论文还系统梳理了四大主流架构模式:单智能体循环以ReAct、Reflexion为代表,通过迭代推理实现简单任务;多智能体协作框架如CAMEL、AutoGen,采用分工协作机制但沟通成本较高;分层调度系统如Claude Code,擅长处理复杂长周期研究;工具增强执行模式则依赖代码执行环境、网页浏览等外部工具扩展能力边界。研究显示,不同架构适用于特定场景,实际开发中常采用混合架构以兼顾效率与可靠性。

这篇46页的论文包含7个图表和4个表格,参考文献多达103篇且全部经过验证。值得注意的是,论文中所有插图均由GPT-Image2生成,体现了AI在科研全流程的渗透。陈德里坦言,这种协作模式极大提升了研究效率:"同样规模的工作,传统方式至少需要一个月,现在我的直接投入时间不到2小时。"但他同时强调,人类研究者仍需把控研究方向和价值判断,避免陷入技术决定论的误区。

论文最后提出了六大待解决问题,包括上下文窗口限制、研究可复现性、安全伦理风险等。其中特别指出,当前单任务成本普遍超过50美元,高昂的研发费用可能加剧科研资源分配不均。这些开放性问题为学术界和产业界指明了后续探索方向,相关讨论已在GitHub等平台引发开发者热烈回应。

Apple Watch无创血糖监测迎新进展:项目负责人调整,落地仍需时日
IT之家援引博文介绍,苹果公司的 Apple Watch无创血糖监测项目最早可以追溯到乔布斯时期,苹果公司目标是不需要传统的扎手指采血,也不需要抽血检测,通过传感器就能识别血糖升高。 最新消息称该项目此前…

2026-05-27

颜值与实力并存!四款高颜值手机推荐 一加Ace 6至尊版等引领潮流新体验
手机作为全天候贴身使用的数码产品,颜值质感不仅关乎视觉审美,更适配日常穿搭、外出场景的风格搭配,细腻的机身工艺、潮流的配色设计、精致的镜头布局等,能够彰显个人审美与生活品味。 CNMO科技精选出四款高颜值机…

2026-05-27

石头科技再获吸尘器主机外观专利,研发投入加码引领智能家居新未来
这项专利的获得不仅彰显了石头科技在清洁电器行业的技术实力,也展现了其在工业设计方面的持续创新能力。这些数据充分体现了石头科技在技术研发、市场运营和品牌建设等方面的综合实力。 总的来说,石头科技在专利授权和研发…

2026-05-27

国家能源局力推51个“人工智能+”能源场景 加速能源智能化跃升发展
国家能源局局长王宏志表示,随着我国“人工智能+”能源从概念走向实践、从探索走向推广,产业形态加速演进、创新应用多点突破、融合基础不断夯实,将加快推动人工智能和能源双向赋能,促进能源领域新质生产力跃升发展和生…

2026-05-27