京东探索研究院近日宣布,其自主研发的图像编辑模型JoyAI-Image-Edit正式开源,成为全球首个深度融合"空间智能"技术的开源项目。该模型突破传统平面修图局限,首次实现了三维空间层面的图像理解与编辑能力,为开发者提供了可直接应用的完整推理代码框架。
通过构建包含空间位置建模、多视角一致性、相机参数感知等核心模块的技术体系,该模型在三维空间重塑领域取得多项突破。实验数据显示,在物体移动精度、空间结构一致性等关键指标上,其性能已达到国际领先水平。研发团队特别强调,模型通过深度解析真实世界的空间规律,实现了相机视角变换、物体空间位移、几何结构精准控制等复杂操作。
该模型最具创新性的三大功能包括:智能视角变换系统支持通过自然语言指令调整相机参数,在保持场景几何完整性的同时生成新视角图像;连续空间漫游功能可生成逻辑连贯的多视角图像序列,模拟三维空间中的自然移动效果;智能物体关系操控技术能在保持场景整体结构稳定的前提下,对指定物体进行位移、缩放等操作,并自动优化遮挡关系与光影效果。
在基础功能层面,模型兼容15类主流图像编辑需求,涵盖物体替换、元素增删、风格迁移、细节优化等高频应用场景。其多模态处理能力可同时支持结构化空间编辑与艺术化内容创作,形成完整的图像处理解决方案。
目前该模型已在电商内容生产、创意设计、智能图像处理、3D建模重建等多个领域展开应用测试。特别是在具身智能视觉感知领域,其提供的底层空间理解能力,为机器人环境感知、虚拟场景构建等前沿技术研发提供了重要支撑。开发者社区反馈显示,模型的开源架构显著降低了空间智能技术的开发门槛,加速了相关技术的产业化进程。

