京东探索研究院近日宣布,其自主研发的图像编辑模型JoyAI-Image-Edit正式开源,为AI图像处理领域带来突破性进展。该模型首次将"空间智能"理念深度融入技术架构,使AI突破传统平面修图局限,实现三维空间层面的精准理解与编辑,相关推理代码已完全开放供开发者使用。
通过构建空间位置关系、多视角一致性、相机感知等核心模块,该模型在相机坐标变换、物体空间位移、几何结构控制等关键技术上取得突破。经实测验证,在物体移动精度、空间场景一致性等核心指标上已达到国际领先水平。其创新性的空间建模能力,有效解决了传统开源模型在三维空间理解方面的技术瓶颈。
模型具备三大核心空间编辑能力:在视角变换方面,用户可通过自然语言指令调整相机偏航角、俯仰角及缩放参数,模型能自动生成符合几何逻辑的新视角图像;空间漫游功能支持连续视角移动,可生成逻辑连贯的多视角图像序列;物体空间关系操控技术则能在保持场景整体结构稳定的前提下,对特定物体进行位移、缩放等变换,同时自动优化遮挡关系与光影效果。
除空间编辑能力外,该模型还兼容15类通用图像编辑功能,涵盖物体替换、删除、添加等基础操作,以及风格迁移、细节精修等高级需求。这种"空间+平面"的双重编辑能力,使其能够满足从电商内容生产到创意设计制作等多样化场景的应用需求。
在智能图像处理领域,该模型可显著提升复杂空间场景的编辑效率与质量;在3D模型重建方面,其多视角生成能力为三维建模提供重要技术支持;在具身智能视觉感知领域,模型的空间理解能力为机器人环境感知、路径规划等研发提供了关键技术支撑。目前,相关技术文档与开发工具包已同步开放,开发者可快速集成至各类应用场景。






















