智快网
快讯 行业 产业 汽车 科技 AI+ 热点

阿里开源Qwen-Image-Layered图像模型,开启AI图层精准编辑新纪元

2025-12-23来源:快讯编辑:瑞雪

阿里近日正式开源全新图像生成模型Qwen-Image-Layered,该模型首次在架构层面实现了类似Photoshop的图层理解能力,标志着视觉大模型从"像素堆砌"向"空间重组"的重大突破。这一创新技术通过引入分层处理机制,使AI生成图像的可编辑性达到专业设计工具水准,有望重塑数字内容创作流程。

传统视觉大模型长期面临"扁平化认知"困境,其处理图像时将所有元素视为紧密耦合的像素矩阵,难以理解物体间的空间关系。这种局限导致图像编辑如同"开盲盒"——修改某个元素往往引发全局变化,例如移动画中猫咪时,背景纹理会完全重构而非自然填补。这种不可控性严重制约了AI在商业广告、UI设计、影视后期等需要精准控制的场景应用。

Qwen-Image-Layered通过三项核心技术突破解决这一难题。首先研发团队自研RGBA-VAE编码体系,在传统RGB色彩模式基础上新增Alpha透明度通道,使模型具备图层分离能力。其次创新的VLD-MMDiT架构配合3D位置编码技术,让AI能自动推理被遮挡区域的背景纹理。最关键的是,模型训练阶段直接解析海量PSD源文件,学习专业设计师的分层逻辑,形成"空间认知"本能。

实测显示,该模型可实现近乎零误差的图层编辑:设计师能独立调整特定图层元素的位置、尺寸甚至重新绘制,而其他图层保持完全不变。这种"内在可编辑性"彻底改变了创作模式——以往需要数小时的精细抠图工作,现在通过AI原生支持即可瞬间完成。某动画工作室测试表明,使用新模型后角色动画制作效率提升40%,背景修改耗时从平均2.3小时缩短至8分钟。

Qwen-Image-Layered分层处理机制示意图

技术开源方面,该模型已在魔搭社区和HuggingFace平台全面开放,支持商业用途免费下载。此举延续了阿里在开源领域的领先布局——截至目前,千问系列已开源近400个模型,全球下载量突破7亿次,衍生开发模型超18万个。在企业服务市场,通义大模型以超百万家客户规模占据中国企业级市场首位,成为应用最广泛的国产大模型。

行业分析师指出,Qwen-Image-Layered的分层处理能力将引发连锁反应:设计工具可能向AI原生架构转型,数字内容生产流程面临重构,甚至催生新的创作职业形态。随着模型在影视、游戏、广告等领域的深度渗透,专业设计工具的市场格局或将迎来新一轮洗牌。

华为鸿蒙终端设备量达3200万台 开发者超千万 12月日均新增超15万
【CNMO科技消息】12月22日,在华为nova 15系列及全场景新品发布会中,华为终端BG CEO何刚透露,截至目前,搭载HarmonyOS5、HarmonyOS 6的终端设备已突破3200万台,成为智能…

2025-12-23

华为nova 15标准版来袭!麒麟芯+红枫影像,2699元起售亮点多
IT之家 12 月 22 日消息,华为 nova 15 标准版手机今日正式发布,新机搭载麒麟 8020处理器、支持鸿蒙智慧通信、后置红枫影像系统,售价 2699 元起。 IT之家注意到,nova 15 标准…

2025-12-23

鸿蒙6加持,AI沾色吸睛!nova 15系列凭实力成为年轻人新宠
全新“带感绿”搭配“耀目双星”设计,颜值一眼入魂;影像首发“前后双红枫”镜头及AI沾色功能,让修图更有趣;更有6500mAh大容量硅负极大电池告别续航焦虑,首发无网通信与昆仑玻璃加持,安全感拉满。如果说以前的…

2025-12-23

小米手表5定档12月25日发布 骁龙W5加持 健康监测与外观皆出色
除了强大的芯片,小米手表5在健康监测功能上实现了重大突破。凭借该传感器,手表能够精准识别更精细的动作,无论是日常运动中的细微动作,还是专业健身时的特定动作,都能被准确捕捉和分析,为用户提供更科学、更个性化的…

2025-12-23

2025拍照手机怎么选?荣耀500领衔,多款影像实力派机型任你挑
不过相比荣耀500的2亿像素主摄,K80在细节解析力和人像算法上稍逊一筹。 总结来看,2025年拍照最好看的手机推荐中,荣耀500凭借2亿像素AI超清主摄、CIPA5.0级防抖和哈苏调校的影像系统,在画质、…

2025-12-23

华为nova 15 Ultra携双红枫影像登场:轻薄机身搭配超强影像实力
快科技12月22日消息,今天下午,华为nova 15系列正式亮相,首先登场的是华为nova 15 Ultra。 作为nova15系列的最强版本,华为nova 15Ultra首发双红枫影像系统,带来前后准出片…

2025-12-22

AI助力科研论文产量飙升,质量风险浮现:学术评价标准待革新
发表于《科学》期刊的一项新研究显示,在诸多学科领域中,使用 ChatGPT 等大语言模型(LLMs)的科研人员,产出的论文数量显著增多。 人工智能在科研领域的应用日益广泛,这引发了人们对粗制滥造研究成果以及机…

2025-12-22