智快网
快讯 行业 产业 汽车 科技 AI+ 热点

阿里Qwen-Image-Edit-2511开源:人物融合自然,风格控制实用新体验

2025-12-24来源:快讯编辑:瑞雪

阿里Qwen团队近日正式发布其图像编辑模型的最新版本——Qwen-Image-Edit-2511。这一版本在保持原有强大功能的基础上,进一步提升了人物一致性和风格迁移能力,同时拓展了多场景下的图像编辑应用。

Qwen-Image系列模型在之前的多个公开基准测试中表现优异,共获得12项最佳成绩。特别是在中文文字生成评测中,该系列模型领先于GPT Image 1和Seedream 3.0等主流模型。新发布的Qwen-Image-Edit-2511版本则重点解决了图像生成过程中的人物一致性问题,在单人连拍和多人物融合等任务中,显著提升了面部特征和风格的稳定性。该版本还集成了多个LoRA子模型,增强了图像编辑中的几何构造、光照控制和材质替换等能力。

在实际测试中,Qwen-Image-Edit-2511在人物融合、LoRA光照控制和风格一致性方面表现出色。例如,在情侣写真合影测试中,模型成功生成了面部特征保持一致、互动姿态自然的图像,光影效果符合写真风格,整体效果稳定可用。在高角度俯拍自拍测试中,模型也成功保持了人物的高人脸相似度,背景干净,整体表现良好。

在光照重构和视角操作测试中,Qwen-Image-Edit-2511同样表现不俗。模型成功完成了柔光重新照明任务,侧光层次自然,整体光线控制稳定。然而,在镜头移至桌面特写和镜头旋转测试中,模型的表现则存在一定局限,桌面物品数量和状态与原图存在偏差,镜头旋转指令也未能有效执行。

在工业设计场景测试中,Qwen-Image-Edit-2511成功将家具图片中的木质纹理替换为浅色松木材质,整体结构保持稳定,材质替换自然贴合。在文字渲染与风格融合测试中,模型也成功生成了真人与卡通壁画风格和镜头方向衔接自然的图像,中文和英文文字渲染清晰,风格与画面保持一致。

Qwen-Image-Edit-2511的另一大亮点是内置了部分高频使用的LoRA子模型,用户无需加载外部权重即可直接启用光照增强、新视角生成和材质替换等功能。这一设计显著降低了LoRA功能的使用门槛,提升了模型在专业应用场景下的实用性。例如,用户可以通过光照增强LoRA控制自然光线的角度、强度和方向,生成具有真实光影层次的画面效果。

在视角调控方面,用户可以调用新视角LoRA,直接以同一主体为基准生成不同拍摄角度下的图像,减少重复拍摄和人工调整角度的成本。在工业设计任务中,LoRA机制也可用于批量图像生成、元素删改和材质替换流程中,初步具备在产品草图阶段进行测试的潜力。

综合来看,Qwen-Image-Edit-2511在人物一致性、多人物合成和LoRA风格控制方面表现稳定,实用性较前一版本有明显提升。对于需要连贯角色形象输出、控制局部风格迁移和进行材质替换等图像生成任务的用户来说,该模型已经具备一定的落地能力。然而,在镜头变换、构图调整和几何推理等涉及空间理解和强逻辑执行的任务中,模型仍存在稳定性和精度上的短板,与当前顶尖的多模态生成模型相比,仍有一定差距。

华为Pura 80系列携鸿蒙6登场,硬核影像与智能交互重塑旗舰新标杆
总而言之,得益于鸿蒙操作系统6的深度赋能,华为Pura 80系列不仅在交互、安全等多层面实现了跨越式提升,更凭借其一镜双目超大底双长焦、红枫原色影像、XMAGE风格个性色卡等硬核影像实力,重新定义了旗舰手机…

2025-12-24

华为Pura X2或2026年3月登场:麒麟9030加持,加配不加价引期待
这款新品将搭载麒麟9030芯片和红枫影像2.0系统,延续16:10比例的“阔折叠”设计,并可能采取“加配不加价”的定价策略。华为能否凭借其在性能、影像和定价上的综合优势,推动折叠屏手机从“尝鲜”走向“常用”,…

2025-12-24

机器人租赁新玩法:智元擎天租打造一小时达,让科技从实验室走向烟火气
昨天,智元发布了机器人租赁平台「擎天租」,它的逻辑简单粗暴:既然大家觉得机器人酷,那就别让它在实验室吃灰,把它变成像共享充电宝一样,一小时内就能出现在你家楼下火锅店里的「快消品」。 但无论如何,擎天租干了一…

2025-12-24

荣耀WIN系列引领新潮流:10000mAh巨无霸电池开启电竞新篇章
12 月 22 日,荣耀官方分享荣耀 WIN 系列预热海报,正式官宣全系搭载 10000mAh 巨无霸青海湖电池。测试结果显示,荣耀 WIN 系列在多项严苛的续航模型中实现了“断层式领先”。未来,荣耀计划构建…

2025-12-24