凌晨战神Qwen又搞事情！新模型让图像编辑“哪里

2025-08-19

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里

henry 发自凹非寺
量子位 | 公众号 QbitAI

用提示词就能点对点编辑图片？

Qwen：没错，正是在下。

瞧，上面这套“哪里不对改哪里”的操作，就来自“凌晨战神”Qwen团队最新发布的——Qwen-Image-Edit

作为Qwen-Image20B的图像编辑版，Qwen-Image-Edit除了能做上面这种精准的文字修改，还能够新增、消除、重绘、修改元素，而且还支持IP编辑、视角切换、风格迁移等生成式玩法。

网友：这一连串功能摆出来，PS都得收声。

一次出图，玩转增删改

话不多说，我们直接看效果。

原创IP编辑

原创IP编辑需要保持原始图像视觉语义不变的前提下，对图像内容进行修改，也就是所谓的语义编辑。

Qwen以他们的吉祥物卡皮巴拉作为输入，生成了一系列衍生IP形象。

（卡皮巴拉：我一好好的水豚成熊了？）

不难看出，这些IP形象既忠实呈现了卡皮巴拉的角色特性，又在对应场景中展现出丰富多彩的形象。

那么，Demo很优秀，实测效果又如何？

对此，我们进行了简单地实测，提示词：这只熊穿着体操队服，双手拉在单杠上。

实话说，生成效果确实不赖，单杠因受力产生了自然变形，更难能可贵的是双手手指数量也是一致的（动漫角色经典的四根手指）。

视角转换

接下来是视角转换，Qwen-Image-Edit在这里不仅展示了90度旋转，还展示了180度旋转。

我们把WRC上拍的小瓦力输入Qwen-Image-Edit，分别进行右侧，后侧视角转换的测试。

（注：这张图片并不是严格意义上的主视图，而且还有点俯视，我们看看效果。）

严格来说，右侧瓦利的右手（图片左）有些变形，但转向后侧的效果实属惊艳到了。

虚拟形象生成

虚拟形象可以说是大伙最爱玩的功能之一，生成头像嘎嘎好用。

在Qwen展示的案例中，如果硬要挑刺就是——3D卡通风格把原先的半框眼镜变成了全框的黑框眼镜。

在测试的过程中，我们发现，一旦画风变得复杂（图为热血漫画风格），线条就会稍显凌乱。

（眼镜框细节倒是保留了下来）

不过，在网友的测试中，效果倒是非常不错：自拍头像的女性版本，动漫版，007版和恶魔版本。

A新增

除了上面的生成式语义编辑，外观元素的增、删、改也非常重要。

Qwen-Image-Edit展示了在图片中添加指示牌的案例，可以看到Qwen-Image-Edit不仅成功添加了指示牌，还生成了相应的倒影，细节处理十分到位。

我们用一张在颐和园实拍的照片进行测试，提示词：add the small wooden sign in the foreground in front of the tree with the text ‘welcome to SummerPalace’（在树前的前景中添加一个小木牌，牌上写着“欢迎来到颐和园”。）

在测试中，我们发现，如果输入的图像分辨率过高，Qwen会主动报告：编辑后的图片会降低分辨率。

同时，由于照片的分辨率较高，生成的图片有些失真。

不过，基本的画面元素和新增操作还是实现了。

为了验证是否是分辨率的问题，我们把照片换成分辨率没那么高的漫画图片，输出效果还是非常不错的。

提示词：add the small wooden sign in the foreground in front of the woman with the text ‘welcome to the sea’（在女人前的前景中添加一个小木牌，牌上写着“欢迎来到大海”。）

AI消除与重绘

在消除和重绘方面，Qwen展示了两个很巧妙的例子，一个是去除头发丝等细小元素，另一个是在一堆复杂元素中，选取其中一个元素改变颜色。

看得出来，效果确实不错。

这里我们简单测试了一下改颜色的操作，把上面的a从黄色变成橙色。

其他字母的颜色都没变，只有a变了。

我服了！确实厉害！

虚拟场景与穿搭模拟

接下来是两个老生常谈的电商场景，模特换背景，换衣服。

人物手部，肢体末端，头发，光影表现都不错。

文字设计与海报编辑

Qwen-Image-Edit在下面的案例中展示了中、英双语的文字编辑能力。

令人惊艳的是，其不光能修改海报中的大字，连细小的文字也能精准调整。

对此，我们拿自己的海报进行了测试：把AICoding改成AIAgent。

没毛病，高，实在是高！

链式编辑

最后，就是我们开头展示的，框出错误的部分，逐步修改的方法，Qwen-Image-Edit把它叫做链式编辑。

在Qwen展示的案例中，他们先用Qwen-Image生成了一幅《兰亭集序》。

不难看出，这幅AI生成的书法作品中有不少错字。

在这里，Qwen展示了不用重新生成整幅图片，就能解决这些问题的办法——

很简单，就是框住错误的字，交给Qwen-Image-Edit改就可以。

离谱的是，对于一些生僻字，还可以圈出错误的偏旁，实现偏旁级别的修复。

就这样，逐步修改画面中的瑕疵，最终得到完美的图片。

需要说明的是，上述简单实测均为一次出图

可以看到，经过Qwen-Image-Edit处理的图片，虽然有时会有一些色调，细节的轻微改变，但在绝大多数情况下，都和官方说的一样，能达到不错的编辑效果。

你给这个效果打几分？

创意+精准，统统搞定

据介绍，Qwen-Image-Edit这次的主要更新包括：

语义与外观双重编辑：Qwen-Image-Edit不仅支持low-level的视觉外观编辑（如元素的添加、删除、修改等，要求图片其他区域完全不变），也支持high-level的视觉语义编辑（如IP创作、物体旋转、风格迁移等，允许整体像素变化但保持语义一致）。
精准文字编辑：Qwen-Image-Edit支持中英文双语文字编辑，可在保留原有字体、字号、风格的前提下，直接对图片中的文字进行增、删、改等操作。
强大的基准性能：在多个公开基准测试中的评估表明，Qwen-Image-Edit在图像编辑任务上具备SOTA性能，是一个强大的图像编辑基础模型。

其中，为了同时实现语义与外观双重的编辑能力，Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL（实现视觉语义控制）和VAEEncoder（实现视觉外观控制）。

换句话说，就是从创意裂变到精准改字，所有常见的图像编辑需求Qwen都能hold住。

最后，Qwen-Image-Edit的体验方式如下，感兴趣的同学快去体验吧！

Qwen-Image-Edit：https://huggingface.co/spaces/Qwen/Qwen-Image-Edit

Qwenchat：https://chat.qwen.ai/

GitHub:https://github.com/QwenLM/Qwen-Image

来源于：https://www.163.com/dy/article/K7B908FG0511DSSR.html 如有侵权请联系我们

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里

最新发布

一箭七星，中科宇航力箭一号遥十运载火箭发射成功

一箭七星！力箭一号遥十运载火箭发射成功

再优化！个人养老金领取情形调整9月1日起实施

获谷歌32亿美元支持！比特币矿商TeraWulf股价五

东方甄选股价暴涨后又暴跌，否认新东方集团CEO

Category

Sports

Travel

Technology

热门

一箭七星，中科宇航力箭一号遥十运载火箭发...

一箭七星！力箭一号遥十运载火箭发射成功

再优化！个人养老金领取情形调整9月1日起...

获谷歌32亿美元支持！比特币矿商Tera...

东方甄选股价暴涨后又暴跌，否认新东方集团...

一箭七星，中科宇航力箭一号遥十运载火箭发...

一箭七星！力箭一号遥十运载火箭发射成功

再优化！个人养老金领取情形调整9月1日起...

获谷歌32亿美元支持！比特币矿商Tera...

东方甄选股价暴涨后又暴跌，否认新东方集团...

Tags

导航

友情链接

POPULAR NEWS

Ratcliffe to be of nation talent

Ratcliffe to be of nation talent

联系我们: 917345325@qq.com

内容详情

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里

猜你喜欢

最新发布

Category

Sports

Travel

Technology

热门

Tags

导航

友情链接

POPULAR NEWS

联系我们: 917345325@qq.com