ControlNet作者新作:AI绘画能分图层了!项目未开源就斩获660Star

给一句prompt,用StableDiffusion可以直接生成单个或多个透明图层(PNG)!

例如来一句:

头发凌乱的女性,在卧室里。Womanwithmessyhair,inthebedroom.

可以看到,AI不仅生成了符合prompt的完整图像,就连背景和人物也能分开。

而且把人物PNG图像放大细看,发丝那叫一个根根分明。

再看一个例子:

燃烧的柴火,在一张桌子上,在乡下。Burningfirewood,onatable,inthecountryside.

同样,放大“燃烧的火柴”的PNG,就连火焰周边的黑烟都能分离出来:

这就是ControlNet作者提出的新方法——LayerDiffusion,允许大规模预训练的潜在扩散模型(LatentDiffusionModel)生成透明图像。

值得再强调一遍的是,LayerDiffusion绝不是抠图那么简单,重点在于生成。

正如网友所说:

这是现在动画、视频制作最核心的工序之一。这一步能够过,可以说SD一致性就不再是问题了。

还有网友以为类似这样的工作并不难,只是“顺便加个alpha通道”的事,但令他意外的是:

结果这么久才有出来的。

那么LayerDiffusion到底是如何实现的呢?

LayerDiffusion的核心,是一种叫做潜在透明度(latenttransparency)的方法。

简单来说,它可以允许在不破坏预训练潜在扩散模型(如StableDiffusion)的潜在分布的前提下,为模型添加透明度。

在具体实现上,可以理解为在潜在图像上添加一个精心设计过的小扰动(offset),这种扰动被编码为一个额外的通道,与RGB通道一起构成完整的潜在图像。

为了实现透明度的编码和解码,作者训练了两个独立的神经网络模型:一个是潜在透明度编码器(latenttransparencyencoder),另一个是潜在透明度解码器(latenttransparencydecoder)。

编码器接收原始图像的RGB通道和alpha通道作为输入,将透明度信息转换为潜在空间中的一个偏移量。

而解码器则接收调整后的潜在图像和重建的RGB图像,从潜在空间中提取出透明度信息,以重建原始的透明图像。

为了确保添加的潜在透明度不会破坏预训练模型的潜在分布,作者提出了一种“无害性”(harmlessness)度量。

这个度量通过比较原始预训练模型的解码器对调整后潜在图像的解码结果与原始图像的差异,来评估潜在透明度的影响。

在训练过程中,作者还使用了一种联合损失函数(jointlossfunction),它结合了重建损失(reconstructionloss)、身份损失(identityloss)和判别器损失(discriminatorloss)。

它们的作用分别是:

通过这种方法,任何潜在扩散模型都可以被转换为透明图像生成器,只需对其进行微调以适应调整后的潜在空间。

潜在透明度的概念还可以扩展到生成多个透明图层,以及与其他条件控制系统结合,实现更复杂的图像生成任务,如前景/背景条件生成、联合图层生成、图层内容的结构控制等。

值得一提的是,作者还展示了如何把ControlNet引入进来,丰富LayerDiffusion的功能:

至于LayerDiffusion与传统抠图上的区别,我们可以简单归整为以下几点。

原生生成vs.后处理

LayerDiffusion是一种原生的透明图像生成方法,它直接在生成过程中考虑并编码透明度信息。这意味着模型在生成图像的同时就创建了透明度通道(alphachannel),从而产生了具有透明度的图像。

传统的抠图方法通常涉及先生成或获取一个图像,然后通过图像编辑技术(如色键、边缘检测、用户指定的遮罩等)来分离前景和背景。这种方法通常需要额外的步骤来处理透明度,并且可能在复杂背景或边缘处产生不自然的过渡。

潜在空间操作vs.像素空间操作

LayerDiffusion在潜在空间(latentspace)中进行操作,这是一个中间表示,它允许模型学习并生成更复杂的图像特征。通过在潜在空间中编码透明度,模型可以在生成过程中自然地处理透明度,而不需要在像素级别上进行复杂的计算。

传统的抠图技术通常在像素空间中进行,这可能涉及到对原始图像的直接编辑,如颜色替换、边缘平滑等。这些方法可能在处理半透明效果(如火焰、烟雾)或复杂边缘时遇到困难。

数据集和训练

LayerDiffusion使用了一个大规模的数据集进行训练,这个数据集包含了透明图像对,使得模型能够学习到生成高质量透明图像所需的复杂分布。

传统的抠图方法可能依赖于较小的数据集或者特定的训练集,这可能限制了它们处理多样化场景的能力。

灵活性和控制

LayerDiffusion提供了更高的灵活性和控制能力,因为它允许用户通过文本提示(textprompts)来指导图像的生成,并且可以生成多个图层,这些图层可以被混合和组合以创建复杂的场景。

传统的抠图方法可能在控制方面更为有限,尤其是在处理复杂的图像内容和透明度时。

质量比较

用户研究显示,LayerDiffusion生成的透明图像在大多数情况下(97%)被用户偏好,这表明其生成的透明内容在视觉上与商业透明资产相当,甚至可能更优。

传统的抠图方法可能在某些情况下无法达到同样的质量,尤其是在处理具有挑战性的透明度和边缘时。

总而言之,LayerDiffusion提供的是一种更先进且灵活的方法来生成和处理透明图像。

它在生成过程中直接编码透明度,并且能够产生高质量的结果,这在传统的抠图方法中是很难实现的。

正如我们刚才提到的,这项研究的作者之一,正是大名鼎鼎的ControlNet的发明人——张吕敏。

目前张吕敏在斯坦福大学攻读博士,但他为人可以说是非常低调,连GoogleScholar都没有注册。

THE END
1.绘制教程:AI生成人物头像头发制作详解本文详细介绍了生成人物头像头发的制作过程,涵Headshot 2 插件程序的优势、生成头发的步骤及教程详解、古风美女头部建模实例等。通过掌握这一技术,设计师能够快速生成具有独有风格和细节的头发与完整头像,增强设计效率为图形图像领域的发展贡献力量。 (注:本文字数约为1500字,如需进一步扩展可在每个部分加入更多的实例、http://www.guanxian.org/consult/aitong/95157.html
2.智能头发生成工具:一键打造个性化发型,满足多种造型需求想象一下只需轻点一下按,就能瞬间拥有理想的发型,无需剪发、烫发甚至无需出门。智能头发生成工具的出现,让这一设想成为现实。这款工具可以一键打造个性化发型,满足使用者多种造型需求,不仅增强了试发的效率,更让人们在追求美的道路上少走了多弯路。 ### 自动生成头发软件:轻松获取,畅享个性化造型https://www.yanggu.tv/webgov/aizhishi/97847.html
3.纯前端在线一键生成矢量卡通头像工具源码,支持多语言~纯前端在线一键生成矢量卡通头像工具源码,支持多语言~ 社交软件头像的使用可以看出一个人的性格和感情,随着AI的普及,越来越多的人通过AI智能生成头像… 本期推荐一款在线生成个性化矢量卡通头像的工具源码: 在线生成矢量卡通头像工具特色说明: 多种头像素材可以选择,包括有:头像形状、背景颜色、头发头饰、耳朵、耳环、https://www.goww.net/4100.html
4.发际线有救了!这款app可一键AI生发,拯救你的自拍焦虑因此,MT Lab结合StyleGAN Projector、PULSE及Mask-Guided Discovery等迭代重建方式来解决生成头发配对数据的问题。该方案的主要思路是通过简略编辑原始图片,获得一张粗简的目标属性参考图像,将其与原始图像都作为参考图像,再通过StyleGAN进行迭代重建。 以为头发染浅色发色为例,需要先对原始图片中的头发区域染上统一的浅色色http://mtlab.meitu.com/news/4
5.速抠图在线Ai头发抠图专业好用#AI+图片 #图片编辑 #背景替换/抠图 收藏链接直达 喵喵 人工智能-智能抠图 智能抠图,一键生成 评分4分 查看9182 部分免费 在线使用 国内 #AIGC工具 #AI+图片 #图片编辑 #背景替换/抠图 收藏链接直达 图可丽-AI背景更换 去除背景,文字描述生成替换背景 评分4分 查看6790 部分免费 在线https://browser.360.cn/bangong/site/details?id=2391&c=detail
6.一键抠图一键抠图是一款能够轻松实现人物抠图、物品抠图的抠图软件,利用AI抠图技术,无需PS基础,即可快速选择图片中的人像、物品,头发丝、花瓣等均可精细抠出,满足日常拍照抠图和工作室专业抠图等不同场景下的需求.https://www.xunjieshipin.com/yijiankoutu/
7.ai抠图头发丝素材网站图片免费下载抠除发丝头发最常用的方法之一!简单粗暴,3分钟搞定 1 小白也能学设计 第14期:ps抠图之通道精确抠取头发丝及去除杂色和白边 6 东海小丑 发光头发丝秋日写真 5 zzzzty_ ps套索工具抠取人像头发羽毛婚纱等 1 z84950003 玩转ps通道,学会抠头发丝 6 简学在线 ai客服,数字人定制/生成,sd图片生成等热门 ai解决方案https://www.zcool.com.cn/tag/ZODAyNjAzMg==.html
8.哪个软件可以p头发APP推荐哪个软件可以p头发下载— AI人像大师更专业 —【AI人像精修】一键减肥、一键增肌、去双下巴、AI表情、AI换背景、AI路人消除、AI一键美颜、AI头发等,告别繁琐,一键出片!【AI写真】AI生成场景妆造,一键生成我的写真!更有博主同款写真、儿童写真、情侣闺蜜写真、全家福、卡通分身等多种主题,轻松实现写真自由!【AI玩法】AI绘画、AI动漫、AIhttps://www.wandoujia.com/bangdan/404614/
9.3dsMax课时:AI角色头发制作视频教程翼狐网致力于推动CG艺术发展,为用户提供海量的CG视频教程,本节内容主要介绍AI辅助制作高精度次世代角色《敦煌天女》全流程之课时4:AI角色头发制作.https://www.yiihuu.com/v_313822.html
10.人工智能3D头像生成器Headshot2CharacterCreatorHeadshot 2 是 Character Creator 的 AI 升级插件程序,可从照片和 3D 模型产生高端 3D 即时数字人类。提供精确的模型拟合、贴图烧制和全身动态功能,超越前代以及竞争产品。利用「自动」和「专业」模式,提供一键生成低解析虚拟头部与 3D 头发的功能、同时提供大量的雕模选项及精修之高端工具处理高解析贴图。它的多http://www.reallusion.com/cn/character-creator/headshot/
11.免费AI绘画,AI工具,AI做图AI文案AI商品图AI素材AI嘲图Ai无限创作灵感, ?释放艺术天赋 免费Ai绘画生成器 AI绘画,AI工具,AI做图、AI文案、AI商品图、AI素材、AI场景图,让创意轻松实现,数十个图像模型,支持文生图、图生图两种方式,简单选择即可输出数百种不同风格的高质量图片,高清画作在线免费生成。 立即体验Aihttps://m.sukoutu.com/ai
12.逆水寒手游和端游互通吗逆水寒手游端游互通情况除了早已在端游与大家见面过的图片捏脸功能,网易伏羲的人工智能技术这次为大家带来了全新玩法,打字就能捏脸,大大降低捏脸门槛!经过上万条捏脸数据与描述词条的投喂,文字AI生成捏脸预期准确度可达80%,稍作微调便可实现描述词与捏脸的精确匹配。 一键生成走秀大片,零门槛分享你的美https://app.ali213.net/gl/994329.html
13.美颜相机ai人像精修怎么弄?ai人像精修操作方法介绍AI可以去双下巴,一键小V脸,模拟打完瘦脸针的样子,从此告别拍照发腮显胖;AI表情,一秒钟就可以把苦瓜脸变成斩男笑;更改AI背景,只需上传一张照片,AI能自动生成30多张不同场景的背景照片;同时,AI一键美颜,可通过AI展现御姐风格、可爱风格、欧美风格等风格;AI头发,能增加头发的数量,自动提炼出https://zhidao.baidu.com/question/1587349968146238180.html
14.7款AI绘画生成软件推荐,从入门级到专业级!9类提示词:在AI自动生成绘画软件Pixso AI点击输入窗口,就会呈现通用、人物、无关、表情、头发、装饰、服装、环境、建筑等9大提示词,帮你快速锁定灵感。 2.boardmix博思白板 基于boardmix博思白板特有的思维导图功能,使用boardmix AI工具可以一键自动生成思维导图,为项目进行计划、组织和集思广益。同时,boardmix社区也https://pixso.cn/designskills/7-ai-painting-generation-softwares/
15.10个优秀的AI艺术生成器ai生成7. StarryAI[6] 8. Fotor[7] 9. Runway ML[8] 10. WOMBO Dream[9] 人工智能(AI)不仅影响商业、医疗等行业,也在创意产业中发挥着越来越大的作用,当下我们进入了一个人工智能生成艺术作品的时代,AI技术和工具被广泛使用也有助于成就新一代的艺术家。 https://blog.csdn.net/Baihai_IDP/article/details/127919705
16.clippingmagic官网,ai在线一键抠图软件工具,去除背景经过数百万真实图像的训练,无人工实验室数据,Clipping Magic 自动剪切 AI 背景清除工具功能强大,处理范围不仅限于几个前景类别。学习并不止步于此。 随着 AI 背景编辑器接触越来越多的照片,其处理能力不断提升。智能编辑器至今唯一将全自动 AI 与智能保留、删除、头发工具以及实现精确剪切的小刀工具进行无缝结合的背景https://feizhuke.com/sites/clippingmagic.html
17.一键抠图AI抠图软件,PS抠图快速抠出头发丝Midjourney AI作图 淘号阁游戏账号交易-找回包赔 免费看足球比赛直播 讯飞星火AI助手 PDF识别/翻译/转换 下歌吧高清音乐 AI写歌/30秒一首歌 免费蓝光影视 免费AI写作 320.AI-全球顶级AI汇聚地 正规绿色撸美元 千图网-2亿素材图库 收藏 九七电影院-97电影网在线看电影,支持微信微博观看,无需播放器的电影网站,支https://www.bidianer.com/site/498886
18.图图玩家AI在线抠图工具免费在线抠图图图玩家,超简单实用的AI在线抠图工具AI图片编辑工具,操作极其简单,只需上传图片,即可实现AI一键抠图、人像抠图、制作证件照、图片压缩、图片超分等超多丰富功能,以及其他图片相关能力,轻松满足多样化作图需求、玩转图片!https://www.upokr.com/