视频一键拆分PS层!DeepMind新模型效果碾压同级,物体背景完美分离,还能脑补deepmind

【新智元导读】DeepMind的研究人员开发了一种视频分层新方法,可以无需假设背景静止或精确的相机姿态,就能将视频分解成包含物体及其效果(如阴影和反射)的多个层,提升了视频编辑的灵活性和效率。

视频数据中通常会包含动态世界中的复杂信号,比如相机运动、关节移动、复杂的场景效果以及物体之间的交互。

如果能自动化地把视频分解成一组语义上有意义的、半透明的层,分离前景对象和背景的话,类似PS中的图片,就可以极大提升视频的编辑效率和直观性。

最近,GoogleDeepMind、马里兰大学帕克分校和魏茨曼科学研究所的研究人员共同提出了一个全新的分层视频分解框架,无需假设背景是静态的,也不需要相机姿态或深度信息,就能生成清晰、完整的图像层,甚至还能对被遮挡动态区域进行补全。

该框架的其核心思想是训练一个视频扩散模型,利用其强大生成式先验知识来克服之前方法的限制。

1.模型的内部特征可以揭示物体与视频效果之间的联系,类似于把视频扩散模型的内部特征应用于分析任务;

2.模型可以直接利用先验补全层分解中的被遮挡区域,包括动态区域,而之前方法在先验信息有限的情况下无法实现。

在实验阶段,研究人员验证了,只需要一个小型、精心策划的数据集,就能够处理包含软阴影、光泽反射、飞溅的水等多种元素的日常拍摄视频,最终输出高质量的分解和编辑结果。

最牛「视频分层」模型

由于真实的分层视频数据很少,并且预训练模型已经在生成任务中学习到了物体及其效果之间的关联,所以希望通过微调模型来发挥这种能力,使用小型的分层视频数据集进行微调。

基础视频扩散模型

研究人员基于文本到视频的生成器Lumiere,开发出了一个可用于移除物体及其效果的模型Casper

基础模型Lumiere先从文本提示生成一个80帧、分辨率为128×128像素的视频,再利用空间超分辨率(SSR)模型将基础模型的输出上采样到1024×1024像素的分辨率。

Lumiereinpainting模型对原模型进行微调,输入条件为「遮罩的RGB视频」和「二进制掩码视频」,然后使用相同的SSR,以实现高分辨率质量。

Casper基于inpainting模型进行微调,对物体及视频效果进行移除,保持相同的模型架构。

使用三元掩码进行物体和效果移除

原始的Lumiereinpainting模型需要输入一个二元掩码来指示需要修复(inpaint)的区域和需要保留的区域。

Casper还引入了额外的不确定性,即所谓的「保留」区域并不完全保留,也可能为了擦除阴影而修改目标区域。

研究人员提出了三元掩码(Trimask)条件M,区分出需要移除的对象(M=0)、需要保留的对象(M=1)以及可能包含需要移除或保留效果的背景区域(M=0.5)。

为了获得干净的背景视频,再使用一个背景三元掩码,将所有物体都标记为需要移除的区域,背景标记为可能需要修改的区域。

使用SegmentAnything2获得二进制对象掩码,然后将单个物体作为保留区域,其余物体标记为移除区域。

在推理过程中,Casper的输入包括描述目标移除场景的文本提示、输入视频、三元掩码和128px分辨率的噪声视频的拼接。

视频生成器中的效果关联先验

可以观察到,阴影区域的查询token对对象区域展现出更高的注意力值,表明预训练模型能够有效关联对象及其效果。

训练数据构造

研究人员从四个类别中构造了一个包含真实和合成视频示例的训练数据集。

Omnimatte,从现有方法的结果中收集了31个场景,形成输入视频、输入三元掩码和目标背景视频的训练元组。场景大多来自DAVIS数据集,以静态背景和单个对象为特色,包含现实世界视频中阴影和反射。

Tripod,通过互联网补充了15个视频,由固定相机拍摄,包含进出场景的对象、水效果(例如,反射、飞溅、波纹)和环境背景运动。然后通过KenBurns效果增强视频,以模拟相机运动。

Kubric,包含569个合成视频,在Blender中渲染多对象场景并使对象透明。此外,研究人员观察到许多现实世界场景在一个场景中会展示同一类型对象的多个实例,例如狗、行人或车辆,所以还特意生成了包含重复对象的场景,以训练模型处理多个相似对象。

对象粘贴(Object-Paste),从YouTube-VOS数据集中的真实视频合成了1024个视频元组,使用SegmentAnything2从随机视频裁剪对象,并将其粘贴到目标视频上。训练输入和目标分别是合成的视频和原始视频,可以加强模型的修复和背景保留能力。

实验结果

定性分析

在下图「船」(boat)的例子中,现有的方法无法将船的尾迹从背景层中分离出来,而文中提出的方法可以正确地将其放置在船的层中。

「马」的例子中,Omnimatte3D和OmnimatteRF因为3D感知背景表示对相机姿态估计的质量很敏感,所以背景层很模糊,无法在最后一行中恢复出被遮挡的马。

在物体移除方面,视频修复模型无法移除输入掩码外的软阴影和反射;ObjectDrop可以移除cartoon和parkour中的阴影,但独立处理每一帧,并且没有全局上下文的情况下修复区域,会导致不一致的幻觉。

定量分析

研究人员采用OmnimatteRF评估协议来评估十个合成场景的背景层重建效果,包括5个电影场景和5个由Kubric生成的场景,每个场景都有一个对应的真实背景,不包含前景对象和效果。

使用峰值信噪比(PSNR)和LearnedPerceptualImagePatchSimilarity(LPIPS)作为评估指标。

结果显示,Omnimatte和LayeredNeuralAtlas使用2D运动模型,因此难以处理视差;Omnimatte3D在两个案例中未能构建背景场景模型,并且在电影场景中的静止前景对象处理上存在困难。

THE END
1.ai图形描摹后怎么拆分?【学ai设计,上羽兔网!专业ai课程提供,0基础也可学平面设计!理论+实战,做到综合提升!今日推荐新进https://www.yutu.cn/question/tiwen_180945.html
2.AI怎么将图片分解开?AI可以将图片分解成不同的元素,例如颜色、形状、纹理等。这个过程通常被称为图像分割。一种常见的图像https://www.3d66.com/answers/question_1433025.html
3.AI中图像描摹怎么使用视频AI中图像描摹怎么使用2018-11-16 18:26 出处:PConline原创 作者:太平洋电脑网 0【PConline 视频】AI中图像描摹怎么使用?置入需要处理的图片,选择工具选择图片,嵌入,点击实时描摹,根据自己需要的效果选择相应的选项,设置完成后点击描摹,即可出现需要的效果。https://www.pconline.com.cn/video/1198/11989220.html
4.AI软件图像描摹怎么去掉图片白底3种方法可尝试解决使用透明背景:在创建新图层时,选择“透明”作为背景类型。这样,在添加描摹后,白色背景将自动被删除,留下只有描摹部分的图像。 消除背景:使用AI工具中的“消除背景”功能来移除图片的白色背景。打开你的图像,然后选择“选择工具”,选择“魔术橡皮擦”或者“消除背景”选项。然后,用鼠标拖动此工具以框选图像出现的区域https://www.cnraksmart.com/8337.html
5.AI图像生成器怎么用?总之,AI图像生成工具的出现为艺术和设计领域带来了革命性的变化。通过利用人工智能技术,设计师和艺术家能够创作出更加独特和创新的作品,为人们带来视觉上的享受和震撼。 五、ai图像描摹怎么剪切图像进去? 方法/步骤: 1. 首先,打开我们的Ai软件,然后开启并进入到需要对图片进行裁剪的文档之中。 https://tool.a5.cn/article/show/82983.html
6.AI图像描摹面板在哪里怎么打开AI图像描摹面板在哪里怎么打开 作品简介: 下面给大家介绍的是AI图像描摹面板在哪里怎么打开,喜欢的朋友可以一起来学习哦! 第1步、打开IllustratorCC软件,点击窗口菜单,在图像描摹前面打勾。 第2步、然后图像描摹面板就出来了。 ,此教程由软件自学网首发https://m.rjzxw.com/jiaocheng/14625.html
7.AI图像描摹不能自定义怎么解决有大神解决下吗?是有自定义的 可窗口是灰色的 选中不了 https://www.zhihu.com/question/293309810/answer/485872647
8.在Illustrator中剪切分割和裁切对象学习如何将对象切割、分割和修剪为几何图形和手绘图形。 可以使用不同的菜单选项剪切对象、将对象拆分为栅格,并在部分锚点处剪切路径。还可以使用“剪刀”工具分割路径,并使用“刀”工具自由切割对象。此外,还可以选择剪贴蒙版来隐藏对象的某些部分,并选择 pathfinder 效果来修剪重叠对象。 https://helpx.adobe.com/cn/illustrator/using/cutting-dividing-objects.html
9.AI软件入门AI中图像描摹的使用方法AI软件入门-AI中图像描摹的使用方法 AI软件入门肥日结自-AI中图像描摹的使用方法是什来自么呢?今天就教大家如何操作。https://xinzhi.wenda.so.com/a/1662444216203624
10.PPT如何使用布尔运算PPT布尔运算图标变成灰色怎么办② 不能合并形状的形状如何抢救?口袋动画PA矢量素描、AI图像描摹 ③ OK插件快速导入矢量素材、iSlide插件丰富的插图库 PPT矢量图形不能布尔运算怎么办 从网上下载的.AI格式或.EPS格式的矢量形状(比如笔刷),插入PPT后,却发现不能与图片或其他形状进行布尔运算(进行联合、拆分、组合、剪除等)。原因是该矢量图形在AI中https://www.sucai999.com/officebg/119833.html
11.ai图像描馁图使用方法?创业仆AI 图像描摹和抠图是图像处理中常用的技术,以下是一般的使用方法:https://cyepu.com/question/53325.html
12.Ai教程——图像描摹(位图转矢量图)。位图特征像素组成,Ai教程——图像描摹(位图转矢量图)。位图特征像素组成,放大后会失真模糊。矢量图特征无论放大多少倍都是清晰的。在Ai中用图像描摹可将位图转为矢量图,提高可编辑性。感兴趣的朋友记得收藏哦!#电脑培训 #平面设计 #Ai教程 #干货分享 - 济宁电脑会计学堂-(联创培https://www.douyin.com/note/7397732687022132480
13.ai自动描摹的使用方法ai自动描摹的使用方法 AI自动描摹是一种利用人工智能技术进行图像描绘的工具。它通常通过训练模型来识别图像中的特征并生成相似的图像。以下是使用AI自动描摹的一般步骤: 1. 选择合适的工具,首先,你需要选择一个适合你需求的AI自动描摹工具或软件。目前市面上有一些专门用于图像描绘的AI工具,你可以根据需求选择合适的https://wenku.baidu.com/view/dbaa80f926c52cc58bd63186bceb19e8b9f6ec36.html
14.ai图像描摹在哪ai图像描摹在哪 在Adobe Illustrator 中,图像描摹功能在“图像跟踪器”窗口中,可以通过以下步骤打开: 选中要描摹的图像或导入要描摹的图像文件。 在菜单栏中选择“窗口”>“图像跟踪器”,或者使用快捷键 Ctrl+Alt+Q(Windows)或 Command+Option+Q(Mac)。 https://www.pcfbw.com/5521.html
15.ai图像描摹在哪ai图像描摹在哪 1、鼠标单击打开AI软件,创建一个新文件,放置要处理的图像。 2、选择单击页面上方的工具选项,在选项里点击嵌入的功能按钮。 3、选择在跳出的命令栏里单击实时描摹的功能选项,即可完成对图片的实时描摹。http://www.admin9.com/view/146626997.html
16.如何用AI快速把图片转化为可编辑形状#AI图像描摹#AI教程#AI技巧00:00/00:00 如何用AI快速把图片转化为可编辑形状#AI图像描摹#AI教程#AI技巧 拾叶设计2021.08.30 23:01 +1 首赞 用AI快速把图片转化为可编辑的形状https://learning.sohu.com/a/486711920_121188268
17.AI基础视频AI基础教程AI转曲AI视频教程AI图像描摹(1)AI基础视频AI基础教程AI转曲AI视频教程AI-图像描摹(1) 举报 为课网校自频道 订阅12,044 信息 分享: 直播热点 下载APP领会员 直播中 小言儿~ 直播中 丽丽感谢家人宠爱 直播中 悠然~ 千帆直播 人气主播 直播5775 飞雪? 姐姐,温柔~ 点击观看 直播6162 甜腻喜帆唱情歌 求一个心软的神~ 点击观看 直播6046https://www.56.com/u30/v_MTQwNjkyMzk1.html
18.AI基础教程描摹的运用选择源图像后,执行下列操作之一: 若要使用描摹预设来描摹图像,请单击“控制”面板中的“描摹预设和选项”按钮 并选择一个预设。 若要使用默认描摹选项描摹图像,请单击“控制”面板中的“实时描摹”,或选择“对象”>“实时描摹”>“建立”。 若要在描摹图像前设置描摹选项,请单击“控制”面板中的“描摹预设和选项https://www.jianshu.com/p/e15e9a13fe18