以「垂直模型」引领AIGC商业化落地,FancyTech的技术路径是什么?

我们正在见证又一轮技术革新,这一次是AIGC为个体提供表达自我的工具,让创作变得更加容易和普及,但背后的推动力却并不是「大」模型。

两年以来,AIGC技术的发展速度超过所有人的想象,席卷了从文本、图像到视频的各个领域。关于AIGC商业化路径的讨论从来没有停止过,其中,有共识也有路线分化。

一方面,通用模型的强大能力令人惊叹,在各行各业展示出应用潜力。特别是DiT、VAR等架构的提出,让ScalingLaw实现了从文本到视觉生成领域的跨越。在这一法则的指引下,很多大模型厂商朝着增加训练数据、算力投入和堆积参数的方向持续前进。

另一方面,我们也看到,通用模型并不意味着「通杀」,面对很多细分赛道的任务,一个「训练有素」的垂直模型反而能够取得更好的效果。

这个演进过程中,一家来自中国的创业公司FancyTech脱颖而出:它以面向商业类视觉内容生成的标准化产品快速拓展市场,比同行们更早一步验证了「垂直模型」在产业落地层面的优越性。

环顾国内大模型创业圈,FancyTech的商业化战绩是有目共睹的。但较少为人所知的是,这家诞生仅几年的公司,凭借怎样的垂直模型和技术优势跑在了赛道前列。

在一次专访中,机器之心和FancyTech聊了聊他们正在做的技术探索。

FancyTech发布视频垂直模型DeepVideo

如何突破行业壁垒?

一般来说,在通用模型的零样本泛化能力达到某个水准后,在其之上做微调就可用于下游任务。这也是当下很多大模型产品落地的打法。但从实际效果来看,仅仅是「微调」还不能满足产业应用需求,因为各个行业的内容生成任务都有自己的特定而复杂的一套标准。

在自研面向商业图像/视频的垂直模型过程中,FancyTech将核心挑战拆解开来:如何让商品足够还原且融入背景,特别是在生成视频中,实现商品的运动可控且不形变。

大模型技术发展到今天,对于应用层来说,走开源或闭源的路线已经不是最核心的问题。FancyTech的垂直模型基于开源的底层算法框架,叠加自有的数据标注重新训练,仅需几百张GPU持续训练迭代即可取得好的生成效果。相比之下,「商品数据」和「训练方式」这两个因素对于最终的落地效果更为关键。

FancyTech在积累海量3D训练数据的前提下,引入了空间智能的思路指导模型的2D内容生成。具体来说,在图像类内容生成上,团队提出「多模态特征器」保证商品的还原,以特殊的数据采集保证商品与背景的自然融合;在视频类内容生成上,团队重建了视频生成的底层链路,定向地设计框架和进行数据工程,从而实现以商品为核心的视频生成。

「空间智能」如何指导2D内容生成?

很多视觉生成类产品的效果之所以不尽如人意,核心原因就在于目前的图像和视频生成模型往往基于2D训练数据进行学习,并没有理解真正的物理世界。

这一点在领域内已形成共识,部分研究者甚至认为,在自回归学习范式下,模型对世界的理解始终处于浅层。

但在商业视觉生成这项细分任务上,要想增强模型对3D物理世界的理解、更好地生成2D内容,并非完全无解。

FancyTech将「空间智能」领域的研究思路迁移到了视觉生成模型的构建中。与一般生成式模型不同,空间智能的思路是从大量传感器获取的原始信号中学习,对传感器获取的原始信号进行精确标定,以赋予模型感知和理解现实世界的能力。

因此,FancyTech以激光雷达扫描替代传统摄影棚拍摄,积累了大量体现商品融入前后差异的高质量3D数据对,并将3D点云数据与2D数据结合起来共同作为模型训练数据,增强模型对现实世界的理解。

要知道,在任何视觉内容的生成中,光影效果的塑造都是极具挑战性的任务。光照、发光体、逆光、光斑等元素能够让画面的空间层次感更强,但这对于生成式模型来说是个很难理解的「知识点」。

为了收集尽可能多的自然光影数据,FancyTech在每个环境中建立了数十盏亮度和色温均可调节的灯,意味着海量数据中的每一对都可以叠加多盏灯及不同亮度和色温的变化。

这种高强度的数据收集模拟了真实拍摄场景的灯光,使其更加符合电商场景的特点。

结合高质量的3D数据积累,FancyTech在算法框架上进行了一系列创新,将空间算法与图像、视频算法有机结合,让模型更好地理解核心物体与环境的交互。

在训练过程中,模型可以在一定程度上「涌现」出对物理世界的理解,对三维空间、深度、光的反射和折射,以及光在不同介质、不同材质中运行的结果都有更深的认知,最终实现了生成结果中商品的「强还原」和「超融合」。

「强还原」和「超融合」背后,有哪些算法创新?

面向常见的商品场景图像生成任务,现阶段的主流方法主要用贴图的方式保证商品部分的还原度,然后基于Inpainting技术实现图片场景的编辑。用户选定需要改动的区域,输入Prompt或者提供参考图像,以引导商品场景生成。这种方法的融合效果较好,缺点是场景生成结果的可控性不高,比如不够清晰或者过于简单,保证不了单次输出的高可用率。

针对当前方法无法解决的问题,FancyTech提出了一种自有的「多模态特征器」,在多种维度上提取商品特征,然后使用这些特征生成融入后的场景图。

提取特征的工作可分为「全局特征」和「局部特征」,全局特征包括商品的轮廓、颜色等要素,使用VAE编码器提取;局部特征包括各处商品细节,使用图神经网络提取。图神经网络的一大好处是可以提取商品中各关键像素的信息以及关键像素间的关系,提高对于商品内部的细节还原。

在柔性材质商品的内容生成中,这种方法获得的效果提升显著:

相比于图像,视频的生成还涉及商品本身的运动控制及其带来的光影变化。对于通用的视频生成模型来说,难点在于无法针对视频中的某个部分进行独立保护。为了解决这个问题,FancyTech将任务拆解为「商品运动生成」和「视频场景融入」两条支线。

·第一步,FancyTech设计了一些针对性的运动规划方案,以控制商品在画面中的运动,相当于预先「定住」商品在视频每一帧的画面;

·第二步,通过控制模块实现视频可控生成。控制模块采用了灵活的设计,可兼容U-net、DiT等不同架构,便于扩展优化。

在数据层面,除了使用FancyTech的特有商品数据资源以提供控制训练和商品保护之外,还加入了多个开源数据集以保证场景泛化能力。训练方案结合了对比学习、课程学习,最终实现了对于商品的保护效果。

让AIGC时代的红利

从垂直模型开始走向更多普通人

无论是「通用」还是「垂直」,两条路线的终点都是商业化问题。

凭借着海量独有数据和行业Know-how的优势,FancyTech通过垂直模型的优势赢得国内外客户广泛的认可,与韩国合作伙伴携手签约了三星和LG;与东南亚的知名电商平台Lazada开启合作;在美国,受到了KateSommerville和Solawave等本土品牌的青睐;在欧洲,荣获了LVMH创新大奖,并与欧洲客户深入合作中。

在核心的垂直模型之外,FancyTech还提供了AI短视频全链路自动发布和数据反馈的能力,驱动商品销售持续增长。

让普通人跨越专业门槛,更轻松地将创意化为现实,从而让每个行业的生产力实现飞跃,并产生更多的新兴产业,AIGC技术带来的时代红利,从这一刻起开始真正走向普通人。

THE END
1.ai的路径查找器在哪里,如何在AI软件里找寻路径查找器并使用那么如何在AI软件中查找并使用这个路径查找器呢? 以下为三种方法:方法一:效果菜单栏中寻路径查找器打开AI软件,在顶部的菜单栏中点击“效果”,然后在弹出的下拉菜单中寻找“路径查找器”,或者直接使用快捷键F,即可启动路径查找器。方法二:窗口菜单栏中找路径查找器另一种方法是在菜单栏中点击“窗口”,然后在下拉https://aiqicha.baidu.com/qifuknowledge/detail?id=10119830803
2.ai中怎么把路径变成形状在ai软件中将路径变成形状的方法步骤如下: 打开“ai”软件;点击“新建画布”选项;点击“窗口”选项;点击“对象”选项;选择“路径”选项;选择“轮廓化描边”选项,即可将路径变成形状。在ai软件中将路径变成形状是指将所绘制的二维平面图形变成三维立体形状。http://m.lhlso.com/xw_2134529/
3.无人机路径规划补给点的图像怎么生成的编程语言遗传算法求解岛屿物资补给优化问题 完整的代码,方可运行;可提供运行操作视频!适合小白!https://ask.csdn.net/questions/8168769
4.教你用AI搞定山脉线条效果!平面设计(本来自神经编织者00124-12-12 09:21 发布于 北京 来自 微博视频号 教你用AI搞定山脉线条效果! 平面设计 (本内容由AI生成)#AI探索计划# #AI创造营# L神经编织者001的微博视频 小窗口 ?收藏 转发 评论 ?赞 评论 o p 同时转发到我的微博 按热度 按时间 正在加载,请稍候 游戏博主 https://weibo.com/6614013820/5110688176936519
5.AI钢笔工具绘制尖锐形状的技巧指南AI百科* 使用“平滑工具”或“简化路径”面板使曲线更平滑。 * 通过从“对象”菜单中选择“排列”来对齐和分布形状。 练习和实验熟练掌握钢笔工具需要练习和实验。尝试创建各种尖锐形状,例如星星、三角形和箭头。通过练习,你将能够绘制复杂且精确的图形。 使用钢笔工具绘制尖锐的形状可以增加你的设计项目的多功能性和创造力https://heiti.cn/ai/25709.html
6.AI人工智能教程:从零开始学习的正确途径与实际项目实践AI教程:从零开始学习的正确途径与实际项目实践,引领你踏入人工智能领域。本文从基础技能掌握、数学基础、机器学习入门、项目实践、参与社区与交流五个方面,为你构建AI学习路径。掌握Python、理解概率与统计、学会监督与无监督学习,从简单的项目实践开始,如情感分析、图像分类、语音识别,逐渐拓展到复杂应用。加入AI社区,参https://www.imooc.com/article/349105
7.AI如何把路径合并变成图形?大家好,我是小溜,AI是现在多媒体和在线图像制作的热门工具,主要应用于印刷出版、海报书籍排版、专业插画、多媒体图像处理和互联网页面制作等。我们可以在AI里面通过路径来制图,例如AI如何把路径合并变成图形?下面来操作一遍。 工具/软件 硬件型号:小米 RedmiBookPro 14 系统版本:Windows7 所需软件:AI CS6 方法/步骤https://mobilezixue.3d66.com/article/details_153359.html
8.ai怎么做图案环绕路径一秒搞定图形环绕效果,一起来@打卡吧#AI #教程 #平面设计 @创作灵感小助手 @DOU+小助手 @抖音小助手 有粉丝问我,像这样的图形反漏效果怎么做的呢?首先选择椭圆工具未知,按住二键复制,选择矩形工具未知,接下来框选整个对象,选择形状https://www.douyin.com/shipin/7270959166464886839
9.形状图层路径和矢量图形的概述每个形状路径也有可影响路径位置和形状的内在属性。对于参数形状路径,这些属性(如和)是显示在时间轴面板中的参数。对于贝塞尔曲线形状路径,这些属性为每个顶点定义,但包含在路径属性内。在使用自由变换定界框修改贝塞尔曲线路径时,将会修改构成该路径的顶点的这些固有属性。 https://helpx.adobe.com/cn/after-effects/using/overview-shape-layers-paths-vector.html
10.人工智能高峰论坛张宏伟先生表示,面对新要求,如何抢抓人工智能这一前沿科技,加快科研成果转化,打造高质量发展强力引擎,已成为摆在一项重大课题,也是实现追赶超越必须探索的重点领域。2020年“一带一路”人工智能高峰论坛围绕人工智能产业发展,汇聚各方智慧,共同交流探讨新科技、新理念、新思路,努力为推动高质量发展寻找新动能、新探索路径https://ipiu.xidian.edu.cn/info/1116/2358.htm
11.illustrator(AI)图形怎么沿着路径流动?AI怎么制作圆点沿曲线流动朋友们,你们好!最近有很多朋友咨询关于AI图像沿着曲线曲率流动的内容。为了消除你的疑虑,古风插画网编辑将尽可能详细地回答你。这一期将与你分享AI图形是如何沿着路径流动的。以下是细节。 AI图形沿着路径流动教程: 1.打开AI软件,点击“文件”和“新建”,创建一个空白文档; https://www.chahuajiaocheng.com/ai/8640.html
12.腾讯云总监手把手教你,如何成为AI工程师?4.入门成为 AI 工程师的可行路径 虽然从垂直领域讲有语音识别,图像视觉,个性化推荐等业务领域的AI工程师,但从其所从事的研发内容来看,从事AI研发的工程师主要分为3类: 1 ) AI 算法研究 这类人大都有博士学历,在学校中积累了较好的理论和数学基础积累,对最新的学术成果能较快理解和吸收。这里的理论是指比如语音https://cloud.tencent.com/developer/article/1004751
13.AI图像语义分割ai中的分割对象的5种方法在堆栈顺序中,将剪贴路径移至想要遮盖的对象的上方。 选择剪贴路径以及想要遮盖的对象。 选择对象 > 剪切蒙版 > 建立。 注意: 要从两个或多个对象重叠的区域创建剪切路径,请先将这些对象进行编组。 使用路径查找器效果裁切对象 路径查找器提供各种分割和裁切重叠对象的方法。 https://blog.51cto.com/u_16213657/10300961
14.AI图片边框怎么设置圆角路径?AI直角路径变成圆角位移路径教程这篇文章主要介绍了AI图片边框怎么设置圆角路径?AI直角路径变成圆角位移路径的相关资料,需要的朋友可以参考下本文详细教程。 ChatGPT & MidJourney 绘图免魔法无限使用 【点击领取】 Adobe Illustrator(AI) 2021 v25.4.1.498 中/英文直装特别版 类型:图像处理 https://www.jb51.net/softjc/811649.html
15.ai怎样把图片生成路径AI怎么将图片变成路径?通过此操作,可以将图像转换为路径图,并可以设置不同的颜色。 ai中怎么把路径变成形状? (ALT s o t)以便您可以选择文本对象!尝试 !有时按下(ctrl h)隐藏选择状态!再按一下你就会看到了 怎样把Ai路径笔刷效果转为图形?我是用路径中的毛笔效果画好了一个图形,路径轮廓化后就没毛笔效果了?http://www.zzfmdn.com/article/986474
16.科学网—[转载]人工智能生成内容的潜在风险及治理对策3.3 其他国家人工智能技术治理的路径选择 其他国家针对人工智能治理领域也出台了相关政策文件。例如,英国在2023年3月发布了《支持创新的人工智能监管方式》白皮书,提出了AI治理的5项原则,包括安全性和稳健性、透明度和可解释性、公平性、问责制和管理,以及可竞争性;同年4月英国政府宣布投入1亿英镑建立基础模型工作组,https://blog.sciencenet.cn/blog-3472670-1427901.html
17.卫星,未来太空数据的「智能平台」而人工智能芯片专门针对神经网络优化,可以具备低功耗、高算力,能处理很多 AI 算法场景了,所以也促进了卫星智能化的发展,例如,遥感图像的在轨处理,可以在星上基于 AI 目标识别算法将获取的卫星图像数据直接提取特征目标,或者基于 AI 算法开展遥感图像数据压缩等。 https://wallstreetcn.com/articles/3668888