单图10秒快速建模,腾讯的AI新神器卷入了3D赛道视图ai新神器视频生成模型

腾讯ARCLab又有新动作,这一次,生成式AI的焦点放在了3D生成上。

不久前,腾讯ARCLab发布了一种新的AI模型“InstantMesh”,可以使用单张静态照片渲染3D对象。

根据腾讯研究院的说法,InstantMesh是一种用于从单个图像即时生成3D网格的前馈框架,能够在10秒内创建多样化的3D资产。通过网络图片实时转换,InstantMesh可以生成元宇宙中的OBJ格式3D模型。

实际体验下来,InstantMesh生成的模型质量见仁见智,但生成速度的确出乎意料。有用户在社交媒体上展示了利用InstantMesh预置图像生成3D模型的过程,并一连用“Superfast”“highquality”形容InstantMesh的输出效果。

10秒内快速3D建模,还附赠模型六视图

InstantMesh的架构与Instant3D类似,都是由多视图扩散模型和稀疏视图重建模型组成。整个3D生成过程拆分为了两步:

首先,在给定输入图像后,使用多视图扩散模型生成3D一致的多视图图像;然后,利用稀疏视图大型重建模型直接预测3D网格,通过集成等值面提取模块(即FlexiCubes)渲染3D几何形状,并将深度和法线等几何监督直接应用于网格表示以增强结果。几秒钟内就可以完成建模。

1、多视图扩散模型

面对单一输入图像,InstantMesh选择了将具有可靠的多视图一致性和定制的视点分布的Zero123++集成到框架之中,通过多视图扩散模型生成围绕对象调整的六个新视图,捕捉全方位视角。同时微调Zero123++来合成一致的白色背景图像,确保后期稀疏视图重建过程的稳定性。

2、大型稀疏视图重建模型

InstantMesh稀疏视图重建模型架构在Instant3D的基础上进行了修改和增强,训练数据集由Objaverse80万个对象初始池中筛选出的大约27万个高质量实例组成。

在训练过程中,InstantMesh为了与Zero123++的输出分辨率保持一致,将所有输入图像的大小都调整为320×320,并将Zero123++生成的6张图像作为重建模型的输入,以减轻多视图不一致问题。

最后,生成的多视图图像进入基于Transformer的大型稀疏视图重建模型,进行精细化的3D网格重建。

而为了进一步提升3D模型的质量与逼真度,InstantMesh还引入了等值面提取模块FlexiCubes,可以直接作用于网格表示,将深度和法线等关键几何信息融入重建过程,犹如为3D模型披上了一件质地细腻、纹理丰富的外衣。得益于此,InstantMesh生成的模型在视觉上更为细腻,在几何结构上更为精准,从内到外优化全面。

整个图像到3D的转化过程在短短10秒内即可完成,这无疑为创作者开启了全新的效率时代。

无论是专业设计师寻求快速迭代设计方案,还是普通用户渴望将生活瞬间转化为立体记忆,InstantMesh都能快速满足需求。更重要的是,其强大的泛化能力确保了在面对各类开放域图像时,都能生成合理且连贯的3D形状,打破了传统方法对特定数据集的依赖,实现了万物皆可3D的跨越。

腾讯开发团队声称实验结果表明InstantMesh的性能显着优于其他最新的图像转3D方法,那么,站在使用者的角度,InstantMesh的输出效果相比其他同类型的模型,是否真的做到了又快又好呢?

新的家具建模神器

InstantMesh的生成速度有多快呢,实测从照片导入到最终的模型生成总用时不超过50秒,建模过程则基本维持在10秒左右。

对于模型质量,InstantMesh声称其生成的3D网格呈现出更加合理的几何形状和外观。

实际使用下来发现,InstantMesh生成的模型具有完成清晰的表面,并且结构完整,这一点在生成家具等物体时尤为明显。

可以看到,生成的六视图以及最终模型不仅完美复现了图片视角的椅子材质结构形态,甚至连图片中不可见的椅面连接处结构也复现得合理且准确。

而当图片中出现两个以上物体时,InstantMesh不仅能复现椅子和桌子的不同形态,甚至连二者的位置关系也完全一致。

同样的,在生成手办、玩偶等虚拟形象的3D模型时,InstantMesh的表现也十分出色。

生成的3D模型几乎已经可以看做是图片内容的一比一手办了,无论是在色彩、结构还是体积感上都处理得已经接近商用水准。只不过还是有瑕疵存在,在识别玩偶图像中衣领部分时,模型似乎不知道如何呈现衣领部分,而是简单的将其去除,导致玩偶3D模型看起来脖子过长。

而在处理动物等现实生物的图像时,InstantMesh就开始显得力不从心了。

可以看到,在处理几何形状简单的动物形象(比如下图的鸟)时,InstantMesh水平仍旧在线,对于图片整体十分还原,唯一的不足出现在抠图上,导致模型腿部缺失,为3D建模拖了后腿。

而面对更加复杂的动物图像,InstantMesh虽然尽力还原除了模型的大概,但也出现了脸部细节缺失、背部材质缺失等不足。

甚至,在面对连人类都会疑惑的“奇怪动物”时,InstantMesh同样也无从下手,当然,这一点无法苛责InstantMesh,毕竟目前的AI还无法向人类这样理解世界,至少在图片视角上,InstantMesh已经做到了还原,也算是合格了。

在论文中,InstantMesh不仅展示了自身的能力,还与TripoSR、LGM等类似的生成模型作了效果对比,称“TripoSR结果令人满意但缺乏想象力”“LGM等具有想象力但明显多视图不一致”。

那么,在同样的输入下,TripoSR和LGM的实际表现如何?

可以看到,TripoSR生成模型的质量在细节把控上优于InstantMesh,但相比之下,TripoSR对于体积感的把握并没有能够胜过InstantMesh,生成的企鹅形象未能像图片展示的一样饱满,从侧面看仿佛被砍了一刀。

而LGM生成的模型完美呈现了图片中没有展示的部分,且模型材质、形态控制出色,不足之处在于模型出现了轻微的重影,且在尾巴、后腿部分出现了不必要的模型粘连增生。

但同时,受制于输出过程中的分辨率控制,InstantMesh输出的图像在清晰度上明显遇到了瓶颈,虽然研发团队有意在未来的工作中解决这一限制,但即使解决了清晰度问题,由于客观存在的多视图不一致、细节建模问题,InstantMesh的建模效果离商用也还存在着一定差距。

至少目前来看,InstantMesh的应用场景更多可能还是在游戏3D资产等对建模精细度要求不高的领域上。当然,作为新一代的家具建模神器,在电商领域未来或许也能有InstantMesh的一席之地。

从百思买已经公布的电商购物应用《BestBuyEnvision》来看,用户在购买之前就可以在VisionPro界面中浏览产品的3D模型外观,这意味着一款拥有数以万计商品的购物软件的背后有着同样数量级的3D资产需求,而电商产品的迭代速度之快又要求企业能以速度更快、成本更低的方式完成商品建模,这使得以InstantMesh为代表的AI建模未来有机会成为电商人的标配工具。

3D生成的终点不是场景建模

3D生成技术在数字人领域的应用前景更多体现在超写实3D数字人建模上。

根据上海交通大学人工智能研究所的一篇论文显示,AI主要通过数据驱动的方式学习真实的数据分布、对数据分布进行采样以生成新的样本表示,并对数据表示进行渲染从而打造出高度真实的三维数字人。

而在3D数字人模型的表示方式上,常见的表示方式可以分为显式表示和隐式表示两种形式。其中,显式表示一般直接给出满足条件的所有元素的集合,如点云包含三维空间中点的位置,多边形网格则包含顶点位置及其连接关系等信息。

这一方法通常被应用在游戏、影视制作等工业应用中,优点在于传统的渲染管线已经能对其进行高效处理,但缺点在于生成模型的精细程度会受到分辨率限制,在对数字人高拟真外表的要求下,模型细节的增加会造成模型复杂度的上升。

在分辨率的硬性要求下,隐式表示就要好用得多。仅仅需要符号距离函数、水平集等三维空间约束,隐式表示就能够使数字人模型突破空间分辨率的限制,此外,使用深度符号距离函数、神经辐射场等神经网络逼近隐式函数还能恢复出数字人的精细几何与纹理,相比显式表示更加灵活。

国内团队推出的文本指导的渐进式3D生成框架DreamFace就结合了视觉-语言模型、隐式扩散模型和基于物理的材质扩散技术,可以生成符合计算机图形制作标准的3D数字人形象。

DreamFace不仅支持基于文本提示的发型和颜色生成,生成的模型还具备动画能力,能够提供更细致的表情细节,并且能够精细地捕捉表演。

而在国外,更有以谷歌DreamHuman为代表的的文字生成带动画3D数字角色技术。

DreamHuman将大型文本到图像合成模型、神经辐射场和统计人体模型连接到新的建模和优化框架中,使得生成具有高质量纹理和特定要求的动态3D人体模型成为可能。

经过完整的生成式三维数字人建模流程之后,生成模型将学习到数字人的先验信息,针对模型进行相应微调即可应用到下游任务。

特别是在数字人重建应用中,生成式数字人模型为重建任务提供了有效的先验约束,不仅有助于生成合理的重建结果,也减少了对于训练标签的要求,降低了重建成本。只需要从图像或视频中恢复人体和人脸的三维几何形状以及对应的外观信息,就可以实现真人与虚拟数字人一对一的数字化映射。

代表应用既有从单张图片重建出目标人3D化身,并合成支持大姿态驱动的真实说话人视频的“单图3D说话人视频合成技术(One-shot3DTalkingFaceGeneration)”,也有无需复杂采样和建模,只要一段几秒钟视频就能实现人物动作流畅的3D数字人合成工具“HUGS”(HumanGaussianSplats)。

其中,HUGS由苹果推出,是一种基于高斯函数的生成式AI技术,可以通过3DGaussianSplatting(3DGS)和SMPL身体模型的融合创造出更加生动和真实的数字人物。

苹果对于数字人的研究并非一时兴起,而是有实际服务于产品的先例。在VisionPro上,用户就可以通过前置摄像头扫描面部信息,并基于机器学习技术和编码神经网络生成数字分身。当用户使用FaceTime通话时,数字分身还可以模仿用户的面部表情及手部动作。

可以预见,HUGS等技术的加入将使数字人形象无论是在二维平面屏幕还是三维元宇宙空间中都能演绎出生动逼真的表演。在AI的加持下,无论是智能助手、虚拟现实游戏,还是视频会议等多元场景,未来都将被“身手矫健”的虚拟人占据,为用户带来与现实无异的沉浸式互动体验。

而这也是InstantMesh们未来可以选择的方向。

我们有理由期待AI生成技术将以更快的步伐不断迭代,带来愈发惊艳的视觉享受与生活便利。虚拟现实的好日子还在后头。

THE END
1.从没学过建筑设计的我,使用AI绘画SD在线版5分钟就生成的效果图炸裂!大家好,我是程序员晓晓,下面我要介绍我这段时间学习的成果,使用AI绘画工具Stable Diffusion在线版做建筑设计,将建筑线稿生成实际效果图。老刘从来没学过建筑设计,但是生成的效果炸裂,让我感觉我已经是一位设计大师了,相当有成就感,先放几张效果图看看。 https://blog.csdn.net/cxyxx12/article/details/136389151
2.ai建筑效果图如何自动生成?建E网设计资讯AI建筑效果图自动生成是通过使用先进的人工智能技术和算法,将建筑设计的理念和要求转化为视觉上的呈现。这种技术结合了计算机图形学、机器学习和深度学习等领域的成果,可以快速地生成高质量的建筑效果图。 要实现AI建筑效果图自动生成,首先需要收集大量的建筑数据和图像,这些数据和图像将作为训练模型的素材。然后,利用深度https://www.justeasy.cn/news/16266.html
3.实测AI建筑设计软件的自动生成效果图能力人工智能经过实测,发现建筑设计效果图软件使用AI自动生成效果图的质量非常高!这大大提高了建筑设计师的工作效率! 该句话可以重写为:本句仅用于展示触站AI软件的生成效果,版权和解释权归触站AI所有 素描模式: ai软件的出现在建筑设计领域产生了巨大的影响,它们能够迅速生成建筑设计效果图从而提高设计效率。同时,它们也能够帮助https://www.php.cn/faq/588331.html
4.即创AI平台效果图AI一键生成生成AI图片(设计师学习AI)AI可以帮助建筑师和设计师快速生成建筑效果图,提供更直观、真实的设计展示。 AI自动生成技术具有高效、精准、创意丰富等优势,能够大大提高效果图的生成速度和质量。 AI技术的快速发展:随着人工智能技术的不断进步,AI在各个领域的应用也越来越广泛。 效果图AI自动生成神器的背景和意义:效果图AI自动生成神器作为一种智能https://www.zuodaoyun.com/news/show-6124.html
5.云图AI云图AI是一个专门为室内外建筑设计师服务的AI智能绘图工具,致力于打造空间设计师专业级的AIGC设计平台。用户可以通过选择一张轮廓图和一张灵感图,轻松打破设计限制,最大化发挥创造力。此外,云图AI还提供了独立开发的SketchUp插件,使得用户在建模的同时也能快速生成高质https://pidoutv.com/sites/18595.html
6.豆绘ai更可以继续按需调整风格、材质和光线设置,AI将实时呈现新的效果图。Step 7: 优化和导出检查生成的效果图,选择最终满意的效果图,保存为高分辨率图像文件(有2k和4K可选)。通过学习使用SU+AI工具,你可以大大缩短效果图制作的时间,提高工作效率和质量,同时减少成本支出。这种技能的掌握将使你在室内设计和建筑设计https://openi.cn/sites/109676.html
7.AI景观设计线稿平面图自动生成园林设计AI景观设计线稿平面图可以自动生成园林设计图了,AI已经成为内容创作者的灵感来源和效率工具,而在景观设计行业,我们也看到AI助力下,在设计稿的生成中,提升了数倍效率,正是如此,也迎来了更多企业的关注,想融入自己公司的项目场景之中。 神采PromeAI在不断更新和变化中,这一次的更新我们将更靠近商业化应用,用AI参与景https://828ai.com/articles/9.html
8.广联达FalconVAI出图,让建筑设计更轻松!在FalconV渲染器的右侧工具栏可以看到带有AI字样的【视点管理AI版】图标样式,点击此图标便可进入AI出图界面。 在右下角的描述框中输入您想要的效果图的关键词,以便让AI为您呈现心目中理想的效果。请务必包括建筑设计类型,例如住宅、办公楼等,后续您可以加上您所需要的一些风格类的关键词。 https://www.fwxgx.com/articles/237625
9.AI自动生成室内效果图AI人工智能软件工具侠的技术博客效果图类型:客厅 ?描述词 & ?模型选择 AI室内设计软件的使用非常简单,只需输入描述词和模型选择写实,就可以轻松地生成高品质的定制化室内设计效果图。比如,当你输入“现代简约”、“卧室”这些关键词时,软件会自动根据你的输入选择相应的模型元素进行拼配,生成最好的效果。 https://blog.51cto.com/u_16103508/6465116
10.建筑学长——千万建筑师的资源库和AI绘图创作平台建筑学长官网,为青年设计师建立的线上资源共享及AI绘图创作渲染平台,免费提供海量设计案例、CAD图纸、SU模型、PS素材、软件插件下载,提供丰富的设计软件教学与灵感参考素材图库。http://jianzhuxuezhang.com/
11.重磅:蝴蝶小花园升级AI设计功能,30秒自动生成庭院花园高清效果图近日,“蝴蝶小花园云设计软件”宣布重大更新,最新推出AI设计功能。这意味着用户只需30秒,即可获得AI自动生成的高清庭院花园效果图,大大简化了以往繁琐的设计过程。 蝴蝶小花园作为“庭院花园行业数字化引领者”,一直致力于为用户提供更便捷、更高效的设计工具。此次升级,不仅提升了软件的智能化程度,也进一步增强了用户体https://i.ifeng.com/c/8Y3LkNXdIsx
12.ai如何生成数据可视化效果图帆软数字化转型知识库AI生成数据可视化效果图的方法主要包括:利用深度学习模型生成、使用自动化数据可视化工具、结合自然语言处理技术。其中,自动化数据可视化工具是一种常用且有效的方法,这类工具能够通过用户输入的数据自动生成多种类型的图表,并提供交互功能,提升数据分析效率。以帆软旗下的FineBI、FineReport和FineVis为例,这些工具不仅支持https://www.fanruan.com/blog/article/211354/
13.模袋云ai设计工具官网,免费不限量创作各类建筑效果图?>1.免费ai视频生成+写作(可联网)?>2.超强免费ai视频神器3.免费ai写作绘画 模袋云ai设计工具官网,免费不限量创作各类建筑效果图 什么是模袋云ai? 模袋云ai是模袋云旗下建筑AI设计工具,免费不限量创作各类建筑效果图,帮助建筑币提升效率,使用AI大卷王功能,可一次创作100张图 https://feizhuke.com/sites/modaiyun-ai.html
14.南樛工具箱官网AI自动建模自动绘制效果图3DMax辅助插件一键3D建模+两秒渲染出图 南樛工具箱满足你在Max作图渲染上各种需求,无论是复杂建模、还是批量渲染、还是快速一键绘图,都可以拥有你从未有过的流畅感,快速完成工作。 AI一键3D建模+AI自动渲染出图 CAD导入max一键3d建模,配合AI一键生成效果图 Max工具+CAD工具双能力 https://www.maliang.com/app/max/
15.神采AIAI万花筒连接AI新世界拯救设计师的AI神器,神采AI一键渲染效果图,告别繁琐免费高效 无需下载,在线网页打开直接使用,全站中文,小白都能上手! 神采PromeAI拥有强大的人工智能驱动设计助手和广泛可控的AIGC(C-AIGC)模型风格库,使你能够轻松地创造出令人惊叹的图形、视频和动画。无论你是经验丰富的设计师还是初学者,PromeAI都有你需要的一切https://www.aiwht.com/sites/495.html
16.设计日常之AI设计研究笔记(一)stablediffusion的建筑设计研究B站:AI建筑师 标题:【Stable Diffusion】建筑效果图手把手教学;【Stable Diffusion】ControlNET知多少?等 SD资源 B站:AI建筑研究室-帆哥 标题:精选AI模型大放送!让你也能快速生成精美效果-dreambooth+lora模型共享 AI辅助设计-SD模型共享文档 https://docs.qq.com/sheet/DRXF5cXNlVUpKUnVL https://www.hxsd.com/information/9187/
17.找到6个近期爆火的AI图像生成工具,附使用教程!5种风格样式:AI自动生成绘画软件Pixso AI支持人物拟真、二次元、风景写实、产品设计、建筑设计等5种模型选择,满足不同的产品设计场景。 6大通用尺寸:Pixso AI支持正方形、横屏、竖屏等6种通用尺寸,最高8张照片同时生成,支持描述生图、以图生图等,覆盖设计师绝大部分传作场景。 https://pixso.cn/designskills/ai-image-generation-tool/
18.能理解能设计!建筑行业AI大模型未来可期刘刚认为,建筑行业大模型的核心能力体现在理解、生成、推理、记忆等方面。如,它可以理解建筑文字与图纸,生成建筑设计三维模型与效果图,依据行业知识进行决策推理,上下文关联专业知识问答。 在他看来,数字化转型的本质是通过数字化技术优化资源配置效率,提高企业核心竞争力。从系统论的角度看数字化转型和建筑行业AI应用的https://www.elecfans.com/d/2386671.html
19.解锁你的想象!3个月,用AI实现高品质建筑!三个月,让AI全流程介入到实际的商业项目当中去创造价值。从概念直到落地,我们跑通了! 这两张“法式”建筑效果图 猜猜哪张是A.I.生成的? 现代主义与法式风格的混合 答案在文末揭晓! 01 写在新时代的前夜 如果你分辨不出来,那么AI对于你而言就是有颠覆性意义的,因为决定你能不能获得设计权的是设计方案图,而http://js.lubanol.cn/nd.jsp?id=8020