打开AI生成视频的盲盒——专访AI创作先锋卡兹克中国科普作家网

中国科幻研究中心张子瑞2023-12-2919:49

导语

AIGC(人工智能生成内容)的创作风潮正在全球范围内蔓延,为广大创作者实现科幻想象提供了新的动力。为了深入探讨AIGC在科幻创作领域的影响,笔者进行了一系列精彩的访谈。本期特邀的受访嘉宾是卡兹克。

AI创作的奇幻漂流

Q:为何取名“数字生命卡兹克”,有什么寓意吗?您是从什么时候开始应用AI进行创作的?

2022年12月,随着ChatGPT和AI绘图的兴起,我发现这些工具极大地契合了我的需求,特别是对于像我这样追求效率的“懒人”来说。我将探索这些新工具的过程视作一种游戏,不断寻找新的技巧来提高效率,就像玩游戏一样。我沉迷于探索各种模态和工具,正是这种游戏化的心态,让我在AIGC应用和创新的道路上越走越远。

图2:郭帆导演与卡兹克的合照

在2023年8至9月期间,我也跟其他的一些影视从业者进行了一些交流,可以感觉到大家都带着一种焦虑的心态,似乎还未完全确定AI技术能在多大程度上帮助影视行业降低成本、提高效率,甚至是否有可能彻底颠覆整个行业。AI技术究竟是仅仅作为辅助工具,还是能成为改变行业游戏规则的关键因素,那时候大家都还在探索中。

在最近两个月(2023年11月至12月),我发现大家的焦虑似乎减轻了很多。很多影视从业者开始将AI视为一项实用的工具,一个可以被整合进影视制作流程,用以提高效率和降低成本的工具。举个例子,影视行业可以先利用AI软件进行初步剪辑,然后在此基础上进行更精细的编辑。以后Al技术可能会有非常多类似的优化,以此促进创作效率的提升。

图3:名人再现系列作品

至于题材选择,我倾向于避免写实或实拍类型,如爱情片或纪录片。因为在这些领域,AI的作用可能不如实际拍摄。而对于特效密集型的电影,例如科幻电影的几乎所有场景都需要进行概念设计,所以这类电影的制作流程更像大型流水线作业,里面有非常多的工序。在这种情况下,AI可以在某些环节提供降本增效的优势,例如在分镜、色彩调整或概念设计方面提供辅助。在动态预演方面,我也可以利用AI快速制作几个镜头调度,以探索成本效益。

Q:在您的AI创作过程中,遇到哪些共性问题?

比如我使用pika1.0(AI视频生成工具)做了一个特别的镜头,场景是一个小女孩在烟花下祈福。我需要的是一种运镜效果,镜头从低处缓缓上升,捕捉到烟花在空中绽放的瞬间。为了达到这一效果,我制作了超过100段短视频,最终勉强完成了一个持续11秒的可用镜头。pika每次只能生成4秒钟,生成好第一段4秒后,得继续再加4秒,每次加时,制作难度都在增加,呈指数级增长。尽管如此,经过半小时多的不懈努力,我最终还是生成出了这个镜头。但如果要自己从头开始制作这样的镜头,难度是相当大的。

图4-1:话题谈到的镜头

图4-2:失败镜头

前沿AI技术体验

Q:你现在有没有碰到过新技术解决老问题的情况?现在在创作过程中最常用的工具有哪些?这其中有哪些AI应用固化下来?

在探索AI视频领域时,我发现新技术能够有效解决许多长期存在的问题。回想起我最初制作视频时,控制物体运动和构图是一个挑战。比如,在编辑过程中,我可以在某种程度上控制构图,但有时候视频中的某些动态效果可能并不符合我的预期。我有时想要修改这些动态,或添加更有趣的元素,但这在传统工具中很难实现。然而,pika推出的一款名为“视频扩展”的工具彻底改变了这一局面。现在,我可以调整视频的比例,缩小原有画面或将其移至右侧来进行扩展。这大大增强了我在构图上的控制力。此外,pika的区域修改功能允许我对视频中的不理想动态进行调整,解决了我之前无法解决的问题。现在,我至少有了更多的选择来改进作品。总的来说,这些新技术为我解决了过去的许多痛点。

常用工具方面,说实话,尽管市面上出现了许多新工具,但在我看来,真正的“大哥”还是那几个,它们的迭代速度更快。从2023年8月份至今,我的工作流程基本没有太大变化——在AI绘图方面,我依然使用Midjourney和StableDiffusion(AI绘画工具),但最近加入了DALL·E3(OpenAI出品的绘图工具),因为它在语义理解方面实在是太出色了,我有时会用它做一些底图。至于声音处理,我使用SVC和elevenlabs的TTS(均为AI语音合成工具),这两个工具已经成为我的标准配置。偶尔我也会尝试使用国内的“出门问问”中的“魔音工坊”。在照片驱动的AI工具方面,我主要使用“奇妙元”。创作AI视频时主要使用PIKA和runway。还是这些工具,但他们自己迭代速度会更快。

图5:上述工具组图

Q:近期“文字生成视频”非常火热,请谈谈对这个技术的理解。与此前“文字生成图片”等技术相比,有何发展?目前这项技术的局限和发展出路又在何方?还有哪些可能的技术路径吗?

实际上,“文字生成视频”和“文字生成图片”在本质上并没有太大区别。如果大家体验过runway就会发现,“文字生成图片”实际上是“文字生成视频”制作过程中的一个阶段,它的流程是这样的:首先生成四张图像,然后基于选定的图像,再去生成视频。我通常会先用一段文字来生成这个四秒视频的第一帧,然后以这一帧为起点,向后推进,预测每一秒视频的画面,但可控性很差。

视频生成的发展路径,按照目前所采用的扩散技术很难解决。现在我注意到有两条路:

第一条路,利用物理引擎来辅助。runway最近发布了一项公告,他们计划招募人员来开发一个“世界模型”。这个模型旨在解决现有技术的局限性,因为目前的技术主要是从第一帧向后扩散,而没有考虑背后的物理规律。例如,一个水杯从空中掉落到地上时会破碎,但现有的技术并不了解这些物理规律,包括光影变化等。所以他们实际上缺少一个物理引擎或者是“世界模型”来告诉他们这些规律。我知道斯坦福有一个团队也在研究这个问题,但是他们已经研究了快一年,实际上还没有什么成果。这是一条可能的道路,如果能够解决这个问题,效果可能会非常好。

图6:runway公告(图片来自runway官网)

图7商汤科技Story-to-Motion模型论文

图8-2AI3D测评内容

AI赋能个人成长

Q:除了AI艺术创作,还用AI做过哪些有趣的尝试?

实际上,在我看来,AI目前在很多领域的实际应用并不多。它主要被用于内容创作和商业产品开发方面。在其他领域,使用AI的机会相对较少,因为它的现有机制限制了它的应用范围,使其无法融入广泛的娱乐行业或用于更有趣的活动。

图9:用ChatGPT写高考作文

Q:作为与AI协同的资深玩家,您认为人类创作的优势在哪里?

我始终认为人类在创意方面具有独特的优势。这种创意源于人类独特的思维方式和讲故事的能力,这些能力从智人时代延续至今,一直是维系社会的关键。我们通常称之为创意。虽然之前我也曾赞扬AI的创意能力,认为它在某些方面超越了人类的边界,但经过长期使用和观察,我的观点有所变化。例如,AI能够编写出“今晚我吃了一个桌子和一个凳子”这样超乎寻常的句子。但这真的算是创意吗?它更像是一种偏离人类常识的表达。虽然AI在医药领域,如帮助开发靶向药物等方面表现出色,但在文学创作上,它真的能超越人类吗?我现在认为并非如此。AI可以用来写剧本、绘图、制作视频,但在创意方面仍有局限。即便我用AI写了许多剧本和标题,它们的创意逻辑似乎都相当简单,只是基于现有数据集的排列组合。

当模型参数变得更大,或者像OpenAI这样的公司放松道德和场景的束缚时,情况可能会有所改变。很多公司现在为了解决幻觉问题,对AI模型进行了严格的对齐,限制它只能表达知识库中已有的内容。但人类的创意往往源于胡编乱造。如果有公司能够在底层算法上取得突破,同时放宽对AI的限制,那么AGI(通用人工智能)时代的到来就不再是遥不可及的梦想了。

图10:AI生成创意图片“今晚我吃了一个桌子和凳子”(DALL·E3生成)

受访者简介

卡兹克

卡兹克,原名张仁杰。互联网基金行业设计总监、AI业务总监,ChatFund负责人。公众号“数字生命卡兹克”主理人,与AI共创的《流浪地球3》“预告片”获全网千万播放量。

THE END
1.第一部分:AI视频生成基础ai生成视频原理知乎在探索AI视频生成的旅程中,我们首先需要了解这项技术的基础。AI视频生成,简而言之,是利用人工智能技术自动创建或编辑视频内容的过程。这一过程减少了人工编辑的需求,使视频制作更加高效和个性化。AI视频生成技术的应用范围广泛,从生成简短的社交媒体视频到创建复杂的动画序列,它为视频内容的创作开辟了新的可能性。 https://blog.csdn.net/m0_52537869/article/details/136263600
2.AI生成视频的法律风险随着人工智能(AI)技术的飞速发展,AI生成视频的能力越来越强。从简单的图像编辑到复杂的影片制作,AI已经可以 在很大程度上模仿人类的创造力。然而,这种技术进步也带来了前所未有的侵权风险。 一、版权归谁所有 著作权法保护的作品的原创性,无论视频、图文等都受到法律保护。但AI生成的视频是否属于原创作品,这在法律https://m.thepaper.cn/newsDetail_forward_26841318
3.VeggieAI:在线AI视频生成工具Veggie AI 是一种在线动画视频生成工具,它利用人工智能技术生成可控视频。用户可以输入图像、视频或文本提示,来创建与提供的动作和角色描述完全匹配的短视频。这个工具有几种模式,包括混合模式、动画模式、创意模式和风格化模式,每种模式都允许用户以不同的方式生成视频https://pidoutv.com/sites/20696.html
4.难以置信,全AI生成美女视频,46秒逼真神态骗过所有人一位推特网友于是使用AI来检测视频是不是AI生成的: 他使用了两个不同来源的AI检测软件,结果证明视频就是人工智能生成的。 毕竟,视频中鸟鸣声一直在循环,花草都纹丝不动,这实在太诡异了。 参考资料 https://twitter.com/BenjaminDEKR/status/1772730757695275072https://36kr.com/p/2707411553941382
5.如何通过AI生成视频的网站分享SD分享导航站SD分享导航站Lumen5将强大的人工智能与简单的拖放界面相结合,可帮助用户在几分钟内创建专业的视频内容。 7、Genmo AI 网址:https://alpha.genmo.ai/ Genmo提供具有AI的梦幻视频生成。还可以查看社区生成的视频。 8、Wonder Dynamics 网址:https://www.wonderdynamics.com/ https://home.designshidai.com/5810.html
6.AI生成视频:有点惊艳,有点离谱在创投圈,视频生成类AI正在取代大语言模型,成为近期最热门的赛道。前段时间出圈的Pika,给这团火又添了一把柴。https://chuangke.aliyun.com/info/1070957.html
7.6个绝佳AI短视频生成工具ai大模型计算机视觉人工智能技术随着人工智能技术的飞速发展,AI视频生成工具逐渐成为了视频制作领域的热门话题。这些工具利用先进的深度学习、自然语言处理和计算机视觉技术,大大简化了视频制作过程,能够节省你的时间和精力。 下面给大家介绍六个非常棒的AI视频生成工具,可以助你在制作视频时更轻松、更高效,分别是: https://dy.163.com/article/J6REDL7S0518R7MO.html
8.人人都可以用的免费AI全自动生成视频软件,一键生成视频!现在小编要向大家介绍一个免费好用的工具——万彩AI,它可以一键生成视频,还能生成文章,并有着将照片制作成数字人等功能,让不少领域的人群都能轻松享受到人工智能的便利。 所以,万彩AI是什么样的?下面跟着小编来了解。 传送门:扫描下方二维码或点击链接https://ai.kezhan365.com/inviteCode/shFdDt,即可免费体验万https://www.animiz.cn/blog-7759.html
9.免费的人工智能文本到视频生成器创作者和编辑器Designs.ai Video Maker 是一个由人工智能驱动的视频创建和视频编辑平台,允许用户快速轻松地创建令人惊叹的自定义视频。该平台使用机器学习算法来协助视频创建过程,包括生成自动视频编辑和建议设计元素。它与 Chatgpt 配合使用,可以创建无缝的文本到视频体验。 https://designs.ai/cn/videomaker
10.ai一键生成短视频免费版什么是AI智能生成短视频? AI智能生成短视频,顾名思义,就是借助人工智能技术实现视频制作的自动化。使用者只需输入相关素材或文本,AI便能依据特定算法创建出一段完整的视频。这一过程高速、便捷、且能在很大程度上满足用户的个性化需求。 AI智能在短视频生成中的优势 https://fuwu.11467.com/info/32079506.htm
11.ai生成短片视频ai生成短片高清原创视频下载AIGC-创意 广告片-TVC广告 VPLAY 共 2 位创作人 VPLAY代理/策划/制片人/制作 Yang导演 播放:706 人气:227 时长:03:52 《弦外知音》——人工智能生成动画视频创作 剧情短片-喜剧 AIGC-创意 肖仁余 共 5 位创作人 肖仁余监制 donlinlin策划/摄影师 何定益特效师/创意/后期导演/合成师/动画师 胡不胡桃视https://www.xinpianchang.com/search/1173369
12.2024年10个最佳人工智能视频生成器10个最佳人工智能转录软件和以下是市场上一些最好的人工智能视频生成器: Pictory图片 https://www.unite.ai/zh-CN/%E8%BD%AC%E5%88%B0/%E5%9B%BE%E7%94%BB Pictory是一款AI视频生成器,可让您轻松创建和编辑高质量视频。 该工具最好的方面之一是您不需要任何视频编辑或设计经验。 https://blog.51cto.com/u_12763213/9987769
13.AI视频生成平台AI视频生成平台是一款集成了强大的AI视频生成、剪辑和制作工具的综合平台。通过利用先进的人工智能技术,AIGC视频平台能够帮助用户快速、高效地创建精美的视频内容。无论您是个人用户还是专业视频制作人员,AIGC视频平台都能满足您的需求,让您轻松实现视频创作的梦想。https://www.aigc.cn/favorites/ai-video
14.分享几个免费AI生成工具(第一期)腾讯云开发者社区今天来给大家分享几个国外免费的AI视频生成工具 Artflow ai https://app.artflow.ai Artflow.ai 是一款人工智能工具,旨在帮助用户创建自定义头像并让他们的故事栩栩如生。主要特点和优势包括: 自定义创作:从文本中生成角色、场景和声音,并编写独特的对话 https://cloud.tencent.com/developer/article/2296041
15.elai.io官网,ai视频生成软件工具,数字虚拟人,文字,ppt生成视频在Elai.io 的帮助下,本地化变得前所未有的简单。您将会惊讶于您的视频可以传播多远和广泛。 450+ 声音 亦来提供针对不同类型的内容和受众量身定制的多样化声音。用户可以选择不同的口音和语言,以及各种语气和风格。 根据提示生成视频 输入一个主题,我们的人工智能会生成文本,可以对其进行审查、增强并自动转换为视https://feizhuke.com/sites/elai-io.html
16.最全合集!20个AI视频生成产品推荐&实战教程!优设网本篇通过产品介绍和丰富的案例实践,带你了解 AI 视频有哪些产品,效果如何实现。产品概况若从生成方式分类,AI 视频生成包含:文生视频、图生视频(Runway、Pika labs、SD + Deforum、SD + Infinite zoom、SD + AnimateDiff、Warpfusion、Stabilihttps://www.uisdc.com/aigc-video-2
17.15个免费的AI视频生成工具和软件,视频创作提效神器AI工具集视频,作为最吸引人的媒介之一,已经成为传达信息、讲述故事和创造影响力的强大工具。高质量的视频制作往往需要昂贵的软件和专业的技能。随着人工智能技术的飞速发展,现在有了免费的AI视频生成工具,本文将介绍15个免费的AI视频生成工具,降低了视频制作的门槛,为创意表达打开了新的可能性。帮助用户无需专业知识就能创造出https://ai-bot.cn/ai-video-generation-tools/