打开AI生成视频的盲盒——专访AI创作先锋卡兹克中国科普作家网

中国科幻研究中心张子瑞2023-12-2919:49

导语

AIGC(人工智能生成内容)的创作风潮正在全球范围内蔓延,为广大创作者实现科幻想象提供了新的动力。为了深入探讨AIGC在科幻创作领域的影响,笔者进行了一系列精彩的访谈。本期特邀的受访嘉宾是卡兹克。

AI创作的奇幻漂流

Q:为何取名“数字生命卡兹克”,有什么寓意吗?您是从什么时候开始应用AI进行创作的?

2022年12月,随着ChatGPT和AI绘图的兴起,我发现这些工具极大地契合了我的需求,特别是对于像我这样追求效率的“懒人”来说。我将探索这些新工具的过程视作一种游戏,不断寻找新的技巧来提高效率,就像玩游戏一样。我沉迷于探索各种模态和工具,正是这种游戏化的心态,让我在AIGC应用和创新的道路上越走越远。

图2:郭帆导演与卡兹克的合照

在2023年8至9月期间,我也跟其他的一些影视从业者进行了一些交流,可以感觉到大家都带着一种焦虑的心态,似乎还未完全确定AI技术能在多大程度上帮助影视行业降低成本、提高效率,甚至是否有可能彻底颠覆整个行业。AI技术究竟是仅仅作为辅助工具,还是能成为改变行业游戏规则的关键因素,那时候大家都还在探索中。

在最近两个月(2023年11月至12月),我发现大家的焦虑似乎减轻了很多。很多影视从业者开始将AI视为一项实用的工具,一个可以被整合进影视制作流程,用以提高效率和降低成本的工具。举个例子,影视行业可以先利用AI软件进行初步剪辑,然后在此基础上进行更精细的编辑。以后Al技术可能会有非常多类似的优化,以此促进创作效率的提升。

图3:名人再现系列作品

至于题材选择,我倾向于避免写实或实拍类型,如爱情片或纪录片。因为在这些领域,AI的作用可能不如实际拍摄。而对于特效密集型的电影,例如科幻电影的几乎所有场景都需要进行概念设计,所以这类电影的制作流程更像大型流水线作业,里面有非常多的工序。在这种情况下,AI可以在某些环节提供降本增效的优势,例如在分镜、色彩调整或概念设计方面提供辅助。在动态预演方面,我也可以利用AI快速制作几个镜头调度,以探索成本效益。

Q:在您的AI创作过程中,遇到哪些共性问题?

比如我使用pika1.0(AI视频生成工具)做了一个特别的镜头,场景是一个小女孩在烟花下祈福。我需要的是一种运镜效果,镜头从低处缓缓上升,捕捉到烟花在空中绽放的瞬间。为了达到这一效果,我制作了超过100段短视频,最终勉强完成了一个持续11秒的可用镜头。pika每次只能生成4秒钟,生成好第一段4秒后,得继续再加4秒,每次加时,制作难度都在增加,呈指数级增长。尽管如此,经过半小时多的不懈努力,我最终还是生成出了这个镜头。但如果要自己从头开始制作这样的镜头,难度是相当大的。

图4-1:话题谈到的镜头

图4-2:失败镜头

前沿AI技术体验

Q:你现在有没有碰到过新技术解决老问题的情况?现在在创作过程中最常用的工具有哪些?这其中有哪些AI应用固化下来?

在探索AI视频领域时,我发现新技术能够有效解决许多长期存在的问题。回想起我最初制作视频时,控制物体运动和构图是一个挑战。比如,在编辑过程中,我可以在某种程度上控制构图,但有时候视频中的某些动态效果可能并不符合我的预期。我有时想要修改这些动态,或添加更有趣的元素,但这在传统工具中很难实现。然而,pika推出的一款名为“视频扩展”的工具彻底改变了这一局面。现在,我可以调整视频的比例,缩小原有画面或将其移至右侧来进行扩展。这大大增强了我在构图上的控制力。此外,pika的区域修改功能允许我对视频中的不理想动态进行调整,解决了我之前无法解决的问题。现在,我至少有了更多的选择来改进作品。总的来说,这些新技术为我解决了过去的许多痛点。

常用工具方面,说实话,尽管市面上出现了许多新工具,但在我看来,真正的“大哥”还是那几个,它们的迭代速度更快。从2023年8月份至今,我的工作流程基本没有太大变化——在AI绘图方面,我依然使用Midjourney和StableDiffusion(AI绘画工具),但最近加入了DALL·E3(OpenAI出品的绘图工具),因为它在语义理解方面实在是太出色了,我有时会用它做一些底图。至于声音处理,我使用SVC和elevenlabs的TTS(均为AI语音合成工具),这两个工具已经成为我的标准配置。偶尔我也会尝试使用国内的“出门问问”中的“魔音工坊”。在照片驱动的AI工具方面,我主要使用“奇妙元”。创作AI视频时主要使用PIKA和runway。还是这些工具,但他们自己迭代速度会更快。

图5:上述工具组图

Q:近期“文字生成视频”非常火热,请谈谈对这个技术的理解。与此前“文字生成图片”等技术相比,有何发展?目前这项技术的局限和发展出路又在何方?还有哪些可能的技术路径吗?

实际上,“文字生成视频”和“文字生成图片”在本质上并没有太大区别。如果大家体验过runway就会发现,“文字生成图片”实际上是“文字生成视频”制作过程中的一个阶段,它的流程是这样的:首先生成四张图像,然后基于选定的图像,再去生成视频。我通常会先用一段文字来生成这个四秒视频的第一帧,然后以这一帧为起点,向后推进,预测每一秒视频的画面,但可控性很差。

视频生成的发展路径,按照目前所采用的扩散技术很难解决。现在我注意到有两条路:

第一条路,利用物理引擎来辅助。runway最近发布了一项公告,他们计划招募人员来开发一个“世界模型”。这个模型旨在解决现有技术的局限性,因为目前的技术主要是从第一帧向后扩散,而没有考虑背后的物理规律。例如,一个水杯从空中掉落到地上时会破碎,但现有的技术并不了解这些物理规律,包括光影变化等。所以他们实际上缺少一个物理引擎或者是“世界模型”来告诉他们这些规律。我知道斯坦福有一个团队也在研究这个问题,但是他们已经研究了快一年,实际上还没有什么成果。这是一条可能的道路,如果能够解决这个问题,效果可能会非常好。

图6:runway公告(图片来自runway官网)

图7商汤科技Story-to-Motion模型论文

图8-2AI3D测评内容

AI赋能个人成长

Q:除了AI艺术创作,还用AI做过哪些有趣的尝试?

实际上,在我看来,AI目前在很多领域的实际应用并不多。它主要被用于内容创作和商业产品开发方面。在其他领域,使用AI的机会相对较少,因为它的现有机制限制了它的应用范围,使其无法融入广泛的娱乐行业或用于更有趣的活动。

图9:用ChatGPT写高考作文

Q:作为与AI协同的资深玩家,您认为人类创作的优势在哪里?

我始终认为人类在创意方面具有独特的优势。这种创意源于人类独特的思维方式和讲故事的能力,这些能力从智人时代延续至今,一直是维系社会的关键。我们通常称之为创意。虽然之前我也曾赞扬AI的创意能力,认为它在某些方面超越了人类的边界,但经过长期使用和观察,我的观点有所变化。例如,AI能够编写出“今晚我吃了一个桌子和一个凳子”这样超乎寻常的句子。但这真的算是创意吗?它更像是一种偏离人类常识的表达。虽然AI在医药领域,如帮助开发靶向药物等方面表现出色,但在文学创作上,它真的能超越人类吗?我现在认为并非如此。AI可以用来写剧本、绘图、制作视频,但在创意方面仍有局限。即便我用AI写了许多剧本和标题,它们的创意逻辑似乎都相当简单,只是基于现有数据集的排列组合。

当模型参数变得更大,或者像OpenAI这样的公司放松道德和场景的束缚时,情况可能会有所改变。很多公司现在为了解决幻觉问题,对AI模型进行了严格的对齐,限制它只能表达知识库中已有的内容。但人类的创意往往源于胡编乱造。如果有公司能够在底层算法上取得突破,同时放宽对AI的限制,那么AGI(通用人工智能)时代的到来就不再是遥不可及的梦想了。

图10:AI生成创意图片“今晚我吃了一个桌子和凳子”(DALL·E3生成)

受访者简介

卡兹克

卡兹克,原名张仁杰。互联网基金行业设计总监、AI业务总监,ChatFund负责人。公众号“数字生命卡兹克”主理人,与AI共创的《流浪地球3》“预告片”获全网千万播放量。

THE END
1.名字随机生成器——让你快速取名在生活中,取名是一项非常重要的任务,名字的好坏将会对你的生活产生很大的影响。但是取好名字并不是一件容易的事情,有的人会花费很长时间才能想出一个满意的名字。为了解决这一问题,今天我们就来介绍一种名字生成器——名字随机生成器。 名字随机生成器是一款非常实用的工具,可以帮助你快速生成适合你的名字。该工具https://www.bamuwu.com/details/2064
2.男子用AI起名字,网友:在诗词里随便找俩字都比这强!男子用AI起名字,网友:在诗词里随便找俩字都比这强!资讯要览 河南 0 打开网易新闻 体验效果更佳不丹归还中国1500平方公里土地,为何印度上蹿下跳 伊历史 321跟贴 打开APP 丈夫想压榨媳妇工资,媳妇一招让丈夫悔不当初,结局真是太解气了 菜菜感情动画 25跟贴 打开APP 上一秒有多嚣张,下一秒就死的多惨 冬咚https://m.163.com/v/video/VRI7KOQCN.html
3.AI公司名称生成器AI在线生成企业名称 网站服务:办公提效,AI公司名称生成器,在线AI起名,公司起名生成器,注册公司取名,免费公司名字生成器,人工智能公司起名网,AI工具集,办公提效,AI公司名称生成器。 AI公司名称生成器简介 NameGPT是一个专业的AI在线起名平台,免费使用人工智能公司起名生成器为注册公司、初创企业、工作室、店铺产品生成独https://openi.cn/sites/284067.html
4.RandomX.AI:智能中文名字生成器RandomX.AI简介 RandomX.ai是一个免费的人工智能驱动的中文名字生成器,专为创建真实的中文名字而设计。https://randomx.ai/将语言专业知识与创意天赋相结合,用户可以根据性别、名字风格和灵感来源进行定制,确保生成的名字符合个人需求。 RandomX.ai利用AI技术根据传统命名惯例生成真实的中文名字。用户可以选择受到中国古典https://www.yjpoo.com/site/4212.html
5.RandomXAIRandomX AI 是一个专注于生成真实中文名字的人工智能工具。它结合了语言专业知识和创意天赋,为用户提供快速生成具有文化意义和故事背景的中文名字的服务。用户可以根据性别、名字 RandomX AI简介: RandomX AI 是一个专注于生成真实中文名字的人工智能工具。它结合了语言专业知识和创意天赋,为用户提供快速生成具有文化https://pidoutv.com/sites/25488.html
6.哪些ai取名网站免费?盘点4大好用的ai取名字自动生成器AI写作宝是一款集成了人工智能技术的写作辅助工具,内嵌的海量不同类型的ai工具里就涵盖了【AI取名神器】这一功能,方便我们给小说人物、爱宠或是新生儿命名~ ?推荐理由: ?AI写作宝能够在短时间内生成多个风格迥异的名字,提供多个取名选择供我们挑选。 https://blog.csdn.net/xixixihahaha_/article/details/141425927
7.AI写诗在线自动写诗软件藏头诗生成器请输入主题或关键词 五言绝句 五言律诗 七言绝句 七言律诗 字体设置 字号 字体颜色 背景设置 开始创作 在线写诗、创作藏头诗 在线快速生成 输入关键词后在线快速一键智能生成古诗 诗句连贯通畅 AI生成的诗句前后连贯通畅,上口容易记 诗体多样化 藏头诗,五言绝句律诗,七言绝句律诗多种诗体任意选 https://www.gaituya.com/aixieshi/
8.AI写诗诗歌生成器自动写诗软件AI写诗在线平台,支持AI人工智能写诗、藏头诗一键自动创作 请输入主题或关键词 AI写诗 藏头诗 五言绝句 五言律诗 七言绝句 七言律诗 字体设置 署名 (选填) 赠予人 (选填) AI写诗的功能特点 一键自动生成 输入主题或关键词,AI在线一键智能快速生成诗句 诗歌体裁多样化https://ai.chiyingapp.com/aixieshi/
9.什么是生成式AI?它是如何工作的?Oracle中国生成式人工智能 (AI) 是一种相对较新的 AI 形式。不同于之前的技术,生成式 AI 可以根据训练数据进行推断并生成新的内容。自 2022 年秋季首款生成式 AI 消费者聊天机器人公开发布以来,这项技术产出拟人化的写作、图像、音频和视频的能力吸引了全世界的关注。根据麦肯锡 2023 年 6 月发布的报告,生成式 AI 将https://www.oracle.com/cn/artificial-intelligence/generative-ai/what-is-generative-ai/
10.手把手教你如何用AIGC创作小说:稿费50对于AIGC来说,一对一的问答就是他当前的完成节点。针对提问,AIGC会通过大数据模型,会通过神经网络分析,给出AIGC觉得更符合问题的答案,但这个问题不一定更符合我们的需求,所以我们就需要进行再次生成。 当我们想要真正释放AIGC生成式人工文本生成智能应用的全部能力,使其能解答复杂问题或者构建应用的时候,就需要了解提https://maimai.cn/article/detail?fid=1824155873&efid=Zgq_aw3RgAInikz72ATlVg
11.读书5000天后的世界·AI扩展人类无限的可能性再来看看身边非常常见的AI用法。2023年了,我们早就已经实现AIGC(AI Generated Content,人工智能生成内容),就是你对AI说一句话,它就可以生成一张图片、一段视频,甚至生成一段游戏。 AIGC现在已经是屡见不鲜了,而新的玩法每天都还在增加。比如说,AI孙燕姿最近大火,AI模拟孙燕姿的唱腔模拟得惟妙惟肖,网友评论说孙燕https://www.jianshu.com/p/4ec8b7c3bb1a
12.对话国内AI生成图片著作权第一案原告:从此AI生成物都有著作权了吗?利用AI生成图片,是否体现作者个性化表达,需要个案判断,不能一概而论。 人工智能(AI)生成巨量图片,并主张了著作权,你随手拍的照和涂鸦都有可能被定性为抄袭、侵权了AI,为此你要支付一笔版权费用。 这仅是一些反对AI绘画的人,忌惮AI生成图片软件的能力和著作权萌发出对AI图片垄断最极端的想象。 https://www.jfdaily.com/wx/detail.do?id=695392
13.AIbaseAIbase拥有一个全面的国内外AI产品数据库,收录了超过7000个出色的人工智能网站和产品,覆盖了40多个不同的领域,如Ai绘画生成、Ai文案写作、Ai视频编辑、Ai智能营销等。您可以通过我们的AI产品库轻松发现最适合您需求的人工智能工具,解锁AI的力量。https://top.aibase.com/
14.生成式AI内容建议事项:为描绘真实财产的生成式 AI 资产上传财产形象授权。深入了解财产形象授权。 禁止事项:提交采用借鉴真实人物、地点或财产的提示而创建的作品,除非您拥有合法权限(例如,拥有肖像权授权或财产形象授权)。 例如,请勿在提示中提及其他艺术家、名人或著名人物的名字以及品牌名称。 https://helpx.adobe.com/cn/stock/contributor/help/generative-ai-content.html
15.Namelix官网,ai公司起名工具,在线logo设计神器,生成器别摸鱼导航领先的AI全自动品牌LOGO在线生成器! 在当今数字化时代,品牌设计和LOGO设计对于企业的成功至关重要。而Namelix是brandmark旗下的一个ai公司起名工具,作为一款人工智能网站,为品牌设计者提供了一个强大而高效的工具。Namelix是一款致力于生成简短品牌商业名称和文字LOGO的AI免费工具。通过最先进的语言模型,Namelix能够即时生成https://biemoyu.com/sites/namelix.html
16.深度解读!Sora将如何引领AIGC趋势变革,附40款各行业常用AI工具事不宜迟,下面就和笔者一起探索不同类型的AI人工智能工具,并且不要忘记写下你想尝试的工具! *各行各业必备的40款AI工具合集 01 AI写作工具和文本生成器 ① boardmix AI boardmix AI,是一款集合了多项AI能力的一站式AI工具,用户基于内置的AI功能,可以生成各式各样的内容,包括但不限于——https://www.jiemian.com/article/10824432.html
17.10款优秀的AI生成logo软件,简单易上手2.1 Pixso AI Pixso AI是在线矢量编辑工具Pixso的内置AI助手,基于人工智能AI,帮助用户完成创意探索。Pixso AI目前具备文生图、图标生成、AI翻译、灵感专家、设计规范生成、设计元素检查清单6大功。其中AI生成图标风格多样,可在线生成扁平、2.5D毛玻璃、3D、拟物、游戏、logo,满足多元化需求。Pixso AI每日赠送20个AI点数https://pixso.cn/designskills/10-ai-logo-generation-softwares/
18.简单又好用的ppt生成器,ai在线生成!2.4 AI助手辅助 为了帮助用户更智能地制作PPT,boardmix提供了【AI助手】辅助功能。我们可以将标题提供给AI,让其帮助我们生成PPT大纲;再根据小标题,生成PPT内容。除此之外,AI提供自动配色和字体排版,无需设计功底,这些都大大节省了用户查找内容和设计排版的时间。 https://boardmix.cn/article/ai-ppt-generator/
19.免费好用的5款AI人工智能工具推荐,效率提升10倍!思途文成生成式人工智能的热潮可能始于 ChatGPT 的问世,但现在这技术已经被广泛应用到各种生产力工具中,让我们的日常工作变得更轻松。 一提到工作场所使用人工智能,许多人可能会担心这技术会取代他们的工作。但实际上,这些AI工具并不是用来取代我们的工作,而是用来提升我们的工作效率的。 https://www.shangyexinzhi.com/article/19156545.html