打开AI生成视频的盲盒——专访AI创作先锋卡兹克中国科普作家网

中国科幻研究中心张子瑞2023-12-2919:49

导语

AIGC(人工智能生成内容)的创作风潮正在全球范围内蔓延,为广大创作者实现科幻想象提供了新的动力。为了深入探讨AIGC在科幻创作领域的影响,笔者进行了一系列精彩的访谈。本期特邀的受访嘉宾是卡兹克。

AI创作的奇幻漂流

Q:为何取名“数字生命卡兹克”,有什么寓意吗?您是从什么时候开始应用AI进行创作的?

2022年12月,随着ChatGPT和AI绘图的兴起,我发现这些工具极大地契合了我的需求,特别是对于像我这样追求效率的“懒人”来说。我将探索这些新工具的过程视作一种游戏,不断寻找新的技巧来提高效率,就像玩游戏一样。我沉迷于探索各种模态和工具,正是这种游戏化的心态,让我在AIGC应用和创新的道路上越走越远。

图2:郭帆导演与卡兹克的合照

在2023年8至9月期间,我也跟其他的一些影视从业者进行了一些交流,可以感觉到大家都带着一种焦虑的心态,似乎还未完全确定AI技术能在多大程度上帮助影视行业降低成本、提高效率,甚至是否有可能彻底颠覆整个行业。AI技术究竟是仅仅作为辅助工具,还是能成为改变行业游戏规则的关键因素,那时候大家都还在探索中。

在最近两个月(2023年11月至12月),我发现大家的焦虑似乎减轻了很多。很多影视从业者开始将AI视为一项实用的工具,一个可以被整合进影视制作流程,用以提高效率和降低成本的工具。举个例子,影视行业可以先利用AI软件进行初步剪辑,然后在此基础上进行更精细的编辑。以后Al技术可能会有非常多类似的优化,以此促进创作效率的提升。

图3:名人再现系列作品

至于题材选择,我倾向于避免写实或实拍类型,如爱情片或纪录片。因为在这些领域,AI的作用可能不如实际拍摄。而对于特效密集型的电影,例如科幻电影的几乎所有场景都需要进行概念设计,所以这类电影的制作流程更像大型流水线作业,里面有非常多的工序。在这种情况下,AI可以在某些环节提供降本增效的优势,例如在分镜、色彩调整或概念设计方面提供辅助。在动态预演方面,我也可以利用AI快速制作几个镜头调度,以探索成本效益。

Q:在您的AI创作过程中,遇到哪些共性问题?

比如我使用pika1.0(AI视频生成工具)做了一个特别的镜头,场景是一个小女孩在烟花下祈福。我需要的是一种运镜效果,镜头从低处缓缓上升,捕捉到烟花在空中绽放的瞬间。为了达到这一效果,我制作了超过100段短视频,最终勉强完成了一个持续11秒的可用镜头。pika每次只能生成4秒钟,生成好第一段4秒后,得继续再加4秒,每次加时,制作难度都在增加,呈指数级增长。尽管如此,经过半小时多的不懈努力,我最终还是生成出了这个镜头。但如果要自己从头开始制作这样的镜头,难度是相当大的。

图4-1:话题谈到的镜头

图4-2:失败镜头

前沿AI技术体验

Q:你现在有没有碰到过新技术解决老问题的情况?现在在创作过程中最常用的工具有哪些?这其中有哪些AI应用固化下来?

在探索AI视频领域时,我发现新技术能够有效解决许多长期存在的问题。回想起我最初制作视频时,控制物体运动和构图是一个挑战。比如,在编辑过程中,我可以在某种程度上控制构图,但有时候视频中的某些动态效果可能并不符合我的预期。我有时想要修改这些动态,或添加更有趣的元素,但这在传统工具中很难实现。然而,pika推出的一款名为“视频扩展”的工具彻底改变了这一局面。现在,我可以调整视频的比例,缩小原有画面或将其移至右侧来进行扩展。这大大增强了我在构图上的控制力。此外,pika的区域修改功能允许我对视频中的不理想动态进行调整,解决了我之前无法解决的问题。现在,我至少有了更多的选择来改进作品。总的来说,这些新技术为我解决了过去的许多痛点。

常用工具方面,说实话,尽管市面上出现了许多新工具,但在我看来,真正的“大哥”还是那几个,它们的迭代速度更快。从2023年8月份至今,我的工作流程基本没有太大变化——在AI绘图方面,我依然使用Midjourney和StableDiffusion(AI绘画工具),但最近加入了DALL·E3(OpenAI出品的绘图工具),因为它在语义理解方面实在是太出色了,我有时会用它做一些底图。至于声音处理,我使用SVC和elevenlabs的TTS(均为AI语音合成工具),这两个工具已经成为我的标准配置。偶尔我也会尝试使用国内的“出门问问”中的“魔音工坊”。在照片驱动的AI工具方面,我主要使用“奇妙元”。创作AI视频时主要使用PIKA和runway。还是这些工具,但他们自己迭代速度会更快。

图5:上述工具组图

Q:近期“文字生成视频”非常火热,请谈谈对这个技术的理解。与此前“文字生成图片”等技术相比,有何发展?目前这项技术的局限和发展出路又在何方?还有哪些可能的技术路径吗?

实际上,“文字生成视频”和“文字生成图片”在本质上并没有太大区别。如果大家体验过runway就会发现,“文字生成图片”实际上是“文字生成视频”制作过程中的一个阶段,它的流程是这样的:首先生成四张图像,然后基于选定的图像,再去生成视频。我通常会先用一段文字来生成这个四秒视频的第一帧,然后以这一帧为起点,向后推进,预测每一秒视频的画面,但可控性很差。

视频生成的发展路径,按照目前所采用的扩散技术很难解决。现在我注意到有两条路:

第一条路,利用物理引擎来辅助。runway最近发布了一项公告,他们计划招募人员来开发一个“世界模型”。这个模型旨在解决现有技术的局限性,因为目前的技术主要是从第一帧向后扩散,而没有考虑背后的物理规律。例如,一个水杯从空中掉落到地上时会破碎,但现有的技术并不了解这些物理规律,包括光影变化等。所以他们实际上缺少一个物理引擎或者是“世界模型”来告诉他们这些规律。我知道斯坦福有一个团队也在研究这个问题,但是他们已经研究了快一年,实际上还没有什么成果。这是一条可能的道路,如果能够解决这个问题,效果可能会非常好。

图6:runway公告(图片来自runway官网)

图7商汤科技Story-to-Motion模型论文

图8-2AI3D测评内容

AI赋能个人成长

Q:除了AI艺术创作,还用AI做过哪些有趣的尝试?

实际上,在我看来,AI目前在很多领域的实际应用并不多。它主要被用于内容创作和商业产品开发方面。在其他领域,使用AI的机会相对较少,因为它的现有机制限制了它的应用范围,使其无法融入广泛的娱乐行业或用于更有趣的活动。

图9:用ChatGPT写高考作文

Q:作为与AI协同的资深玩家,您认为人类创作的优势在哪里?

我始终认为人类在创意方面具有独特的优势。这种创意源于人类独特的思维方式和讲故事的能力,这些能力从智人时代延续至今,一直是维系社会的关键。我们通常称之为创意。虽然之前我也曾赞扬AI的创意能力,认为它在某些方面超越了人类的边界,但经过长期使用和观察,我的观点有所变化。例如,AI能够编写出“今晚我吃了一个桌子和一个凳子”这样超乎寻常的句子。但这真的算是创意吗?它更像是一种偏离人类常识的表达。虽然AI在医药领域,如帮助开发靶向药物等方面表现出色,但在文学创作上,它真的能超越人类吗?我现在认为并非如此。AI可以用来写剧本、绘图、制作视频,但在创意方面仍有局限。即便我用AI写了许多剧本和标题,它们的创意逻辑似乎都相当简单,只是基于现有数据集的排列组合。

当模型参数变得更大,或者像OpenAI这样的公司放松道德和场景的束缚时,情况可能会有所改变。很多公司现在为了解决幻觉问题,对AI模型进行了严格的对齐,限制它只能表达知识库中已有的内容。但人类的创意往往源于胡编乱造。如果有公司能够在底层算法上取得突破,同时放宽对AI的限制,那么AGI(通用人工智能)时代的到来就不再是遥不可及的梦想了。

图10:AI生成创意图片“今晚我吃了一个桌子和凳子”(DALL·E3生成)

受访者简介

卡兹克

卡兹克,原名张仁杰。互联网基金行业设计总监、AI业务总监,ChatFund负责人。公众号“数字生命卡兹克”主理人,与AI共创的《流浪地球3》“预告片”获全网千万播放量。

THE END
1.如何使用AI生成适合朋友圈的个性化文案?在当今数字化时代,社交媒体已成为人们分享生活点滴、情感体验和创意想法的重要平台。朋友圈作为中国最流行的社交平台之一,用户经常需要创造个性化且引人注目的文案来分享自己的生活。随着人工智能(AI)技术的发展,我们可以利用AI工具来生成适合朋友圈的个性化文案。以下是使用AI生成个性化文案的几种方法和步骤: https://www.kdocs.cn/article/7C94A9EEB2.html
2.一文搞懂ChatGPT相关概念和区别:GPT大模型AIGCLLMTransformer6)AIGC(人工智能生成内容) 7)AGI(通用人工智能) 8)LLM(大型语言模型) 9)羊驼(Alpaca) 10)Fine-tuning(微调) 11)自监督学习(Self-Supervised Learning) 12)自注意力机制(Self-Attention Mechanism) 13)零样本学习(Zero-Shot Learning) 14)AI Alignment (AI对齐) https://blog.csdn.net/weixin_44292902/article/details/130801513
3.AI文字生成图片在线智能AI图片生成网站创客贴AI,输入文字在线生成精美图片,顶级智能算法支持,百余种设计风格,多尺寸选择,人物图片/动物图片/风景图片等等,输入画面描述文字即刻生成。https://www.chuangkit.com/adlp2/261.html
4.文字生成图片:输入关键词,人工智能自动帮你绘图即使大众对AI绘画的褒贬不一,但我们不得不承认,AI生成艺术的爆发大势不可逆。作为计算机视觉算法领导者,皮卡智能AI也不甘落后。目前也研究出「文字生成图片」技术,正在不断完善中, 对于大多数普通人来说,进行AI绘画创作无疑是新奇的体验,只需要输入指定的关键词,就能生成自己想要的图片,甚至能颠覆想象生成更大胆的创https://tech.china.com/article/20221022/102022_1163046.html
5.文字及图片生成视频的AI工具集合来了,以后可能每个人都能自己文字及图片生成视频的AI工具集合来了,以后可能每个人都能自己在家用AI做电影了#ai #ai工具 #ai视频 #人工智能 #图文伙伴计划2024 - AI小鱼哥于20240416发布在抖音,已经收获了1852个喜欢,来抖音,记录美好生活!https://www.douyin.com/note/7358376633654365480
6.一键AI绘画多种AI模型,画风随心切换,畅享创作乐趣 从绘画到写诗,突破灵感界限 Win下载 MAC下载 扫码下载APP 软件介绍 一键AI绘画是一款基于人工智能系统的ai绘画软件,用户可以输入文字描述,让ai绘画生成风格各异、惊艳有趣的图片或画作。软件充分利用AI技术,支持智能写诗、智能抠图、老照片修复等多种实用功能。 软件特色 AI生https://www.xunjiepdf.com/aihuihuapc
7.函数计算部署AI艺术字应用,生成新春文字头像简介:基于 Stable Diffusion Serverless API 解决方案搭建 AI 文字生成应用,支持并发出图。 1.场景介绍 AIGC热度居高不下,为开发者带来了更多想象力和创业机会。AI绘画通过人工智能算法和计算机视觉技术,创作出颇具艺术性的绘画作品,在过去的一年里为人们带来了很多惊喜。越来越多的人开始关注AI绘画的商业价值,并探索https://developer.aliyun.com/article/1427587
8.InvideoAIInvideo AI是一个在线视频制作工具,它可以让你用文字输入来生成AI视频。你可以用文字提示来编辑你的视频,从1600万的素材库中选择合适的视频片段,并添加人声、字幕、过渡和背景音乐等。你可以用Invideo AI轻松地制作出高质量的视频。https://pidoutv.com/sites/13039.html
9.AIGC万字百科全书:底层原理应用嘲工具示例行业现状发展AIGC全称为AI-Generated Content,指基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数 据寻找规律,并通过适当的泛化能力生成相关内容的技术。与之相类似的概念还包括Synthetic media,合成式媒 体,主要指基于AI生成的文字、图像、音频等。 从字面意思上看,AIGC是相对于过去的 PCG、UCG 而提出的。因此,https://blog.51cto.com/u_15730109/6275463
10.30+AI人工智能软件整理,生产力提升必备!在谈论Pixso AI人工智能软件时,我们不能忽视其"AI灵感专家"的功能。在面对设计过程中的创新挑战时,Pixso AI提供了九大灵感生成工具,它们包括UI知识问答、随机人名生成、论坛评论生成、彩虹屁生成、需求文档框架生成、用户画像生成、用户旅程地图生成以及代码生成等。通过这些工具,设计团队能够打破思维定势,更好地满足用户在https://pixso.cn/designskills/30-plus-ai-software/
11.免费AI写作生成器:让文字设计更便捷赵露思AIBIM免费教程免费AI写作生成器是一种基于人工智能技术的工具,可以帮助用户快速生成文本内容,从而提高文字设计的效率和便捷性。其中,赵露思AI是一款知名的AI写作生成器,拥有强大的自然语言处理能力,可以生成高质量且流畅的文案,让用户在创作过程中省时省力。 1. 免费 作为一个免费的工具,AI写作生成器可以帮助用户节省成本,不需要雇http://www.tuituisoft.com/ai/131651.html
12.Filme官网,AI语音克隆,ai文字转语音生成器?>1.免费ai视频生成+写作(可联网)?>2.超强免费ai视频神器3.免费ai写作绘画 Filme官网,AI语音克隆,ai文字转语音生成器 Filme简介 免费人工智能语音生成器和语音克隆 超过3200 种逼真的文本转语音声音,涵盖46 多种语言。 通过人工智能语音克隆,即时99%准确的真人声音。 https://feizhuke.com/sites/filme.html
13.大火的AIGC是什么?能用到工作中哪些地方?一.AIGC是什么?AIGC(即一.AIGC是什么? AIGC(即Artificial Intelligence Generated Content),中文译为人工智能生成内容。简单来说,就是以前本来需要人类用思考和创造力才能完成的工作,现在可以利用人工智能技术来替代我们完成。 在狭义上,AIGC是指利用AI自动生成内容的生产方式,比如自动写作、自动设计等。在广义上,AIGC是指像人类一样具备生https://juejin.cn/post/7247059220142456887
14.「超实用」全领域AI工具大盘点!(附链接)一、AI写作工具 1.Jasper——AI文字内容创作工具 https://www.jasper.ai/ 2.Copy.ai——人工智能营销文案和内容创作工具 https://www.copy.ai/ 3.Writesonic——AI写作、文案、释义工具 https://writesonic.com/ 二、AI图像工具 1.Midjourney——AI图像和插画生成工具 https://www.niaogebiji.com/article-550460-1.html
15.Murf.AI:在线AI文字转语音合成配音工具黑马自媒体导航Murf AI是一个在线AI文字转语音合成配音工具,可以让用户从文字内容生成音频文件。拥有丰富的语音库和额外的功能,如语音克隆和变换。还可以帮助用户创建涉及语音配音的不同类型的内容,如视频、广告和播客。 特色功能 选择多种语音:Murf AI提供了120多种文本转语音的语音,可以在20多种语言中选择。具有自然和逼真的效果https://www.hmwww.cn/site/2213.html
16.AI写小说绘画剪视频,生成式AI更火了盗梦师是一个能根据输入文本生成图片的AI平台,属于AIGC(AI-Generated Content,即人工智能生成内容)的分支。 在用户发挥想象,输入文字描述后,盗梦师便可生成1:1、9:16和16:9三种比例的图片,还有24种绘画风格可以选择——除了基础的油画、水彩、素描等绘画种类,还包括赛博朋克、蒸汽波、像素艺术、吉卜力和 CG 渲染https://weibo.com/ttarticle/p/show?id=2309404836090984137038
17.starryai官网,免费AI绘画软件,艺术图片生成工具别摸鱼导航starryai是一个免费的应用,可以在iOS和Android上下载。你还可以浏览和收藏其他用户用starryai生成的一百万多张AI艺术作品。starryai没有明确的免费生成限制。你可以随意输入文字提示,来生成AI艺术作品。 starryai官网: https://starryai.com/ StarryAI是一款基于人工智能的绘画工具,它以独特的方式改变了我们对艺术创作https://biemoyu.com/sites/starryai.html
18.AI一键生成原创动漫视频软件艺映AI:专注于人工智能视频领域,具备文生视频、图生视频、视频转漫等功能。用户可上传图片让静态图片变为动态视频,或输入纯文字生成各种风格的AI 视频。其官网为: https://www.artink.art/ 视频图片动漫化:基于 AI 智能的软件,具有多种功能,比如通过 AI图像生成技术把普通视频转换为不同画风的动漫视频;将描述转http://hangzhou.11467.com/info/30949968.htm
19.AI文生图软件免费版下载应用标签:ai人工智能人工智能软件 扫描二维码下载 应用介绍 AI文生图软件让用户生成不同风格的图片,只需输入文字就能得到精美的画面,有ai智能创作的功能,方便用户得到文案信息,用户能在生成画面前选择不同风格,素描,油画以及超现实主义等风格都能挑选,软件的各项功能都是免费的,方便用户的作品生成,又能随时分享自己创作https://www.juxia.com/sjwy/ruanjian-679139.html
20.6个AI人工智能软件,其中两款免费使用!DALL-E 2 与即时灵感相同,都是能够通过文字描述生成艺术图像的 AI 绘画软件,只需要简单的几句文本提示,DALL-E 2 就可以按文本指示生成全新的艺术图像,甚至可以将毫不相关的物体以合理的语义方式重新组合在一起。 5、Notion AI Notion AI 是一款可以被用来写作的 AI 人工智能软件,它可以根据输入的关键词帮助用户https://js.design/special/article/ai-artificial-intelligence-software.html
21.AI自动生成字幕,一键语音转文字爱剪辑的“AI识别字幕”功能是真正意义上通过人工智能(AI)技术去识别视频或音频里的人声内容(包括多人对白的内容),并自动生成同步字幕。爱剪辑的“AI识别字幕”功能的特别优势之处不仅体现在准确的识别率、丰富的语种支持、超快的识别速度,还体现在可以对识别结果进行各种更人性化的超细致调整!http://www.ijianji.com/article/aijiazimu.htm
22.免费ai写作app推荐免费的AI写作App是一种通过人工智能技术生成文字的工具。用户可以输入一些信息,如文章主题、关键词、句型等,这些信息将用于生成文章。 AI写作App使用机器学习算法来分析语法、语义和上下文,以产生高质量的文章。这些文章包括新闻报道、博客文章、营销材料等,可帮助用户节省时间和精力。 https://tool.a5.cn/article/show/76158.html