可灵制作短片惊艳马斯克,所以最好用的AI视频工具究竟是谁?

这两天,国产3A游戏《黑神话·悟空》引爆全网,火到了海外,而在AI视频领域,快手可灵也在海外大杀特杀,连马斯克也忍不住上线称赞。

过去半年,AI视频圈的热度可以说从未停止,不少国内外网友都想着借AI颠覆好莱坞。各种经典画面在网上一通发酵,掀起了一阵阵AI生成短视频的热潮。

比如,有网友借助Grok2的生图能力,和可灵、DreamMachine等相结合,生成了各种令人瞠目结舌的场景:

Grok2+可灵

Grok2+Gen3

Grok+DreamMachine

与此同时,已经推出视频模型的厂商们也在马不停蹄地迭代产品。

8月19日,LumaAI更新了v1.5版本,有大神就利用它的文生视频功能,制作起了电影特效:

8月18日,Runway发布了Gen-3AlphaTurbo图像转视频模型,生成速度提升了7倍。

再往前,引起病毒式传播的“Ted演讲者”也是由AI直接视频化的:

大半年过去,AI给视频生产和交互体验带了什么样的改变?爆火出圈的产品哪个性价比最高?本文进行了一波综合盘点。

AI生成视频进化到哪了?评价标准是什么

年初OpenAI的虚晃一枪,让国内外不少企业“卷”起了视频生成,今年上半年AI视频生成工具有关话题几度迎来热度高峰。

早已被大家熟知的Runway带来了新一代模型“Gen-3”,将可生成时长拉长至10秒。

Pika在AI视频基础上,不断推出诸如一键添加音效、延长视频、对口型等新功能。

甚至有AI创企Luma从3D模型领域转型AI视频,发布DreamMachine。

国内,字节和快手相继推出即梦、可灵AI,一经发布就吸引了全球网友的青睐。

智象未来、爱诗科技等专注视觉大模型的AI企业,接连上线了HiDream、PixVerse等可用的AI视频工具。

前两周,大模型厂商智谱AI也发布了旗下的AI视频工具“清影”,并将模型“CogVideoX”开源。

这些视频工具不同于此前剪映推出的数字人、AI一键成片等功能,更像是AI靠自己的知识储备,“无中生有”般生成的视频内容。

AI既要理解用户的指令,还要生成的内容之间前后衔接、内容连贯。

据我们了解,当前,AI从业者普遍认可的AI视频生成的评估标准,至少有3个方面:语义理解、画面美观度以及可控性。

语义理解通常在于文生视频领域,主要看AI能否理解用户表达的指令,简单来说,比如让AI生成一个女孩,它得往年轻、活泼的形象上塑造,不能是一位老太太,否则就是语义理解能力不够。

画面美观度,通常包含视频的画面元素合理性、画质是否精细、是否有掉帧闪烁等问题,而可控性则是动作幅度加大的同时,能否保证画面不出现畸变。

现在的主流视频模型都在往这三大方向进行优化。生数科技CEO唐家渝此前接受媒体采访时提出,未来会持续在模型层面改进,提升AI视频的语义理解、可控性等方面的效果。

除此之外,和模型的交互也是重要的维度之一。谷歌VideoPoet模型作者于力军曾公开表示,视频生成交互是极简和动态的,文字表达宏观的信息,图片提供细节指引,通过任意的输入和编辑,模型会自己理解和生成。

这也对应了产品的易用程度如何。过去,我们可能需要在复杂的操作界面上进行编辑修改,才能实现预期效果,现在可能只需要打打字,就能获得初版预览视频。

都有哪些优缺点

那么,从一年多前惨不忍睹的威尔史密斯吃面,到现在动辄生成10秒以上的AI视频,我们离电影级别的AI视频生成还有多远?

左右滑动,查看更多

超强语义理解能力,文生视频跃升新台阶

文生视频,最关键的其实就是投喂给AI的提示词要怎么写。我们结合主流AI视频工具发布的提示词文档,总结了一个相对普适的提示词公式:

根据这个公式,我们列了一组包含了人物、动作、环境以及镜头语言的提示词,尽可能覆盖测试到AI视频生成的不同维度,比如涉及了人物、细节把握、镜头语言以及数字。看看有没有符合预期的视频。

Prompt:Agirlwearingblack-framedglassessitsquietlyinacoffeeshop,holdingacoffeecupwiththenumber6printedonit,surroundedbyawarmandrelaxedatmosphere.Thecameracapturesamediumshottakenindoors,focusingonthegirlwithherglassesandhercoffeecup.

可以看到,Vidu在人物生成上表现出了较高的稳定性,动作变化也较为自然。

眼镜、数字、镜头语言都一一拿捏,除了画面中出现了2个人物外,称得上合格的生成视频。

和Vidu一样,可灵生成的画面也非常流畅,背景营造出人头攒动的咖啡店场景。

遗憾的是,可灵在数字生成上仍存在短板,无法一次精准获得数字效果。

PixVerse对语义理解较为精准,提示词中的要素都一一呈现,生成的人物动作幅度也很明显。但也因此出现了“手指异常”,以及眼睛歪斜等技术瑕疵。

即梦最初的生成效果尚可,但视频稳定性上有所欠缺,到后期“数字6”摇身一变成为了咖啡拉花,女孩的五官也变得不再可控。

清影生成的咖啡热气细节相当细节,特写镜头感拉满。但遗憾的是,主体运动上并没有符合我们提示词所写的内容。

HiDream生成的人物面部控制到位,但无法正确理解提示词中“女孩捧着咖啡杯”,出现了多余的画面元素。

Luma更新v1.5后,整体画面呈现的内容更丰富,不仅仅只有“女孩”一个主角,动作幅度也更大,在光影、构图上也比较自然。只不过,仔细看人物的手部、牙齿还是有AI的痕迹。

由于Pika模型本身在动画效果上更胜一筹,所以生成的女孩也逃不开动画的影子。整体画面也只是眨眨眼的微动,也无法识别出精确的数字。

StableVideo生成的视觉效果较好,人物外貌、场景、手指细节都没有出现崩坏,但整体运动更像图片平移。

值得一提的是,StableVideo的视频生成逻辑和其他家都不同。

或许是因为StableVideo本身在文生图上具有一定的技术优势,所以它是先生成4张图片,用户从中挑选1张后,再根据这张图生成动态视频。

在人物类镜头上,RunwayGen-3依旧是最能打的。

整个画面运动非常符合逻辑,也没有明显的画面瑕疵,除了缺少“数字6”这样的细节外,Gen-3这轮表现还是相当出色。

总的来说,在文生视频这一环节,Vidu、可灵、Runway在语义理解、人物生成、画面可控上表现更为稳定,生成视频的可用度较高,可以大大减少新手抽卡次数。相比之下,其他几家的盲抽概率更大。

从PPT“伪视频”到动幅明显,AI摆脱切片式画面

图生视频功能上,我们还是选用了经典梗图作为实测素材。

一方面,“威尔史密斯吃面”在一年前就曾火爆AI圈。另一方面,作为人物类案例,涉及手指、人物外貌、物理世界理解,它可以更直观地呈现AI视频生成的几个维度。

擅长吃播的快手可灵在这张图上也有天然优势,在可灵的加持下,感觉盘子里的面看着都更香了。

从画面来看,吃的动作、手指细节都没有太大的问题。

Vidu是另一个让我惊喜的视频工具,虽然威尔史密斯的脸部发生了畸变,但在视频流畅性、动作幅度上都超出预期。

清影生成的画面在画面一致性上比较好,但动作过于缓慢,有些违背正常吃饭的速度,不够自然。

清影生成视频

PixVerse主要还是集中在手部和脸部问题上,手部的细节到最后糊成了一团,还多了额外的元素。

即梦乍一看视频流畅,画面过得去,但它的AI一定有个“中国胃”,吃着吃着叉子变成了筷子。

可惜的是,在努力让画面元素丰富的同时,即梦并不能保证其稳定性。

即梦生成视频

HiDream和StableVideo这次的翻车有点严重,除了面条自行消失外,手部也出现了较为明显的瑕疵。

HiDream生成视频

StableVideo生成视频

乍一看,Luma生成视频还比较正常,但在结尾的时候突然出现了明显的动作异常,开始逐渐往“鬼畜”的方向走了。

LumaDreamMachine生成视频

RunwayGen-3这轮直接上演一个“假吃”,人物面部也和我们上传的图片可以说毫无关系。

RunwayGen-3生成视频

看到这里,各位还记得威尔史密斯长什么样吗?

按道理来说,在技术上,图生视频应该比文生视频实现难度更低,毕竟图生视频给予AI具体的参考物体。但在人物吃播镜头上,上述10款工具表现都不如预期,角色可控性上还是有所欠缺,几乎都上演了“3秒内换脸”的绝技。

但除了人物稳定性之外,我们更容易感知的是,可灵、Vidu在手部细节以及“吃”的真实感上取得了优势,能够生成动作幅度更大,更理解物理世界的视频内容。

当然,即便是以上相对集中的横向测试,也不能说明全部。AI生成工具能产生的价值还是在于每个人结合实际需求的使用。

无论是文生图、文生视频,还是图生视频,目前为止应该没有一个模型能够完美适用于所有的场景和任务。

换句话说,每个视频模型都可能针对特定的任务和数据类型进行了优化。一个模型可能更擅长生成现实风格的视频,而另一个可能更擅长卡通或抽象风格。

比如,Vidu就有特定的动画风格,RunwayGen-3更擅长电影镜头,可灵在人物表现上有明显优势等等。

对大部分玩家而言,如果不追求极致的视频效果,想不断进行抽卡,目前几家的免费额度已经够逐一尝鲜。

其中,即梦提供了较高的积分数量(505积分)和较低的生成成本(最低3积分),相比之下,用户可以用较少的积分生成更长的视频。

但如果追求更优质的镜头画面、更快的生成速度,可灵和Vidu综合订阅价格以及抽卡概率,会是不错的选择。Runway的文生视频可玩性最高,对于新手来说,极易获得成就感,但价格上并不占优势。

即使是这样“上手可用”的状态下,很多主流的AI视频工具也还是有一定的改进空间。

AI视频的普遍痛点——画面准确性和可控性,依旧是非常常见的问题。

对此,一些AI企业会通过“事前控制”的方式,让视频可控性得到提升。比如,PixVerse和Runway上线了动态笔刷,尽量让人物外貌、背景保持一致的情况下,画面动起来。可灵、即梦、DreamMachine推出了视频首尾帧功能,让生成视频尽量符合物理规律。

这些功能背后的技术难度不大,但更难的是现阶段阻碍视频工具发展的算力、数据和算法,同步影响生成视频的速度、质量和效果。

对于视频训练AI来说,需要大量光线、细节、人物、时长、镜头等等都不同的画面,进一步进行标注后,提升AI生成的精准度。所以优质的视频数据远比文字图像更难获得。

纵观AI视频生成领域,除了引发大量模型复刻追赶的Sora尚未发布,被誉为“国产Sora”“Sora平替”的各种视频生成工具,都已是“现货”状态。

那么,AI会主导未来的视频工作流吗?

要知道,在视频画面中,只有镜头的来回运动是没有意义的。从PPT到真正的AI短片,除了不断优化画面的美观程度,还有声音、镜头语言、转场等等。

现阶段,我们除了用AI生成需要的画面之外,剪辑、配乐、画面转场都需要人工后期完成。

从Midjourney、Flux生成图像,再在Runway、可灵上制作视频,然后到PR、剪映等剪辑软件上进行升级改造,这样的工作流并不少见,甚至是目前主流的AI视频工作流。

未来是否会有一个AI原生视频编辑平台,在一个应用间实现跨模态的内容,从文字开始,一键生成视频?

我们在Github上发现了这个想法的雏形,有网友将现有的生成式AI技术集合在一个平台,让任何人都可以使用AI一站式制作视频。相信在不远的将来,AI原生工作流会取代现有的编辑流程,成为创建视频的新思路。

THE END
1.2024年最强AI文生视频图生视频工具王炸组合!免费无Pixverse是一款AI视频生成工具,这款模型目前是免费使用状态,在生成视频的分辨率颗粒粒度展现了强大的实力。可在官网直接使用,或者软件内使用,支持中英双语。 主页分为,popular Videso社交类展示视频和My Videos我的指令生成视频还有Collection/Favourite我们点赞过的视频,以及charater我们创作的角色视频。支持文生视频text https://www.bilibili.com/read/mobile/35572141
2.一款免费无限制的AI视频生成工具(能保持IP角色形象一致)之前跟大家分享过一款高人气,且免费无限制的AI视频工具-Pixverse 前段时间,Pixverse又迎来重磅更新! 除了基础的文生视频、图生视频功能外,还能够保持视频中角色形象不变! nice!有了它 Pixverse玩法仅仅是个AI玩物了,能够有更多落地玩法。 比如,做一个美女IP账号 https://cloud.tencent.com/developer/news/1349272
3.免费的ai视频生产软件ai视频生成软件免费免费的ai视频生产软件有哪些?有什么软件能够AI自动生成视频?ai生成视频哪个免费软件好用?ai一键生成视频什么软件好?小编为大家带来超好用的ai视频生成软件合集,用户可以自定义打造关键词,快速为你进行视频内容生成,对软件感兴趣的话可以点击下载! 其他视频推荐:正规小视频app免费好用的看视频app成为视频人的免费app软件https://www.fxxz.com/k/aispscrj/
4.[转]AI工具:27款顶级免费国产AI神器!即梦AI视频生成工具 在视频生成领域表现极其稳定。特别是处理动态视频时,其他AI动得太猛容易崩脸,但即梦不会!而且它还有个特别绝的功能,叫首尾帧连接,让你的视频片段切换得特别顺滑。 即梦AI视频体验地址:https://jimeng.jianying.com/ PixVerse AI视频生成免费工具 https://yun.zjer.cn/space/index.php?r=space/person/blog/view&sid=164914&id=39518109
5.AI视频生成工具哪家强?推荐三款亲测好用的免费工具推荐三款亲测好用的免费工具 工作需要,我用过不少AI生成视频工具,对比来看,目前我用得最多最顺手的就是以下三款AI视频生成工具了,他们分别是快手的可灵,字节的即梦,还有最近让我眼前一亮的Vidu。 咱们来看看他们都各有什么独门绝技哈。 一、即梦AIhttp://www.360doc.com/content/24/1012/23/30624544_1136414927.shtml
6.ai生成视频工具领先的AI自动生成视频免费在线制作工具,一句话,一张照片,即可AI一键生成原创视频!基于国际领先的AI视频技术研发,提供文生视频、图生视频等全场景视频制作需求,让每个人都能轻松地创作出高质量的视频内容。https://www.aimp4.cn/
7.8款国内外免费AI生成视频工具对比实测!我们真的可以做到“一人搞定一部因此本文将从AI生成速度、一次可生成视频内容时长、视频呈现效果、文本指令理解,长视频制作等维度对国内外热门AI视频生成工具进行实际评测,作为大家日后使用AI生成视频工具的一个参考。 本文测评的AI视频生成工具(均可免费使用): 国内:即梦AI、智谱清影、可灵AI、Vidu https://blog.csdn.net/m0_56647251/article/details/141824350
8.15个免费的AI视频生成工具和软件,视频创作提效神器AI工具集视频,作为最吸引人的媒介之一,已经成为传达信息、讲述故事和创造影响力的强大工具。高质量的视频制作往往需要昂贵的软件和专业的技能。随着人工智能技术的飞速发展,现在有了免费的AI视频生成工具,本文将介绍15个免费的AI视频生成工具,降低了视频制作的门槛,为创意表达打开了新的可能性。帮助用户无需专业知识就能创造出https://ai-bot.cn/ai-video-generation-tools/
9.推荐几款超好用的免费AI视频生成工具,三强对决,谁才是最厉害的?基于现在的实际效果,要想保证好的视频质量,其实有种更好的办法,就是先用文字生成图片,然后图片生成视频,同时配以文字来辅助图片中的目标运动。这种方法,会比直接文字生成视频的效果要好不少。我们来看实际效果。1、比如这是一张用优秀的AI绘画工具——秒画做出来的图,颜值很高: https://www.jianshu.com/p/f9d7737663b4
10.2024公认好用又免费的14款AI视频生成工具排行榜近年来,人工智能技术的迅猛发展催生了大量的AI工具,其中AI视频生成工具因其强大的功能和广泛的应用场景而备受关注。本文将对14款最新的AI视频生成工具进行详细剖析,帮助你快速找到适合自己的工具,提升创作效率。同时,我们也会深入探讨这些工具的独特功能,以及如何在实际应用中获益。 在众多AI绘画和AI写作工具中,视频生成https://m.sohu.com/a/807787933_121798711
11.免费的人工智能文本到视频生成器创作者和编辑器Designs.ai Video Maker 是一个由人工智能驱动的视频创建和视频编辑平台,允许用户快速轻松地创建令人惊叹的自定义视频。该平台使用机器学习算法来协助视频创建过程,包括生成自动视频编辑和建议设计元素。它与 Chatgpt 配合使用,可以创建无缝的文本到视频体验。 https://designs.ai/cn/videomaker
12.超强大的AI视频工具,可免费无限次白嫖,无任何限制,敏感内容都可无论是文生视频还是图生视频,都能高效快捷完成,操作简单。 而且无任何限制,敏感的视频内容也可以生成,适合所有用户,赶快体验,享受无与伦比的便利和创意灵感吧! 课程目录 外网环境注册 准备工作 AI网站实操 下载权限 所有人: 评论并刷新后下载 VIP用户组: 免费下载 超强大的AI视频工具,可免费无限次白嫖,无任何https://www.ziyuan.cn/html/19286.html
13.for:8款最好用的AI视频生成工具!完全免费!图片转视频AI工具&8款最好用的AI视频生成工具!完全免费!图片转视频AI工具&让图片开口说话最佳工具安利,口碑超级好的AI视频生成工具,良心分享,值得一看! This is an AI generated summary. There may be inaccuracies.Summarize another video· Purchase summarize.tech Premiumhttps://www.summarize.tech/www.youtube.com/watch?v=O2eaczmQQM0
14.Pika!又一个AI短视频生成神器,免费使用!优设网大家好,这里是和你们一起探索 AI 的花生~ 之前为大家推荐过一款知名的 AI 视频生成工具 Runway,它的 Gen-2 模型可以直接根据文本生成视频,效果稳定。最近又新出现了一款新的 AI 视频生成工具 Pika,功能与 Gen-2 相似,并且可以免费使用。 Pika 主页截图 了解Gen-2: AI短视频神器Gen-2开放测试!靠打字做短视频https://uisdc.com/pika
15.免费图生视频教程:白日梦AI快速生成原创故事视频设计达人第四步,设置分镜,这里我们可以指定人物的位置。 白日梦AI视频生成工具以其独特的AI故事视频生产流程脱颖而出,但要创作出真正高质量的内容,还需要您亲自投入,精心雕琢文案和制作过程。 对于有志于制作此类故事视频的朋友们,不妨亲自动手尝试,体验AI与创意结合的无限可能!https://www.shejidaren.com/bai-ri-meng-ai.html
16.AI视频生成平台AI视频生成平台是一款集成了强大的AI视频生成、剪辑和制作工具的综合平台。通过利用先进的人工智能技术,AIGC视频平台能够帮助用户快速、高效地创建精美的视频内容。无论您是个人用户还是专业视频制作人员,AIGC视频平台都能满足您的需求,让您轻松实现视频创作的梦想。https://www.aigc.cn/favorites/ai-video
17.AI自动生成创意视频:如何让大模型助你一臂之力本文探讨了如何利用大语言模型和AI视频生成模型来创建高度个性化和创意丰富的视频内容。文章详细介绍了从构思到实现的全过程,包括问题分析、目标设定、工具和模型选择,以及实际操作步骤。 作者| 崔皓 审校| 重楼 摘要 本文探讨了如何利用大语言模型和AI视频生成模型来创建高度个性化和创意丰富的视频内容。文章详细介绍了从https://www.51cto.com/article/771753.html
18.免费的AI生成视频软件?截至目前(2023年),有一些免费的软件和在线服务可以生成或辅助生成视频内容,这些工具利用人工智能(AI)技术来简化视频制作流程。以下是一些流行的免费AI视频生成软件: 1、DeepArt.io DeepArt.io 是一个基于AI的平台,可以将你的照片转换成艺术风格的视频。 2、Headlinerhttps://python.tedu.cn/xuexi/492606.html
19.elai.io官网,ai视频生成软件工具,数字虚拟人,文字,ppt生成视频elai.io官网,ai视频生成软件工具,数字虚拟人,文字,ppt生成视频,声音克隆 什么是elai.io? Elai.io 是一个由全球 AI 技术专家团队运营的领先 AI 视频生成器。 用户可以根据文本轻松地创建各种视频内容,实现大规模生成视频的目标。只需简单的三个点击,用户就可以使用 Elai.io 平台从文章或博客https://feizhuke.com/sites/elai-io.html
20.AI神器文字一键生成短视频,效果超叼!奇迹秀随着人工智能技术的飞速发展,AI工具已经在多个领域展现出了惊人的能力,它们不仅能够生成图像、创作音乐,甚至还能制作视频,这些进步让一些从事平面设计、音乐制作和视频制作的专业人士感到既兴奋又忧虑。 今天小呆给大家分享一款既免费又实用的AI视频制作工具,它可以帮你节省宝贵的时间,提高工作效率,同时还能创造出高品质的https://www.shangyexinzhi.com/article/20387840.html
21.年度最热AI应用TOP50,除了ChatGPT还有这么多宝藏它将今年井喷的 AI 工具主要分为 3 个门类,文本、图像、视频生成。 文本生成工具 为啥要从 3 月开始看起? 大概是这个月里,GPT-4、Bard 先后发布,直接把大模型趋势推向更高潮。 这和Writerbuddy 的数据也有所对应,2023 年 3-4 月,50 大热门 AI 工具的总访问量增加了 9 亿,是调查期中增速最快的一个月https://www.ithome.com/0/742/981.htm
22.「超实用」全领域AI工具大盘点!(附链接)三、AI音频工具 1.网易天音——网易推出的AI音乐创作平台 https://tianyin.163.com/ 2.Riffusion——AI生成不同风格的音乐 https://www.riffusion.com/ 3.讯飞智作——科大讯飞推出的A转语音和配音工具 https://peiyin.xunfei.cn/ 四、AI视频工具 https://www.niaogebiji.com/article-550460-1.html