AI音乐半年观(上)音乐生成有哪些实用场景和代表产品?

结合我的个人实践、产品体验和用户调研,我总结了AI音乐生成在哪些应用场景中发挥了价值?有哪些代表产品?哪些需求暂未满足?我会按照AI音乐生成、AI歌声生成/转换、AI音效生成这三个方向来阐述对应的用户场景和AI产品,希望对大家了解AI音乐目前进展及未来趋势有所帮助。

本文为上篇,AI音乐生成。

我将AI音乐生成的实际应用归纳为5个场景,生成技术在音乐视频和功能型音乐创作中正在发挥商业价值,社交娱乐和业余音乐创作场景未产生明确价值,专业创作领域尚待AI融合进工作流。

今年2月春节期间,我正在围绕“过年”这个项目主题,制作AI音乐视频。与「背景音乐」不同之处在于,MV里的歌曲具有独立欣赏的价值,且歌曲和视频画面在节奏、内容、情感上相互呼应。我需要先找到合适的歌曲,再根据歌词来制作对应的画面。

我的期望是:歌词描绘一个「过年」的故事,措辞风格是悠扬温馨的中国风,内容易于我后续用画面呈现,歌曲时长50s左右。最初,我尝试去音乐素材网站直接购买一首现有的歌曲,但没有找到合适的,主要原因是曲库歌曲的歌词内容、歌曲风格和长度很难完全符合我的期望。与其买一首不那么满意的歌曲又硬着头皮配画面,不如从头制作一首完全符合我要求的歌。可是我完全不懂音乐创作,于是利用AI生成音乐就成了救命稻草。当时(2月份)我所能使用的只有Suno,虽然那时它只发展到V2模型但也勉强够用,同时通过订阅会员,我也获得了商业使用权。

随后,我开始构想歌曲内容:歌曲围绕过年团圆的主题,讲述一位打工喵回到家乡、触景生情闪回童年、时光流转重聚当下的故事。整体工作流:1.ChatGPT+Suno来制作歌曲2.StableDiffusion制作分镜图片3.Runway+少量即梦和可灵制作动画4.剪映里剪辑视频,并添加音乐、音效、字幕等

歌词

歌词创作非常重要,它直接决定了我的故事内容和每个视频画面,由于Suno内置的歌词生成功能不支持多轮对话修改,因此我借助了ChatGPT来生成歌词。

在这个过程里,需要提供给ChatGPT以下信息:

歌词生成后,再根据结果对于押韵、字数、措辞等方面不断提供修改意见直到满意为止。

最终确定下歌词:

[verse]站台瑞雪静落灯火通明映归途老城炊烟轻绕岁月流转梦回初[verse]小桥流水声细童年欢笑随风起夜幕垂蒲扇轻外婆故事月下听[chorus]此刻家中围炉共话团圆灯火摇曳映照如初笑颜旅途终点也是新的起点

歌曲

歌词确定了以后,就可以打开Suno制作歌曲了。打开页面上方的「Custom」开关(即自定义歌词、否则suno会随机作词)填入歌词和「StyleOfMusic」(歌曲风格描述),我这个案例填的是「Chinesefolk」(传统中式歌曲)。

最后点击生成即可以开始抽卡,我最终抽了二三十首选到了合适的歌曲。我对音乐创作还知之甚少,好在并不是要交付严肃的音乐创作,对于这个视频项目来说已基本满足要求。

视频

最近我用Runway最新的Gen-3模型重制了这个音乐视频:

对于MV这类创作,曲库里的歌曲无法满足创作者对于歌词内容、歌曲风格和长度的要求。AI音乐生成工具则可以发挥价值,帮助创作者制作满足要求的歌曲。

上述音乐视频制作流程是「歌曲->视频->剪辑」,而为视频配乐的流程是「视频->歌曲->剪辑」,无论哪种方式,最后一步都离不开剪辑工具。

有些视频剪辑工具在编辑场景里集成了AI音乐生成的能力,相当于视频、配乐、剪辑都在同一个工具里完成,比如剪映:

这种方式把生成能力和工作场景相结合,可以减少工具之间的切换。但是和专业的AI音乐生成工具相比,这些内置AI功能,在生成方式和控制精度上做了许多简化,模型效果也较为一般。追求更高质量更可控的音乐作品,仍然需要使用那些更成熟、更全面的生成工具。

相对于有独立欣赏价值的音乐,功能型音乐(FunctionalMusic)的创作目的不是为了艺术表达,而是为服务于某种功能和效果。它一般有这些特点:无人声,不吸引听众注意,旋律简单重复,相对模式化。AI生成的音乐目前在艺术性和独特性方面存在限制,功能型音乐的这些特点,刚好弱化了技术在这些方面的不足。

因此,相比于注重艺术价值的音乐创作,功能型音乐的领域更容易被AI技术渗透和改变。在这波生成式AI浪潮前,已经有些早期的音乐生成技术应用在这个领域了。

功能型音乐具体有哪些类型呢?

vibrantsynths,coolhigh-energy,dramaticcrescendos,fashiondynamicbasslines“充满活力的合成器、潮酷有能量,戏剧性的渐强效果,时尚动感的低音线条。”这段提示词是让ChatGPT来生成的,我给到的信息是:“我准备制作一个视频,展示一种潮酷的视觉炸裂的效果,我希望使用AI生成背景音乐。请你帮我写AI配乐的文生音乐prompt,要求描述出音乐的风格、流派、乐器等,表达精简,并用逗号分隔。”

目前使用SunoV3.5模型可以在几秒之内获得视频配乐,效率远高于在素材网站的分类目录下逐一试听。

这是音乐搭配视频画面的最终效果:

推特作者@JulieW.Design也经常利用Suno和Udio来给她的短片配乐:

其中MusicFX的「DJ模式」,允许用户通过拖动提示词对应的滑块来调整相应的权重,并基于此,生成不间断、无限长的音乐。就像DJ打碟一样,可以根据现场氛围变化实时调整音乐。网站的动效设计也非常丝滑:

前几个月谷歌在I/O大会上,还真请来了一位DJ来现场演示效果:

如果你不想亲自制作,也有一些网站定位于音乐素材售卖,提供了大量现成的功能型音乐,比如Mubert、Pixabay、AudioJungle、Musicbed等。你可以通过分类目录去试听并购买歌曲,许多视频创作者都会在这些网站上寻找配乐。

我注意到身边朋友有一些低频的音乐创作需求。比如在一些特殊时刻如,生日、纪念日,送别日等,用AI歌曲来传递专属祝福。还有的喜欢用AI生成的歌曲帮助他们去记录当下的感受,将情感用音乐保存下来。

朋友1

周一上班很疲惫,但想起了周末和娃一起在公园里的画面,教他骑车,虽然身体很累但是内心很放松。特别怀念那个感受,就把它写成了一首歌单曲循环,听着听着心情也轻快了许多。通过歌曲,那时候的感受被具象化了,让我可以更深刻地体会它。

朋友2

我也深有感触。之前参加一个写作疗愈营,我写了一首诗。后来我用Suno把这首诗变成了一首歌,确实更加具象化了,多维度地记录下了那种感受。

作品在视频号:「天天的多重宇宙」

《我的阿勒泰》上映期间我非常痴迷,有几个画面深深植入我的脑海:巴太和文秀坐在树上看彩虹、月光下在波光粼粼的河边散步、在桦树林里告白、在草原上自由奔跑。还有几句很喜欢的台词比如:「再颠簸的生活,也要闪亮地过」、「我清楚地看见你」。除了二刷三刷电视剧,我也很希望能用音乐来记录和表达我脑海里的这些美好。

于是我先把以上这些细节信息通通告诉GPT来构思歌词,虽然GPT写的词还是有点文绉绉的缺乏些灵性,但私下用来记录感受也足够了。(自己玩,没有做MV的负担,对歌词的要求也就没先前那么高)

接着,再通过歌词和提示词让Suno(这次用了V3.5模型)生成歌曲,最后的成品我个人还是挺满意的:

让我惊喜的地方1.我没有使用元标签注明男女声,最后自动生成的男女对唱配合得很不错2.唱完了我提供的歌词,还自由发挥增加了桥段和尾声3.自由发挥了一段女生的哼唱,这段我很喜欢未达预期的地方1.标签里指定了乐器“冬不拉”(剧里常用配器,是哈萨克族传统乐器),但是这个乐器音色没有生成2.音质还是有待提升

这类自娱自乐的制作,我没有投入太多精力仔细雕琢,如果追求精细的控制,还是要多多参考WaytoAGI的文档。

一些社交娱乐平台如「唱鸭」、「给麦」,在现有的音乐、游戏、直播功能基础上,引入了AI歌曲发布作为一个新的互动方式。

然而根据我的使用体验和观察,这些AI歌曲的生成质量还有较大提升空间,而且基于歌曲来互动的需求也不强烈。因此我推测这个功能可能难以促成深度互动和实现长期留存。

还有一种社交存在于人和AI之间,之前GPT-4o的发布会上展示了模型的音乐能力,AI的交流互动方式变得更多样更自然,能聊也能唱。

这我联想到了电影《Her》里,AI女主跟随人类男主弹奏的尤克里里一起唱《Themoonsong》,以及博主@午夜狂暴哈士奇狗和她的ChatGPT男友(DAN模式)一起唱《TakeMeHome,CountryRoad》的场景。

和其他音乐人合作,比较慢,3年也没发几首歌,有了AI一个月能发好几首。

我询问了这位朋友关于营收的情况,头部的IP歌曲(明星、头部创作者)占据着最大的流量,而像他这样的素人创作者则需要购买流量来提升歌曲曝光进而获得相应的收益,因此还暂未实现盈利。

上述场景主要涉及非专业创作,而在专业创作领域,目前这波一键生成技术还无法辅助创作过程。

比如:在作曲过程中,AI基于已有的主旋律片段,提供拓展或变奏建议;在编曲过程中,AI提供乐器搭配建议,优化音乐整体结构。然而,目前的AI音乐大模型生成的是完整的歌曲音频,还有待技术创新来生成可编辑的MIDI文件。同时,也需要设计合理的交互方式,使其无缝嵌入到DAW中。

虽然这个AI功能还无法辅助专业人士,不过这个APP的视觉设计和动画真的很精致。

1、模型对提示词的理解有限,难以准确理解用户意图2、编辑歌词的方式不灵活,只有匹配联想或重新生成,无法通过对话来精确修改3、伴奏单一,采用了预设模板库,无法提供个性化的内容

最后,补充近几个月,AI音乐生成工具可控性方面的提升

1-Suno、Udio支持音频成曲

基于用户提供的音频片段来生成歌曲,音频可以是用户哼唱的旋律,敲击出的节奏,或者弹奏的和弦,生成方式会参考该音频的旋律或节奏或和弦进行(输入若带有音色,也会参考)。可以辅助创作者把自己的初步灵感延展为一个完整的作品。

我曾做了三段测试:

1、输入猫叫->输出一首Lo-Fi2、输入我的哼唱(两句杰伦的晴天)->输出一段民谣3、输入一段beatbox(来自网络)->输出一段rap

我的这个demo还意外地被Suno官方推特账号转发了

2-Udio局部修改

对某部分的旋律、歌词不满意,则可以进行二次修改,但不影响歌曲其他部分。

3-Udio重新混音

保持歌曲歌词和主旋律不变,转换为新的曲风。

remix前Adayinthelifeofaprofessionalimaginaryfriend,indiepop,tweepop

remix后Adayinthelifeofaprofessionalimaginaryfriend,jazz

从今年2月份我首次使用AI音乐工具至今,虽然自己觉得过了很久很久,但是这在生成式技术的发展历程里,也只是短暂的一瞬。

在实践和记录的过程里,我体会到生成技术发展给创作者带来的便利和惊喜。除此之外,我也学习到了一些音乐方面的基础理论知识,虽然依旧非常粗浅,但音乐鉴赏能力提升了,也更能体会到音乐的美妙和专业创作的不易,对创作者有了更深的钦佩和敬意。

最近一直在听《黑神话:悟空》交响乐版的《云宫迅音》和合唱版的《敢问路在何方》,每次都会涌起波澜壮阔的情感,音乐仿佛穿越了时光,带着每个人独有的回忆和感悟触动内心。AI会作为创作者手中的工具来提供辅助,而人类独有的情感体验、艺术创新,会成为音乐作品里最打动人心的部分。正如一位音乐人所说:

好作品可遇不可求,虽然有公式,但科学无法完全抵达答案。正是如此多的不确定性,音乐创作才如此美妙。

下篇将聊聊AI歌声合成/转换、AI音效生成这两个方向上的应用案例和代表工具。感谢阅读,下篇见。

THE END
1.求字体网提供中文和英文字体库下载识别与预览服务,找字体的求字体网提供上传图片找字体、字体实时预览、字体下载、字体版权检测、字体补齐等服务,本网站可识别中文、英文、日韩、书法等多种字体。只要上传图片或输入字体名称,就可以帮您找字体。http://qiuziti.com/
2.艺术字免费生产软件有哪些零代码企业数字化知识站1. 有哪些免费的艺术字生成软件? 艺术字生成软件是一种可以将普通文字转化为艺术字体的工具,让文本看起来更加美观和独特。以下是一些免费的艺术字生成软件推荐: –FontSpace:FontSpace是一个提供免费字体下载和艺术字生成功能的网站,用户可以在该平台上找到各种独特的艺术字体,并且还可以使用他们的在线工具将文字转化为https://www.jiandaoyun.com/blog/article/438217/
3.艺术字在线生成器资料大全www.meishuzi.cn查询结果美术字提供在线平面设计,艺术字体在线转换,艺术字在线生成,字体描边,字体特效,字体投影,字体立体效果,字体加粗,字体渐变,字体倾斜,字体特效,字体填充,banner图设计、广告店招在线设计!https://www.2898.com/website_49055.htm
4.有哪些艺术字生成软件APP推荐有哪些艺术字生成软件下载想要告别传统的文字模式,生成更加炫酷的字体,又或是设计最独特的艺术签名,那么有哪些艺术字生成软件2022?艺术字的设计其实很容易,只要下载小编介绍的这些软件,很轻松地就能帮你找到自己喜欢的艺术字模板。 No.1 字体美化大师 手机美化|73.73MB 在当今个性化时代,是否厌倦了手机单一乏味的字体样式和主题桌面?是时候让你https://www.wandoujia.com/bangdan/405953/
5.文字生成图片软件有哪些?让你文字转图片在线制作文字生成图片软件有哪些?让你文字转图片在线制作 随着互联网和社交媒体的普及,图片已经成为人们交流和表达的重要方式之一。然而,对于没有设计和绘画技能的人来说,制作一张具有专业质感和美感的图片并不容易。为此,文字生成图片应运而生。 文字生成图片是指通过输入文字或文本,软件自动生成一张图片,图片通常包含艺术字https://cloud.tencent.cn/developer/news/1032011
6.艺术字体生成器在线感谢您在茫茫网海进入到我们的网站,今天有幸能与您分享关于艺术字体生成器在线(艺术字免费生成)的有关知识,本文内容较多,还望您能耐心阅读,我们的知识点均来自于互联网的收集整理,不一定完全准确,希望您谨慎辨别信息的真实性,我们就开始介绍艺术字体生成器在线(艺术字免费生成)的相关知识点。 http://www.spshc.com/article/1987.html
7.字体转换器在线转换艺术字体在线生成器设计第一字体网为您提供最全的字体转换器在线转换、艺术字体在线生成器和字体下载,包括书法字体在线转换、毛笔字在线生成器,更有草书字体、篆体字、连笔字、POP字体转换器等中文和英文字体。https://www.diyiziti.com/
8.艺术字体在线生成器艺术字转换器请在下面输入文字后点击生成艺术字 字体 钟齐流江硬笔草体钟齐段宁行书造字工房版黑常规体造字工房悦黑细长体造字工房形黑细体造字工房形黑粗体造字工房尚黑粗体造字工房俊雅常规体汉仪菱心体简汉仪细等线简汉仪特细等线简汉仪中等线简毛泽东字体时尚中黑简体方正风雅宋简体方正铁筋隶书简体方正藏体简体方正粗谭黑简体https://www.zitibang.cn/
9.在线ASCIIbanner艺术字生成工具入门小站在线ASCII艺术字生成工具,SpringBoot banner生成工具 在线ASCII艺术字生成工具 ASCII:美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言.本工具可以在线生成SpringBoot banner,创建src/main/resourcehttps://www.cnblogs.com/rumenz/articles/14992856.html
10.和秋叶一起学PPT(第5版)阿酷字体网站提供了89款书法字体,包括段宁毛笔行书、尚巍手书体、默陌山魂手迹、汉仪秦川飞影等多款PPT高手们常用的书法字体。在网站顶部导航栏中切换到艺术字生成页面,我们还能使用同样的方法生成造字工房启黑体、站酷快乐POP设计字体等其他字体效果,非常方便。 https://labs.epubit.com/bookDetails?id=UB831725a36acde
11.2024最全盘点!AI音乐生成有哪些实用嘲和代表产品?因此,相比于注重艺术价值的音乐创作,功能型音乐的领域更容易被 AI 技术渗透和改变。在这波生成式 AI 浪潮前,已经有些早期的音乐生成技术应用在这个领域了。 功能型音乐具体有哪些类型呢? 一些预算有限的广告、游戏、影视、播客里的配乐 - 预算有限的项目,使用 AI 辅助生成配乐,可以更高效、更经济地满足需求。当然https://www.uisdc.com/ai-music
12.豆绘AI豆绘AI专业且免费的在线AI绘图设计平台,轻松创作无限可能豆绘AI首页AI绘图Flux创作文本出图以图出图MidJourney图片工具图片放大局部修改涂抹消除图片扩充AI抠图描述词提取PNG透明底素材图片美化线稿渲染照片转线稿多图融合3D渲染真人转动漫艺术字更多功能>建筑室内3D渲染线稿渲染材质转换毛坯房精装彩平图商品图商品场景图批量http://www.jujiwang.com/links/7b0d34d14164d8c5bb49.html
13.毛笔书法有哪些APP常用工具这里没法输入网址,你可以百度一下“第一字体网”,这是一个个书法字体在线转换器,不仅可以在线生成你说的楷书、行书、草书、隶书、篆书五大字体,还可以生成古代和近代各大书法名家的书法字体。转换后生成的字体图片可以分享到QQ空间、微博。具体信息你可以进去看一下它的详细介绍。 字体转换器网「艺术字在线生成」书法https://hao.gjw123.com/cygj/6199.html
14.广告语生成器1、现在网上有很多“logo在线制作,免费logo在线生成的网站”。不知道那个比较好,有没有推荐的。。。 2、logo生成器目前选什么样的更好?想了解情况。 YEELOGO是一款完全免费的logo设计工具,它的界面比较整洁,没有多余的东西,直接进入正题,工具提供了大量的免费素材可供使用,也可以上传本地素材,对素材进行了详细的分http://www.chile-dominios.com/zwfw/4250.html
15.文字转图片工具软件有哪些?将文字转图片生成器分享给你此外,有一些专门的文字转图片工具,例如文字转图片生成器、文字转艺术字等等,这些工具的使用非常简单,即使是没有设计基础的人也可以轻松地进行使用。 总的来说,文字转图片是一种非常实用的工具,可以让信息更加直观、易懂、生动有趣,适用于各种场景和应用,是我们日常生活和工作中不可或缺的一部分。 https://cloud.tencent.com/developer/news/1044554
16.酸梅汤创意简约手绘字体夏季饮料艺术字图片下载包图网提供精品模板下载,本设计作品为酸梅汤创意简约手绘字体设计夏季饮料艺术字,格式:PSD,像素:2344x2128,分辨率:72,下载即可获得源文件,作品可编辑修改,主体文字图片皆可替换,下载酸梅汤创意简约手绘字体设计夏季饮料艺术字就到包图网。https://m.ibaotu.com/sucai/18380162.html
17.有效构建幼儿园资源库(精选十篇)在筛选中需要收集那些获得公众认可的资料,尤其是一些一线名师的主题教学资料、教案等,或者教师们自己在工作中遇到的一些比较好的资料都可以附上,有条件还可以附上精美的艺术字、精美的模型挂图等,让一些有价值的材料得以完整地保存下来。其次收集到的资料必须做好各种分类统计工作,让老师们在材料入库时能清晰地展示每https://www.360wenmi.com/f/cnkeyciv1a2u.html
18.毛笔字在线生成器毛笔字体转换器默陌雅诗手迹 天空之城毛笔书法 站酷妙典和风体 字悦毛笔隶书毛笔字是中国传统书法之一,是几千年的历史文化发展而来,对中国文化有着深厚的影响力,毛笔字体丰富多样,练习者众多,毛笔书法是重要的文化传承!毛笔字生成器收录上百款字体,归类整理多位知名书法家字体供大家生成,还可调整大小,设置颜色及背景颜色等。链接http://www.akuziti.com/mb/
19.头像logo设计在线生成文字类头像最简单淘宝店或者自媒体,如果你的头像比较有特色,那么就会更加容易被客户或者读者接受,像是我们初期刚刚开始做一些淘宝店铺或者自媒体的时候,你往往不会有非常多的资金,所以头像问题一般都是自己解决的,请专业的设计师帮我们设计显然是不现实的,利用学的知识自己制作是更多人的一个选择,当然也可以利用头像logo设计在线生成平台https://www.niurensheji.com/article/design/4.html