想象一下,你站在一片广阔的虚拟世界前,眼前是一幕幕由人工智能精心编织的影像——栩栩如生的人物、绚丽多彩的风景、扣人心弦的故事。这不是科幻小说的情节,而是大模型技术带来的现实。
2024年,随着Sora技术的璀璨登场,人们见证了智能创作的惊人突破,它不仅颠覆了传统影视制作,更在人工智能领域掀起了一场深刻的变革。
当伊隆·马斯克对Sora技术赞不绝口,称赞其为「人类愿赌服输」的创新时,我们就知道,这不仅仅是技术上的飞跃,更是对未来智能世界的一次大胆预言。从美国到中国,从一级市场到三级市场,生成式模型的热潮像涟漪一样扩散至全球每一个角落,激起了无数创业者和科技爱好者的无限遐想。
然而Sora模型并未开源,高昂的算力训练成本也让众多科研学者和开发者望而却步。
无论是视频生成、图像制作还是文本生成创作,都变得触手可及。
用户使用Open-Sora生成的视频Demo
想跑起来Open-Sora等AI任务,还需要有GPU等算力支持。目前主流的AI云主机有AWS、AutoDL、阿里云等。但GPU资源不仅昂贵稀缺,供应商普遍还要求使用者必须预先进行高额投入,按年或提前数个月预付定金。潞晨云不仅提供了便捷易用的AI解决方案,还为力求为广大AI开发者和其他提供了随开随用的廉价算力:
H800:最适合处理大规模模型(数十亿到上百亿参数),具有强大的分布式计算和数据处理能力。
H800配置:NVLink:GPU:8xH800-80GSXMNVLinkCPU:2x8470-52c内存:32x64G集群网络:8x400GRoCE系统盘:2x960GNVME本地存储:4*7.68TNVME
A800:适合大规模深度学习模型的训练和高性能计算任务,特别是在需要高内存和高带宽的情况下。
4090:适合中型到大型模型的训练和推理,适合作为高性能AI开发工作站。
使用FaceFusion等工具创作
AI换脸的数字人短视频绘
使用StableDiffusion和Open-Sora
等工具创作绘本故事
Crossin同学也使用潞晨云创作和投稿了一个绘本故事短视频。
2ollamaserve
3ollamarunllama3
2.绘图:有了剧本和提示词,作者接下来开始绘制插画。潞晨云默认提供了StableDiffusionWebUI的镜像,选择此镜像创建主机后(建议选择1卡H800机器),直接启动网页版的StableDiffusion。把llama3生成的提示词贴进去稍作修改,设定下出图的数量,就能得到与剧情配套的插图。然后UP主尝试使用了潞晨云提供的提供了OpenSora的镜像进一步将插图变为动态内容。
1cd/root/stable-diffusion-webuibashwebui.sh-f
3.配音:最后,UP主通过语音合成开源工具包Coqui-TTS给故事只做了一个朗读旁白。通过pip命令安装,支持包括中文在内的多种语言。
用tts命令把llama3生成的配图说明转成语音,再同前面生成的视频整合到一起。
1pipinstallTTS
4.最终的效果图
UP主说:「这个演示中,我用的都是基础模型和默认配置,大家可以在此基础上进一步微调和优化。虽然这几样功能,市面上都有现成产品可以实现。但对于学习AI的人来说,是要成为AI的产生者而不是消费者,所以还是得靠自己动手部署和开发。这种情况下,尤其对学生党来说,云服务的性价比就很高了。假设只有3000块的预算,买台带4090显卡的电脑就别想了,但在潞晨云上,4090的云主机按2块钱一小时,平均每天使用4小时来算,就能用上375天了。而且还能根据你的需求快速升级和扩容,这点上比自己的电脑还要方便。」
随着潞晨科技的这一创新步伐,我们正站在一个新时代的门槛上。这是一个由人工智能驱动的创作时代,一个充满无限可能的智能未来。潞晨科技不仅为我们打开了这扇门,更为我们展示了一个全新的创作世界。