ChatGPT最新综述!一文带你理清AI生成式内容挑战与解决方案W.Yentl

引用格式:YuntaoWangandYanghePanandMiaoYanandZhouSuandTomH.Luan,"ASurveyonChatGPT:AI-GeneratedContents,Challenges,andSolutions",inIEEEOpenJournaloftheComputerSociety,vol.4,pp.280-302,2023,DOI:10.1109/OJCS.2023.3300321.

1.引言

人工智能生成式内容(AIGC)是指利用生成式人工智能算法,根据用户输入或需求来协助或替代人类以更快的速度和更低的成本创建丰富、个性化、高质量的内容,包括文本(如诗歌)、图像(如艺术品)、音频(如音乐)、视频(如动漫)、增强型训练样本,以及3D互动内容(如虚拟化身、资产和环境)。作为PGC(ProfessionalGeneratedContent)和UGC(UserGeneratedContent)等传统内容生成范式的补充,AIGC范式具有广泛的应用前景,可以自动、高效、低成本地生产大量高质量内容,这对于元宇宙和数字孪生等各种新兴应用至关重要。例如,在交互式元宇宙游戏Roblox中,AIGC可以为avatar生成个性化的皮肤和3D游戏场景,使得用户在沉浸式的虚拟空间中游戏、合作和社交。根据Gartner预测,到2025年全球约10%的数据将由生成型人工智能算法生成。

在AIGC时代,更大的数据集是“燃料”,更大的基础模型充当“引擎”,而无限的计算能力则起到了“加速器”的作用。ChatGPT是由GPT-3.5模型微调而来,其训练数据集由接近1万亿个词的大约45TB的语料集构成。它集成了自监督学习、强化学习和提示学习等多种人工智能技术。ChatGPT训练所需的计算能力约为每天3640PetaFLOPs,相当于每秒计算10千万亿次,需要3640天来完成。在大数据、大模型和大计算力的工程化组合下,ChatGPT展示出了强大的涌现能力,可以学习新特征和更高级别的模式,并根据用户的多模态提示自动化创建有价值的内容。除了大规模训练数据和大算能力外,ChatGPT还集成了一系列新技术。例如,ChatGPT使用了思维链提示(CoT-prompting)技术[13],使预训练的LLM能够在少量数据和零样本学习环境下通过逐步推理来解释其推理过程。此外,它还集成了人类反馈增强学习(RLHF)来帮助ChatGPT更好地理解人类偏好,通过训练奖励模型和强化学习对LLM进行微调。此外,在计算机视觉领域,2022年创业公司StabilityAI开发的StableDiffusion和OpenAI开发的DALL-E2已经取得了巨大的成功,可从复杂和多样化的文本描述中生成高分辨率的图像。

尽管AIGC前景光明,但安全和隐私问题对其广泛应用构成了重大阻碍。在AIGC服务的生命周期中,可能会出现一些安全漏洞、隐私泄露、信任问题和道德问题,这些问题可能源自普遍的数据收集,智能模型/数据盗窃,到大量的网络钓鱼邮件的分发。

2.AIGC工作原理

本节首先介绍AIGC的发展路线图和使能技术,然后讨论内容生成范式以及知识表示和使用的范式转变,接着,介绍AIGC的通用架构、工作模式、关键特征和典型应用。

2.1.AIGC发展脉络

2.2.AIGC使能技术生成式AI算法、预训练大模型和多模态技术等多种先进AI技术的融合汇聚,正引领着AIGC范式的蓬勃发展。

2.3.内容创作的范式转变

AIGC范式以大规模生产、高质量输出和低单位成本的显着优势,如表II所述,正在革新当前内容生成的格局。借助ChatGPT等预训练大模型和CLIP等多模态技术,AIGC范式已经成为一种强大的产生不同类型的多样化内容的工具,其效率和经济性达到了无所匹敌的水平。

2.4.知识表示和使用的范式转变诸如ChatGPT和GPT4等AI大模型的出现,正在革新当前知识表示和使用的范式。正如表III所述,这一发展预计将对工业界产生持久的影响。

2.5.AIGC-as-a-Service架构

如图3所示,AIGC-as-a-Service(AIGCaaS)的体系架构涉及以下3个层次:(i)基础层,(ii)AIGC引擎层,以及(iii)AIGC服务层。

2.6.AIGC工作模式在未来,AIGC有潜力完全取代简单的和缺乏创造性的人类工作,并加速人机协作时代的到来。AIGC存在两种主要的内容生成模式:协助生成和自主生成。

2.7.AIGC关键特性在此部分,我们将讨论AIGC服务的关键特性:

2.8.AIGC应用及原型在此部分,我们将讨论不同类型的AI生成内容以及其应用:

3)音频生成。AI生成的音频有着广泛的应用,包括语音合成、音乐创作和声音设计。如AmperMusic这样的音乐创作AI程序,允许用户使用AI创建原创音乐。

5)3D内容生成。AIGC可以通过分析照片和视频等真实世界的数据来创建逼真的3D模型,AI生成的3D模型可以用来创建动画、游戏资产和产品设计。

7)跨模态生成。AIGC中的跨模态内容生成指的是使用基础AIGC模型在多种模态之间生成新内容。它包括文本到图像、图像到文本、文本到代码、文本到视频、文本到音频等。

表IV总结了代表性的AIGC原型及其应用。总之,AIGC使我们的生活更加便捷高效,但也带来了新的安全及隐私威胁、伦理影响和潜在的偏见问题,如下一节所示。

3.AIGC安全与隐私威胁

本节讨论了针对AIGC范式下安全和隐私问题的威胁,从以下四个方面进行分类:安全威胁、隐私威胁、信任问题和伦理问题。

3.1.AIGC安全威胁

3.2.AIGC隐私威胁

3.3.AIGC信任问题

3.4.AIGC伦理问题

小节:图4展示了AIGC服务的安全性和隐私威胁的分类。可以看出,现有的大多数AI安全和隐私威胁在AIGC领域仍然存在,甚至可能变得更加严重。例如,攻击者可以利用AIGC模型的能力生成大量中毒或对抗性样本,以增加攻击的影响。除此之外,由于AIGC模型可以动态地学习用户输入并从训练数据中记忆可能的敏感信息,从而引发新的隐私威胁,如从AImomory中盗取数据和在与AI交互期间泄露隐私。此外,AIGC的新特征(即快速、密集、低成本和多样化的内容生成)可能引入包括IP问题、越狱和提示注入等新型安全威胁。此外,AIGC服务引发持续的信任问题,特别是涉及接收内容的真实性(例如,接收到的图像和视频是否由AI生成)。此外,虽然AIGC服务可能彻底改变用户的生活,但它们可能引发严重的伦理问题,并更易于实施。因此,在设计AIGC系统之前,识别和解决潜在的安全威胁非常重要。我们需要从技术和监管的角度尽快提出有效和可行的对策。

4.AIGC的IP保护和监管

在本节中,我们首先探讨AIGC中的IP保护和监管方法。然后,我们回顾现有的基于数字水印的可监管的AIGC方案和面向AIGC数字水印的安全威胁和对策。

4.1.AIGC领域的IP保护和监管方法现有和潜在的AIGC领域中的IP保护和监管方法包括数字水印、加密、硬件、区块链和法律法规,如下:

小节:上述每种技术都具有独特的优点和局限性,可在组合使用中提供更好的保护,减轻知识产权侵犯的风险。随着AIGC技术的快速发展,开发新型产权保护和监管方法并与现有方法进行全面高效整合至关重要。

4.2.AIGC中基于数字水印的知识产权保护解决方案AIGC模型中的数字水印是一个两阶段的过程,包括(i)模型训练阶段的数字水印嵌入和(ii)模型发布后的数字水印验证。数字水印嵌入旨在将预先设计的向量或特殊激活模式插入到AI模型中。在完成水印嵌入后,AI模型公开发布并部署服务,当怀疑存在外部模型侵权行为时,模型所有者可以通过验证可疑模型来提取数字水印以证明所有权。

4.3.AIGC水印的威胁和对策

5.未来研究方向

在本节中,我们从以下几个方面指出了AIGC时代下的未来研究方向。

5.5.设计安全的AIGC服务为各种应用中对AIGC服务日益增长的需求,开发能够抵御攻击、保护敏感数据和保护用户隐私的安全设计的AIGC系统对减轻潜在威胁至关重要。设计安全的AIGC系统确保安全不是事后措施,而是系统架构设计中一个不可分割的部分。特别是,需要提前考虑到人工智能可能带来的潜在安全风险,并将安全措施嵌入到AIGC系统的设计和开发中。因此,其有助于减轻恶意攻击或系统中意外漏洞对数据隐私和安全可能产生的潜在威胁。对抗性鲁棒程度[110]是安全设计的AIGC系统的一个关键方面。它指代AIGC系统抵抗旨在欺骗或操纵系统等攻击的能力。因此,设计安全的AIGC系统可确保AIGC系统即使面临意外或对抗性输入,也仍然保持可靠和值得信任。诸如鲁棒优化[111]、对抗性训练[110]和防御蒸馏[112]等各种技术,都可以提高AIGC系统的对抗性强度。其中的开放性研究问题包括内生安全AIGC算法、新型主动防御、安全编程、严格测试、安全监测和隐私合规性等。

6.总结

ChatGPT和AI生成式内容技术的快速兴起带来了内容创造方面的重大进展。然而,它也带来了诸如越狱、数据盗窃、深度伪造和有偏见/有害内容等安全威胁。为跟上AIGC时代的进展,本综述从安全威胁与防御的角度对AIGC进行了全面的回顾。本文首先介绍AIGC的工作原理,包括其支撑技术、体系架构、工作模式、关键特征和典型应用。然后,指出了现有和潜在的GPT和AIGC中的安全/隐私威胁、信任、伦理问题。此外,综述了AIGC的最新监管解决方案,以及当前解决方案的挑战和限制。最后,讨论了AIGC框架的绿色、可解释、有效性、可问责和设计安全等方面的未来研究方向。本综述的主要目标是为AIGC提供工作原理、安全/隐私/伦理问题和潜在对策方面的综合洞察,并引领该领域更多的创新举措。

THE END
1.电子签名软件有哪些电子签章数字签名软件哪个好用2024年电子签名十大品牌最新发布,电子签名排行榜前十名品牌有e签宝、上上签、法大大、信步云、安心签、大家签、腾讯电子签、诚信签、一签通、密信。电子签名10大品牌排行榜由品牌研究部门收集整理大数据分析研究得出,帮助你了解数字签名软件哪个好。https://m.maigoo.com/maigoo/9380dzqm_index.html
2.AI写诗在线自动写诗软件藏头诗生成器请输入主题或关键词 五言绝句 五言律诗 七言绝句 七言律诗 字体设置 字号 字体颜色 背景设置 开始创作 在线写诗、创作藏头诗 在线快速生成 输入关键词后在线快速一键智能生成古诗 诗句连贯通畅 AI生成的诗句前后连贯通畅,上口容易记 诗体多样化 藏头诗,五言绝句律诗,七言绝句律诗多种诗体任意选 https://www.gaituya.com/aixieshi/
3.10款优秀的AI生成logo软件,简单易上手2.AI logo生成软件推荐 2.1 Pixso AI Pixso AI是在线矢量编辑工具Pixso的内置AI助手,基于人工智能AI,帮助用户完成创意探索。Pixso AI目前具备文生图、图标生成、AI翻译、灵感专家、设计规范生成、设计元素检查清单6大功。其中AI生成图标风格多样,可在线生成扁平、2.5D毛玻璃、3D、拟物、游戏、logo,满足多元化需求。Pixsohttps://pixso.cn/designskills/10-ai-logo-generation-softwares/
4.爆火的AI网站工具合集,30个自动生成内容网站推荐!在现今的技术驱动型社会中,人工智能(AI)的发展无疑是当之无愧的热门话题。每一次AI技术的进步,都会引发一阵媒体狂潮。今天,我们将介绍30个AI网站工具,它们不仅是AI领域的革新者,更是为不同领域提供了无限可能的解决方案。https://boardmix.cn/article/30-ai-website-tools/
5.昇腾学院昇腾AI处理器软件栈离线模型生成 以卷积神经网络为例,在深度学习框架下构造好相应的网络模型,并且训练好原始数据,再通过离线模型生成器进行算子调度优化、权重数据重排和压缩、内存优化等,最终生成调优好的离线模型。离线模型生成器主要用来生成可以高效执行在昇腾AI处理器上的离线模型。 https://blog.51cto.com/u_15214399/2810247
6.远光软件什么是AI? 人工智能(Artificial Intelligence),是一门综合了 计算机科学、生理学、哲学的交叉学科。凡是使用机器代 替人类实现认知、识别、分析、决策等功能,均可认为使 用了人工智能技术。作为一种基础技术,人工智能在很多 行业都有用武之地。 了解更多 https://www.ygsoft.com/zt/ai2018/index.html
7.AI写小说绘画剪视频,生成式AI更火了近日,生成式AI又火了!一个叫做「盗梦师」的微信小程序,上线一鸣惊人,达成了日增5万新用户的纪录。 盗梦师是一个能根据输入文本生成图片的AI平台,属于AIGC(AI-Generated Content,即人工智能生成内容)的分支。 在用户发挥想象,输入文字描述后,盗梦师便可生成1:1、9:16和16:9三种比例的图片,还有24种绘画风格https://36kr.com/p/1993822961414916
8.没有审核的ai绘画软件不用审核的ai绘画ai绘画生成器无审核飞翔游戏网为大家整合了一系列无需审核的ai绘画软件,近期ai人工智能相关的话题十分火热,在chatgpt横空出世之前,ai绘画已经范围性的火起来了,ai绘画软件随着市场的需求增多也越来越多地被开发出来,那么没有审核、无需审核的ai绘画软件有哪些呢?跟小编一起来看看吧! 其他绘画推荐: 免费的ai作图软件 画世界pro软件合集https://www.fxxz.com/k/myshdaihh/
9.AI人工智能sora视频生成制作教程,图文完整版软件方法步骤随着人工智能技术的不断发展,越来越多的领域开始应用AI技术进行视频生成制作。其中,AI人工智能sora是一款备受瞩目的视频生成软件,它能够将文字转化为高质量的视频内容。下面将详细介绍AI人工智能sora视频生成制作的教程,包括软件安装、基本操作、进阶技巧等方面的内容,帮助大家快速掌握这款软件的使用方法。 sora全部学习视频https://www.jianshu.com/p/086d7c9e90da
10.2023年10款好用的AI生成PPT软件盘点,干货建议收藏!AI生成PPT软件使用先进的人工智能算法,可在几分钟内生成具有专业外观的演示文稿,无需事先具备设计专业知识。 大多数AI生成PPT软件能够分析输入提示、生成相关内容,提供适当的布局和设计建议,并提供自定义选项。其中一些软件还带有额外的AI功能,例如从文本生成图片(即AI绘画)以及将文档一键转换为PPT演示文稿。借助AI生成https://www.hxsd.com/information/4891/