生成式人工智能:发展演进及产业机遇

当OpenAI在2022年11月30日发布ChatGPT的时候,没有人会意识到,新一代人工智能浪潮将在接下来的6个月给人类社会带来一场眩晕式的变革。自2010年代初深度学习问世以来,人工智能进入到第三次高潮。而2017年Transformer算法将深度学习推向了大模型时代。OpenAI基于Transformer的Decoder部分建立起来了GPT家族。

ChatGPT一经面世便风靡全球,人们惊讶于其能够进行连贯、有深度对话的同时,也惊异地发现了它涌现了推理、思维链等体现智能的能力。伴随AI预训练大模型持续发展、人工智能生成内容(AIGC)算法不断创新以及多模态AI日益主流化,以ChatGPT为代表的AIGC技术加速成为AI领域的最新发展方向,推动AI迎来下一个大发展、大繁荣的时代,将对经济社会发展产生重大的影响。

AIGC大爆发的背后,普遍认为三个领域的AI技术的发展为其提供了肥沃的土壤,分别是生成算法、预训练模型和多模态技术。

第一,随着各种生成算法的不断创新突破,AI现在已经可以生成文字、代码、图像、语音、视频物体等各种类型的内容和数据。AIGC与过去最显著的区别是从分析式AI(AnalyticalAI)发展为生成式AI(GenerativeAI)。分析式AI模型是根据已有数据进行分析、判断、预测,最典型的应用之一是内容智能推荐;生成式AI模型则是学习已有数据后进行演绎、生成创造全新内容。

第二,预训练模型,也就是我们常说的大模型,引发了AIGC技术能力的质变。在过去,研究人员需要针对每一个类型的任务单独训练AI模型,训练好的模型只能从事特定任务,不具有通用性。而预训练的大模型技术显著提升了AIGC模型的通用化能力和工业化水平,让AIGC模型成为自动化内容生产的“工厂”和“流水线”。生成式AI模型,包括ChatGPT、GPT-4等大语言模型(LargeLanguageModels,LLM)和Midjourney、StableDiffusion等图像生成模型,又被称为基础模型(FoundationModels),其作为基于种类丰富的海量数据预训练的深度学习算法,展现出强大的、更加泛化的语言理解和内容生成能力。

第三,多模态AI技术的发展。多模态技术让AIGC模型可以跨模态地去生成各种类型的内容,比如把文字转化为图片、视频等等。进一步增强了AIGC模型的通用能力。[1]

·以下是AIGC领域的一些基本技术:

1)生成对抗网络(GAN,GenerativeAdversarialNetworks):

GAN是由IanGoodfellow等人于2014年提出的一种生成式模型。它由生成器(Generator)和判别器(Discriminator)两部分组成。生成器负责生成新的数据,判别器负责判断生成数据与真实数据的相似程度。通过不断的训练,生成器能够生成越来越逼真的数据。

2)变分自编码器(VAE,VariationalAutoencoders):

VAE是一种基于概率生成模型的生成式方法,它通过编码器(Encoder)和解码器(Decoder)两部分来实现数据的生成。编码器负责将输入数据映射到潜在空间中的一个分布,解码器负责从潜在空间中的分布采样数据并生成新的数据。

3)循环神经网络(RNN,RecurrentNeuralNetworks):

RNN是一种用于处理序列数据的神经网络结构。RNN具有记忆功能,能够捕捉序列数据中的时序信息。在生成式人工智能中,RNN可以用于生成文本、音乐等序列数据。

4)Transformer模型:

Transformer是一种基于自注意力(Self-Attention)机制的神经网络结构,它在自然语言处理领域取得了显著的成果。Transformer模型可以用于生成式任务,如文本生成、机器翻译等。

大语言模型等生成式AI技术带来了新的AI发展范式,其应用前景十分广阔。。对于大众而言,生成式AI意味着新的创造力工具,将在更大程度上解放个体的创造力和创意生产。除此之外,AIGC还将改变获取信息的主要方式。ChatGPT在寻找答案、解决问题的效率上已经部分的超越了如今的搜索引擎,ChatGPT或许在未来会改变我们获取信息、输出内容的方式,AIGC有望成为数字经济时代驱动需求爆发的杀手级应用。

比尔·盖茨将人工智能的发展和微处理器、个人电脑、互联网以及智能手机相提并论,认为其将重塑所有的行业。微软公司首席执行官SatyaNadella认为,ChatGPT是知识工作者的“工业革命”,断言人工智能将彻底改变所有类型的软件服务。目前,搜索、办公、在线会议等诸多软件服务都已融入了生成式AI的能力。OpenAI公司首席执行官SamAltman称,多模态的AI大模型有望成为继移动互联网之后的新的技术平台。这意味着,开发人员基于预训练的AI大模型,可以通过模型微调快速开发出垂直领域的模型应用并予以部署使用,人工智能的革命性正在于此。[2]

1.文本生成领域

ChatGPT(全名:ChatGenerativePre-trainedTransformer对话生成式预训练变换模型)是由OpenAI开发的一个人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练。ChatGPT目前仍以文字方式互动,可以解决包括自动文本生成、自动问答、自动摘要等在内的多种任务。

Jasper已经开始为谷歌、脸书等知名公司提供文案AIGC的商业服务。

2.图像生成领域

图像生成是AIGC技术中最为普遍的应用之一。StabilityAI发布了稳定扩散(StableDiffusion)模型,通过开源快速迭代大幅降低了AI绘画的技术使用门槛,消费者可以通过订阅旗下产品DreamStudio来输入文本提示词生成绘画作品,产品已经吸引全球50多个国家超过100万的用户注册。

3.音视频创作与生成

4.电影与游戏

生成式AI可以用于生成虚拟角色、场景和动画,为电影和游戏制作带来更多的创意可能。此外,AI还可以根据用户的喜好和行为生成个性化的故事情节和游戏体验。

5.科研与创新

生成式AI可以在化学、生物学、物理学等领域探索新的理论和实验方法,帮助科学家发现新的知识。此外,生成式AI还可以用于药物设计、材料科学等领域,加速技术创新和发展。

6.代码生成领域

经过自然语言和数十亿行代码的训练。部分生成式AI模型精通十几种语言,包括Python、JavaScript、Go、Perl、PHP、Ruby等等。能够根据自然语言的指令生成相应的代码。

GitHubCopilot是一个GitHub和OpenAI合作产生的AI代码生成工具,可根据命名或者正在编辑的代码上下文为开发者提供代码建议。官方介绍其已经接受了来自GitHub上公开可用存储库的数十亿行代码的训练,支持大多数编程语言。

腾讯云新一代AI代码助手CODINGWise:将大模型AI能力赋能给开发者,增强开发体验,提升开发效率。CODINGWise支持多种编程语言、主流开发框架和常用IDE。具备代码补全、生成单元测试、代码纠错等能力,能辅助开发者加速开发过程,提升开发质量。CODINGWise能力覆盖沟通、编码、评审等关键环节,包括:沟通环节:通过对话方式,进行上下文推理给出代码回复,帮助开发者理解代码逻辑;研发环节:根据当前代码类型、代码上下文等信息进行代码补全;能根据代码反向生成注释和单元测试代码;排错环节:进行代码查错、定位问题并辅助生成建议;随后给出建议代码、替换错误的代码块;评审环节:辅助开发者生成代码提交信息,也可以辅助评审者生成评审建议;调试环节:可通过自然语言指令实现快速的代码修改和调优。

7.内容理解与分析

腾讯会议·AI小助手:只需通过简单自然的会议指令,基于对会议内容的理解,就可以完成信息提取、内容分析、会管会控等多种复杂任务。会后可以自动生成智能总结摘要,还能基于智能录制的能力,帮助用户高效回顾,提升用户开会和信息流转效率。

彭博社于近期发布了为金融界打造的大语言模型(LLM)——BloombergGPT。它使用了类似于ChatGPT的技术原理,即使用Transformer模型和大规模预训练技术来实现自然语言处理,拥有500亿参数。BloombergGPT的预训练数据集主要来自彭博社的新闻和金融数据,构建了一个3630亿个标签的数据集,支持金融行业的各种任务。

8.AI智能体(AIAgent)

AI智能体(AIAgent)被认为是OpenAI的下一个方向。从今年3月AutoGPT推出后,GenerativeAgent、GPT-Engineer、BabyAGI项目的爆发将LLM的叙事代入了新的阶段,从“超级大脑”到真正有可能成为“全能助手”。

2023年4月,一个名叫AutoGPT的开源项目在Github上发布了,截止至2023年4月16日,该项目已经获得70K+星。AutoGPT是一个由GPT-4驱动的可以自主实现用户设定的任何目标的开源应用程序。当用户提出一个需求或任务时,AutoGPT会自主分析问题,给出具体的执行计划并开始执行,直到完成用户提出的要求。

尽管Auto-GPT还在非常早期的实验阶段,但其开创了一种全新的AI交互方式,即由机器主动提出任务和计划,人类只需要给出任务目标。这种交互方式不仅提高了AI智能体的自主性和灵活性,同时也拓展了人与AI之间的交互方式,打破了人类对于人工智能的“控制”想象,使得人工智能技术能从“工具”走向人类的“伙伴”。

除了独立的AIAgent之外,未来还可能出现由多个AI智能体组成的“虚拟智能社会”。GenerativeAgents—在由斯坦福大学和谷歌联合发表的一篇名叫《GenerativeAgents:InterativeSimulacraofHumanBehavior》论文中,研究者们成功地构建了一个“虚拟小镇”,其中的25个智能体在小镇上生存。借助AIGC,其中的NPC具备了可信人类行为,并对周围环境变化做出适当的反应,使得可以用现实社会现象去填充赛博空间。

1.可解释性与可靠性

生成式人工智能的可解释性问题是指生成式人工智能(GenerativeArtificialIntelligence)所产生的结果难以解释或理解。生成式人工智能是一种基于深度学习的人工智能技术,其通过学习大量数据来生成新的数据或图像。但是,生成式人工智能所产生的结果通常很难理解和解释,因为其内部的运作过程非常复杂,而且很难直观地描述。

这种可解释性问题对于许多应用场景都非常重要,比如医疗诊断、金融风控、自动驾驶等领域。在这些领域中,人们需要了解生成式人工智能的内部运作过程,以便更好地理解其产生的结果,并且能够对其进行调整和优化。

解决生成式人工智能的可解释性问题是当前人工智能研究的一个重要方向,研究人员正在探索各种方法来使生成式人工智能的结果更加可解释和可理解。这些方法包括可视化技术、可解释性模型、对抗性样本等等。

2.AI大模型的价值对齐问题

所谓人工智能的价值对齐(AIAlignment),就是让人工智能系统的行为符合人类的目标、偏好或伦理原则。价值对齐是AI安全研究的一个核心议题。在理论上,如果一个强大的AI系统所追求的目标和人类的真实目的意图和价值不一致,就有可能给人类带来灾难性后果。就目前而言,大语言模型的价值对齐问题主要表现为,如何在模型层面让人工智能理解人类的价值和伦理原则,尽可能地防止模型的有害输出,从而打造出更加有用同时更加符合人类价值观的AI模型。在这方面,RLHF是一个有效的方法,通过小量的数据就可能实现比较好的效果。简言之,RLHF要求人类专家对模型输出内容的适当性进行评估,并基于人类提供的反馈对模型进行优化。其目标是减少模型在未来生产有害内容的可能性。实际上,RLHF算法不仅是确保AI模型具有正确价值观的关键所在,而且对于生成式AI领域的长期健康可持续发展也十分重要。[4]

3.塑造负责任的AI创新生态

大语言模型等生成式AI的进展,在让人们看到AGI曙光的同时,也带来更加复杂难控的风险,包括对人类未来生存的潜在风险。AI时代需要成为一个负责任创新的时代,而非另一个“快速行动、打破陈规”的时代。人们需要建立合理审慎的AI伦理和治理框架,塑造负责任的AI生态,打造人机和谐共生的未来。生成式AI领域的创新主体则需要积极探索技术上和管理上的安全保障措施,为生成式AI的健康发展和安全可控应用构筑起防护栏。

在科技向善理念之下,人工智能时代不应成为另一个“快速行动、打破陈规”的时代(即先快速把产品做出来,事后再通过修补、补救等方式解决其社会问题),而应成为一个负责任创新的时代,通过建立合理审慎的AI伦理和治理框架,塑造负责任的AI生态,打造人机和谐共生的未来。[5]

1.多模态带来创新应用蓝海

多模态AI是指能够处理和理解多种类型信息的人工智能,如文本、图像、音频、视频等。这种AI不仅能够处理单一数据类型的任务,而且可以在不同数据类型间建立联系和融合,从而实现一个综合、全面的理解多模态。AI能够对各种不同类型的数据进行关联分析,为解决复杂问题提供支持。

在多模态技术发展初期,不同模态的AI开始进行集成,比如图像识别和自然语言处理技术的结合。除了ImageBind打通六种模态外,多数仍在探索文本与图像的融合,但进展飞快。UniDiffuser:除了单向文生图,还能实现图生问、图文联合生产、无条件图文生成等多种功能。

随着多模态技术的进展,多模态AI在理解和处理不同类型数据时能够实现更高程度的融合。算法和模型可以在不同数据类型之间建立联系,提取跨模态的共享信息。这使得AI能够深度理解和解决复杂问题。未来在诸多创新领域,多模态技术的发展将带来创新应用的蓝海。[6]

2.生成式AI带来更贴近人的交互方式

从使用键盘-鼠标等方式跟电脑交互,到使用手指滑动屏幕跟手机交互,再到人们用唤醒词跟智能音箱等交互,人机交互从识别机器指令,到识别人的动作,语音,不断朝着更贴近人的习惯的交互方式演进。生成式AI的发展,让人类有史以来第一次有机会用自然语言的方式,来跟机器对话,而机器也借由大模型拥有了极强的理解人类语言的能力,有望带来一场全新的交互变革。正如历次交互变革带来从终端、到连接,到各类应用的颠覆式变革,生成式AI也必将带来产业链、价值链和生态的重塑。

生成式AI的技术突破,带来了大模型理解能力的大幅提升。大模型可以更好地理解人类表达的含义,并生成更符合人类价值观的回答。其技术成熟度已经可以在很多场景下达到可用,甚至好用的程度。在科技公司不断投入对齐工作的进展中,大模型的“幻觉”被持续降低,从而让人类第一次有可能完全以自然语言对话的方式来跟机器交流。这也是人去发掘机器智能最简单直接,最有效的交互方式。

[1]腾讯研究院.AIGC发展趋势报告2023[R].2023[2]陈楚仪、曹建峰.AIGC技术的发展趋势、影响和展望[J].2023.中国银行业[3]宋嘉吉等.Auto-GPT评测——更聪明的AGI[R].2023[4]曹建峰.迈向可信AI:ChatGPT类生成式人工智能的治理挑战及应对[J].2023.上政学报

THE END
1.AI生成3D模型再进化!距离真实模型师还有多远?实测结果一览!生成的一个角色模型 质量也是相当哇塞 稍微修修细节 用作3D打印也挺不错 那么这个质量 和真实的艺术家作品相比 到底差多少 小编做了个实验 先找来一个艺术家的模型 ?这个结构比较简单 主要测试一下AI的硬表面能力 ?我截了一张图上传给Tripo? 虽然只有一个角度? 但生成的结果竟然和原模型非常接https://dy.163.com/article/JCI7OK4R0514CVVN.html
2.AI3D模型生成器怎么选?这4个关键因素你不能忽略这两年,AI驱动的3D模型生成器爆发式增长,越来越多的公司和设计师开始使用AI 3D模型生成器。那如何选择适合自己的AI 3D模型生成器呢?以下四个关键因素你千万不能忽略。本文还附2024年排名前 5 的 AI 3D 模型生成器供大家参考使用,感兴趣就看下去吧! https://blog.csdn.net/LhcyyVSO/article/details/140128441
3.AI自动生成创意视频:如何让大模型助你一臂之力在科技日新月异的今天,人工智能不仅仅局限于数据分析或自动驾驶等领域,其在创意产业中的应用也越来越广泛。那么,能不能让大语言模型与AI视频生成模型联手,为我们带来高度个性化且极富创意的视频内容呢?本文将介绍如果通过输入几个关键词让大模型帮助我们生成创意视频。其中用到了OpenAI,Huggingface开源库,LangChain等技https://www.51cto.com/article/771753.html
4.什么是ai自动生成在过去的几年中,人工智能(AI)技术一直在迅速发展,并且已经被广泛应用于各种不同的行业中。其中之一是AI自动生成。那么什么是AI自动生成呢? AI自动生成是指使用自然语言处理(NLP)和机器学习技术来自动创建文本内容的过程。这些内容可以包括文章、博客文章、新闻报道、产品描述和广告文案等。AI自动生成技术可以帮助企业和https://tool.a5.cn/article/show/39859.html
5.妙话AI:在线智能写作应用,自动生成绘画语音对话机器人新媒派妙话AI,为您研制的在线AI智能体集合平台,根据您的需求轻松实现智能写作、模拟角色语音对话、自动绘画生成;大量AI机器人让您快速上手;轻松完成您的AI工具需求。https://pidoutv.com/sites/13848.html
6.了解人工智能生成内容(AIGC)的基本原理和应用人工智能生成内容(Artificial Intelligence Generated Content,简称AIGC)是指利用人工智能技术和算法来自动生成各种形式的内容,例如文章、新闻、广告、代码等。AIGC的发展可以追溯到机器学习和自然语言处理等领域的进展,以及深度学习模型的快速发展。 ? AIGC的发展历程 AIGC的发展历程可以追溯到上世纪50年代的机器翻译研https://www.skycaiji.com/aigc/ai11801.html
7.自动生成一个完整的Revit模型,这是AI干的?!(2/3)#BIM#BIMBOX#自动生成一个完整的Revit模型,这是AI干的?!(2/3)#BIM #BIMBOX #建筑 #工程 #数字化 #AI #自动化 #数字化 #智能 #人工智能 #模型 #三维 #BIMBOX进步学社 - 建筑科技BIMBOX于20230219发布在抖音,已经收获了3.8万个喜欢,来抖音,记录美好生活!https://www.douyin.com/video/7201823980163042615
8.AI自动生成绘画软件,图生图功能免费使用随着科技的飞速发展,艺术创作领域的创新也日新月异。其中,人工智能绘画软件尤为突出,它已经无所不在,从平面设计到动画制作,甚至于雕塑艺术,无一不在人工智能的影响之中。本文将介绍一款AI自动生成绘画软件:Pixso AI,深入探讨这款软件的功能,AI绘画教程以使用体验。 https://pixso.cn/designskills/ai-automatic-generation-painting-software/
9.人工智能在法官裁判领域的运行机理实践障碍和前景展望人工智能辅助办案引发深刻的裁判结构性变革,可能导致庭审虚置化、判决同质化、司法碎片化和算法模型代替法官裁判等溢出效应。司法裁判是一个复杂的判断和决策过程,融合了法官技术理性和经验理性,人工智能无法替代法官自由裁量权,也无法实现实质正义。未来,应当明确法律人工智能是辅助性而非替代性的司法实践工具,法官在具体https://www.thepaper.cn/newsDetail_forward_5264350
10.一键AI绘画怎么智能生成画作?AI自动生成绘画软件推荐(1)AI绘画的概念:AI绘画是利用人工智能技术进行绘画创作的一种方式。在AI绘画中,计算机会通过机器学习算法学习大量的绘画作品,然后使用这些学习到的知识来生成新的艺术作品。 (2)AI绘画的原理:AI绘画是将一张输入的图像进行分析和处理,然后生成一张与之相关联的新图像。为了实现这一过程,AI绘画模型需要经过训练,通https://www.xunjiepdf.com/25482
11.《2020科技趋势报告》:AI和中国,成为未来科技世界关键词研究人员使用大量的三维模型、转换成三维模型的图像和从不同角度显示物体的二维图像训练神经网络。结果:一个新的系统,可以渲染三维模型,无需任何人为干预。实际应用包括仅使用二维图像自动生成环境真实模型的机器人。 3.2 神经符号人工智能算法与系统 人工智能的发展一直走在两条概念轨道上:符号(机器使用表示概念的知识和https://www.tmtpost.com/4274113.html
12.上海科技党建近日,上海人工智能实验室(上海AI实验室)联合香港科技大学、德国图宾根大学、香港大学推出首个大规模自动驾驶视频生成模型GenAD,通过预测和模拟真实世界场景,为自动驾驶技术的研究和应用提供支撑。 视频生成模型GenAD进一步拓宽了自动驾驶技术的研究路径,结合此前推出的端到端自动驾驶模型UniAD、“语言+自动驾驶”全栈数据集https://www.shkjdw.gov.cn/c/2024-03-22/531951.shtml
13.什么是生成式AI?IBM生成式 AI,有时也称作gen AI,是一种人工智能(AI)。生成式 AI 能够创建原创内容(例如文本、图像、视频、音频或软件代码)以响应用户的提示或请求。 生成式 AI 依赖于复杂的机器学习模型,称作深度学习模型,即模拟人脑学习和决策过程的算法。这些模型的工作原理是识别大量数据中的模式和关系并对其进行编码,然后使用这些https://www.ibm.com/cn-zh/topics/generative-ai
14.什么是生成式AI生成式AI的定义与应用SAP生成式人工智能(生成式AI)是一种人工智能模型,能够创作各种格式的新内容,例如文本、音频、图片和视频等。生成式人工智能的应用和用例十分广泛。例如,生成式人工智能可以根据特定作者的写作风格创作短篇小说;生成虚构人物的真人形象;以著名作曲家的风格谱写交响乐;根据简单的文本描述创作短视频。 https://www.sap.cn/products/artificial-intelligence/what-is-generative-ai.html
15.一文读懂“生成式AI”腾讯云开发者社区生成式 AI 的定义 生成式 AI 的工作原理 生成式 AI 模型的分类 生成式 AI 的应用 二、生成式 AI 介绍 2.1 生成式 AI 的定义 人工智能不等于机器学习 人工智能是关于赋予机器以模拟人类智能的能力的广泛领域。它涉及使计算机系统能够执行类似于人类智能的任务,如语音识别、图像识别、自然语言处理和决策制定等。 https://cloud.tencent.com/developer/article/2286454
16.生成式AI:定义工作原理和示例生成式AI的简单定义是什么? 生成式AI是一种人工智能技术,广义上指的是能够生成文本、图像、代码或其他类型内容的机器学习系统,通常是作为对用户输入提示的回应。 生成式AI模型越来越多地被整合到在线工具和聊天机器人中,使用户能够在输入框中输入问题或指令,随后AI模型将生成类似人类的回应。 https://www.jianshu.com/p/7cdca5f0048a
17.生成式人工智能生成式人工智能生成式人工智能是指一类能够自动生成全新的、真实的、有用的数据的人工智能技术。这些技术包括文本生成、图像生成、音频生成、视频生成等。生成式人工智能基于深度学习技术,通过训练神经网络来学习数据的内在结构和模式,从而生成与真实数据相似的新数据。生成式人工智能在许多领域都有广泛的应用,如自然语言处https://vebaike.com/doc-view-2917.html
18.“全要素生成”会是未来的游戏形态吗?一文看懂AIGC在游戏领域的从作者个人视角探讨AIGC引发游戏形态革命的可能性,畅想科幻电影中的情境何时照进现实 AIGC定义:AIGC即AI Generated Content,又称生成式AI,即人工智能生成内容。在量子位《AIGC内容产业展望报告》 中,将AIGC定义为基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关https://www.youxituoluo.com/530782.html
19.一文搞懂ChatGPT相关概念和区别:GPT大模型AIGCLLMChatGPT横空出世后,伴随而来的是大量AI概念,这些概念互相之间既有联系也有区别,让人一脸懵逼,近期大鱼做了GPT相关概念的辨析,特此分享给你。 1)Transformer 2)GPT 3)InstructGPT 4)ChatGPT(GPT3.5/GPT4.0) 5)大模型 6)AIGC(人工智能生成内容) 7)AGI(通用人工智能) https://blog.itpub.net/70027828/viewspace-2953696/
20.什么是生成式AI?它是如何工作的?Oracle中国甲骨文公司董事会主席兼首席技术官 Larry Ellison 在 2023 年 6 月的电话会议上表示,未来几年,很多公司都会训练自己的专业化大型语言模型。 生成式 AI 与 AI 的区别 人工智能(AI) 是一个庞大的计算机科学领域,而生成式 AI 是其中的一小部分,至少目前是如此。当然,生成式 AI 与传统 AI 有着许多共同的属性,https://www.oracle.com/cn/artificial-intelligence/generative-ai/what-is-generative-ai/