何宝宏,中国信息通信研究院云计算与大数据研究所所长
当前,人工智能生成内容的种类、质量、灵活度持续增强,技术应用的边界也在不断打破,未来很可能会对现有的产业和法律规范带来冲击。
漫画曹一
什么是AIGC和ChatGPT
人工智能生成内容(ArtificialIntelligenceGeneratedContent),简称AIGC,本质上是以生成式人工智能为核心技术的内容创作范式。总体上,可以将AIGC概括为伴随着网络形态演化和人工智能技术变革产生的一种新的生成式网络信息内容。
ChatGPT(ChatGenerativePre-Training),是一个典型的生成文本的AIGC应用,是由美国人工智能公司OpenAI于2022年11月推出的一款聊天机器人软件,因其可快速地对各种问题进行回答而风靡全球,上线两个月后用户破亿,是史上增速最快的消费者应用。有人将ChatGPT概括为“聊天机器人+知识检索+文本生成工具”,其本质是一个应用在对话场景的语言模型,能够回答后续问题、承认错误、质疑不正确的前提以及拒绝不适当的请求。据统计,其支持的任务类型达49种,覆盖大部分主流语言任务,可按照要求生成用于不同场景、不同形式的文字,包括邮件、小说、论文和代码等,已初步具备通用智能产品特征。
2018年,OpenAI公司曾发表论文,介绍了生成式预训练语言模型(GPT)的概念。GPT是神经网络受人脑结构和功能启发的机器学习模型,可以在人类书写的文本数据集上进行训练并执行许多功能。ChatGPT高度依赖于微软的算力支持,其作为第3.5代GPT模型,充分发挥了监督指令微调和从人类反馈中强化学习等技术作用,使得其能够理解多轮对话以及表现得更接近人类。此外,与第一代GPT相比,ChatGPT训练数据量有约万倍的扩充。
以ChatGPT为代表的自然语言处理大模型技术,将促使AI(人工智能)产业进一步带动生产力变革,极大冲击现有研发路线,发展方式或将迎来新拐点。
带动一批创新应用
从应用范围上来看,ChatGPT将带动一批创新应用。
对话类应用:以智能客服、智能外呼等产品服务为代表,主要应用行业为银行、证券等具备大量客服场景的企业。
语义理解和信息检索类应用:以大规模知识图谱、企业知识库产品等为代表,应用行业包括法律咨询等。
各类代码纠错和生成类应用:以代码智能生成、代码辅助开发产品等为代表,主要应用行业为互联网等。
各类文案、新闻、图片生成和创造类应用:如文案自动生成、新闻自动宣传等,主要应用行业为媒体等。
变革与风险并存
首先,AIGC将极大提高整个人类社会的劳动生产率,使整个人类社会更加智慧、精准和高效,同时改变人们工作、学习、生活和娱乐等生活方式。例如,一些重复性的文字创作、咨询及客服工作将被ChatGPT所取代,人们可以通过ChatGPT快速获取和学习知识,也可以创造出更多的数字生活和娱乐服务内容,给大众带来全新的体验。
其次,AIGC有望满足日益增长的数字内容需求。数字世界的繁荣离不开数字内容的丰富,AIGC可以辅助人们快速、灵活地生成数字内容,在绘画、诗歌、作曲等艺术创作领域大放异彩,既激发广大用户使用AIGC进行“创作”的热情,也极大地提升数字内容的供给能力。
随着以ChatGPT为代表的AIGC应用的不断扩大化,也存在几方面风险。
一是,会带来一些伦理和治理问题。比如,因为预训练数据的不完整性以及本身可能带有的偏见、恶意及道德伦理的问题,使其可能会在某些场景下输出违背当地社会价值观的内容等。
三是,AIGC恐极大增加互联网内容监管难度。当前,机器深度学习后生成的内容愈发逼真,且应用门槛也在不断降低,人人都能轻松实现“换脸”“变声”,甚至成为“网络水军”中的一员。由于造假内容生产者具有分散性、流动性、大规模性和隐蔽性的特点,将导致追踪难度和复杂性与日俱增,对内容监管行动造成严重阻碍。
发展前景和趋势
当前,AIGC行业仍处于早期摸索期,未来随着技术的不断突破,将不断扩展AIGC的应用场景。
二是产品类型逐渐丰富。近年来,随着元宇宙概念的兴起以及科技进步而快速发展的数字人是未来AIGC应用的一个重要细分赛道。未来产品将使得多重信息感知和认知能力以数字化的形式传输,并指导人工智能进行内容创作。