关键词:大模型;人工智能;生态型商业模式
作者戎珂,清华大学社会科学学院教授(北京100084);康正瑶,布里斯托大学商学院助理教授;罗怡宁,浙江大学管理学院研究员(杭州310058)。
引言
随着ChatGPT的问世和在全球范围的爆火,大模型正在逐渐成为引领技术和产业革命的新兴力量。大模型(LargeModel),又称为基础模型(FoundationModel)或通用模型(GeneralModel),属于一种相对较大的人工智能预训练模型。这些大模型采用迁移学习的方法,首先在大规模的公开数据集上进行训练,利用深度神经网络构建出AI模型,随后这些预训练模型可被迁移到目标场景进行微调,并实现应用创造价值。
从发展历程来看,人工智能的演化已经历经了三个阶段,但是在商业化和产业落地方面似乎一直面临着问题,可以说历经了三次挫折。1956年夏,在美国达特茅斯大学召开了一次关于机器智能的学术研讨会,会上正式采用了“人工智能”这一术语。尽管人工神经网络的概念可以追溯到20世纪40年代和50年代,但在发展早期由于算力算法等条件都不成熟,这一时期的探索停留在理论阶段。20世纪70年代起,人工智能发展进入第二阶段,第五代计算机的问世带来了算力和算法的进步,但是数据成了主要的障碍,因为不足以计算和积累海量数据,此时与人工智能技术的商业化也有较大距离。直到21世纪第二个十年,人工智能技术才迎来了新一轮发展,这一变革主要得益于硬件技术的进步(如GPU)、算法的优化和大规模数据集的可用性。人工神经网络的演进和深度学习的崛起代表着人工智能领域的重大转变。深度学习作为人工智能的一个子领域,强调训练多层次的深度神经网络。这一技术的兴起为大模型的发展铺平了道路,并成为当今人工智能领域的重要支柱之一。但是目前看来,在商业化方面,由于应用场景和行业知识缺乏的问题,这一阶段人工智能仍未实现大规模商业化运用,也成为亟待解决的问题。
从大模型的发展历程可以看出,尽管起步很早新技术不断涌现,大模型的发展仍历经挫折,特别是商业化应用和应用场景落地困难重重,这是因为前期算力、算法、算据等条件还不成熟,而目前也需要进一步寻找和探索应用场景,解决具体应用场景的问题,创造实际价值真正赋能万行万业。展望未来,尽管大模型的前景光明,但仍面临着一系列的技术挑战,包括计算资源、数据偏见和模型解释性等问题,更需要解决长期以来在商业化落地方面的障碍。在用户端掀起浪潮后,大模型将如何进一步赋能产业,实现商业化落地,带来万行万业的升级与革命?在这个充满机遇和挑战的背景下,本文将聚焦大模型如何商业化这一研究问题,探讨大模型的定义、发展现状以及商业化应用的发展机遇。
大模型的产业化落地和商业化应用需要培育生态型商业模式,构建大模型产业生态体系。本文首先将大模型产业生态分解为四个层次,包括数字基础设施层(L1)、通用大模型层(L2)、行业模型层(L3)和场景模型层(L4)。在这四个层次中,数字基础设施提供了大模型训练和推理所需的基础设施,通用大模型为各行各业的应用提供了通用性的基础构建模块,行业模型通过融合特定行业的数据和特征,提供了更专业化的大模型,而场景模型则进一步细分,专注于解决特定场景或问题的需求。
基于此,本文提出了生态型商业模式的关键概念。与传统商业模式不同,生态型商业模式由更广泛的生态成员组成,包括通用平台和多元的生态伙伴。生态型商业模式强调能力共享和能力组合,企业不再仅提供单一的产品和服务,而是根据自身优势和禀赋,培育和提供不同侧重的能力,并通过能力的灵活组合以满足各种不同场景的需求。在大模型产业生态中,各级别的生态成员,包括政府、行业协会、数字企业、各行业龙头企业和中小企业等,共同参与,协同合作,构建一个具有开放性和创新性的生态系统,推动大模型在各行各业的应用和发展。本文将探讨如何通过培育生态型商业模式和构建大模型产业生态体系,将大模型的力量充分落地于各行各业,推动全面的数字化转型和智能化发展。
一、大模型发展的机遇和挑战
大模型的发展受到多个关键因素的影响,这些因素既提供了机遇,也带来了挑战。
在算法方面,大模型的发展取得了显著进展,这为各种任务的高效训练和部署提供了新的机遇。新的深度学习架构和优化技术不断涌现,如Transformer架构的提出,极大地推动了自然语言处理任务的发展。这些新算法使得大模型在各个领域中的发展取得了重大的突破,使大模型更加智能。然而,其也带来了进一步的挑战。大模型在运用到各类多元化的应用场景的过程中,需要面向该领域的算法人才的补充和算法技术的进步。为了实现卓越性能,大模型需要更海量的数据和更复杂、精细的算法,实现不断优化迭代。这意味着需要进行更多的专业研究来改进训练算法,同时也需要更多的标注数据,要求持续的大投入、高成本,这对于许多企业来说将成为最大的制约因素之一,特别是资源相对缺乏的中小企业。
在算据方面,海量数据是大模型发展的关键要素之一。互联网上积累的大量数据为大模型的训练带来了巨大的机遇,包括文本、图像、音频、视频等多种形式的数据为多领域的任务提供了训练的基础。然而,算据的积累需要大量的标注工作,特别是高质量算据往往需要企业投入大量成本、雇佣专业团队进行标注,比如OpenAI对GPT模型的训练就投入了普通企业难以负担的成本,因此高质量算据缺乏也将成为大模型普及的瓶颈之一。另外,数据的质量和隐私问题一直是一个饱受争议的话题,目前仍缺乏统一标准,一定程度上将阻碍大模型未来的规范健康发展。同时,不同于互联网数据,许多领域的可用数据可能非常有限,难以训练出高性能的大模型。在未来的发展中,数据分类、数据采集、数据管理和数据安全保障等环节对于大模型的发展都至关重要。
最后,大模型在经济社会层面的影响也意味着大量的机遇和挑战。大模型的发展不仅仅涉及技术问题,还会产生广泛而深远的社会影响。首先,大模型的大量计算需求导致高能耗和碳排放问题,未来需要寻找更为可持续性的人工智能解决方案,以减轻其对环境的负面影响。其次,随着大模型的力量愈发强大,其使用也引发了伦理担忧,包括生成虚假内容、深度伪造(Deepfake)技术的滥用、误导信息传播等,这些都需要社会共同努力来解决。
二、大模型产业的生态层次
目前大模型的发展已经给产业变革和生产力的提高带来了新的机遇,但是我们也可以看到,目前大模型的应用落地情况并不乐观,处于一个分散探索的状态,缺乏整体体系。如何将大模型的力量更紧密地和万行万业的产业落地相结合?本文提出,各方需要应用生态培育思维,联合多层次生态伙伴,构建生态型商业模式,共同打造大模型产业生态体系。
本文认为,大模型产业生态的生态层次可以解构为四层,如下图所示,包括L1数字基础设施层、L2通用大模型层、L3行业模型层、L4场景模型层。
(一)L1:数字基础设施层
数字基础设施是以数据创新为驱动、通信网络为基础、数据算力设施为核心的基础设施体系。数字基础设施层包括“硬软云网”等主要组成部分,比如数字硬件(主要包括CPU、GPU、智能芯片)、数字软件(主要包括数据库、中间件和操作系统)、数字云服务/计算和数字网络设施(指5G和工业互联网)。数字基础设施是数字经济和生活发展的基石,也是大模型产业发展的重要底座。大模型的训练需要高算力的支持、更专业的软件工具和算法框架,云计算为大模型的发展提供了更弹性的计算资源,高性能网络基础设施则确保了快速的数据传输和模型推理,5G技术的发展将进一步改善移动应用中大模型的性能。因此,数字基础设施层是大模型产业生态不可或缺的一个层次。
(二)L2:通用大模型层
通用大模型是指那些能够提供最基础、最底层的人工智能能力的模型,它们在多个行业和场景中都具有广泛的通用性。通用大模型具有多种基础的核心AI能力,包括自然语言理解、图像识别、语音识别和处理等,可以类比为一个人的基础五感,提供了大模型产业发展的基础构建模块,这种底层通用能力为进一步在各行各业的应用提供了坚实的基础。
国内通用大模型的发展也如火如荼。我国互联网科技巨头公司包括百度、腾讯、华为、阿里都已经纷纷推出通用大模型体系。比如百度的文心大模型体系中包括NLP(自然语言处理)大模型、CV(机器视觉)大模型和跨模态大模型等多种类基础性的通用大模型,提供了全面的通用能力。阿里巴巴的“通义”大模型体系中,作为底座的通用统一大模型M6OFA模型具备处理多种任务的通用能力,囊括了针对图像、文本、语音、动作等多种跨模态任务。同样地,2023年9月,腾讯在2023腾讯全球数字生态大会上发布了“混元”大模型,协同了腾讯预训练研发力量,完整覆盖NLP大模型、CV大模型、跨模态大模型。华为也发布了“盘古大模型”,包括五个基础大模型——自然语言大模型、视觉大模型、多模态大模型、预测大模型和科学计算大模型,能力覆盖了对话问答、文案生成、图像生成、图像理解、科学计算等。其他通用大模型的例子包括IDEA研究院推出的姜子牙(Ziya)通用大模型、科大讯飞的星火大模型等。从这些案例中可以看到,通用大模型成为目前主流大模型体系中不可或缺的一个层次。
(三)L3:行业模型层
行业大模型往往需要根据不同行业内的企业或组织的需求进行调整,以提供定制化的解决方案,并且也根据行业的演变和新数据的涌现而不断优化,以保持与行业发展的同步。行业大模型代表了通用大模型向更具定制性和行业导向性的演进,这些模型的出现将为各行业带来更多的智能应用,帮助解决行业内的复杂问题,并推动各行业的数字化转型。因此,行业大模型往往需要各行业的企业的参与,融入该行业的特定数据、知识和需求。
华为盘古大模型另一个典型的行业应用是盘古矿山大模型。该模型由华为与行业内龙头企业山东能源和云鼎科技共同开发,华为提供通用大模型的底层基础能力,行业龙头山东能源和云鼎科技则提供矿山行业的专有知识和能力,目前盘古矿山大模型具有百亿参数、十亿数据,为矿山行业的智能转型提供了极大的助力。
(四)L4:场景模型层
场景模型层是各行业大模型下的进一步细分化、专业化的大模型,它们专注于满足特定行业内某个具体场景或问题的需求,并结合特定数据和专业算法来构建。这一级别的模型在行业大模型的基础上进一步精细化,以提供更具体的解决方案。场景模型层的特点包括:第一,问题定制。场景模型旨在解决特定场景或问题,因此它们的设计和训练更加精细化,以满足特殊需求。第二,数据特定。它们结合了特定场景中的数据,这些数据包括更明确的传感器数据、图像、文本等,以支持在特定场景下的应用。第三,算法专业。场景模型需要面向每个场景的要求,开发特定的算法和技术,以应对多个场景带来的复杂性。
三、生态型商业模式
一个生态型商业模式需要通用平台和生态伙伴两部分成员的共同参与。在大模型产业生态中,通用平台由L1数字基础设施层和L2通用大模型层这两层承担,它们以平台的形式向外开放,对接广泛的、来自各行各业的生态伙伴,拓展千行百业的应用场景,从而构建L3行业模型层和L4场景模型层,推动大模型在各行各业的赋能。通用平台需要提供强大可靠的数字基础设施和基础人工智能模块,因此通常需要数字实力强的大组织或大企业承担。与此同时,还需要引入各行各业的生态伙伴,这些生态伙伴可以是各个行业的龙头企业,也可以是深耕细分领域的中小企业,还包括各类行业协会、科研机构等。有了通用平台作为支持,生态伙伴不再需要投入大量的成本开发底层大模型,只需要结合自身所在行业和场景的特定数据与需求进行微调,开发专业化的行业和场景大模型。
大模型产业生态的建设不能是“孤军奋战”,需要多方成员的合作、协同和共享,包括政府、行业协会、数字企业、各行业龙头企业、中小企业等。政府需要提供数字基础设施底座,并引导、监管各层次成员的互动和协同,以促进产业的规范健康发展。行业协会和企业需要协同制定研发计划和标准,促进各行业的标准化,推动行业的合作和创新,特别是行业龙头企业需要发挥引领作用。同时,要有开放的生态融合思维,培育多元领域、各类规模的生态伙伴,在各行各业开拓创新的生态应用场景,整合其专有能力,推动L3层和L4层的繁荣发展。
生态内各成员和不同生态层次之间的能力组合将带来极大的互补和协同效应,一个良性互动的体系得以构建,实现动态的“能力叠加迭代”体系。对于来自各行各业的生态伙伴来说,它们不再需要耗费巨大的投资去搭建基础设施、从零开始训练大模型,只需要调用通用平台提供的核心能力,比如云计算能力、某个通用大模型的API,就可以开始训练自己的大模型,创新门槛大大降低。而那些通用大平台往往具有很强的数字能力,但是对各个行业缺乏了解,难以将这些核心能力落地应用到各个角落,通过开放核心能力、与生态伙伴共创,也补齐了这些企业缺乏行业深耕的短板,使其优势得到了充分发挥。实际上,生态型商业模式实现了能力的共享,大模型产业也将成为未来最大的共享经济,赋能万行万业。
结语
以生态型商业模式的思维促进大模型产业生态培育,将进一步助推各行各业的数字化转型。通用大模型的核心能力为企业和组织提供了更好的数字基础能力,支持更高效的数据分析和决策支持,帮助提高生产效率和服务质量,有助于各行各业的企业不断培育、提炼专有能力,加速大模型生态能力体系的建设。大模型生态的崛起也将促使工业互联网和消费互联网的深化发展,在工业领域,大模型用于监控和优化生产过程,实现智能制造;在消费领域,人工智能在个性化推荐和服务改进上的强大能力将有助于提升用户体验,并反馈给生产端,从而实现全场景的数字化和智能化。
总之,大模型的时代已经来临,通过培育生态、促进合作和创新,大模型将成为科技进步和经济发展的引擎,推动各个领域的变革和发展,不仅有助于促进数字化、革新生产力,还有助于为诸多全球性挑战如气候变化、能源革命、医疗创新等带来新的机遇。因此,各行各业应积极利用和发挥大模型的能力,构建生态型商业模式,加速大模型的商业化落地和广泛创新,打造未来最大的共享经济,迎接新时代的机遇和挑战。