科技创新在不同时代呈现不同特点。从数据生成、传递和获取,数据交互能力,数据共享能力以及数据数量、深度和广度等维度,观察分析数字时代的科技与产业创新,能够为回顾创新范式演进历程提供新的视角。当前,科技创新进入新的时期,一个显著特征是数据数量和关系重新定义创新链条上各方的交互方式和地位作用,各种创新力量的地位作用重新分化组合。
创新源泉:数据洞察能力与理论逻辑能力交互耦合的双驱型创新
因果关系作为演绎法和归纳法的基础假设,是理论逻辑推理的重要机制。数学理论模型作为一种抽象思维工具,特别适用于对变量进行形式逻辑处理,识别和揭示变量之间的因果关系,成为物理学、化学、生物学、医学等学科的重要研究进路。但受限于理论认知边界、模型结构形式、计算复杂性等因素,过往数学理论模型能够处理的数据量小、数据维度少、数据关系相对简单。进入数字时代,宏观社会运行和微观主体活动都以数字化形式呈现,数据关系的复杂性急剧增加,变量之间更易表现出非线性、时变性和非平稳性特征,以因果律为基础的理论模型方法在刻画和理解复杂现象的结构特性、交互关系以及演化行为等方面遇到前所未有的挑战。
从创新源泉角度看,超过60年的人工智能发展历史可大致以2010年为界分为两个阶段。2010年以前,人工智能的前沿研究成果主要由理论逻辑能力驱动,而在此后,数据洞察能力成为人工智能创新发展的核心推动力。
新一代人工智能的发展,在更深层展示出理论逻辑能力和数据洞察能力是一个迭代累进过程。深度神经网络、机器学习等理论模型的发展带来多模态数据处理能力的极大提升,数据驱动力的增强使得大模型出现“智能涌现”,衍生出通用人工智能的部分能力。然而,人工智能基础大模型逐渐面临复杂度急剧攀升、算力需求激增、摩尔定律逐步失效等“瓶颈”,并不足以支撑从感知人工智能到认知人工智能的跨越,包括数学、心理学、脑科学在内的理论研究对人工智能发展非常关键。在可预测的未来,数据洞察能力和理论逻辑能力交互耦合的双轮驱动依然重要,但每个阶段前期理论积累带来的突破点不同,当前正是需要加快利用数据带来创新突破的关键时期。
创新主体:规模涌现规则与大平台创新优势
规模报酬是经济学的一个基础概念。以往实体产品为主的时期,企业达到一定规模后,规模报酬呈现出报酬递减的规律。进入网络时代,软件和各种数字产品呈现出规模报酬递增的特点,产出增加比例大于投入增加比例。这是网络空间数字产品可以复制复用的特性带来的,更多销售并无需更多产出。
海量数据和AI时代,规模报酬出现了本质变化。规模报酬递增的特点由“边际增量”改变为“新能力涌现”。为了描述分析这种新类型的收益递增,本文借用深度学习领域的一个重要概念——ScalingLaw(即规模涌现规则),这个概念描述了模型性能与模型规模(如参数数量、数据规模和计算资源)之间的关系。其基本原理是,随着模型规模的增加,模型的性能也会提高。这一发现激励着研究者投入更多资源构建更大规模的模型,以期获得更好的性能响应。研究者对这个规则的未来适用边界有不同看法,但对其在当前阶段的适用性大都赞同。从现实情况来看,头部企业拥有数据和算力方面的优势,当规模越过一个阈值后,就会涌现出后来者无法企及的全新能力,包括深度泛在的感知能力、对多元变量关系的洞察能力、对高度复杂问题的预测能力等,为企业带来强大市场竞争力。
平台的上述创新优势对高端人才和投资者形成强吸引力,因而成为数字前沿技术和基础研究的重要创新力量。
创新组织:数据能力与边界开放型创新组织形态
随着数据成为重要创新要素,任何一个创新组织链接数据愈多、更新愈快、交互愈强,其创新能力就愈强。因此,能够最大程度获得数据、挖掘数据深度和广度、增强数据交互和共享的开放式产业组织成为重要的创新组织形态。
在数字时代之前,开源开放已经成为重要的创新模式。全球97%的软件开发者和99%的企业使用开源软件,全球70%以上的新立项软件项目采用开源模式。虽然目前的人工智能大模型的领先者还是采用闭源模式,但由于大模型的训练和调整需要极其巨大的数据、算力和算法的投入以及海量场景的支撑,后继者很可能采用开源模式与之竞争。
开放科学以“自由、开放、合作、共享”为理念,以海量数据汇聚和处理为手段,推动大规模科学项目研究。数据生成、传递和交互方式的不断演进,使开放科学逐渐成为创新范式变革的一类趋向性目标。在天文学、高能物理、生命科学、空间科学等领域,国际大科学项目成为推动重大科学发现的主流模式,各国或国际组织均致力于大科学数据的开放共享,并将各国科学家联合起来开展分布式协作研究。
数字时代,数据汇聚和交互能力成为驱动创新的重要引擎,任何主体具备的数据资源、专业知识都可能成为创新起点,也可能链接到创新链条中,与其他主体的数据交互还可能带来新增的知识或发展,因而边界开放对于创新的意义比以往任何时期都重要。从数据角度看,开放型组织能够获取多样化的互补数据资源,包括市场需求数据、技术开发数据、行业发展数据等,提升创新能力。从主体角度看,开放型组织可以广泛连接用户、供应商、技术服务商等,提供了创新汇聚的枢纽,通过数据交互激发组织创新活力,形成多元主体驱动的创新模式。未来可能会有多种形态的开放组织出现,但有竞争力的组织形态必然与其数据汇聚和交互能力匹配。
数据驱动的创新不仅能够揭示海量数据间的复杂关系,洞察颗粒化场景并赋能,而且能够推进和深化理论机制的多样化探索路径,甚至带来新能力的动态涌现。可以预期,这种新型创新范式将成为科学发现最重要的范式和路径。
创新伦理:普遍参与、负责任创新与维护竞争的公共价值
区别于以往传统技术革新带来的伦理问题,数字时代的科技伦理生发于创新过程本身,数据、数据关系成为科技发展方向的重要引导,以介入社会基础运行的方式彻底重塑人的主体性与独特性,导致自然秩序和社会关系的多元改变。数据驱动下的社会发展趋向、数字平台成为新型社会基础设施带来的变革,以及创新效率提升中的垄断等都成为新的难题与挑战。
负责任创新:数据、算法黑箱与风险治理。由于数据量大、复杂度高,数据驱动的算法决策往往具有内部机制不透明的“黑箱”特点,且随着数据交互能力与共享能力不断提升,给用户和社会带来未知风险的概率也越大。近些年来,创新范式越来越强调“负责任”的维度以应对这些风险,国内外提出的诸多新兴科技治理理念,如“建构性技术评估”“预期性治理”等,更多标志着伦理维度的深度嵌入。“负责任研究与创新”的理念更是将伦理考量直接纳入创新过程本身,确保科技进步不仅仅追求经济效益,更重要的是要在尊重人类价值观、社会规范和环境保护的前提下开展创新。
(作者分别为中国社会科学院大学教授、中国社会科学院财经战略研究院博士后、清华大学讲师)