作者:黄匡时(中国人口与发展研究中心)
一、计算人口学的诞生及其学科范式
计算人口学的早期研究更多基于主体的计算人口学研究。因为基于主体的建模在分析人与关联生命(likedlives)之间的行为具有独特的优势,而且也是最容易被计算机化的分析技术和方法。随着互联网、大数据、人工智能等数字技术的快速发展,万物互联将成为可能并日益紧密,人与人之间的关联(linked)更加紧密(Giles,2012)[16]。人与经济、社会、政治、文化、心理、伦理等之间的关系更加密不可分,人口学与经济学、社会学、政治学、文化学、心理学、伦理学互相交织和融合。在一切可计算的社会,尽管所有社会科学的分支都可以单独成为计算社会科学的一支,但是逐渐融合却是必然。作为研究人的行为的科学,计算人口学是以人为核心(human-centric)的计算社会科学快速发展的基础,也是开展计算社会科学研究的钥匙和抓手。正因为如此,研究分析计算人口学具有重要意义。
二、计算人口学的理论基础
计算人口学是由互联网、大数据和人工智能等数字技术直接催生的新兴学科,不仅有其鲜明的时代特征,而且有其深厚的理论基础,至少体现在三个方面。
(一)第三次人口转变理论
(二)主体性理论
无论是支持人工智能主体性观点,还是否定人工智能主体性观点,主体性理论毫无疑问都会深化数字化时代人类主体性的理解,加深人类对人类本身与机器人等数字人口在主体性上的相似性和差异性的研究,是计算人口学的重要理论基础。
(三)天人合一理论
天人合一是我国重要的哲学思想(张岱年,1985)[32],儒、道、释等诸家各有阐述。天指自然和天道,天人合一多指人与道合而达到“天地与我并生,万物与我为一”的境界。当今,5G技术快速发展,正在实现万物互联、智慧家居和无人驾驶。而且6G技术即将到来。人与万物的联通即将实现。因此,有人认为,5G是万物互联,6G就是天人合一。在“万物互联”的数字化时代,“以人为本、天人合一”思想将为计算人口学提供丰富的营养。
三、计算人口学的技术方法
计算人口学是人口学和计算机技术交叉学科,因此其技术方法既有传统人口学方法上的创新发展,比如与纸质调查不同的在线调查和在线实验,与假想队列方法不同的拓展队列法等,也有计算机技术的延续和发展,比如主体建模方法和在线谱系学。因此,本文主要介绍计算人口学上述四个主要技术方法:
(一)拓展队列法(ExtendedCohortAnalysis)
图1完全队列法、假想队列法和拓展队列法(以总和生育率为例)
(二)在线调查与实验(OnlineSurveysandExperiments)
在线调查与互联网的发展紧密关联。在互联网发达的欧美和日韩,在线调查非常成熟。我国在线调查才刚刚起步,但是随着互联网的快速发展而迅速发展。根据2021年2月3日中国互联网络信息中心(CNNIC)发布第47次《中国互联网络发展状况统计报告》,截至2020年12月,我国网民规模达9.89亿,互联网普及率达70.4%。互联网、大数据和人工智能等大数据的快速发展催生了在线调查。与线下面对面的入户调查不同的是,在线调查凭借互联网技术,将设计好的问卷放在网上,等待任意网民或者特定的网民自行填答,因此,在线调查具有低成本、高速度、跨越时空局限、有着丰富的表现形式、具有智能化及互动性等优点(黎沛姿,谭北平,2005)[37]。不过,在线调查也存在显而易见的局限。比如样本代表性问题。我国网民中68.7%是城镇网民,高于我国的城镇化率(60.6%),而且年龄别结构也与总人口的结构分布存在偏差。因此,在线调查的样本肯定是有偏差的,需要加权处理。此外,在线调查的答题过程缺乏交流和监控,填答者在答题的情景也多种多样,这些都可以影响答题的可靠性。正因为如此,关于在线调查数据的清理和修正技术也在不断发展(李军军,李应荣,2005)[38]。
与在线调查相比,在线实验具有更高的技术难度。相比于实验室实验,在线实验对实验条件的控制更弱,往往采用可控性低的电子邮件、APP等工具。有些在线实验准入门槛高,成本也巨大,比如要在社交网络上开展实验嵌入式实验就会面临准入门槛的问题。目前在线社交网络集中在少数大型企业手中,普通研究人员不具备开展控制实验的条件。而且在线社交网络的控制实验需要依靠特定的APP,软件开发和大数据清洗、甄别、标注和分析等需要高昂的成本,制约了控制实验的普及。此外,在线实验也会面临一些法律和伦理道德的问题,比如侵犯用户个人隐私,不仅有悖于科学研究的伦理道德,甚至可能违法(金诚等,2020)[39]。
(三)在线谱系学(Onlinegenealogy)
谱系学(genealogy)俗称家谱。家谱中承载着世系表资料,记载着每个家庭成员的出生日期、婚育状况、迁移信息和死亡日期等信息,是开展人口学研究的宝贵资料,可以开展预期寿命、生育水平、人口年龄结构、人口迁移等方面的研究(Clark,2014;李会敏,2015;FireandElovici,2015)[42][43][44]。在计算机技术普及之前,人类的家庭基本都是通过书本记载,随着从计算机技术尤其是互联网技术的快速发展,在线谱系学应运而生。在线谱系学包括两个方面的内容:一是历史家谱的计算机化,俗称网上修谱;二是在世人口的谱系化过程,即将人与人建立在线关联(linkedlives)。
在线谱系学是计算机技术发展的必然,是实现世界人口数字化链接(digitallinked)有效途径。当然,由于追溯性固有的缺陷,采用在线谱系学建构的数字家谱必然存在一定的偏差,当然,这种偏差是可以修正的,而且随着未来世界人口数字化和谱系化进程的推进,这种偏差会越来越小。
(四)主体建模技术(Agent-basedmodeling)
主体建模又称为智能体建模,是一种基于计算机技术的建模方法,广泛应用于社会科学研究。诺贝尔奖得主、经济学家ThomasSchelling(1971)[48]对种族隔离的主体建模实验研究、政治学家RobertAxelrod(1984)[49]对囚徒困境的主体建模研究、爱普斯坦(Epstein)和埃克斯特(Axtell)(1996)[50]对人工社会的主体建模研究等都是主体建模在社会科学领域的经典研究。由于人口学具有较规范的数理渊源和很强的实际政策应用,因此,主体建模方法在人口预测、婚育过程、家庭关系、迁移、养老支持、家庭政策等人口学领域得到广泛应用(BillariandPrskawetz,2003;GrowandJanVanBavel,2017)[9][15],并形成了一系列主体建模软件和平台,比如MIMOSE(Mohring,1996)[51]、ML3(TomWarnkeet.la.,2015)[14]和JAS-mine(www.jas-mine.net)(RichiardiandRichardson,2017)[52]。其实,计算人口学就是微观人口仿真(microsimulation)技术以及主体建模(agent-basedmodeling)技术的基础上发展起来的,因此,主体建模技术是计算人口学的经典技术方法。
四、计算人口学面临的机遇挑战与政策建议
计算人口学的兴起具有鲜明的时代特征。当前,互联网、大数据、云计算、人工智能等数字计算正蓬勃发展,尤其是2019年底新冠肺炎疫情全球暴发后,数字技术加快发展,计算人口学迎来了良好的发展机遇。随着互联网普及率不断提高,越来越趋向覆盖全员目标人口。5G技术加快普及,6G技术即将到来,人与人之间、人与机之间、人与环境之间的融合速度前所未有,而且颠覆经典超级计算机的量子计算技术加快布局,成为推动计算人口学快速发展的重要推动力。同时,以互联网、物联网、5G和6G通信技术、量子计算、人工智能、数字孪生等为代表的数字技术群落不断融合、叠加和迭代升级,为数字经济发展提供了高经济性、高可用性、高可靠性的技术底座,构建了驱动数据密集型的科学研究范式快速发展的基础设施,为计算人口学的蓬勃发展提供了重要的技术生态。2020年12月28日,国家发改委发布《关于加快构建全国一体化大数据中心协同创新体系的指导意见》的通知,提出“到2025年,全国范围内形成一批行业数据大脑、城市数据大脑,全社会算力资源、数据资源向智力资源高效转化的态势基本形成”的建设目标,为“十四五”时期我国计算人口学的发展创造了良好的政策环境。
(一)机遇与挑战
(二)政策建议
参考文献
[1]GrauntJ.Naturalandpoliticalobservations.MentionedinafollowingIndex,andmadeupontheBillsofMortality[M].Tho:Roycroft,London,1662:11-15.
[2]BURCHTK.Theory,computersandtheparameterizationofdemographicbehavior[N].IUSSPInternationalPopulationConference,Montreal.Li6ge:IUSSP,1993,3:377-388.
[3]PICKJB.Computerdisplayofpopulationagestructure[M].Demography.1974,11(4):673-682.
[4]ARRIAGAE,ANDERSONP,HELIGMANL.ComputerProgramsforDemographicAnalysis[M].Washington,D.C.,GovernmentPrintingOffice.1976
[5]MODECJ.StochasticProcessesinDemographyandtheirComputerImplementation[M].Springer,Berlin.1985.
[6]UNITEDNATIONS.MORTPAK-TheUnitedNationsSoftwarePackageforMortalityMeasurement:Batch-orientedSoftwarefortheMainframeComputer[N].ST/ESA/SER.R/78.1988.
[7]翟振武,李龙,陈佳鞠,等.人口预测在PADIS-INT软件中的应用——MORTPAK、Spectrum和PADIS-INT比较分析[J].人口研究,2017,41(06):84-97.
[8]LAZERD,PENTLANDA,ADAMICL,etal.ComputationalSocialScience[J].Science.2009,323(5915):721-3.doi:10.1126/science.1167742.
[9]BILLARIFC,PRSKAWETZA(eds).Agent-basedComputationalDemography.UsingSimulationtoImproveourUnderstandingofDemographicBehaviour[M].Heidelberg:PhysicaVerlag(Springer).2003.
[10]TODDPM,BILLARIFC,SIMAOJ.AggregateAge-at-MarriagePatternsFromIndividualMate-SearchHeuristics[J].Demography.2005,42(3):559–574.
[11]HILLST,TODDP.PopulationHeterogeneityandIndividualDifferencesinanAssortativeAgent-BasedMarriageandDivorceModel(MADAM)UsingSearchwithRelaxingExpectations[J].JournalofArtificialSocietiesandSocialSimulation.2008,11(4):5.
[12]DIAZBA,FENTT,PRSKAWETZA,etal.TransitiontoParenthood:TheRoleofSocialInteractionandEndogenousNetworks[J].Demography.2011,48(2):559–579.
[13]FENTT,APARICIODIAZB,PRSKAWETZA.FamilyPoliciesintheContextofLowFertilityandSocialStructure[J].DemographicResearch,2013,29(37):963–998.
[14]WARNKET,STEINIGERA,UHRMACHERAM,etal.ML3:Alanguageforcompactmodelingoflinkedlivesincomputationaldemography[N].2015WinterSimulationConference(WSC),HuntingtonBeach.CA.2015,pp.2764-2775.doi:10.1109/WSC.2015.7408382.
[16]GILESJ.Computationalsocialscience:Makingthelinks[J].Nature.2012,488(7412):448-50.doi:10.1038/488448a.PMID:22914149.
[17]宋健.人口学方法的传承与演变——兼论中国人口学学科发展[J].人口与经济,2020(04):1-14.
[18]黄匡时.数字化时代的人口学发展:从人类人口学向数字人口学转变[J].人口与社会,2020,36(01):25-37.
[19]孟小峰,张祎.计算社会科学促进社会科学研究转型[J].社会科学,2019(07):3-10.
[20]VANDEKAADJ.Europe'sseconddemographictransition[J].PopulBull.1987Mar;42(1):1-59.PMID:12268395.
[21]蒋耒文.“欧洲第二次人口转变”理论及其思考[J].人口研究,2002(03):45-49.
[22]乔杰.人类辅助生殖技术的新进展[J].中国实用妇科与产科杂志,2008(1):33-34.
[23]黄匡时.人工智能时代人口研究的前瞻性思考[J].人口研究,2020,44(03):118-128.
[24]郑杭生,杨敏.个人的当代形貌:社会化理论的世纪挑战——人的主体性的新发展与以人为本的时代源泉[J].河北学刊,2006(03):73-82.
[25]HABERMASJ.ThePhilosophicalDiscourseofModernity[M],trans.FrederickLawrence,Cambridge,MA:MITPress.1987:242.
[26]刘日明.哈贝马斯的主体性理论及其现实意义[J].上海社会科学院学术季刊,2001(03):116-123.
[27]骆郁廷.马克思主义主体性理论的三个维度[J].武汉大学学报(人文科学版),2009,62(01):5-10.
[28]孙祥飞.“机器人新闻”与新闻工作者的主体性强化[J].新闻论坛,2016(02):42-44.
[29]张劲松.人是机器的尺度——论人工智能与人类主体性[J].自然辩证法研究,2017,33(01):49-54.
[31]张勇,许亚洁.智能机器人主体性的刑法审视[J].上海政法学院学报(法治论丛),2020,35(02):105-114.
[32]张岱年.中国哲学中“天人合一”思想的剖析[J].北京大学学报(哲学社会科学版),1985,(01):3-10.
[33]路甬祥,陈鹰.人机一体化系统与技术——21世纪机械科学的重要发展方向[J].机械工程学报.1994,13(5):1-7.
[34]黄孝鹏,周献中,杨洁,毛可,盛寅.人机协同决策系统中人件及人件服务的概念体系研究[A].中国系统工程学会.社会经济发展转型与系统工程——中国系统工程学会第17届学术年会论文集[C].中国系统工程学会:中国系统工程学会,2012:10.
[35]刘伟.人机融合智能的现状与展望[J].国家治理,2019,(04):7-15.
[36]励建安.人机共融,天人合一——关于康复机器人应用与发展的思考[J].中国康复医学杂志,2020,35(08):897-899.
[37]黎沛姿,谭北平.在线调查的代表性与可靠性对比研究[J].市场研究,2005(08):7-11.
[38]李军军,李应荣.在线调查估计偏差分析及相应措施[J].统计与决策,2005(06):26-28.
[39]金诚,江婷君,闵勇,等.在线社交网络控制实验的现状与展望[J].浙江大学学报(理学版),2020,47(01):1-11.
[42]CLARKM.ASurveyofOnlineDigitalNewspaperandGenealogyArchives:Resources,Cost,andAccess[J].JournaloftheSocietyforAmericanMusic.2014,8(2):277-283.doi:10.1017/S1752196314000170
[43]李会敏.浅谈家谱文献价值及其开发策略[J].边疆经济与文化,2015(06):138-140.
[45]韦加佳.美、英、澳、加四国家谱档案信息资源开发利用途径及启示[J].北京档案,2014(10):32-35.
[46]张振霞.中国近二十年来网上修谱历程考察[D].宁波大学,2019.
[47]KAPLANISJ,GORDONA,SHORT,etal.Quantitativeanalysisofpopulation-scalefamilytreeswithmillionsofrelatives[J].Science.2018,360(6385):171-175.doi:10.1126/science.aam9309.
[48]SCHELLINGT.DynamicModelsofSegregation[M].JournalofMathematicalSociology.1971,1:143-186.
[49]AxelrodR.TheEvolutionofCooperation[M].NewYork:BasicBooks.1984:173.
[50]EPSTEINJM,AXTELLRL.GrowingArtificialSocieties:SocialSciencefromtheBottomUp[M].MA:MITPress.Cambridge.1996.
[51]MOHRINGM.SocialScienceMultilevelSimulationwithMIMOSE.InSocialScienceMicrosim-ulation[M].editedbyTROITZSCHKG,MUELLERU,GILBERTGN.London,UK:Springer.1996,P123–137.
[53]陈禹.复杂性研究的新动向——基于主体的建模方法及其启迪[J].系统辩证学学报,2003(01):43-50.
[54]FAGIOLOG,ROVENTINIA.MacroeconomicPolicyinDSGEandAgent-BasedModels[J].Revuedel'OFCE,2012,5:67-116.
[55]隆云滔,李洪涛,王国成.基于主体的建模方法与宏观经济政策分析[J].经济与管理,2018,32(02):47-52+80.
[56]黄璜.社会科学研究中“基于主体建模”方法评述[J].国外社会科学,2010(05):40-47.
[57]王飞跃,曾大军,毛文吉.社会计算的意义、发展与研究状况[J].科研信息化技术与应用,2010,1(02):3-14.
[58]孟小峰,李勇,祝建华.社会计算:大数据时代的机遇与挑战[J].计算机研究与发展,2013,50(12):2483-2491.
[59]张小劲,孟天广.论计算社会科学的缘起、发展与创新范式[J].理论探索,2017(06):33-38.
[60]LAZERD,PENTLANDA,WATTSDJ,etal.Computationalsocialscience:Obstaclesandopportunities[J].Science,2020.369,6507,Pp.1060-1062.