图1.CCFYOCSEF济南分论坛主席刘新锋发表开幕致辞
图2.浪潮软件科技副总经理商浩作引导发言“社会治理行业应用实践”
发言结束后,与会专家围绕“如何看待智能化技术在社会治理应用平台系统中的使用成效?”“平台如何保护居民和网格员数据隐私?”“信息技术应用创新产业方面,从芯片到服务器架构是否国产化?”以及“如何判断应急事件?”等问题开展了进一步讨论,总结如下:
(提问1)
孟雷:我们论坛的主旨是怎么数字化、智能化。那您怎么看待智能化技术在系统中的应用?人工智能技术在系统里能够做一些什么事情?是否能有一定的成效?
(提问2)
郭延辉:综治平台如何保护居民和网格员数据隐私,涉及到哪些数据?
商浩:目前已有对普通人员进行加密,尽量不存储数据,尽量只调用数据,存储的是非敏感数据。对于访问权限来说,设立部分互联网的行政服务阈,很少与互联网沟通。
(提问3)
刘新锋:国家比较重视信创,从芯片到服务器架构,是否国产呢?
商浩:目前有一些国外的,国家政务国有化正在逐步进行。
(提问4)
李梁:对应急事件的判断是依据什么标准?
商浩:现在的做法是只要发现了,就要呈现。我们对事件类型做一个定义和发现,然后把事件移交给公安进行内部流程的督察。系统的定位目标是发现问题,就当事件来处理。
图3.山东大学尹义龙教授团队孙皓亮博士引导发言“智慧司法专网跨域认证和可信交互研究”
报告的最后孙皓亮博士进行了总结与展望:他指出团队研究的统一用户认证技术可提供跨部门可信协同应用的支撑环境,为跨部门身份认证安全等提供技术支撑。其次通过综合运用数字身份认证和分区分层权限管理技术,实现跨域、跨部门统一用户认证和可信交互,在技术方面具备一定创新性。第三,基于案件粒度和多种访问方式,可以支撑跨法检司的有效访问控制,团队在这方面思路上具有较强的创新性。第四,是引入机器学习技术,实现业务数据访问操作行为的有效特征表达,以及对跨法检司业务数据异常访问操作行为的可靠识别,团队实现了一个系统的功能创新。第五,通过建立根账户体系以及对边缘端计算单元的关键特征提取、融合,有效解决法检司协同业务中的可信身份认证,这个可以体现出团队研究的方法的创新。最后,目前研究的业务协同理念对法检司外的其他部门(例如:银行与税务)具有普适性,如果把这个协同理念应用到其他部门,还能够提高社会运行的效率。针对团队研究的统一认证和可信交互技术,它可凝练为“零信任安全”理念,有望应用于各类安全产业。
报告结束后与会专家就“法检司案件粒度定义是什么?”“法检司部门信息流转慢是机制问题还是信息化手段不充分?”“异常访问的定义是什么以及如何识别?”“如何理解系统会针对不同的数据,使用不同的技术,实现可靠的认证识别算法?”“如何检测有权限用的异常行为?”“通过行为模式是否可以进行身份冒用识别?”等问题进行了思辨讨论,总结如下:
孙皓亮:之前的访问控制是针对用户的,而现在我们在案件处理流程中赋予各种角色,然后对这些角色进行访问控制。
侯睿:也就是Id对应权限,能看到对应的案件的哪些部分,能访问到哪些字段?
刘新峰:是的,而且司检法案件相互间是隔离的,现在要把三个之间打通。
刘新锋:智慧司法的业务信息流转慢的原因是什么,是不同部门间人工审批存在延迟、还是各部门系统缺乏直连接口?智能技术在其中起到作用?
孙皓亮:从业务方面来理解就是目前这三个系统还没有打通,可能我们需要从系统里跳出来然后再进入另一个系统,这是主要的问题。
吕洪涛:异常访问具体指什么,我们识别它的目的是什么?
孙皓亮:异常数据主要针对恶意行为,比如案件关键信息的恶意修改、删除、添加,防的是内部人员这种操作。首先可以是生成一些数据作为标注,后面期望能够接入这些示范单位调取真实数据。
孙皓亮:举个例子,常规来说这些操作都是正常的,恶意行为是很罕见的。可以训练一个模型来建模数据分布,那么恶意行为是不符合这个分布,就可以识别这是种异常行为。
(提问5)
刘宁:数据库有严格的权限,如果对人员有一个严格的访问限制,是否就可以检测它的异常?
孙皓亮:要在他已有权限的时候,要识别人员做出的恶意行为。
(提问6)
李新:如果冒用别人身份,那么他的行为模式和当事人不一样,是否这样可以识别?
孟庆钢:我们和尹义龙老师和孙皓亮老师是一个课题组的,我们在第四模块那个支持边缘计算模式下多技术的融合里,有对人的使用习惯等进行分析。如果发生异常的话,首先要升级认证模式,否则就进行拒绝。
孙皓亮:这个问题不是一个模块或者算法的事情,要多个模块的联动去解决这个问题。
图4.山东警察学院警务信息系主任侯睿作引导发言“智慧警务与社会治理实践思考”
此外,侯主任介绍了在城市扩大化、文化多元化、互动虚拟化的背景下,公安部门的群防群治宣传、智慧警务APP等专群结合数字化社会治理工作:他提到,受抖音等媒体的启发将警察和警务工作进行虚拟化,进行反诈宣传。通过对人群、数据标签进行细分,筛选、确定高危被骗人群,对他进行定向的,准确的,精准的劝阻。这就是我们现在做反诈的一个基本思路。
关于社会治理,侯主任表示一方面社会治理能力提高,还有一方面要专群结合,把专门工作和群众工作相结合。所以就有了智慧警局、虚拟警察、AI警察等来应对新时代群众工作,网络环境下的群众工作,网络环境下的群防群治的宣防工作。从警务方面的工作考虑,社会治理应当是个精细化,同样反诈也是精细化的。这才是国家治理现代化的题中之义。每一个人都是一个特别的个体。不能把所有人的要求放到一个人身上。过去,因为我们没法精准的给每个人定义所以达不到期望的效果。而现在大数据技术,人工智能技术,加上通信技术就可以实现精准的测定,然后精准的投放,这样的智慧治理的现代化程度就会提高。
关于大数据技术,侯主任提到,通过大数据分析技术可以发现规律、解释现象、预测未来,对全社会数据进行掌控,然后得到社会存在和社会运行发展的信息,构建知识图谱。基于这方面技术,结合社会治理,公安系统推出了智慧警务。智慧警务是以互联网、物联网、云计算、智能引擎、视频技术、数据挖掘、知识管理等为技术支撑,以公安信息化为核心,通过互联化、物联化、智能化的方式,促进公安系统各个功能模块高度集成、协调运作,实现警务信息“强度整合、高度共享、深度应用”之目标的警务发展新理念和新模式。首先是用在军方,然后就是公安,通过这些技术做支撑,结合自身信息化,通过这些互联化,物联化,智能化,来促进这些要素的整合共享甚至应用,这是目前警务发展的一个新的模式。
刘新锋:智慧警务的难点在哪里,是治理要素的筛选,还是建模或者收集数据?
侯睿:主要难点在于数据的时效性比较差、数据质量比较低,还有数据之间的关系挖掘,现在想做就是通过迭代的关系自动找出间接关系。
徐立先:虚拟警察在政务上是怎么使用的?应该把他建模为三维数字人执行警务吗?
侯睿:虚拟警察主要是一个应答的形象,前端要有一个直观形象让用户以为和警察在互动,后台是知识图谱在运行。由于群众提问一般都是比较固定的问题,所以目前对虚拟警察的依赖度还是比较高的。
李梁:疫情防控在分析轨迹交叉的时候就是利用wifi手机定位吗?还有就是比较密集人群的紧急事件怎么来获取运动信息?
侯睿:wifi只是其中一个,还要结合视频等其他数据,要根据不同场景和对象目标采用具体技术。
许海振:智慧警务中观点性的数据比较多,而且数据比较复杂。那么在知识图谱中对于普通人群来说,算法成分和人工干预成分各占多大比重?
侯睿:重点人员是一人一道,就是每增加一次轨迹就给他加分。对于普通人员数据建立相对较少。重点人员的手动比例要远远大于普通群众。
孙皓亮:各部门协同系统中,大数据分析是地区各自分析然后汇总吗?
侯睿:有中心还有分中心。一般在分中心有备份。某些特定数据库是和公安部对接,其他情况需要请求。
图5.论坛嘉宾合影
图6.闭门论坛阶段议题一讨论现场
数字化赋能传统社会治理模式的技术路径设置了三个子议题,包括社会治理场景的数字化建模、人工智能算法与传统社会治理的结合模式、以及数字化社会治理下的数据隐私和决策可信。议题参与专家包括商皓、侯睿、许海振等社会治理业务专家,以及孟庆刚、李新、孙皓亮、武蕾、徐敏峰、刘新锋、郭延辉、刘宁、杜丽娜等来自高校的人工智能技术专家。与会专家三个小时的深度讨论输出总结如下:
子议题1:社会治理场景的数字化建模
思辨点1:使用哪些数据治理技术能够完成传统社会治理模式和流程的数字化构建?
针对数字化建模问题,商浩谈了自己的看法,他表示由于各级行政机构有不同的系统,数据之间的流转和表结构都是不统一的,首先要建立一个统一的标准或事项清单,规定网格员或者工作人员的工作职责范围。另外,山东省也在建立一体化的数据共享中心,各级机关都在提数据需求,可以对数据进行挖掘分析,对特殊人群或者重点人员做人员画像。
侯睿结合警务工作,发表了自己针对数字化建模问题的看法,他表示现在警务里面主要是经验建模,把执法经验转化成数学语言进行建模,然后在警务工作中找数据作为验证集,但这种模式以后会逐渐被替代掉。
针对主持人刘宁提出的在识别领域哪些技术对社会治理能起到有价值的应用问题:孙皓亮表达了自己的看法,他提到模式识别包括生物特征识别,图像场景的识别等,在社会治理方面有广泛应用,比如对场景场所的智慧监控和预警,目前的系统智能化程度还不是很高,一方面要继续提升,另一方面还是不能完全抛弃人工,专家知识还是比智能系统要强很多的。
主持人刘宁提出基于互联网时代网上有大量的新闻消息,在媒体领域哪些数据治理技术能够完成治理模式或流程的数字化构建问题:媒体领域的许海振表示数字化治理的一个前提是要有应用场景和应用需要求,同时数字化治理过程中要有权威部门来牵头,这样这个平台才是可信赖的、有价值的,从而建设让群众满意的政府。
思辨点2:社会治理的实景三维技术和挑战有哪些?
针对社会治理场景的实景三维是否需要三维GIS的问题:武蕾表示实景三维可以通过已有软件,在三维GIS的基础上把数据累加到上面,能够实现人地事物组织的融合,但社会治理数字孪生平台在目前开发过程中似乎对三维孪生模型没有太大的需求,二维GIS足够用了。侯睿提出反对意见,认为三维GIS的应用场景远远大于二维GIS,只是受系统建设的现状所限。比如城市化高层建筑很多,二维GIS不能解决,需要三维数据来呈现。再比如,暴恐袭击后的毁伤程度建模,辐射范围不光是平面的,需要三维表示。此外,地形地貌的描述也需要三维GIS。现在三维GIS在警务系统里用的比较少,国内的方法一是精度不够,还有信赖度不高,要价太高,将来走信创必须替代这些方法。
面对三维建模问题:李新表示三维模型的数据量太大,用什么方法可以把三维模型快速加载,在web层或者手机层进行快速显示,还是困难的问题。在数据叠加上,包括智能推理,还需要很多技术。是否可以针对某种具体类型的范围,通过模型分析来达到事后研判或者提前预防?因此,在模型方面、技术接口方面、共享数据方面、应用层面的社区管理或治安管理等还有很多层面的内容需要继续研发。作为技术人员,我们是否能够定义一些标准,基于这些标准能快速把模型都集成进来,分层做一些研究工作。
针对主持人刘宁提出的哪些三维建模技术能够更好的促进数字化社会治理的转变问题:
徐敏峰表示在三维建模促进数字化社会治理应用方面,社会治理场景有很多定位的问题,例如发生爆炸,可以在二维平面定位爆炸地点,在分析的时候,利用三维技术去做爆炸分析。在获取三维信息方面,对于城市信息可以直接扫描,对于更大的范围可以用无人机来解决精度问题。此外,重建的模型目前可以存储在本地,以应对数据量大而导致的加载慢问题。
针对社会治理数字化建模的难题:郭延辉表示无论二维还是三维只是技术上数字化的一个方面,更多的还要从其他方面来考虑,比如社会治理中参与的角色有哪些,政府职能部门在智能化方面充当什么角色,以及群众有什么诉求。另外,我们要理清楚社会治理主要有哪些方面的数据,它们的建模是多种多样的,在数据交互中存在很多问题,更需要考虑对政府开放哪些接口,对技术人员开发哪些接口,这是需要分层进行处理的。
刘新锋根据各位专家的回答进行了总结:数据获取的精度、数据传输、数据管理和共享、数据治理建模复杂度、人工智能和业务场景的结合是我们现在遇到的五大挑战。
思辨点3:哪些共性技术能够作为数字化社会治理模型的统一架构?
针主持人刘宁提出的哪些共性技术在数字化治理中能够作为基础技术进行应用的问题:刘新锋表示BIM的渲染技术、数字孪生技术、元宇宙技术,不同领域对技术的定义完全不同,要解决这个问题需要先理清什么是技术。
侯睿从警务人员角度举例,刑事科学技术,就是一种技术方法的具体实现,借助什么材料、工艺、程序,例如指纹,早期是用粉末的方式,然后出现真空镀膜或者化学试剂,但都是一次性且容易破坏的,现在用光学技术,这就是一种技术的发展。
针对数字孪生技术,侯睿谈了自己的看法,他认为好的社会治理能不能变成数字化,坏的能不能通过数字化进行改进,这是目前遇到的两个问题,只要能解决这两方面问题的方法,都叫技术。他认为数字孪生就是解决问题的方法,但是如何进行数字孪生,这又是接下来的问题。
针对侯睿提出如何进行数字孪生的问题:李新表示,通过视频融合技术把实时视频有机地融合到三维模型,实时地反应场景的变化,可能是个有价值的解决方法。另外,目前数字孪生可以做一些仿真,有了数字孪生技术就可以叠加在模型上做一些火灾的模拟。
刘新峰最后补充道:数字孪生的最大问题就是成本,什么时候成本降下来,就能有更多应用出现。
社会治理业务的自动化处理和决策是数字化社会治理的目标,这需要传统社会治理模式的改变。针对人工智能算法与传统社会治理的结合模式议题,与会专家从以下两点进行了思辨:
思辨点1:如何将识别、检索、推荐、仿真等人工智能算法“嵌入”数字化社会治理业务流程、从而简化或替代人力?
侯睿首先从警务工作方面谈到了关于主持人刘宁提出的在非计算机领域中,社会治理过程中所遇到的问题:他表示警务工作中使用的人工智能还不是特别成熟,主要对一些简单重复性工作用人工智能替代,比如虚拟警察,准确度仍然比较低。另外,在案件推演中,推演出的意见采信度仍然不是很高,始终作为辅助而做不了证据。虚拟仿真在应急管理方面用的比较好,因为它没有很多逻辑分支。但是人的思想太细了,案件推演更有挑战,现在只能主动将人带入剧情,用很多条件判断去控制,具有游戏性质。刘新锋表示赞同,并补充说明医疗系统、自动驾驶方面都有这个问题。
针对侯睿遇到的案件推演问题发表了自己的观点,他表示目前最常见的人工智能是基于一些已有的、客观的数据训练网络模型训练而来的,本质上还是属于弱智能。有些时候并不是模型有问题,而是数据有问题,即使是人也不能根据信号做出准确的判断,他提到著名的AlphaGO也是基于大量训练状态,用学到的模型去估计下一步怎么走,而不是通过进行严密的逻辑推理来解决。
针对人工智能问题:徐敏峰提出了自己的看法,他表示人工智能确实存在问题,但是人也会出现问题,例如相机采集到的图像可以当作证据,或者医学通过图像处理技术采集X光片,但也是有误差存在的,为什么人类对这些技术信任度比较高呢?对于智能化的算法,如果用某种硬件进行包装后再输出,是否可以提高信任度?似乎现在人们对可看到的实物,信任度比较高。刘新锋提出反对意见,他表示照片或者CT是对原有技术的反映,精度比较高。但是人工智能是要对数据进行推理,而不是原来数据的呈现。针对这个问题,李新表示人工智能技术,需要不停发展,不停标注数据设计新模型,才能成长进步,例如图像识别领域已经很好的效果了。
针对主持人刘宁提出的使用人工智能分析流媒体数据时应该怎样结合的问题:许海振表示,这方面人工智能算法可以做到,但算法应用和用户诉求是否一致,是需要考虑的问题。例如机器人写稿,今天天气怎么样这个主题可以写的很好,因为这是个客观的主题。但是主观的题目,例如有温度的济南教育,我们设计算法时候并没有预计到这种题目,所以效果比较差。针对许海振的回答,主持人刘宁总结道:人工智能还是应该辅助减少人力成本。商浩针对主持人刘宁的总结表示赞同,并补充说道:社会治理中最重要的人工智能场景是事件流转,一般做法就是把事件转派给人员,这是个不断修正的过程。
针对主持人刘宁提出的人工智能无法模拟人类情感的问题:郭延辉发表了自己的看法,他表示,人工智能在逻辑推理方面,目前是处在弱智能阶段,一方面可以利用人工智能做数据治理,比如指纹识别等。在决策管理方面,可以用人工智能做一个初步的筛选,然后由人工做出决策。再一个就是习主席强调的是要注重联动融合,可以让大众都参与,有更多的数据依据来做判断,他认为这是一个从弱智能转向强智能的方式。刘宁对郭延辉的观点表示赞同,并总结道:尽管目前人工智能是弱智能,但也不妨碍用这些技术解决一些问题,毕竟全部解决不太可能。
针对人工智能算法“嵌入”数字化社会治理业务流程的问题,侯睿表示将重复劳动环节用人工智能来替代,是现阶段“嵌入”的一个方法。刘新锋提出了一个传统社会治理模式的改变的观点:他表示,社会治理的核心就是数据治理,面对低质数据,需要政府制定配套解决方案;或者通过质量监控或评估来修复,可以用算法来提高模型质量。徐敏峰表示很赞同,并补充道:有了高质量数据、鲁棒的算法,还需要再加上可见的实体。
思辨点2:如何平衡算法系统复杂度和业务人员不均的数字素养与技能?
针对如何平衡算法系统复杂度和业务人员不均的数字素养与技能的问题:孙皓亮表示,人工智能模型与传统社会治理的深度结合需要打通社会治理数据流通的各个环节,例如每个系统都带有人脸识别,那么在一个系统注册是否就可以直接使用别的系统。打通这些系统的联系就在一定程度上可以避免人员素养和技能的要求了。针对孙皓亮的观点,张亮并不赞同,他提到,在集成电路方面,人工智能很多东西都没有落地,想法很好但是理解程度还不够。到目前为止,人工智能芯片方面一直没有落地,还在寻找解决方案的过程中。
针对以上问题,徐敏峰提出设想,有没有新的模式,除了语音、触摸屏以外,让人和机器做一些交流,从而让群众更愿意参与治理的过程?侯睿表示,虚拟警察本质上就是一种尝试,不是触屏、语音、读写,而是模仿虚拟人的交流,具有人的表情、情感等,未来还会更多尝试。
针对主持人刘宁提出的公务员工作中每天都要靠人力填写大量表格的问题,侯睿表示可以采用标准化流程来解决这一问题。
数字化技术和人工智能算法可能需要使用业务人员和居民的个人信息、存在信息泄漏风险,与会专家围绕以下两个思辨点进行讨论:
思辨点1:如何使用区块链、联邦学习等技术保障社会治理大数据使用中的隐私信息?
针对如何使用区块链、联邦学习等技术保障社会治理大数据使用中的隐私信息问题:侯睿表示,联邦学习在电信诈骗案件方面很有需求:例如,银行想让警方找到洗钱的团队,但是不会提供账户信息,于是就建立了数据交换区。还有通讯方面,判断手机卡是不是本人在使用的问题。社会管理方面,判断居民用水用电等问题,都会应用到联邦学习技术。专家郭延辉表示,数据隐私方面更多是政策问题。什么东西属于隐私数据,数据所有权归谁,谁能使用,需要法律法规来规范。以后出台这些方面的法规和约束,会促进数据持有方在数据共享方面以及数据隐私保护方面的参与,互相之间有更好的信任。
主持人刘宁结合数据隐私提出一个假设:如果有人用了自己的数据,有什么方法可以发现或者进行预防呢?针对这个问题,吕洪涛表示,联邦学习可以解决隐私保护的问题,联邦学习分成两类,横向和纵向。横向是大家数据形式特征都一样,但是数据分布不一样。纵向联邦是指每个人掌握的数据分布不一样,某种标签有些人有,而有些人没有。通过联邦学习可以让模型在各方数据之中训练更好的大模型,同时保护各方数据的隐私性。这取决于样本特征。例如,不同公司有不同特征,这就够了,可以大家一起训练同一个模型。侯睿表示,吕洪涛描述的这种情况更适合洗钱的案例,电信诈骗案件中银行关心有没有洗钱。原来洗钱方式有某种特征,在检测过程中又发现了新的洗钱模式。商浩结合综合治理方面的工作列举了一个例子:对于精神障碍患者需要联合卫建部门进行监控,有些需要定期服药的患者如果他的购买药品记录中断就要上门进行询问,但是医保部门往往不愿意提供这些记录。主持人刘宁针对以上专家的发言做了总结,机器学习的目的是更好的从数据中抽取特征,但是联邦学习的假设是如果数据分布在不同地方,虽然获取不到数据,但是可以通过把机器学习算法部署就可以训练出很好的模型。
思辨点2:现有人工智能算法通常只能做到推理或决策过程的可解释,比如特征热力图或者基于决策树的推理过程刻画,如何设计治理业务导向的、业务人员可理解、可信赖的决策模型?
图7.闭门论坛阶段议题二讨论现场
智能化提升社会治理手段的技术路径议题设置了三个子议题,包括:低质业务数据下智能化模型的设计与构建,面向社会治理事件推演的多主体博弈技术,支撑社会治理全生命周期感知调控的数字孪生技术。参与议题的专家包括来自于计算机方向的专家以及产业界的专家,他们是:聂秀山、吕洪涛、陈关忠、李梁、王宇、沈旭、杜萍、宋立莉、李照川、李西娜。与会专家三个小时的深度讨论输出总结如下:
现实场景中,社会治理业务数据体量大、指标性信息稀疏、很难直接利用结构化数据设计基于规则的决策模型,而数据驱动的机器学习算法、特别是深度学习模型对数据数量以及标注信息的要求很高,基础数据采集设备缺乏、业务大数据难处理缺标注、决策推演模型性能难保证是智能化社会治理技术研发的痛点问题。与会专家围绕“面向社会治理业务大数据,哪些技术能够缓解现有人工智能技术的数据依赖或增强低质数据训练鲁棒性?”展开讨论,从数据缺失、重要数据发现和人机协同三个角度对现有技术进行梳理,形成以下思辨点:
思辨点1:面对数据缺失问题,如何进行相应的模型设计以辅助业务?
针对三维场景遮挡情景下的数据缺失问题,杜萍表示人群疏散工作方面遇到了缺失数据问题的解决方案是从硬件设备的角度找到更多维度的数据,例如从视频里面提取人的轨迹信息。或者可以根据手机轨迹利用WIFI提取手机轨迹,在室内可以利用蓝牙提取轨迹。另外,还可以采用仿真数据。
对于数据缺失的问题,研究人群疏散建模方向的李梁发表了自己的看法:他表示人群疏散建模在真实情况下难以获取数据,可以采用模拟数据,通过规律总结行人运动中的约束条件,对于不能采集数据的极端情况,一律根据约束条件去计算极值,将所有空值划分为极值状态,这样可以保证模型的下限。另外,针对最容易发生踩踏事件的地方可以部署硬件设备。对数据和场景的理解来说,密集人群的运动相对简单,可以用宏观的简单模型加以预测80%的人群,但是剩下的20%比较困难,动力学角度难以解决,可以试试分形学方法从基础结构入手。陈关忠表示,针对低质量数据问题,有两种解决办法:增加传感器,和通过算法适应数据。前者需要在建模之前评估需要采集哪些数据,并在关键节点部署传感器;收集来的数据需要在传感器阶段进行一次数据处理,入库前再进行一步数据清洗,通过人工的方式剔除低质量数据。清晰的原则是根据业务规则来判断数据是否异常,并通过机器学习的方法来预测和补充数据。
主持人孟雷基于以上发言作出总结:针对数据缺失问题,经讨论后凝练出多采集数据、制定数据标准、从模型角度解决低质数据等观点,吕洪涛提出能否通过打通渠道解决数据缺失问题,李梁提出通过建模方式建立仿真数据。
思辨点2:面对多源异构的治理大数据,如何围绕社会治理下游任务进行重要数据的挖掘?
思辨点3:人机协同能否解决低质业务数据处理问题?
针对人机协同问题,孟雷表示:人机协同也就是人在回路,目前有许多方法,用的最多的是众包、众筹,对缺失数据问题就可以采用众包众筹的方法去做标记,或者采用多人答案共性去提出较好的答案。李照川发表了自己的看法,他表示:低质量数据在实际业务中很常见,针对不同行业的数据,通过开发不同的专业小工具针对性进行数据收集、预处理,以清洗数据。同时清洗是多个环节的,每个环节人工对数据进行校对和批注,保证数据质量,构建半监督、人在回路的方法。也可以将人机协同中的具体现实人替换为相应的专家知识,以实现更好效果。
针对人机协同问题,盖伟提出疑问:我们需要思考面对低质量数据,如何结合一线人员的经验,将其融入到模型的训练,或者对低质量数据的弥补中去?模型具备强大的学习能力,在这个过程中如何能把人机更好地融合起来,在这个系统里面发挥人的作用?针对盖伟提出的问题,孟雷表示目前的人机协同有两种方式,第一种是人模拟机器,第二种是人和机器人去帮忙检测,但是两方如何合力完成一件事情仍旧很难。
社会治理事件包含大量治理主体、要素、及其间的复杂交互关系,因此治理事件的推演具有博弈演化性质,需要使用复杂网络建模。与会专家就如何结合强化学习、多主体博弈、时序图卷积网络等计算模型建模社会治理模型的自主进化过程、能否使用博弈模型揭示社会治理事件的机理和演化机制等方面展开思辨讨论,形成以下输出:
思辨点1:社会治理事件的建模需要考虑哪些因素?难点在哪里?
针对李西娜的观点,主持人孟雷提出问题,要素建模的关键是确定主体,以疫情为例,博弈双方为政府和居民,个人的目标为完成日常生活,政府目标是减少人员流动。在社会治理环境下,选择要素是否很困难?在确定主体的时候,政府为一方,而居民具备同质性,也具备个性,一般会考虑居民的个性作为很多主体吗?李西娜表示,同质主体归为一个主体,不同质的划分为独立主体,一般来说至多四方主体。一般把很多居民同质化,认为是一类主体,与政府做两方博弈,不过也可以考虑居民的个性,将其视作复杂网络中的节点。针对复杂网络,孟雷继续提出问题:用复杂网络去建模是否存在难点?在推理上有什么难点博弈方多为两方,环境因素等事件影响因素可以有很多吗?李西娜表示,用复杂网络建模和推理,难点在于如何去刻画个性(异质性)。若博弈方多为两方,环境因素等事件影响因素可以有很多,把它们作为目标函数的一部分即可。
思辨点2:社会治理事件的博弈模型该如何设计?
针对在博弈论中,社会治理事件的建模一般用什么模型问题:李西娜表示,社会治理事件的表示其实是选择博弈策略的问题,比如政府是否加强监督,企业是否遵守规则,根据不同的策略主体可以表现出不同的意愿。一般先在博弈论中建立一个目标模型,再在复杂网络中建立模型,网络节点人物根据所服从网络拓扑特征设定不同的网络类型,将博弈论综合功能的模型作为复杂网络中的规则。吕洪涛表示,运用博弈论,可以通过仿真建模单纯地进行推演决策,通过仿真实验推演系统的变化,这样可以处理更加复杂的场景,以疫情为例,例如政府希望降低感染者数量,居民决定是否做核酸以及多久做一次核酸,这些目标就是每一方主体的目标函数,通过仿真的方式来让系统自发地演化,通过一轮一轮的演化,我们可以看到最后的推演结果。从社会治理的这个角度,通过仿真的方式来用多主体博弈对社会治理中的实际问题进行建模是一个有效的路径。
针对多主体博弈方式,吕洪涛表示:博弈论的前提假设是,每一个参与者都是理性的,只优化各自的目标函数。目标函数下主体只做出最符合自身利益的决策,但是全局上可能存在资源浪费等问题。这种问题可以通过多主体博弈的方式进行刻画和描述,通过一些规则和工具来辅助主体做更好的决策。李照川针对吕洪涛的观点表示反对:他认为多智能体之间可能存在矛盾,需要彼此之间不断的沟通和交流,通过算法上或者其他更好解决办法,比如跟政府商讨的一些流程来化解矛盾。在基层治理中,矛盾纠纷调解很有效。
吕洪涛针对李照川提到的矛盾纠纷调解的方法发表了不同见解:他表示,博弈论中最主要的还是刻画主体的行为和目标函数,最终在博弈中达到多主体的稳态。我们需要把社会治理问题抽象为数学问题,判断其是否满足博弈论的两个基本假设,一是存在多个理性的参与方,每个主体需要优化自己的目标;二是个主体有自己可选的策略,且策略选择对其他主体存在影响。矛盾调解目前在数学上较难建模。
针对社会治理事件建模,杜萍表示人群疏散中主要是用社会力模型对人群进行建模,并采用传染病模型对情绪传染问题进行建模,当人群中产生情绪躁动时就容易引发一系列事件,通过设置安全员,降低人群情绪等方法可以防止情绪传染,让整个人群的情绪趋于缓和。这一方法同样可以应用于线上的情绪传播问题。
思辨点3:能否结合数据驱动的深度学习缓解传统博弈模型预设参数依赖?
针对博弈模型预测社会治理实践推演问题,李西娜表示,社会治理实践的推演中,不同博弈主体面对多个博弈策略的时候,在复杂网络中的决策会影响到其他人,并对其他主体的决策进行模仿学习。吕洪涛对李西娜的观点做了补充:他表示可以用博弈论的方法,构建一个数字化模型,从而能够对社会治理事件的演化进行一个数学方面的推理。多主体博弈技术是可以结合复杂网络以及博弈方,决策空间定义,以及每一个主体目标函数的定义,但是我们也通过讨论发现多主体博弈其实更适合于宏观性质的推演,比如居民,我们尽量把他们当成一个整体来看,这样可以让我们推理不会那么复杂,更好去处理我们的数据。我们需要对社会治理事件具备充分深入了解,这是确定角色目标函数和影响因素是否合理的关键,也是推演的前提。方法上可以采取对特定因素进行测试,判断加入特定因素前后对社会治理事件推演结果的影响。另外,我们可以通过深度学习技术,如通过图神经网络描述社会治理事件上的个体,通过数据驱动的方式进行推演和预测。
针对主持人孟雷的观点,吕洪涛做出了补充,他表示:可以通过一些深度学习方法,将矛盾调解场景里面简单的决策模式用图卷积神经网络定义出来去做仿真推演。如果不去做理论结果的推导,这就是相对容易的。基于这种推演虽然不是一种优化,但是依然可以在开始的时候调节一些参数来看看结果是不是能够变好,例如刚才的矛盾调解场景,需要定义什么样的概率会让矛盾双方的态度趋向于缓和,这种概率在我们现实生活中有没有一些因素能够去影响它?例如通过一些社会教育,让他们在遇到矛盾情况下,发生冲突的几率下降,这个参数的变化,我们可以通过主体博弈方式进行仿真或推演,通过这种多主体博弈的方式,来来判断什么样的参数对于最终的结果有什么样的影响,从而来辅助我们进行决策。
孟雷针对专家的观点进行总结:我们基本知道博弈技术在推演上的优势是主流的深度学习技术所达不到的,如果简单的只是对于事件进行推演的话,深度学习技术也是一个非常好的方法,将治理事件上面的人描述成图神经网络,可以数据驱动的方法进行一个预测。从另外一个方面,将多主体博弈用于社会治理事件的推演存在一定要求,一是建模主体要明确,同时要把决策空间等可能情况定义好,另外一个方面也可以结合一些数据驱动的方法进行,在进行一个策略上面的选择使得我们的推理更好一点。
数字化社会治理需要同时考虑治理场景的动态数据和数字化的静态业务数据,需要物理和数字世界之间的数据和计算资源实现互联互通,以及智能化推演和决策模型的实时调度。与会专家围绕“数字孪生技术的应用对社会治理事件感知、处理、调控整个流程中的作用”“数字孪生、元宇宙等前沿数字生态架构与技术如何为智慧社会治理的感知、交互和调度方式提供建设思路?”“数字化社会治理平台该以软件系统形态集成在数据中台进行统一存储、管理和调度,还是以云边端协调架构提升系统的时效、容量和算力的需求?”等话题展开讨论,形成以下思辨点及意见输出:
思辨点1:数字孪生技术如何支持社会治理事件的全周期感知和调控?
孟雷针对思辨点1作出补充:数字孪生调控很重要,如果摄像头检测出不法行为,我们前去制止存在时效性的问题,那么采取在比较关键的节点提前布置一些硬件,如双向喊话摄像头,或者通过机器人机器狗去做类似的事情?针对这个问题,王薇表示,目前达不到这个程度,但是机器人可以进行行为捕获并对场景进行分析,观察、捕捉到治理数据,通过挖掘数据背后它存在的因果关系,建立发生的场景以及导致的场景之间的关联,以逐渐挖掘背后这个产生的规律。她认为在这方面可以做一些工作,将发现的规律融入到整个的社会治理的大框架里去。微观层次上机器人从所感知到的数据当中来挖掘出因果关系,决策层面上面对这种关系我们如何应对,比如在高层可以部署强化学习,然后实现层层往下实施,层层往上反馈。她认为机器人在未来的社会治理方面,一定会起到收集社会治理方面存在的各种问题的作用。但问题本身存在时效性,所以难以在当时就能发现其背后因果关系。但是通过将机器人角色融入到整体框架里面去,机器人可以通过算法实现自主学习。
盖伟提出问题,目前感知和交互的方法很多,一线操作中,数据孪生与现有方法的不同,有什么需要注意的呢?李照川表示,模型最看重的是稳定性和质量,以及能否完成客户要完成的事情?关键就是在于最后形成一些指标,体征和决策。主持人孟雷根据李照川观点中的指标继续提问:指标是否是提取出来的处理过的信息?交互设备还有其他作用和应用场景吗?李照川表示,指标可以理解为简单模型,简单模型再组装为复杂模型则为体征,下一步则是客户决策。如果能满足这几点,通过决策告知客户可信度,就能形成完整链条。针对交互设备的其他应用场景问题,李照川表示调研、咨询、虚拟数字人去解答是常见交互方式,其他的比如正规的有12345热线。
思辨点2:面向社会治理场景的数字孪生平台该如何建设?
针对面向社会治理场景的数字孪生平台建设问题,李新涉及数字景区方面工作,他通过列举景区建模的例子,提出有一种成熟的数字景区规划方案:通过对整个景区做建模,建立数字孪生系统,将所有的摄像头接入系统,实现数字孪生模型和VR导览相结合的功能,用户在景区可以享受推荐路线、景区知识点视频和音频的综合导览服务,同时也用到了目标检测、人脸识别等应用,这一方面和社会治理有一些业务存在相似和共通性。
孟雷针对讨论做出总结,智慧景区和社会治理都涉及到数字孪生,在总体架构上存在共性。VR导览等本身和社会治理的部分业务也很相似,但在底层会涉及到很多问题,如交互设备之间wifi连接的距离问题,三维场景存在显示卡的问题。
图8.论坛输出总结讨论现场
经过3个小时的闭门论坛讨论,两个议题的讨论完成,接下来进行了论坛输出总结,该总结由议题一与议题二的主持人刘宁和孟雷进行总结发言,随后与会专家进行了热烈讨论,两个议题的观点输出在论坛的第三阶段输出总结讨论中进行碰撞优化,对于数字化助推社会治理的多个议题形成了共识,包括:
(1)现有数字化社会治理手段亟待解决的痛点问题:一是平台的数据流转和异常反馈依赖网格员手动录入和预设阈值,业务数字化、自动化程度提升空间大;二是三维实景化建设基础设施不全、治理业务全周期的要素和数字模型缺乏,需要探索数字孪生等新技术新概念、以完成治理模式的渐进式改革创新。
(2)社会治理数字化的技术需求:现有治理业务模式需要业务数字化和实景化建设、稳步实现数字化转型;需要结合人工智能和三维建模技术、打通治理业务自动化和实景化管控的技术瓶颈;需要结合大数据技术、人工智能技术、通信技术实现“强度整合、高度共享、深度应用”的数字化社会治理新理念和新模式,助力社会治理、经济发展和学术科研生态环境建设。
(3)社会治理数字化转型的主要挑战:包括数据获取的精度、数据传输、数据管理和共享、数据治理建模复杂度、人工智能和业务场景的有机结合等。可以着重把数据治理的过程进行标准化,获取需求并把需求传达给研究人员,从而更好地应用于社会治理数字化转型。
(4)社会治理场景的数字化建模手段:提出并形成统一的数据评估标准、使用联邦学习挖掘重要数据、通过人机协同方法进行数据模型矫正。
(6)社会治理数字化平台功能架构:需要结合数字化技术提升抗干扰能力强、精度高、通用性强、加速创新等优势,在算力方面比较推荐边缘计算,在满足算力需求的同时整个系统能够具有比较高的时效性。
(7)实景三维建设:虽然三维模型受系统建设、信赖度不高、要价太高、数据量大、加载慢等现状所限,但在城市化高层建筑场景、地形外貌描述等场景,其应用场景远远大于二维模型,可以通过无人机扫描解决三维信息获取和精度问题,通过将重建模型存储在本地来解决因为数据量大而导致的加载慢问题。建模多种多样,还需要对数据有充分的了解。
(8)数据隐私:联邦学习技术在保护隐私方面会有很大的作用,通过联邦学习可以让模型在各方数据之中训练更好的大模型,同时保护各方数据的隐私性,而且在社会治理中是有广泛应用场景的,比如警方的反洗钱工作、银行与公安数据互通问题等。
(9)可信计算:涉及到决策可信问题,可以使用区块链技术,直接抽取规则的离散深度学习模型,决策树,基于示例的方法等,都可以帮助建立可信赖的决策模型,提供决策可信。但仍要注意,算法技术要根据应用而言,具体情况具体分析。