大数据如何改善社会治理:国外“大数据社会福祉”运动的案例分析和借鉴理论

原标题:大数据如何改善社会治理:国外“大数据社会福祉”运动的案例分析和借鉴基金项目:国家社会科学基金重大项目“群体行为涌现机理及风险辨识研究”(编号:11&ZD174);教育部人文社科基金一般项目“基于社交网络的老年人健康传播应用研究”(编号:14YJC860029)

作者:吴湛微,上海交通大学媒体与设计学院讲师;禹卫华,上海交通大学媒体与设计学院副教授,上海200240

doi:10.3782/j.issn.1006-0863.2016.01.20

一、背景

今年,国务院印发《促进大数据发展行动纲要》明确指出大数据将成为提升政府治理能力的新途径,提出:建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制,…,推动政府管理理念和社会治理模式的进步。

与此同时,国外学术界和政府管理部门近年来也发起了一项“大数据社会福祉”(bigdataforsocialgood)运动。与我国的目标相似,该运动也尝试将大数据技术与社会治理相结合,以数据驱动的方式应对现代社会中面临的一些复杂问题,增进社会福祉。在政府层面,华盛顿、伦敦、慕尼黑、纽约等做了不少探索,成功运用大数据为政府治理问题提供了支持;在研究层面,ACM、IEEE等国际学术联合体设立了专题会议讨论大数据与社会治理的结合;在社会层面,企业、高校、公益组织等开始积极探索应用模式。我们认为总结这些初期探索的经验将有助于我国各级政府更快更好地发展大数据社会治理。

二、案例选择和综述

我们从公开资料中广泛收集了261个案例,并通过三次筛选最终总结了41个案例。

三、大数据用于改善社会治理的模式总结

通过对案例集的进一步分析,我们识别了国外大数据社会治理的一些常用模式,可以作为借鉴。

(一)大数据开放,提高基础服务能力

(二)大数据决策,实现科学决策

这一模式将原始大数据加工成能解释、预测社会现象的精炼数据,用于帮助决策者掌握更全面的信息或更有力的证据,从而增强决策的科学性。通过分析案例集,我们发现有两类基本方法被大量使用。

第二类是预测,即根据现有数据预测未来可能发生的事件,并提前做好预案。例如,多地劳动部门根据就业、企业、经济和教育数据分析劳动技能的供需趋势,引导企业、就业者和教育者提前规划和实施技能培训、填补“技能沟”,以达到充分就业的目的。此外,波士顿教育部门通过成绩、投诉、奖学金和学生活动等数据来预测学生辍学的可能性并提前干预;芝加哥公共教育部门根据学生、学校和教师数据,结合地区治安、住宅、人口和经济发展数据预测辖区各学校的招生人数,并提前划拨公共教育经费;纽约将全市33万余栋建筑物分为2400类并分别预测了火灾发生情况和拟定针对性救火方案,有效提高了救火效率、降低了火灾损失,等等。

在本文案例集中,有59%的案例为大数据决策服务,其中28%使用了某种关联方法,18%使用了某种预测方法,13%同时使用了两种方法。

(三)大数据沟通,改善外部环境

大数据技术也可以用于收集社会数据,例如通过社交网络,了解群众观点,或改善群众关系,并有利于说服。Kosinski等发现仅通过社交网站(如facebook)的点赞数据即可推测用户的年龄、性别、种族、政治观点、宗教态度等,从而可以根据这些数据有针对性地投放精心设计的说服信息。[6]类似的方法已在美国大选中成功运用。

在本文的案例集中,有15%的案例使用了某种形式的大数据沟通。

(四)大数据群体智慧,弥补政府资源不足

社会治理的政策设计和执行都需要大量的人力物力,一些任务可能极为细琐繁复,完全依靠政府力量往往难以完成或者效率不高。这一模式通过发动群众参与大数据建设,利用群体智慧(wisdomofcrowd)来弥补政府资源的不足。群体智慧可以从数据、技术和人力资源等多个方面弥补政府的不足,对大数据社会治理起到极大的支持作用。例如,波士顿市经常下雪,消防栓很容易被雪埋住找不到而耽误消防任务。由于消防栓众多,日常维护光靠消防局显然人手不足。因此波士顿消防局开发了一个称为“认领消防栓”的应用,邀请居民认领一个住宅附近的消防栓,帮助除雪等日常维护,受到居民的积极响应。类似的案例有,英国借助群体智慧维护道路和附属设施;纽约发动群体智慧利用公共空间设计环境艺术和扩大绿化;芝加哥利用群体智慧帮助流浪汉和孤寡老人等。此外,多地政府以支持数据竞赛、工作坊和夏令营等形式发动高校研究机构、公益组织和有条件的个体自愿者基于开放大数据设计、开发数据产品和应用,服务社会,均取得良好效果。

在案例集中,有多达82%的案例使用了某种形式的群体智慧,74%的案例中使用了高校、行业组织等提供的开源软件。

(一)既要重视数据变大,也要重视大数据变小

第二种是从对数据的表达入手,主要是对数据进行可视化处理。以数字形式呈现,人类一次只能理解一个数据;但以图像形式呈现,人类一次可以理解很多数据。因此利用人类认知能力的特点,采用可视化形式呈现数据,也是让大数据变小的有效方法。在本文使用的案例集中,除去单纯的数据接口以外,有高达94%的案例使用了数据可视化。

要用好大数据,数据变大(原始数据积累)和数据变小(数据处理和数据可视化)其实缺一不可,但目前我国的大数据平台仍普遍停留在能“大”不能“小”的状态。

截至10月15日,我国的上海、北京、贵州三大数据平台分别提供491类、303类和22类(大类,未细分)开放数据,均仅提供数据文件。而美国洛杉矶、纽约和旧金山三个数据平台分别开放数据1187类、1250类和786类。单从数量来看,中外数据平台的原始数据相差并不大。但国外数据平台普遍提供数据排序、过滤、计算等分析模块和多种可视化工具,让大数据变小,便于理解和使用。相比之下,国内平台仅提供原始“大数据”,一般公众很难有效运用,导致利用率非常低。平均用户访问量的对比也证实了这一情况:国内数据平台的平均访问量只有数百次,约为国外同类平台的1/100到1/1000。

(二)既要重视数据平台,也应重视数据应用和服务

除了数据平台以外,大数据更有价值的一面是将数据深度加工后融入日常生活,这就需要开发多种多样的高可用性数据应用和服务。这些应用和服务可以增加数据平台的使用率,提高社会治理水平,改善人们的生活,并创造新的就业和发展机会。根据北京、上海、贵州三个大数据平台官方网站显示,各自的应用数量分别为15个、75个和6个。作为比较,仅2015年纽约市举行的NYCBigApps比赛就征集到452个应用。下载量的差距更大,最大可达数百倍。经过我们的分析,国内应用大多使用单一数据下载量的差距更大,最大可达数百倍。需求分析和界面设计也存在一些不足之处,造成可用性不高。此外,数据接口服务的差距也较大,如纽约市提供11种,而国内平台仅北京提供了1种。

不解决好应用和服务的问题,重金打造的开放大数据平台很容易“空心化”,难以对社会治理和社会福祉产生应有的支持。这个问题应当引起重视。

(三)有必要重视对群体智慧的运用和发展

我国大数据平台缺乏应用的现状与未能积极利用群体智慧有很大关系。大数据平台建设主要是技术问题,可以通过一两个技术过硬的企业来完成。但大数据在社会各领域的运用则完全是另一回事,单纯依靠个别企业不可能理解千变万化的社会问题和群众需求。因此国外政府大数据治理过程中普遍尝试引入社会群体的力量来帮助收集数据、识别需求、开发应用以更好地服务社会,即群体智慧。目前主要有三种推进方式:

第一种是政府自身发起大数据应用竞赛。例如,美国政府为了鼓励使用data.gov的开放数据,专门建立了challenge.gov网站,持续发布数据竞赛,最高奖励达2000万美元。除此之外,美欧各城市也经常发起数据应用竞赛。最早的一次是2009年华盛顿市耗资5万美元组织的政府开放大数据APP开发大赛,在30天内征集到47款应用。这些应用后来发展成为估值230万美元的各种软件产品。[7]

第二种是利用高校研究机构学术优势开办工作坊、组织夏令营。目前,哈佛大学、芝加哥大学、华盛顿大学等高校都经常组织“大数据社会福祉”工作坊和学术夏令营并提供专项资金支持。这些工作坊和夏令营与所在地政府合作,全社会征集参与者,针对具体的社会治理问题设计开发了许多成功的数据产品,并普及了数据思维和数据产品的设计开发方法。

五、结语

本文的研究说明,我国的大数据社会治理还刚刚起步,存在很大的提高空间。但我国各级政府的执行力很强,只要能将建设热情和对成功经验的借鉴结合起来,相信我国的大数据社会治理一定能得到快速发展,并对提高全社会的福祉起到应有的推动作用。

[参考文献]

[1]于浩.大数据时代政府数据管理的机遇、挑战与对策[J].中国行政管理,2015(3).

[2]郭建锦,郭建平.大数据背景下的国家治理能力建设研究[J].中国行政管理,2015(3).

[3]JohnCarloBertot,郑磊,徐慧娜,包琳达.大数据与开放数据的政策框架:问题、政策与建议[J].电子政务,2014(1).

[5]JohnsonJA.FromOpenDatatoInformationJustice.EthicsandInformationTechnology,2014,16(4):263-274.

[6]Kosinski,M.,Stillwell,D.,&Graepel,T.Privatetraitsandattributesarepredictablefromdigitalrecordsofhumanbehavior.ProceedingsoftheNationalAcademyofSciences,2013.

HowCouldBigDataImproveSocialGovernance:AnAnalysisof“BigDataforSocialGood”Movement

WuZhanweiYuWeihua

[Abstract]Recently,especiallysincetheissueof"ActionPlanforpromotingtheBigDataDevelopment"bytheStateCouncilofthePeople'sRepublicofChina,bigdataforsocialgovernancehasgraduallybecomeahottopicbetweengovernmentandscholars.Basedontheanalysisofexamplesfromthe"bigdataforsocialgood"movement,thispapersummarizedfourbasicpatternsandrelatedoperatingexperiencesofusingbigdataforsocialgovernancesuchasopendata,bigdatafordecisionmaking,bigdatacommunicationandbigdatawisdomofcrowd.AftercomparingwithChina'ssituation,wesuggestconcerningaboutthreeissueswhichinclude:equalemphasisonbothbigdataandsmalldata,equalemphasisonbothplatformandapplication,andmakegooduseofwisdomofcrowd.

[Keywords]socialgovernance,bigdataforsocialdata,wisdomofcrowd

[Authors]WuZhanweiisAssistantProfessoratSchoolofMediaandDesign,ShanghaiJiaotongUniversity.YuWeihuaisAssociateProfessoratSchoolofMediaandDesign,ShanghaiJiaotongUniversity.Shanghai200240

THE END
1.6种数据分析实战项目!建议收藏供应链优化是指对公司的供应链数据进行分析,以提高供应链的效率和可靠性。通过对供应链数据的分析,可以帮助企业识别瓶颈和风险点,优化供应链的运作流程,降低采购成本,提高生产能力和产品质量。以上就是六个常见的数据分析实战项目案例。数据分析的应用领域非常广泛,可以帮助企业提高运营效率、优化决策、发现商机等。https://baijiahao.baidu.com/s?id=1807794217589643300&wfr=spider&for=pc
2.案例全程附图EXCEL数据分析实例数据分析项目案例那么接下来我们可以按照这两种数据提出几个问题: 1、用户的个人信息是否对结果有着明显的影响(哪些属性影响大)? 2、营销人员的行为是否对结果有着明显的影响(哪些属性影响大)? 4 分析过程 4.1 年龄 此时我们探究年龄与结果是否有明显的影响。 首先我们可以查看以下数据集中的年龄统计分布情况: https://blog.csdn.net/2401_84247423/article/details/138245613
3.小型案例集合案例5 投给谁。(帕累托分析模型) 某零售电商企业旗下有10款产品,每款产品的销售效益是不一样的,最近企业的盈利增长受阻,想要调整一下产品的资源投入情况,作为数据分析师,如何划分? 1 先确定维度指标分析方法: 维度:产品销售 指标:毛利率、销售额 分析方法:累计对比 https://zhuanlan.zhihu.com/p/470302845
4.10个超有趣的经典数据分析案例!让你轻松了解数据分析!——九数云BI随着互联网和移动互联网的不断发展,数据量呈爆发式增长态势,大数据有着Volume(大量)、velocity(高速)、variety(多样)、value(价值)的4V特性。数据作为和土地、资本、劳动力、技术一样的生产要素,在数字经济不断深入发展的过程中,地位愈发凸显。下面我们带来了几个经典数据分析案例,帮助大家理解。 https://www.jiushuyun.com/other/14643.html
5.精选30个数据分析案例,建议收藏!腾讯云开发者社区之前,我一直关注的数据大神“郭炜”,他是前易观的 CTO,易观大家都知道,专业做大数据分析研究的,他最近在极客时间上出了一个《数据分析思维课》专栏,把自己20 年来的数据分析心法、思考方式、项目经验都浓缩在这里了。 专栏刚完结,我也读的差不多了,非常通识,而且擅用案例,比如讲「幸存者偏差」时,就举了 201https://cloud.tencent.com/developer/article/1966722
6.商业分析实战项目案例分析商业分析专业,以数理统计和机器学习为核心,以编程为手段的辅助商业决策,其主要应用领域包括市场营销、风险分析、客户分析、供应链分析、人力资源分析,web分析等等。 指南者的商业分析项目实战,就以数据分析方法为核心,引用热门项目实战,由指导老师带领学员,进行明确分析目标,获取分析数据,清洗和变换数据,描述统计分析和深入http://m2.compassedu.hk/article_4328
7.Python数据分析人口分析案例 需求: 导入文件,查看原始数据 将人口数据和各州简称数据进行合并 将合并的数据中重复的abbreviation列进行删除 查看存在缺失数据的列 找到有哪些state/region使得state的值为NaN,进行去重操作 为找到的这些state/region的state项补上正确的值,从而去除掉state这一列的所有NaN https://www.cnblogs.com/linranran/p/13307951.html
8.数据分析案例基于多元线性回归算法预测学生期末成绩数据分析案例-基于多元线性回归算法预测学生期末成绩 一、加载数据集 该数据集包含了不同年级数名学生的科目成绩及一些其它的原始 信息,例如学号、姓名、身份证号等,总成绩由考试成绩、作业成绩、实验成绩等通过一定的规律计算得出。 首先,导入本次实验用到的第三方库https://developer.aliyun.com/article/1123414
9.成功大数据项目实战案例福特汽车用这些方法把所有的数据都界定好了以后,第二步是把项目交给了一个差不多200人的大数据分析专业团队,他们获取和搜索所需的外部数据,比方说第三方合同网站,区域经济数据、就业数据等等。 第三步是他们获得数据以后,就开始对数据进行建模分析、挖掘,为销售和决策部门提供精准可靠的角色选择和效果分析,也就是说https://cda.pinggu.org/view/20251.html
10.基于Hadoop部署实践对网站日志分析(大数据分析案例)1、项目概述 本次要实践的数据日志来源于国内某技术学习论坛,该论坛由某培训机构主办,汇聚了众多技术学习者,每天都有人发帖、回帖。至此,我们通过Python网络爬虫手段进行数据抓取,将我们网站数据(2013-05-30,2013-05-31)保存为两个日志文件,由于文件大小超出我们一般的分析工具处理的范围,故借助Hadoop来完成本次的实https://blog.51cto.com/u_15172991/5716496
11.通过数据分析驱动用户增长知乎Live整理稿假设是看 6 个月的风险,现在开始设置实验对照组,那么要能看到用户的表现的话至少需要等到 6 个月之后,再开始花几个月半年(这算比较快的)做模型和数据分析,之后再等 6 个月看结果,所以一个项目完整的流程下来都是至少一两年的。基本上是由行业特性决定的,不可能像互联网行业的一些项目周期这么快。https://weibo.com/p/1001603993976268003547
12.鲲鹏产业学院课程介绍《鲲鹏云大数据服务与基础应用实训》课程是基于鲲鹏云大数据的实践课程,提供鲲鹏架构的大数据网站流量离线分析项目用于学生进行实践,项目案例技术面涉及广,按照真实项目场景分析以及技术团队分工及工作流程介绍,与企业项目一致,学生完成后可以达到大数据高级开发工程师水平,采用实训周方式进行授课。 https://xxdz.hnuahe.edu.cn/info/2062/2760.htm
13.我的第一个数据分析项目——51job“数据分析”岗位分析(爬虫篇)最初我把重心都放在编写爬虫代码上,后来发现如果要走数据分析这条路的话,爬虫仅仅是个辅助工具,真正重要的数据分析思维,所以有了我的第一个数据分析项目。 我在网上找到了一个类似的分析案例,学习并参考,当然还有取长补短。参考案例链接:https://blog.csdn.net/lbship/article/details/79452459 https://www.jianshu.com/p/309493fe5c7b
14.案例分享养猪行业的大数据分析,牧原是这样做的!以下方案案例以FineBI构建的自助分析系统为例做分享。 三、总体架构方案 1.项目方案 传统关系型数据库的性能限制,导致难以支持大量级数据多维度查询计算,此时如果直接对接传统关系型数据库进行数据分析查询,就容易出现性能瓶颈。因此项目中采用了FineBI自带的需要做数据抽取的数据引擎。由于前期数据量级不大,根据推荐,直https://maimai.cn/article/detail?fid=806048938&efid=NbSAxmtChWmc2of9L-IZoA