当前,“智慧城市”已成为信息化时代城市治理和社会发展的新模式、新形态。智慧城市的理念是充分运用信息和通信技术手段感测、分析、整合城市运行核心系统的各项关键信息,对包括民生、环保、公共安全、城市服务、工商业活动在内的各种需求做出智能的响应,为人类创造更美好的城市生活。智慧的城市离不开智慧的政府,作为智慧政府在互联网上的形象代表,智慧政府门户将成为智慧城市发展最为重要的组成部分之一。
本文在回顾发达国家在基于大数据提升智慧政府网站服务能力方面成功经验的基础上,结合国家信息中心近年来围绕国家各部委和地方政府网站的大数据分析、服务优化等领域的探索与实践,介绍了政府网站的大数据分析技术及其应用案例。
首先,从政府网站分析工具上看,目前美国、英国、澳大利亚、加拿大、日本、韩国、新加坡、荷兰、丹麦、瑞典、挪威、芬兰、新西兰等发达国家中央政府门户网站和联合国门户网站均已部署了基于云服务模式的网站用户行为分析系统。基于这种用户需求挖掘技术,欧美国家政府可以提供更加个性化的政府网上服务,并通过对用户访问规律和点击行为的动态监测,有针对性地改进政府网上服务。
表1发达国家和国际组织政府网站使用的云分析工具一览表
网站名称
网站地址
云分析工具
联合国网站
google-analytics
美国政府门户网站
iPerceptions
英国首相府门户网站
澳大利亚政府门户网站
Urchin
日本首相官邸门户网站
加拿大政府门户网站
韩国政府门户网站
新加坡政府门户网站
丹麦政府门户网站
Siteimprove
瑞典政府门户网站
挪威政府门户网站
芬兰政府门户网站
Snoobi
新西兰政府门户网站
本文所使用的政府网站大数据集合主要来自中国政务网站智能分析云中心。为确保政府网站所属机构隐私信息不被泄露,本文所采用的研究数据仅用于反映政府网站服务运行总体情况,并对涉及具体网站的信息进行匿名化处理,仅保留研究所需要的基本内容。
表2政府网站2013年1-9月份热点需求关键词
月度
需求热点
1月
八项规定、收入支出决算表、严控机构编制、食品安全、全国农业工作会议、十二五规划、社保缴费查询、公积金查询、港澳通行证、会计证
2月
贯彻落实八项规定、社保审计、生态文明、元宵节、招聘信息
3月
乡镇机构改革、国务院机构改革、三定方案、十八大、事业单位分类、部际联席会议、雷锋学习
4月
政府机构改革、两会经济热点、春季森林防火、中国梦、雅安地震
5月
事业单位分类目录、美丽中国、芦山地震、爱鸟周、毒生姜、百人计划
6月
驾照消分新规、事业单位改革、中小微企业、安全生产、神舟十号最新消息
7月
特种设备安全法、防汛、体制改革、美丽中国、最难就业季
8月
持续高温、行政改革、习近平在河北调研讲话、工业地产政策、群众路线
9月
廉洁自律、大气污染治理、城镇化、群众路线、教师节、黄金周
图1关于“玉米”的访问人次变化情况
图2关于“玉米除草”的访问人次变化情况
图3关于“玉米价格”的访问人次变化情况
(2)政府网站用户需求的地域差异分析
政府网站用户需求的地域差异性主要由来自行政辖区内外、国内外用户对于一级政府的公共服务需求的差异性所决定。笔者以82家样本政府网站中的省级政府门户网站和省级部门网站为对象,分析了省内用户、国内省外用户以及国外用户三类不同地域用户在各项基本需求分类中的差异性。如图4所示:
图4省级政府网站中不同地域用户需求的差异性
从图4可以看出,不同地域政府网站用户的需求分布具有明显的差异性。例如,政府机构名称、其他机构名称、人名和职务关键词,以及地名区划词等类用户需求中,省内用户的需求明显高于省外和国外用户,说明本地用户更加关心当地的知名企业、政府机构、行政地名和重要人物等信息。而文化旅游词中,省外用户和国外用户的需求明显高于省内用户。这提示我们,对于一个地方性政府网站而言,其所提供的不同类型的服务内容,所面向的用户群体在地域上具有明显差异性,在提供本地区知名企业信息、领导活动信息、地名区划信息时,主要目标用户群体是本地公众;而提供文化民俗、景区名胜、活动赛事等信息时,其目标用户群体则是外地用户。此外,非中文关键词的主要用户群体是海外用户,这说明政府网站提供外文版服务信息,能够很好地解决海外用户的语言问题,对于提升网站国际影响力具有重要作用。
以上是从行政区内外和国内外的角度,初步比较了政府网站用户的地域需求差异性。中国是一个幅员辽阔的国家,各地区经济状态、自然环境、文化习俗等千差万别,不同省份、不同地域用户对于同一类政府公共服务的需求同样存在显著差异性。仍以前文所分析的农业政府部门网站为例,笔者进一步分析了该网站上来自全国各地的互联网用户搜索各类主要农产品信息的地域分布差异性。图5选取了其中六类农产品加以分析:
1.茶叶信息需求地域分布
2.甘蔗信息需求地域分布
3.水稻信息需求地域分布
4.玉米信息需求地域分布
5.枣类信息需求地域分布
6.小麦信息需求地域分布
图5六类农作物信息需求的地域分布
1、用户站外搜索关键词语义分类框架
政府网站作为一类较为特殊的公共信息服务网站,其用户需求带有明显的以政府行政工作和社会公共话题为核心的特征。结合对政府网站用户需求的前期调研,本书作者提出了一套面向政府网站用户站外搜索关键词的语义分类框架。将政府网站用户的站外搜索词划分为8类,就各类关键词的包含内容及提取逻辑说明如下:
(1)人名职务词。
人名职务词主要包括三部分:
第一类是职务职称词。指关键词中包含各类职务、职称词的情况,如秘书长、区长、审判长、省长、委员、监狱长、调研员等。通过人工梳理的方式总结了党政机构和公共机构的常用职务职称的后缀词库。
第二类是名人姓名词汇。课题组手工收集了政治人物、历史名人、文化名人词、当代社会知名人士等姓名信息共28122条。
第三类是常见人名词,提取逻辑包括以下三类:
A:如果关键词长度=2,第一个字在百家姓中,且不属于其他关键词类别,则将其视为人名词;
B:如果关键词长度=3,若第一个字属于百家姓,或者前两字属于百家姓复姓,且不属于其他关键词类别,则将其视为人名词;
C:如果关键词长度=4,若前两字属于百家姓复姓,且不属于其他关键词类别,则将其视为人名词;
D:如果关键词长度>4,则从前往后扫描,如果出现“百家姓+常见人名组合”,则将其视为人名词。常见人名组合词库的制作方法如下:手工收集了互联网上常见的150万个网络人名,提取三字姓名的名称部分,取前5000个最常见的名称组合,如“婷婷”、“海燕”、“建华”、“丽娜”等,构建常用人名组合词库。匹配逻辑,当关键词不属于任何一类其他关键词类别时,且符合上述规则时,则该关键词属于人名词。
(2)公务公文词。
公务公文词库包括以下三部分:
(3)办事服务词。
人工提取关键词结尾符合办事服务词库特征的词。办事服务词库包括以下几类:
第一类是办事动作词,如复查、注销、报到、注册、填报、挂失、罚款、缴存、缴纳、报销等;
第三类是办事事项词,即表示一类办事事项的词,其又可以划分为以下几类:
表3办事事项词分类
分类
代表词
税费缴纳
座机费、报名费、抚养费、检验费、费、工本费、资费、学费、水费、税费、管理费、施工费、工本费、电费、鉴定费、报建费、缴费、收费、手续费、处置费、使用费、购置税、退税、契税、个税、所得税、缴税
证卡办理
公交卡、市民卡、公积金卡、贷款卡、电卡、安置卡、医保卡、办证、上岗证、资格证、合格证、换证、公证、旅行证、通行证、婚证、登记证、许可证、准刻证、代码证、凭证、枪证、权证、光荣证、驾驶证、准生证、结婚证、运输证、失业证、执业证、毕业证、使用证、婚育证、设置证、安置证
社保事项
退休金、保金、维修资金、互助金、保障金、优抚金、公积金、基金、养老金、抚恤金、保证金、补偿金、参保、社保、医保、养老保险档次
购房租房
购房、保障房、廉租房、适用房、经适房、拆迁、二手房、商品房、限价房、公积金封存
其他
户口、电价、年审、安检、年检、牌号、限号、尾号、挂号、选号、摇号、购车、审车等
(4)政府机构词。
(5)其他机构词。
所谓其他机构词,主要包括以下几类:
第一类是经营性单位词,即以诸如公司、茶城、咖啡厅、金融城、夜市、营业厅、塑料城、交易会、家具城、酒店、皮革城、菜市场、餐馆等为后缀的词;
第二类是事业单位词,即以诸如医院、文化活动室、托儿所、敬老院、火葬场、看守所、监狱、大学、研究所、中学、信息中心等为后缀的词;
第三类是著名企业品牌词,即以诸如家乐福、肯德基、沃尔玛、三星、富士康、奥特莱斯等知名品牌中文名称为后缀的词。
(6)文化旅游词。
文化旅游词的提取方案包括以下三方面:
第二类,是提取具有共性的景点结尾词,采用结尾匹配的方式提取关键词,如科技馆、冰雪世界、水上世界、海洋世界、动物世界、海底世界、玫瑰园、动物园、体育城、大舞台、风情街、博览园、博览会、音乐厅等;
第三类,是提取旅游活动内容的关键词,采用结尾匹配的方式提取关键词,如垂钓、采摘、踏青游、短途游、旅行、自由行、好去处等。
(7)地名区划词。
地名区划词提取方案包括两条路径:
首先,提取地名区划词的共性结尾,采用结尾匹配的方式提取关键词,如社区、街道、镇、乡、港、经济合作区、出口加工区、科技园区、物流园区、产业园区功能区、发展区、工业区、创业园等;
其次,收集全国寸以上行政区划名称,并采用全文匹配的方式提取关键词。
(8)非中文词。
提取用户输入站外搜索关键词中不包含任何中文字符的关键词,并纳入这一类别。
2、政府网站用户站外搜索关键词的主题分类
通过对82家样本政府网站数据统计分析,将目前我国政府网站站外搜索关键词的主题划分为政府机构名称、公务公文词、办事服务类、人名和职务关键词、文化旅游类、地名区划类、其他机构名称、非中文关键词等八类。发现其中政府机构名称、公务公文词、办事服务类用户访问量排名前三,占比分别为26%、24%、16%,是最主要的需求类别。各类关键词的比例分布情况如下:
图6样本政府网站用户需求情况分布
3、不同类型政府网站用户站外搜索词主题分布的差异性
为进一步分析不同类型政府门户网站用户站外搜索需求分布的差异性,此处进一步选取了部委门户、省级门户和市区县门户三类政府网站,比较了上述8类用户搜索关键词的分布情况,如图7所示:
图7三类政府网站用户站外搜索关键词的主题分布差异比较
从图7可以看出:
(1)三类政府网站用户中,直接查找政府机构名称词的用户比例分布基本相同,说明这类用户的需求与政府网站业务特征无关,不会因为政府网站的业务层级或业务结构变化而出现波动。
(3)办事服务词中,省级门户网站的用户需求比重明显高于部委门户和市区县门户网站。这可能主要是由于两点原因造成的:一是省级门户网站与部委门户网站的业务职能定位各有侧重,部委门户网站国家偏重政策发布、信息公开等内容,而地方门户网站则更加注重在线办事服务的提供。二是省级政府门户网站相比基层政府网站而言,其服务规模和服务水平更高,网站上提供的公共服务事项更加齐全,因此吸引更多有办事服务需求的用户访问。
随着政府网站大数据分析技术的不断完善,政府网站服务优化工作需要改变当前以定性判断为主、缺乏客观数据支撑“拍脑袋”决策的方式,通过系统、全面、深入的网站数据分析,形成以客观数据为主、经验直觉为辅的决策模式。通过开展网站用户需求和用户行为的数据分析,以真实的用户数据帮助网站管理部门和主管领导准确定位当前网站的服务短板,形成面向网站首页、栏目和具体页面改版优化的针对性建议,确保网站改版方案科学有效。
从用户访问政府网站元素层面的角度,可以将政府网站用户的访问行为从微观到宏观划分为页面元素点击行为、页面间跳转行为和栏目访问行为三个层面。对于单个用户而言,其在一次访问会话期间很可能会同时触发三类行为,比如用户在某政府网站的办事大厅栏目的A页面通过点击超链接来到了信息公开栏目的B页面,则其在这一过程中发生了三个层面的访问行为:首先,用户选择办事大厅栏目页中的某一个超链接,并进行了鼠标点击操作;其次,用户点击超链接之后,网站随之将用户从A页面跳转到了B页面;第三,从栏目的角度看,用户的访问栏目同样发生了切换,即从办事大厅栏目来到了信息公开栏目。
针对上述用户所触发的三个层次访问行为的分析,实际上对应了网站服务运行的三个层面,即页面元素设计(页面内)、服务流程设计(页面间)和栏目体系设计(栏目间)。基于这一考虑,可以从三个层面对基于大数据分析方法的智慧政府网站服务优化方式进行分析。
针对单个网站页面,可以运用用户鼠标点击热力图等分析工具对用户访问行为进行深入剖析。所谓点击热力图,就是借助于页面标签等用户行为采集技术,收集访问该页面用户鼠标点击行为的频次、位置等基本信息,并对页面上每一个像素按照其所吸引鼠标点击次数的多少绘制色彩,从多到少依次为黄色、橙色、红色、蓝色和白色。借助鼠标点击热力图分析工具,能够非常直观地反映用户需求热点的分布情况。以下以某质量监督检验检疫局网站首页的“在线服务”栏目的热力图分析为例,介绍基于热力图分析工具优化网站页面设计的基本思路。
质检局网站“在线服务”栏目是网站三大基本功能之一,并汇聚了质检局的各项服务内容。该栏目在设计时,使用了标签嵌套的方式展开信息,基本操作步骤如图8所示。可以分为四个步骤:
第一步:选择办事事项大类方式,包括按业务类别、使用对象、审批方式和办理机构四类。
第二步,选择办事事项小类,如业务类别分类下又包含了产品质量监督、通关、特种设备管理等10类办事事项。
第三步,选择具体事项名称,总局网站默认提供了4条办事事项的办事指南、表格下载、常见问题、结果查询、在线办理和业务咨询的入口。
第四步,如果上述四条办事事项不能满足用户需求,可以点击“more”按钮,查看该小类下的所有办事事项列表。
图8某质检总局门户网站“在线服务”栏目
为考察上述质检局网站在线服务栏目的四个步骤用户使用情况,在首页加载了页面点击热力图分析工具。图9显示了该网站首页“在线服务”栏目的热力图分布情况:
图9某质检局门户网站“在线服务”栏目热力图
可以看出,步骤2点击比例为8.25%,步骤3点击比例为2.02%。换句话说,就是用户在选择了办事事项小类之后,只有25%的人点击了具体办事事项名称;正常来说,另外75%用户没有点击具体事项的原因,很可能是由于默认显示的4条信息不是用户所需要的信息,因而选择点击“更多”以查找其他信息。但从热力图上看,步骤4“more”按钮的点击仅为0.24%。这说明大量用户很可能在选择完服务事项小类之后就流失掉了。
在基于数据分析发现上述用户体验问题之后,质检总局网站立即针对该问题进行了整改。将步骤4的“more”按钮改为中文“更多服务事项”,使其更加容易被中文用户接受;同时,按钮字体样式大大加大,使用了深蓝色加粗字体,使其更加醒目;第三,将步骤4的位置挪到了步骤3之下,使其更加服务用户使用习惯。如图10所示:
图10“在线服务”栏目按钮调整后页面
在完成上述改进后,笔者对该网站在线服务栏目的总访问量进行了进一步跟踪。发现自调整上述设计之后,在线服务栏目访问人次有了显著上升,栏目访问效果有了明显改善。如图11所示:
图11“在线服务”栏目访问情况
经过十余年发展,目前我国各级政府网站在线服务体系已经初具规模。在政府网站中,办事服务是一种比较特殊的服务内容,一个完整的政府在线服务,会有若干个网上办事环节,这种服务内容组织模式在一定程度上类似于电子商务网站的购物流程。通过分析政府网站在线服务流程各环节的用户访问行为指标,可以借助具体指标来判断网上办事业务的运转是否正常,包括:
(3)新老用户分布:对于仅需一次访问即可办理成功的办事服务,如果出现老用户比例过高的情况,说明办事流程存在不畅的问题。
(4)访问者系统环境:对于办事环节中跳出用户,可以分析其浏览器、分辨率等技术环境特征,判断用户流失的原因是否与网站的技术兼容性有关。可以基于办事流程漏斗图分析工具,分析办事流程各环节的转化率,定位转化率较低的网办环节,通过多维度剖析发现问题,进行针对性改进。
(5)不同办事环节的用户点击情况。基于用户点击热力图分析工具,可以分析网上办事流程不同环节用户点击行为异常情况,如果出现办事流程之外的区域出现较多点击,则说明网办流程设计存在一定问题。
漏斗图分析是电子商务网站分析中一种较为常见的用于业务流程管理的分析工具。在政府网站办事流程分析中,漏斗图可以清晰地展现政府网站上在线办事的各个环节中网民的路径变化。根据路径转化漏斗图,政府网站监测者可以直观了解每一步业务流程的实现率、流失率,并且可以将漏出的那部分用户选择出来进行多维度数据分析,了解网民流失原因,优化办事流程的设计。以某地方旅游局网站上提供的景区门票在线购买流程为例,从景区门票首页到购物车页面,再到确认订单页面以及最后的付款页面,漏斗图都非常直观地展现了每一流程的流量变化。如图12所示,5.17%的用户从首页来到了购物车页面,70.31%的用户在购物车页面选择继续浏览下一页面,而在付款页面中,94.52%的用户进入了付款页面,顺利完成了门票购买交易。
图12某旅游局网站门票购买服务漏斗图分析
图13某旅游局网站用户流失的原因分析
所谓栏目需求相似度分析,是通过判断两个栏目的用户群体实际需求的重合程度,并对比两个栏目在实际功能定位和内容主题上的差异性,根据不同情况提出解决对策的研究方法。具体来说,有以下两种情况:
(1)栏目A和栏目B分别从属于不同的大厅栏目,并且其政务属性具有明显分别,两个栏目的用户需求高度相似,这表明两个栏目尽管在政务分类上属于不同范畴,但很可能属于用户办事流程的不同环节,因此对于这类栏目,应当在彼此之间增加深度链接机制,从而方便用户在两个栏目服务之间来回切换;
(2)栏目A和栏目B分别从属于不同的大厅栏目,其政务属性没有明显差异,两个栏目的用户需求高度相似。在这种情况下,可以考虑将两个栏目合并,并按照突出特色的原则选择合并方向。通过栏目合并的方式,突出网站的特色服务,形成拳头产品。
栏目需求相似度分析的基本步骤是:首先,导出待分析栏目用户的站外搜索关键词列表。其次,编写Java程序,统计栏目两两之间关键词重合的比例,将其定义为栏目的相似性。基本公式是:栏目相似性=两个栏目的共同关键词数/两个栏目的关键词数之和。第三,根据上述结果,形成栏目关键词的相似性矩阵,将相似性矩阵导入SPSS,使用多维尺度分析功能进行可视化分析。多维尺度分析的基本原理,是结点之间以相似性连接(即把相似性定义成节点之间的空间距离)而形成的多维空间,按照一定规则投射到一个二维平面上。
对成都某政府门户网站政民互动的二级栏目需求相似度进行分析,结果如图14所示:
图14成都某网站政民互动栏目的需求相似度分析
从图14可以看出:
(1)政府信箱、市长信箱、市民话题三个栏目的用户需求高度相似,说明用户对于上述三个栏目的政务属性差异并不理解,而是倾向于将其视为同一类服务使用。尤其是市长信箱和政府信箱两个栏目,用户在使用时往往会分不清各自的功能差异,而造成不必要的困惑。由于市长信箱栏目是该网站最具特色的品牌栏目,而相比之下,政府信箱和市民话题栏目的使用人数均不多,因此建议将政府信箱和市民话题栏目合并入市长信箱栏目,从而整合资源,充分发挥市长信箱的品牌效应。
本文结合课题组近年来对政府网站大数据分析和政府网站服务优化方面的实践探索,介绍了当前我国智慧政府门户建设过程中应当着重解决的技术问题和应用案例。希望本文研究,能够为中国智慧城市建设研究者和从业人员提供有益借鉴。