AI赋能政府公共服务新模式基于NLP的人工智能在市民服务热线中的探索与应用

时至今日,大数据、云计算、人工智能技术飞速发展,互联网+思维渗透到各个行业,互联网+政务惠民服务开展的如火如荼,各个政务服务领域正在经历着信息化带来的变革,百姓也享受到了前所未有的巨大便利。

作为城市为民服务的窗口,12345市民服务热线面对新的百姓期盼,新的技术发展,如何利用这些信息化成果,代替低效的人工劳动,更加快速响应市民服务热线反应的社会问题,有效分类进行处置,提高服务效能,更好的发挥市民服务热线桥梁纽带作用,是12345市民服务热线作为构建社会现代治理体系和服务型政府的一项新课题。

本文正是基于这样的一种背景,初步探讨了AI技术在服务热线中的应用思路,以及在实际中的应用场景。

自然语言处理(NLP)和文本挖掘是以半结构或非结构的自然语言文本为对象,从大规模文本数据集中发现隐藏的、潜在的、新颖的、重要的规律的过程。其基本思想是从文本中提取适当的特征,将文本标识成计算机能够理解的形式,采用各种语义分析和文本挖掘的方法发现隐藏的知识模式,以用户可以理解和接收的形式输出,成为指导现实活动的有用的知识。

深度学习(DL)是机器学习中一种基于对数据进行表征学习的方法,是一种能够模拟出人脑的神经结构的机器学习方法。作为机器学习研究中的一个新领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,比如图像、声音和文本等。深度学习的实质,通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。

数据挖掘是指在大量的数据中挖掘出信息,通过分析来揭示数据之间有意义的联系、趋势和模式。它是数据库技术、机器学习、统计学、人工智能、可视化分析、模式识别等多门学科的融合。利用预测模型发现、聚类分析、分类与回归、关联分析、异常和趋势发现等数据挖掘技术,提供超大数据量的数据分析和结果展示,实现灵活查询数据集市、下钻挖掘、BI报表服务。

语音识别技术是让机器通过识别和理解把语音信号转变为相应的文本或命令的技术,主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别的原理是模式识别,过程包括:预处理、特征提取、基于语音模型库下的模式匹配、基于语言模型库下的语言处理以及完成识别。

某市AI+“12345”服务热线解决方案,运用了大数据、语音识别、NLP、深度学习等技术,基于东方金信海盒大数据平台的人工智能组件开发建设,将人脑无法快速定位的问题通过分词解意的方式进行大数据文本挖掘处理,深度分析文本信息,解决了办件分类不准确、办件派单不准确、结构化数据准确率低且数据真实性差、数据分析响应周期长等老大难问题,显著提高了热线办件准确率、处置效率和市民满意度,为社会管理决策分析提供了支撑。

AI智能化升级改造后的AI+“12345”服务热线,提供了“智答”(智能问答机器人)”“智办”(智能语音辅助登记)、“智推”(智能案件分配)、“智库”(智能城市知识库)、“智判”(智能分析研判)五大智能化服务。如下图:

图1:AI+“12345”五大智能化服务

对12345热线常见投诉问题的智能问答,通过一问一答的形式,实现系统与市民之间的问题交互,一方面为市民提供个性化的服务,改善服务体验;另一方面可以约束和规范市民诉求的提出形式和内容,为案件工单的要素提取和后续的自动登记打好基础。

文本分类是文本挖掘的基础与核心,项目创新运用文本挖掘、语义分析技术,以东方金信海盒人工智能组件为载体,成功替代某地市12345服务热线办件的人工分类方式,这一举措大幅提高了热线接线员的办件分类准确度和及时性。借助于东方金信海盒语音识别系统,为热线接线员提供办件适配分类和应答提示,同步构建和完善行业知识图谱,构建城市管理智库。

图2:案件智能办理

方案应用TF/IDF、Map/Reduce、贝叶斯、聚类等统计方法完成文本挖掘应用。对办件集历史数据进行高效训练,得到热线办件内容中词与词之间的相似性,构建本地近义词库,优化案件办理流程,对大规模办件内容进行总结,大幅提高大量办件内容的分析效率。

基于历史相似案件进行案件分类及案件派发处理,提高分类准确率以及加派件成功率。

图3:案件工单智能推送

图4:办件效能提升分析

项目在某市将文本挖掘和语义分析技术应用于12345热线,属国内首创,取得了良好的社会效应,显著提高了市民对政务服务的满意度,实现政府服务体系的升级和重塑是“互联网+政务服务”的典型应用,起到了应用示范效果。

2017年,中央电视台《新闻联播》点赞某市将80多个部门热线统一归入“12345”,30分钟响应处置,让公职人员成为“跑腿的”办事员,将小问题化解在基层。最新数据显示,该市12345热线日均接话量从2017年初的700多个增加至4300多个,最高峰值达1.04万个,增长约6.1倍,办件满意率从48%提高至95%;热线前台接通率从73.7%提高至98.5%。2017年,热线通过多渠道受理办件,总量达103.0577万件,已办结102.9162件,办结率为99.86%。

图5:AI+“12345”创新效果央视报道

作者简介:北京东方金信科技有限公司,公司主要负责提供跨行业领域企业级一体化大数据解决方案,实现产品+实施+咨询一站式服务,与众多国际主流软硬件厂商建立了大数据战略合作。

本文发表于由国家信息中心数字中国研究院编辑出版的《数字中国建设通讯》2019年第3期

THE END
1.数据挖掘概念(AnalysisServices与以下关系图的突出显示相同,数据挖掘过程的第一步就是明确定义业务问题,并考虑解答该问题的方法。 该步骤包括分析业务需求,定义问题的范围,定义计算模型所使用的度量,以及定义数据挖掘项目的特定目标。这些任务转换为下列问题: 您在查找什么?您要尝试找到什么类型的关系? https://technet.microsoft.com/zh-cn/library/ms174949(en-us,sql.105).aspx
2.教程丨手把手教你做数据挖掘!(附教程&数据源)转载自:数据派THU(ID:DatapiTHU) 作者:宋莹 本文11836字59图,建议阅读30分钟。 本文介绍一个极其详尽的数据挖掘实例。 本文主要介绍基于集成学习的决策树,其主要通过不同学习框架生产基学习器,并综合所有基学习器的预测结果来改善单个基学习器的识别率和泛化性。 https://blog.csdn.net/eNohtZvQiJxo00aTz3y8/article/details/103146460
3.全球岛弧玄武岩数据挖掘——在玄武岩判别图上的表现及初步解释领域: 地质学; 关键词: IAB;MORB;OIB;数据挖掘;判别图;岛弧;后弧; 格式: PDF原版;EPUB自适应版(需下载客户端) 751310 开通会员更优惠,尊享更多权益 下载PDF版(2330K) 原貌显示 下载EPUB版 自适应显示 地质通报 2016年12期立即查看 > 相似文献 期刊硕士博士会议报纸 沙湾地区玄武岩对峨眉山地幔柱岩浆过程的https://wap.cnki.net/touch/web/Journal/Article/ZQYD201612001.html
4.学部组织第三批“课程思政”教改项目中期检查《数据分析与数据挖掘》 项目负责人:王鑫 《数据库原理》课程以中国共产党党史知识图谱数据库为案例,详细展示了数据库的完整设计实现流程,包括使用E/R图或UML图建立高层数据模型,设计关系数据表,使用SQL定义、查询和更新数据,建立视图、索引、约束、触发器及其他数据库对象等实践过程。 http://cic.tju.edu.cn/info/1040/3631.htm
5.商战数据挖掘:你需要了解的数据科学与分析思维数据科学的一条重要原则是,数据挖掘的流程可以分解为几个通俗易懂的环节。有些环节涉及信息技术的应用,如数据中模式的自动发现和评估,而有些则主要依赖数据分析师的创意、常识和商业知识。理解数据挖掘的整个过程,有助于组织数据挖掘项目,使它们更接近系统性的分析,而不是凭借运气和个人智慧的冒险行为。 https://www.ituring.com.cn/book/tupubarticle/28952
6.艺术档案数字化民间艺术的数字化涉及信息的采集、处理和储存,这其中包含采集设备的选择、数据处理方式、储存格式和数据库技术。但是截止到目前,并没有一个全国统一的数据加工规范或标准,无论在民间艺术普查阶段还是在名录项目申过程中,都不同程度存在一些问题,具体表现在:数据资料保存很好,但标示和描述很差,以至于使潜在的用户无法了解https://www.zboao.com/cgal/8068.html
7.数据挖掘分析流程图mob64ca12e8a030的技术博客数据挖掘是从大量数据中提取有用信息的过程,广泛应用于商业、科学研究、医疗等多个领域。为了有效地进行数据挖掘,我们通常遵循一个标准的分析流程。本文将通过该流程简要介绍数据挖掘的基本步骤,同时附上示例代码,方便读者理解和应用。 数据挖掘分析流程 图1展示了数据挖掘的基本流程,包括数据收集、数据清洗、数据探索、https://blog.51cto.com/u_16213399/11755555
8.DatawhaleAI活动第二期我们微调的目的,是定制一个专属的垂类大模型,实现这一点,需要我们所指定领域的优质数据集和一个选定的开源通用大模型 通俗来说, 微调 ,其实可以类比为给一个 高中生 ( 通用大模型 ),灌输 知识偏好 (数据集)塑造世界观,长大成 职业选手 (分化成对应的能力者, 垂类大模型 )。 https://www.bilibili.com/read/cv40098880
9.深度详解:对象检测和图像分割的数据探索过程数据挖掘对于图像分割和目标检测的需要 数据探索是很多机器学习过程的关键。也就是说,当涉及到目标检测和图像分割数据集时,没有直接的方法进行系统地数据探索。 在处理常规图像数据集和分割图像数据集时,有很多东西是可以区分的: 标签被强绑定在图像上。您必须非常小心对图像所做的任何操作,因为它可能破坏图像-标签-https://www.flyai.com/article/703
10.课程介绍了清洗大数据的新方式——可视化清洗的含义、过程和方法,并解释说明了4个免费清洗工具和3类商业化清洗工具。 第四章突破想象:大数据挖掘分析 大数据挖掘分析,可以帮助我们获得事先不知道的信息和知识。因此,本章节通过阿里的大数据挖掘应用案例和“西游记”讲述大数据挖掘的实际应用价值和难易程度,通过规范流程和四https://higher.smartedu.cn/course/62354d379906eace048f64f2
11.人工智能学习图片人工智能学习高清设计图片素材大全人工智能机器学习技术图AI神经网络VR屏幕数据挖掘 高清图片 远程学习创新教育概念 高清图片 人工智能思考大脑人工智能和机器学习过程第四轮工业革命 高清图片 学习屏幕显示网络教育或在线学习 高清图片 电子学习远程学习 高清图片 计算机学习语言数据 高清图片 人工智能机器学习技术图AI神经网络航空VR屏幕数据挖掘 https://699pic.com/image/rengongzhinengxuexi.html
12.[转载]一种基于深度神经网络的临床记录ICD自动编码方法提出一种基于多尺度残差图卷积网络的自动ICD编码技术,该技术采用多尺度残差网络来捕获临床文本的不同长度的文本模式,并基于图卷积神经网络抽取标签之间的层次关系,以加强自动编码能力。在真实医疗数据集MIMIC-III上的实验结果表明,该方法的P@k和Micro-F1分别为72.2%和53.9%,显著提高了预测性能。https://blog.sciencenet.cn/blog-3472670-1280973.html
13.知识图谱实体对齐:基于GNN嵌入的方法orionorionHGCN[3]在实体嵌入的过程中隐式地利用关系的表示来改善对齐过程。为了包含关系信息,HGCN同时学习实体和关系谓词的embeddings, 其整个包含embedding和align模块的框架如下: 本文提出的框架可分为以下的三个阶段: Stage 1使用GCN的变种Highway-GCN来将实体嵌入到统一的向量空间。这里直接将G1G1和G2G2视作一个图GaGahttps://www.cnblogs.com/orion-orion/p/16790701.html
14.为电商而生的知识图谱,如何感应用户需求?关系挖掘和本体构建通过文本增强图谱和外部数据的关联常识类推理规则的挖掘图推理的符号逻辑表示 阿里巴巴搜索事业部NLP&知识图谱团队欢迎自然语言处理、数据挖掘、知识图谱方向的优秀人才加入,共建阿里电商生态,有兴趣的同学可发简历至xique.llx@alibaba-inc.com。每天一篇技术文章,看不过瘾?关注“阿里巴巴机器智能”,发https://baijiahao.baidu.com/s?id=1610282079138678790&wfr=spider&for=pc
15.建筑平面图生成式设计,?HouseGAN++Mixlab建筑智能我们知道建筑平面图设计可以通过泡泡图的方式来表达,这一概念与知识图谱的形态是类似的。设计师对泡泡图的理解就是用来可视化思考建筑平面的功能、动线等,而程序员对知识图谱的理解是一种数据结构及算法。 非常类似的概念,在各自的领域里理解也有各自的侧重点。 https://cloud.tencent.com/developer/article/1829787
16.深度学习论文阅读图像分类篇(六):SENet《Squeezeand在训练过程中,我们遵循标准的做法,使用随机大小裁剪[39]到 224×224224×224 像素(299×299299×299 用于 Inception-ResNetv2[38]和 SE-Inception-ResNet-v2)和随机的水平翻转进行数据增强。 输入图像通过通道减去均值进行归一化。另外,我们采用[32]中描述 的数据均衡策略进行小批量采样,以补偿类别的不均匀分布。网https://developer.aliyun.com/article/1210043
17.“就在江苏”智慧就业服务平台2、有3年以上的大型PCB工厂任职经历,有2年以上的(沉铜、电镀、塞孔、化金、镍钯金、表涂、阻焊、图形蚀刻、层压等站别)工艺或过程质量任职经历 3、有面向对象的思维,能熟练使用工具绘制数据流图、时序图、类图等,具有一定的设计能力和良好的代码编写习惯 4、精通SqlServer、MySql或Oracle一种或多种数据https://www.js365job.com/recruitment/news/1537313427270025217.html
18.图挖掘技术在京东广告流量风控上的应用与实践目前初步设计出图挖掘算法平台的框架并在不断的进行优化和建设中,未来希望能够建设成为一个具有支持较多主流图挖掘算法的基础算法平台,能够支持 billion 量级、超大规模风控场景下的图挖掘应用需求,设计初期的图挖掘算法平台的架构(图5)。 图5:图挖掘算法平台主要包含六层,从下到上依次为数据层(由业务数据封装成的https://maimai.cn/article/detail?fid=1567807199&efid=OaWNb5R1UOE_ZaDNI3D1mg