随着安徽省联社数字化转型的不断深入,如何从海量数据中挖掘更多价值成为大数据应用的一项新的挑战。一方面,数据资源的数据维度逐渐增多,随着行内业务数据的治理和外部数据的丰富,安徽省联社各类系统已沉淀了海量数据,仅靠现有的数据应用模式难以更合理的分配数据资源,挖掘数据价值;另一方面,随着金融科技的广泛普及和发展,金融产品和服
务模式持续变革,金融服务逐渐向主动化、个性化、智慧化发展,对数据智能化应用也提出了更高要求。安徽省联社为进一步完善大数据服务体系,深度挖掘数据资源价值,提升智能决策水平,构建了数据挖掘和模型管理平台,通过引入数据挖掘和机器学习技术,实现模型算法的优化提升和模型全生命周期管理。
(二)项目目标
通过数据挖掘和模型管理平台的搭建,实现数据智能化应用和模型标准化管理,基于业务需求进行数据挖掘应用,对模型风险进行统一管理。一方面提升数据挖掘能力,通过引入当前主流的人工智能、机器学习算法,专注数据挖掘和模型应用,改变现有专家评分卡模型类型单一、功能简单的应用现状,实现数据挖掘的自动化、标准化和智能化;二是完善数据应用体系,本平台是安徽省联社大数据应用平台数据服务的重要组成部分,通过模型服务的方式实现对下游应用系统的数据赋能,持续完善数据应用体系建设。三是统一模型服务,为线上信贷产品、精准营销平台等应用系统提供统一、标准的模型服务,提升业务产品线上化能力,实现全系统模型的集约化建设和统一管理。
二、项目方案
(一)建设规划
根据安徽省联社数据应用体系,一方面系统已经建立大数据应用平台并在在全系统内推广使用,主要负责内外部数据整合、数据清理、数据加工、数据推送等功能;另一方面在线上信贷、信用卡等业务条线已经上线了多个基于专家评分卡的模型,采用规则配置方式提供模型服务。结合业内数据挖掘或机器学习平台建设经验,数据挖掘和模型管理平台主要侧重于机器学习模型的开发、部署和管理,平台分模型管理、模型构建、模型运行、模型监控共四大模块,各模块进行一体化建设。(二)业务功能
三是模型管理:实现模型的集中管理,有序的将模型生命周期中的各种信息做统一的展示和管理,整体掌握每家农商银行的模型情况;支持省联社及农商银行二级法人框架下的数据模型管理,各农商银行可根据实际需求对模型进行新增、修改、配置、删除等操作;实现各农商银行数据、模型参数、计算资源的隔离,农商银行可根据需求自主进行模型发布、下线、权限管理等。
三、创新点
(一)松耦合式模块化设计
平台的核心功能包括模型管理、模型构建、模型服务、模型监控共四大模块,各服务模块基于微服务架构实现松耦合式设计,支持容器化部署、使用K8S定制场景资源配置,数据计算采用主流的分布式Hadoop大数据平台,用于数据、指标以及模型的分布式计算,同时满足大规模数据的分布式存储,在部署、计算、存储等方面均具备横向扩展能力。
(二)标准化模型管理工作流
(三)通用型模型构建平台
本平台提供代码建模、可视化建模、智能建模三种建模方式,搭建了低门槛、易用、适应不同建模场景的统一建模平台,能够使专业建模人员或业务人员共同参与到模型开发的工作中,实现了建模过程的标准化管理,包括代码标准化、模型包管理、开发报告管理等。
(四)线上模型服务管理
平台可作为模型服务的统一发布平台,通过服务列表对模型服务统一管理,支持评分卡、python、pmml等格式模型文件的自动化部署,提供模型发布审批、上下线流程配置,同时支持接口调试、A/B测试等工具,对模型服务实际效果跟踪比较,实现模型版本的流畅切换。基于业务场景需要,模型服务提供实时调用或批量调度两种调用方式。
(五)实时监控预警体系
平台构建了全面细致的模型监控预警体系,对模型结果分布、特征稳定性、预测有效性进行定时跟踪,帮助模型管理人员及时掌握当前模型的整体性能。报告内容支持自定义预警规则,可以对特征变化幅度、模型退化程度、在决策中的效果等设置预警,通过平台内消息和短信进行提醒告知,及时采取处置措施。
四、项目过程管理
安徽省联社于2022年8月启动数据挖掘和模型管理项目,建设过程采用CMMIv4.4瀑布式项目管理模式,2023年4月完成系统编码、测试和上线,目前已投产运营。
五、运营情况
目前平台内已上线3个业务模型,以数据为驱动实现模型的优化升级,为线上信贷、信用卡、综合收单业务提供模型服务,在前期申请、定价和中期风险管理等业务环节对客户信用风险进行预测,模型算法采用了逻辑回归和集成学习算法,模型效果评估KS指标值均超55%,对坏客户表现具有显著预测能力。
六、项目成效
(一)助力数字化转型
(二)提升风险防控能力
系统数据模型已成功在农商银行贷款、信用卡的贷前审批、贷中监测等场景等上线使用,能够及时监测并分析客户交易数据,及时发现客户异常行为,准确评估客户信用风险指数,识别潜在的风险因素,规避坏账和违约风险。
(三)改善客户体验和满意度
利用数据模型计算,可以更好地分析客户行为,理解客户需求,从而为客户提供定制化的产品和服务,实现精准营销;另外,通过自动化的模型分析功能替代人员审批和处理流程,能够提高业务处理效率,提升客户体验和满意度,增强客户的忠诚度和留存率。
(四)应用案例
场景1:线上信贷贷前申请评分
安徽省联社于2019年在辖内农商银行全面推广了一款线上信贷产品,该产品经过近3年的运营,已沉淀了足够多的申请样本和好坏标签,为了更好地把控该线上信贷产品贷前审批环节风险,深入挖掘数据信息,安徽省联社基于已沉淀的历史数据,利用机器学习算法构建了该产品的贷前申请评分模型。
该模型根据客户人行征信数据以及行内金融数据,预测客户未来逾期的概率,基于概率映射为信用评分,根据该评分可对客户进行分层评价,分层结果可在准入控制、授信定价等环节对客户风险进行精准评估。该模型训练评估指标AUC约80%、KS约49%,已达模型可用标准,目前该模型已开始在业务系统验证调用,每日调用约1000次。
场景2:信用卡贷中行为评分模型
安徽农商银行系统信用卡业务开始于2014年11月,经过几年的发展已形成一定规模,目前信用卡业务贷前风险已配置有专家评分卡模型,但是贷中环节仍缺少模型对风险统一管理,因此在2022年,伴随数据挖掘和模型管理平台的建设,构建了信用卡贷中行为评分模型,对存量的信用卡客户定期跑批,根据模型结果进行贷中风险控制。
该模型主要是基于存量信用卡客户的行内交易信息,预测未来逾期超M3的概率,模型结果最终是以评分的形式展现,整个模型也可以转换为评分卡,可以直接作为决策结果使用,也可供模型管理人员做模型配置参考。目前模型已完成上线部署,等待下一步业务系统正式调用。
七、经验总结
本项目是安徽省联社对数据挖掘和模型管理两个领域的探索和实践的成果,通过项目的建设和运营,使得安徽省联社对数据的应用能力和模型的管控能力有了进一步提升。接下来,将持续提高数据挖掘工具的可用性和模型管理流程的合理性,在模型服务方面,完善实时数据的解析能力,使得模型服务更加便捷;在模型构建方面,提高对规则类模型的支持,提供规则即时配置界面,增强对业务决策的支撑作用;在模型管理方面,优化工作流管理和流程文档管理,进一步防范模型风险。