反洗钱实践案例展播(15)|应用监管科技构建智能制裁扫描系统分析

对于大型金融机构而言,传统的制裁扫描系统不但难以有效应对日益加强的监管力度以及金融机构自身业务增长带来的挑战,系统本身还存在着高误中率和高维护成本的问题。

01

挑战

(1)高误中率

为了应对全球严格的监管要求,金融机构过往都致力于建设具有较高侦测能力的制裁扫描系统。近年来,系统的整体侦测能力的确有显著提升,但随之而来的问题是高误中率,其后果不仅是浪费了人力资源,更影响了业务的正常开展和客户关系的稳定延续。

(2)高维护成本

很多传统的制裁扫描系统,当初设计时考虑到业务人员使用便捷性的要求,在功能实现上运用了底层算法和业务规则相结合的双重架构。但在实际使用中,业务人员往往仅通过业务规则来调整系统的侦测预期和运行效率,却对底层算法的功能和应用知之甚少。因此,业务人员在使用系统时往往只依赖后置规则对误中问题进行定期检验和手工维护,这不仅增加了维护成本,也造成不必要的工作负担。

02

机遇

上述问题催生了建设智能化制裁扫描系统的需求,其带来的效果提升主要体现在以下几个方面:

(1)智能化制裁扫描系统将优化现有扫描流程并提高整体工作效率

以交易制裁扫描为例,传统制裁扫描系统其工作流程分为扫描、分析、补充信息、得出结论四个主要步骤,即金融机构将SWIFT信息和客户信息录入制裁扫描系统后,将命中结果传输至案件管理系统做进一步的分析处理。受制于数据信息有限性,侦查人员需要从金融机构内部的上游系统和外部渠道收集更多的数据,对真实/错误命中情况进行判断。而智能化制裁扫描系统其工作流程恰好相反,为特征数据准备、扫描、智能分析、得出结论四个主要步骤,这些特征数据包括制裁名单本身的类别、案件管理系统侦查人员对真实/错误命中情况的判定结果、客户与交易的基本信息数据、其他非结构性数据等。

(2)传统制裁扫描系统的核心技术可以完全做到自主研发,这为金融机构自主开发智能化制裁扫描系统奠定了基础

(3)机器学习算法在智能化制裁扫描系统中的运用是一大技术创新

机器学习算法在智能化制裁扫描系统中的运用是一大技术创新,这是传统制裁扫描系统无法比拟的。其应用将改变现有的业务管控流程:业务规则的更新转变为特征数据的收集;业务规定期审阅验证转变为高频的线上动态模型监测。与此同时,技术人员和业务合规专家的紧密合作将变得尤为重要。

二、构建智能扫描系统的必要条件

结合本团队数年来服务于金融机构的项目经验,我们认为建设智能化制裁扫描系统需具备如下必要条件:

在团队组成上

金融机构合规部门除需配备制裁专家外,还需配备熟悉机器学习算法的技术专家。原因如下:首先,只有在技术层面对传统制裁扫描系统有透彻的了解,才能把现有底层算法的输出,转化为特征数据,作为机器学习的输入。其次,只有系统性掌握机器学习算法,才能向业务人员提出更有针对性的特征数据需求,以用于机器学习算法训练,并追溯机器学习效果未达预期的原因,以提出算法优化建议。

在命中判断上

传统制裁扫描系统可用于命中判断的字段很少,主要基于名字的模糊匹配和其他辅助字段,如生日、证件信息等的条件匹配。与传统制裁扫描系统不同,智能化制裁扫描系统依赖大量、多维的数据为机器学习的命中判断提供支持。在数据范围上,制裁名单、命中特征以及人工甄别信息,均可被加工处理成机器学习所需的特征数据,数据格式可包含但不限于文本、图像等。

03

在业务功能上

智能化制裁扫描系统相较传统制裁扫描系统也有很大的提升。传统系统依赖于业务规则的设置,而业务规则的更新在很大程度上依赖于厂商对产品的持续迭代。由于金融机构各不相同的业务特征,产生了很多定制化的开发的需求,这就导致了定期改造升级制裁扫描系统的需要。相比较而言,智能化制裁扫描系统并不要求使用者持续更新业务规则,而是令系统通过自主学习高质量、多元化的特征数据,从而赋予其自动更新业务规则的能力。智能化制裁扫描系统支持所有中间过程数据成为特征数据,并保障其持续收集、加工处理以及评估验证的各个环节,最终将其用于机器的自主学习。

三、机器学习在智能制裁扫描系统中的应用

数据处理中的技术难点:

特征数据获取

数据解析处理

可获取的特征数据和制裁名单多数是以RTF、HTML、XML等标记式格式存储,属于半结构性文本数据,需经过解析和再加工成为机器学习可用的数据结构。这就需要技术人员熟悉不同的编程及脚本语言,以实现此类数据的自动解析,比如Python和LinuxShellScript等。

数据加工处理

在完成对数据的解析处理后,还需要根据数据特征,结合对应的模型或算法,做数据加工处理。对于决策树来说,其所需特征数据主要由分类而非连续性数据组成。命中匹配率可划分为高、低两类以满足决策树的分叉结构;对于逻辑回归来说,获取分类数据需要先进行变量处理。例如将名单类型区分为制裁名单和非制裁名单,形成二元式数据。对于一些判断命中数据来说,由于没有现成的真实命中和错误命中的结构化数据,只能通过对命中结果进行分类,这就需要用到更复杂的自然语言处理算法来实现。

四、总结

在数据加工处理时,提到不同的算法需要做不同的数据加工处理,至于选择什么样的方法进行数据处理,就需要对算法的计算原理有比较透彻的了解。基于对机器学习算法的机理的透彻了解,我们能更好的理解为什么机器学习能帮我们解决误中率高的问题。其优势主要体现在通过机器自主学习对业务规则的更新优化。首先,在业务中提炼用于真实及错误命中判断的特征数据及判断的结果,这与传统统计回归方程式中自变量和应变量选取是等效的概念;其次,机器学习通过特征数据对命中判断加以学习。所谓机器学习就是对自变量权重的迭代优化求解,使得最终模型预测值和真实结果拟合,实现偏差最小化;最终,自动化实现业务的手工判断过程,减少人工在侦查工作中的比重,助力实现工作效率的大幅提升,这也就是机器学习模型根据更新数据持续校准的过程。

专家点评:制裁合规压力让无数金融机构不堪其苦,人力负荷几近极限。在此形势下,RegTech的引入就成为必然。锐合新创系统介绍了利用技术手段开展制裁扫描的经验,提出很多有意义的增加有效性的方法,很有价值。

THE END
1.AI技术革新自主学习能力的突破性进展尤其是自主学习能力的突破性进展,为此领域带来了前所未有的创新机遇。本文将深入探讨这些最新资讯新闻背后的科学原理,以及它们如何影响我们的生活和工作。 自主学习的概念与意义 自主学习是一种机器能够通过观察、模仿和实践来提升自身性能的能力。这种能力不仅限于单一任务,而是能够适应新的情境https://www.whhdaiezn.com/zhi-neng-zhuang-bei/776521.html
2.智能系统设计师手册理解和运用人工intelligence三大算法1. 人工智能三大算法概述 人工智能三大算法分别是机器学习(Machine Learning)、深度学习(Deep Learning)以及强化学习(Reinforcement Learning)。这三个概念虽然有着不同的具体实现,但它们都旨在通过数据驱动来提高计算机程序对环境变化的适应能力,并最终实现自主决策。 https://www.jvahvb5c.cn/shu-ma/524011.html
3.解析人工智能三大算法机器学习深度学习与强化学习的核心之旅解析人工智能三大算法:机器学习、深度学习与强化学习的核心之旅 人工智能三大算法是现代计算机科学领域中的重要组成部分,它们分别是机器学习、深度学习和强化学习。每种算法都有其独特的特点和应用场景,共同推动了人工智能技术的发展。 机器学习:数据驱动的革命 机器学https://www.fmovhaqkz.com/shou-ji/530948.html
4.算法原理与代码实例讲解:自主学习自主学习算法本文将介绍自主学习的核心概念和算法原理,以及如何使用深度学习来实现自主学习。同时,我们还将提供代码实例和详细解释说明,帮助读者更好地理解和应用自主学习技术。 2. 核心概念与联系 自主学习是指机器能够自主地从数据中学习知识和技能,而不需要人类的干预。自主学习的核心概念包括数据、模型和算法。 https://blog.csdn.net/m0_62554628/article/details/139816417
5.机器人运动平衡控制中自主学习算法的研究期刊模型与期望性能指标设计出模糊控制器,构建了基于模糊自适应算法的自主学习方法,并从理论上证明了算法的稳定性.仿真结果表明,所提自主学习算法能在机器人偏离垂直位置较大角度时,实现机器人直立平衡和速度跟踪,并与传统PID控制方法相比,消除了机器人各状态响应的抖动现象,具有较高的动态响应和稳态精度,体现了算法的有效https://d.wanfangdata.com.cn/periodical/jsjfz201406083
6.机器人自主学习新进展,百度飞桨发布四足机器人控制强化学习新算法百度的工作展现出,基于自主学习的方法在四足机器人控制上具有完全替代甚至超越经典算法的潜力,有可能成为强化学习和进化学习在复杂非线性系统中开始大规模落地和实用化的契机。 这不是百度在机器人方向上做的第一个强化学习工作,早在18年,他们就尝试将人工干预引入到强化学习中,以推进强化学习应用在在四轴飞行器控制等https://www.youuvs.com/news/detail/202109/34581_2.html
7.人工智能新算法,糅合VR技术“教”会机器人自主学习本周,OpenAI又推出了用于机器人仿真的开源软件Roboschool,它基于增强学习研究平台OpenAI Gym而开发的,提供了十几个新的操作环境,让用户可以在模拟环境中训练一个或多个机器人。 图丨Roboschool的训练画面 不过,相较以往,单次模仿学习算法的进步之处在于不需要人类操作者将动作反复重复,只要一次就足够人工智能来“领悟学https://m.sohu.com/a/676462821_121687414
8.六年级下册信息技术教案(集合15篇)机器人还有很多其他的功能,你对它们的哪些功能最感兴趣呢?在课后通过其他方式作进一步了解吧。 六年级下册信息技术教案7 学习目标: 1、了解编制程序解决问题的大致过程,会用流程图设计和描述循环结构算法。 2、在自主学习常用的程序流程图符号中了解流程图,在小组合作绘制“计算商品金额”流程图中加强对算法的理解,学https://www.fwsir.com/jiaoan/html/jiaoan_20230213091926_2377682.html
9.人工智能助推教师教育教学能力提升心得(精选13篇)网络学习与多参加线下培训学习方式自我成长,提高课程融合能力和课程开发能力;针对实施场地和怎么教的问题,大部分学校没有开展起来的原因可能主要也是因为资金对场地和平台投入比较大,但是可以利用信息技术课堂作为人工智能教育的切入点,融入数据、算法、程序设计、机器人课程、开源硬件类课程等,利用项目式教学或其他活动如https://www.jy135.com/jiaoxuexinde/913126.html
10.机器学习151CTO博客概念<-> 数值、关系 <-> 运算的映射,造就了机器可以自主学习获得事物规律的可能 二 机器学习三要素:数据、模型、算法 算法通过在数据上进行运算产生模型 特征工程: 1.确定用哪些特征来表示数据; 2.确定用什么方式表达这些特征。 模型是机器学习的结果,这个学习过程,称为训练(Train)一个已经训练好的模型,可以被理https://blog.51cto.com/u_15088375/3249973
11.电院计算机系卢策吾团队提出时空概念提取算法汤佳俊上海交通大学电院计算机系在读硕士生,上海交通大学计算机系学士。主要研究方向为计算机视觉和深度学习,尤其是视频动作理解算法。 卢策吾上海交通大学电院计算机系长聘教轨副教授。在他加入交大之前,他是斯坦福大学人工智能实验室研究员。他的研究兴趣主要集中在机器人、人工智能和机器人计算机视觉。他担任CVPR 2020的https://www.seiee.sjtu.edu.cn/index_news/1802.html
12.吴晶辰·算法通识16讲1机器学习算法是一系列让计算机自主学习的算法。它们最适合用在人类没法用明确规则进行解决的问题上 2 机器学习学到了很多人类没教过、自己也不懂的事物细节。 3 机器学习学到的是事物之间的复杂关系。 15_学习策略:机器学习如何获得知识 1 机器学习模拟了不同的学习模式,学习模式不同,学到的知识也不一样,但也许https://m.douban.com/note/853714655/
13.把看不懂的算法做成产品,「智铀科技」让AI小白也能上手机器学习凭着此前在百度的积累,智铀在算法调参、建模等方面较为擅长,包括怎么梳理客户的数据特征;怎么提炼用户画像和业务维度;如何调整参数让 F(x) 的效果更好,智铀可以将这些需要算法科学家完成的工作打包成一个 PC 端的产品,工程师只要将已有的数据导入“Ebrain”系统,就可实现机器的自主学习与判断。 https://www.tmtpost.com/3268558.html
14.机器学习和深度学习的常见概念总结(多原创图)4.不同优化算法的损失减少曲线理论对比图。 5. **优化算法的挑战** 5. **总结** 梯度下降(Gradient Descent) 1. **梯度下降的基本思想** 2. **梯度的含义** 3. **梯度下降的三种变体** 3.1. **批量梯度下降(Batch Gradient Descent)** http://www.zsrm.cn/news/167769.html
15.快速入门了解机器学习计算机程序自主学习任务T的经验E,随着提供大量,优质,合适的经验E,该程序对于任务T的性能逐步提高 过程 算法:根据业务需要和数据特征选择相关算法,也就是一个数学公式 模型: 基于数据和算法构建出来的模型 评估/测试:对模型进行评估的策略 机器学习是人工智能的一个分支,我们使用计算机设计一个系统,使他能够根据提供的https://www.jianshu.com/p/496b913a4ab0/