架构算法方法论齐备,智能风控峰会完整日程!

石霖中国信通院云计算与大数据研究所内容科技部主任

个人介绍:石霖,现任中国信通院云计算与大数据研究所内容科技部主任,CCSATC602主席,主要从事人工智能、内容科技的技术研究、标准制定及测试评估工作,对信息安全、内容安全领域有丰富经验,参与智能审核、app加固、人脸识别、深伪检测等多项标准制定工作,圆满完成第二、三届中国人工智能大赛的举办工作,推动开展内容科技产业推进方阵、“护脸”计划等多项有助产业健康发展的工作。

专家团

蒋宏狮桥集团高级风控总监

个人介绍:蒋宏,狮桥智能风控高级总监,超过10年风控模型算法经验,在数据挖掘、机器学习、图谱应用、风险管理等方面有丰富的经验,主编书籍《智能风控实践指南:从模型、特征到决策》,曾任职德勤信息技术咨询顾问、百融风险部副总监、融360风控模型部负责人。上海交通大学学士、清华大学MBA。

个人介绍:刘宇,京东安全研发总监、京东安全技术委员会主席。2006年毕业于北京邮电大学计算机系,获得工学硕士学位。2006年~2014年,分别就职于摩托罗拉、雅虎中国、淘宝网,欧鹏,历任软件开发工程师、资深技术专家。2014年~2018年就职于易到用车,历任系统架构师、风控研发技术总监,亲身参与了网约车行业的百亿补贴大战及黑灰产对抗,并从0到1建设了易到风控系统-易盾。2018年加入京东集团风控,和团队一起建设京东风控体系,为京东业务保驾护航。2020年至今做为京东集团风控中台的项目经理及架构师,本着“共建共享、联防联控”的思想,联合各个业务板块的风控专家及架构师,整合各个业务板块的风控服务能力产品,实现京东生态内的风险共治。2021年《智能风控技术峰会》峰会主席及系统架构专场出品人。

个人介绍:拥有近十五年金融风险管理和智能风控领域业务策略、量化建模、解决方案、风控体系建设等工作经验,专注于商业银行、消费金融和金融科技行业,在智能风控策略模型数据体系建设、风险业务策略与量化模型、信贷资产组合管理、金融资产定价与风险管理、巴塞尔新资本协议、金融机构全面风险管理咨询、金融机构数字化转型、业务安全技术模型与策略、智能风控平台业务技术架构等方面积累了丰富的工作经验。曾在FICO、Accenture、GE等行业知名专业机构的风险咨询和分析咨询部门担任要职。

峰会议程

①风控体系建设方法论

出品人:李家琛bilibili风控负责人

个人介绍:硕士毕业于浙江大学自动化。曾就职美团风控,研究了一种通用算法对各场景进行高召回高准确。现任B站活动风控负责人,负责风控引擎以及不同业务风控。

1.互联网风控的分类

2.如何组件一支风控团队

3.如何行成一套风控体系

1.成为一个风控负责人需要哪些软技能和硬技能

2.风控体系飞轮如何旋转,对外承接业务,对外螺旋上升

3.对整个风控有全面认识

个人介绍:拥有13年安全技术研究和实战经验,曾任腾讯反诈骗实验室总监、T4-2级资深安全技术专家。在风控系统构建、策略对抗方面有丰富的实践经验。

1.风控攻防对抗中的挑战

2.风控体系中涉及到哪些情报

3.基于知识图谱的情报系统设计及实践

1.了解从攻击者的维度来思考风控体系中的攻防对抗点

2.了解到如何构建攻击情报系统,进而能够从更高维度来思考风控体系的建设

个人介绍:信息安全硕士毕业,目前在携程旅行,负责业务安全建设,主要集中在设备、账号对抗、业务防控,情报建设。

演讲题目:甲方威胁情报建设实践

演讲提纲:主要介绍甲方电商,业务威胁情报的定义、种类,落地使用的方法,情报和风控规则、风控基建如何互相驱动改进。

听众收益:

1.外部情报在甲方如何落地使用

2.内部情报如何做增益

3.情报运营中碰到的问题

个人介绍:本科毕业于中国科学技术大学少年班学院,硕士就读于伊利诺伊大学香槟分校。现就职于莉莉丝游戏,负责全游戏反欺诈业务,从0到1搭建风控系统、策略算法、风控产品,包括但不限于内容安全、支付风险、账号安全、脚本外挂、打金工作室识别等

演讲题目:手游反欺诈体系的设计与探索

演讲题目:数美风控体系建设总结与实践

演讲提纲:

1.风控体系关键元素

2.风控体系运营流程

1.一套风控体系搭建需要的考虑关键元素

2.一套风控体系搭建需要的建设流程

扫描二维码免费报名

②风控系统架构

出品人:朱杰奇富科技风控技术总监

雷柴卫奇富科技架构管理与公用平台架构师

个人介绍:雷柴卫,奇富科技架构师。主要研究方向为金融科技大数据以及AI在智能风控领域的应用以及拓展,包括图数据挖掘、AI工程、决策引擎、实验平台。

1.如何够条件智能风控与数据的生态闭环;

2.智能风控中数据的高可用与灾备;

3.智能风控的大数据实验。

1.智能风控生态闭环的搭建

2.智能风控数据高可用思考

3.大数据和人工智能在智能风控的深度探索

1.实时风险洞察面临的挑战

2.实时风险洞察的架构演进

3.核心组件剖析

4.未来的思考与展望

1.高吞吐的实时写入、高性能的实时计算与查询

2.OLAP如何选型?

3.异常检测模型在预警领域的应用

个人介绍:李瑞毕业于武大硕士研究生,在风控领域深耕6年多,对直播行业的黑产有丰富的对抗经验,目前是斗鱼业务安全的负责人。

演讲题目:斗鱼直播实时风控引擎快速对抗探索实践

1.直播行业的黑产问题

2.全栈式风控引擎的建设

3.快速对抗的有效措施

4.思考与展望

1.如何提升研发对抗策略的效率

2.介绍风控策略模型在斗鱼的实践方法

个人介绍:王欢,融360算法经理,国内线上模型负责人,硕士毕业于中科院软件所,书籍《智能风控实践指南》作者之一,曾参与国内及海外多个业务线的风控搭建、建模及特征工作,在风控模型和特征挖掘方面有丰富的实践经验。

演讲题目:风控场景全流程模型构建及应用实践

演讲提纲:针对在风控实践各场景下遇到的问题和挑战,构建模型来解决这些问题,以及介绍模型最终在业务中的应用方式。

1.贷前、贷中及贷后各场景下遇到的问题及挑战

2.针对典型场景介绍模型构建及上线应用的过程

3.模型应用的局限及优化探索

1.风控各业务场景下会遇到哪些问题及挑战?

2.如何充分利用各场景下的可用数据,搭建风控模型体系?

3.不同场景下数据获取及应用方式有哪些区别?

③风控算法

出品人:汪浩然资深风控和图计算专家

个人介绍:英国硕士,业内有算法百晓生和扫地僧之称,自幼好算法,遍干互联网诸侯,曾在蚂蚁金服,阿里巴巴,腾讯等公司主要从事风控算法,社交计算和图计算等工作,三十入风控,历抵圈内卿相,横跨金融,支付,电商,供应链,社区,社交等场景。率先工业界落地过诸多图上挖掘和机器学习算法。

个人介绍:毕业于清华大学自动化系模式识别与智能系统专业,曾就职于华为、快手负责多模态算法研发,现就职于北京枫清科技图智能分析部,复杂图算法和图机器学习设计、开发。

1.如何快速筛选环路?

2.如何优化分布式场景下的环路检测算法内存消耗?

3.环路检测在金融风控场景下如何使用?

个人介绍:许嘉蓉,复旦大学青年副研究员。主要研究方向包括图数据挖掘、图隐私计算,研究工作发表在人工智能顶级会议和期刊KDD、AAAI、NeurIPS、IJCAI、TKDE、TKDD等上,曾指导学生获得AAAI杰出论文奖,担任KDD、NeurIPS、WWW、AAAI、WSDM、TKDE等多个重要国际会议及期刊评审。

1.何时需要进行图预训练?

2.图预训练的数据是否越多越好?

此外,还提供了三个广泛的应用场景:

1.提供图预训练模型的适用范围

2.量化图预训练的可行性指标

3.挑选预训练数据的解决方案

1.预训练图神经网络

2.何时需要进行图预训练?

3.图预训练的数据是否越多越好?

演讲题目:主动学习以及样本不均衡在图数据场景的探索

演讲提纲:在风控场景中,由于异常事件相对于正常事件的发生频率较低,因此会出现样本不均衡的问题。例如,交易数据中正常交易数目远远多于欺诈交易数目,这就导致了欺诈交易数据集过小的情况。另外,标注难也是风控领域面临的一个挑战。由于涉及大量复杂的交易和操作流程,需要专业的知识和经验才能正确地标注异常事件。同时,异常交易往往会被恶意用户精心伪造,使得标注更加困难。这些问题都会导致数据集的不完备性,从而影响模型的准确率和鲁棒性,本次内容我们将会介绍我们在图主动学习以及样本不均衡技术上的一些探索。

2.图数据样本不均衡的解决方法

个人介绍:本硕毕业于西安交通大学和南加州大学,曾就职于中国银联风险管理部,加入蚂蚁后曾负责蚂蚁账户盗用类风控算法、国际卡收单业务风控算法,目前负责蚂蚁国际B类资金账户风控算法。

演讲题目:非结构化数据智能风控

演讲提纲:本次演讲介绍蚂蚁国际风控的业务背景,以及在非结构化数据场景中的智能风控解决方案,提纲如下:

1.业务背景介绍

2.非结构化数据风控的挑战

3.算法技术方案

4.智能风控解决方案

1.多模非结构化数据中如何精准获取信息?

2.多模非结构化信息的真实性如何保障?

3.账户和交易真实性智能风控解决方案如何设计?

演讲题目:内容风控对抗系统的探索与实践

1.背景

2.问题分析

3.解决方案:对抗感知、模型自动化迭代、模型融合、智能决策

4.效果

1.对内容对抗体系的基本组成及运作方式有一个大概的了解

2.模型自动化生产中涉及到的一些难点,如数据收集等

3.针对文本对抗中,最常见的形近字对抗解决方案

④图分析与关系网络

出品人:单黎平度小满AI算法资深专家

个人介绍:单黎平,硕士毕业于北京大学计算机系,度小满科技AI算法资深专家,现任度小满AI平台负责人,专注于机器学习与人工智能技术提能增效与落地应用。

1、图机器学习基础知识

2、风控场景下的图算法设计

3、图机器学习在度小满风控中的实际应用案例

1.反洗钱业务背景

2.当前反洗钱的业务流程及痛点

3.如何应用图智能进行反洗钱分析

4.案例介绍

1.如何通过应用图智能,节省业务60%工作量?

2.如何更好的让业务人员应用图智能技术解决业务问题

3.好的图智能产品需要满足何种要素

个人介绍:本硕均毕业于武汉大学数学系,目前在虎牙负责账号与营销活动的黑灰产对抗,包括图聚类算法开发,实时特征挖掘开发等工作。

演讲题目:图聚类在虎牙风控的实践

1.虎牙业务场景下的风控挑战

2.图机器学习算法在虎牙风控的实践

2.风控场景下的图算法设计

3.图聚类在虎牙风控中的实际应用案例

演讲题目:应对复杂风险的下一代风控基础设施-全图风控

⑤实时风控

出品人:付典阿里云高级技术专家

1.介绍FlinkCEP基础概念

2.介绍阿里云实时计算团队在增强FlinkCEP功能方面所做的工作,包括:

2.1.支持动态CEP、支持多规则在同一数据流上进行匹配等新特性;

2.2.拓展了FlinkSQL的MATCH_RECOGNIZE语法,增强MATCH_RECOGNIZE表达能力;

2.3.通过增加Cache机制、优化CEP内部实现逻辑、修复state泄漏等工作,大幅提高了FlinkCEP性能与稳定性。

3.介绍FlinkCEP常见业务场景及实现思路。

1.了解什么是FlinkCEP以及如何使用FlinkCEP作为规则引擎来解决风控场景中的常见问题

2.了解动态CEP的实现原理

3.了解如何优化FlinkCEP作业

个人介绍:网易互娱技术中心计费实时平台与SDK技术负责人,ApacheFlinkContributor,FlinkCDCContributor。负责计费实时数据平台与SDK的设计和开发,参与了实时风控、用户画像、异构关联分析挖掘等业务的核心工作。

1.从T+1走向实时风控

2.实时业务会话风控引擎

3.实时风控平台的建设

4.从实时风控到DataOPS

5.发展历程与展望未来

1.基于Flink构造实时风控引擎的技术思路

2.实时风控规则管理、运维和应用

3.实时风控与DataOPS

演讲题目:Airwallex基于大数据和机器学习构建智能金融风控系统

1.公司业务背景介绍

2.主要风控场景

*Onboarding

·业务场景

·技术方案

*TransactionalMonitoring

*PostMonitoring

3.另一个维度,InfrastructureforRisk

·MLPlatform

·BigDataSolution

4.CaseStudy:如何使用Graphbasedsolution应对黑产团伙

5.未来发展方向

1.了解金融风控的需求以及技术挑战

2.了解基于Flink的流批一体风控解决方案

3.了解基于图数据识别黑产团伙

⑥典型风控实践

出品人:徐德华翼支付风险管理部总监

个人介绍:风险管理部总监,模型团队负责人,负责支付、电商、通讯反诈等风控模型体系建设。

个人介绍:2017年毕业,先后从事互联网金融风控算法、业务风控算法等岗位。目前在OPPO主要负责应用分发业务的黑灰产对抗,包括搭建实时和离线防刷系统,感知、识别和处置作弊。

主要内容包括:

1.平台业务及黑灰产攻击介绍

2.流量作弊的整体防控思路及架构

3.典型案例

4.总结

1.流量反作弊体系如何搭建、评估?

2.如何感知黑灰产的变化?

3.如何评估算法的识别效果?

个人介绍:多年风控算法实践落地经验,涉及o2o,电商,泛娱乐等多个行业,现任同盾算法专家。

演讲题目:人工智能在跨境交易风控中的应用

1.智能化防控相比传统防控的区别

2.行为序列在风控场景的技术落地

3.风控算法在跨境电商场景的技术落地

4.关系图谱在业务风控场景的落地

5.智能化风控防控体系

1.风控算法在跨境电商场景的技术落地

2.关系图谱在业务风控场景的落地

3.行为序列在风控场景的技术落地

个人介绍:反欺诈风控模型团队负责人,先后负责车险、健康险领域风控模型体系建设以及保险科技创新产品的研发。

演讲题目:保险反欺诈能力建设实践

1.车险领域,反欺诈技术应用有哪些?

2.健康险领域,反欺诈技术应用有哪些?

个人介绍:硕士毕业于电子科技大学,2015年加入蚂蚁集团大安全至今,专注于风控领域,先后参与蚂蚁集团第四代、第五代风控体系的建设工作,目前负责牵头蚂蚁集团交互式风控平台建设。

演讲题目:蚂蚁集团交互式主动风控在反欺诈领域的应用

1.平台建设背景

2.平台技术挑战

3.核心思路和系统架构

4.典型应用场景-叫醒热线

5.未来的思考

1.如何通过技术手段,帮助解决电信诈骗这一愈发突出的社会问题?

2.蚂蚁集团在反诈领域做了哪些尝试和成果?

3.支付宝叫醒热线是如何运作的?

个人介绍:在算法技术应用于产业实践深耕多年,曾在宜信全面负责借贷领域的风险策略及算法应用,目前在58后负责建设高质量的风控技术并推进应用落地,对风险对抗有全面透彻的理解,善于设计系统化、体系化、完备性的风控方案。

1.58的业务主要面临的黑产形态

2.业务安全是一个长期对抗的事情

3.58同城加速黑产治理的技术设计以及应用设计

1.学习如何将复杂的业务风控问题抽象为技术问题,并把技术方案还原为应用方案

2.了解58同城关于黑产治理中遇到的重重挑战以及应对措施,如何打造体系化、智能化的风控屏障

个人介绍:研究生毕业于上海交通大学自动化系。先后职于交通银行信用卡中心、51信用卡等。现就职于中国电信翼支付(甜橙金融),参与负责C端信贷风控全流程从0到1的初始搭建及完善。

THE END
1.大数据时代的非结构化数据处理技术随着大数据时代的到来,数据呈现爆发式增长,其中非结构化数据占据了大部分。非结构化数据包括文本、图像、视频、音频、社交媒体内容等,由于其多样性、无规则的格式和分散性,传统的数据处理工具难以应对。为了从这些海量数据中提取价值,非结构化数据处理技术应运而生,成为企业提升效率和竞争力的关键工具。 https://www.gokuai.com/press/a1165
2.非结构化数据提取技术在统计工作中的应用摘要结构化数据和非结构化数据是大数据的两种类型,目前非结构化数据信息已达信息总量的85%以上,且每年以55%~65%的速度增长,统计工作受到大数据的冲击,日常总会遇到一些非结构化数据提取的难题,导致工作量加大,效率低下。本文对非结构化数据及其提取技术、大数据处理语言——Python语言进行学习研究,解决实际中遇https://tjj.changzhi.gov.cn/sjfx/202207/t20220704_2588893.html
3.非结构化数据分析技术非结构化数据主要包括6 非结构性数据预处理 非结构化数据是数据结构不规则或者说是不完整,没有预设的数据模型或者结构,不便使用数据库、模型及标准的数据接口表现的数据,包括所有格式的文本、图片、各类报表、图像、音频、视频数据等。 计算机信息化系统中的数据分为结构化数据和非结构化数据。非结构化数据的形式非常多样,标准也具有多样性https://blog.51cto.com/u_16099165/6757640
4.非结构化数据分析为什么要关注欺诈识别和预防领域的非结构化数据分析 // 149 非结构化数据分析的好处 // 153 欺诈领域的非结构化数据分析是什么 // 157 非结构化数据分析如何在欺诈识别和预防中发挥作用 // 159 用于欺诈识别和预防的非结构化数据分析框架:保险 // 162 主要的欺诈识别和预防技术 // 165 使用非结构化数据分析https://baike.baidu.com/item/%E9%9D%9E%E7%BB%93%E6%9E%84%E5%8C%96%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/60021270
5.结构化与非结构化的区别多源异构数据源半结构化数据结构化与非结构化数据的区别?这里有答案!? 当代,高新技术发展迅速,大数据作为新兴潜力股也发展迅猛,人们不断探索数据分析、数据处理以及数据可视化等的深度,那么,活在这个时代的你,对结构化与非结构化数据了解多少?对多源异构数据源又多少了解?下面让我们一起来详细学习一下吧。https://www.fanruan.com/bw/doc/154297
6.IBMCloudObjectStorage在银行业非结构化数据存储嘲下的对象随着银行业IT技术的快速发展和业务的不断升级变革,业务应用系统产生的非结构化数据(包括文件、图片、音视频文件等)的规模也越来越大,银行业非结构化数据呈指数式爆发式增长。目前使用非结构化数据的主要系统包括内容管理平台、后督影像系统、身份验证、柜员办业务扫描件等需要用到影像图片,以及呼叫中心系统、电话客服的https://redhat.talkwithtrend.com/Article/242823
7.探索非结构化数据入湖方式及相关技术的最佳实践数字经济观察网伴随着人工智能的兴起和数据湖的广泛应用,非结构化数据入湖变得尤为重要。非结构化数据,如文本、图像、音频和视频等,包含了丰富的信息,但由于其复杂性和多样性,传统的数据管理和分析方法往往无法充分利用这些数据的潜力。然而,结合人工智能和数据湖的技术和方法,可以有效地处理和分析非结构化数据,从中挖掘出有价值的https://www.szw.org.cn/20230817/62871.html
8.大数据技术原理与应用期末复习知识点全总结(林子雨版内容:随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和知识管理技术开始被应用,如数据仓库、专家系统、知识管理系统等 第二阶段:成熟期 时间:21世纪前10年 内容:Web2.0应用迅猛发展,非结构化数据大量产生,传统处理方法难以应对,带动了大数据技术的快速突破,大数据解决方案逐渐走向成熟,形成了并行计算与分布式https://developer.aliyun.com/article/1418435
9.行政管理论文15篇这势必导致学生处理社会现实问题和交往能力的技能很难有所提升,他们的知识结构、能力结构和素质明显存在不平衡,很难适应信息社会高速发展的需要。操作性和实践性教学严重薄弱。虽然目前我国高校《行政管理学》课程内容体系一般都设置了教学实习、实训等实践环节,但由于其时间短、任务重,而且管理松散,缺乏常态化和规范化,https://www.ruiwen.com/lunwen/6220159.html
10.engineering):利用领域知识和现有数据,创造出新的特征,用于具体涵盖了结构化与非结构化、定量与定性数据的区分,数据清洗中的数据对齐、缺失值处理、异常值处理等方法,特征构造中的统计量构造、周期值、数据分桶、特征组合,特征选择的三种形式及多种具体方法,特征变换的标准化、归一化、区间缩放、非线性变换等,还讨论了离散变量处理和降维的多种方法,并在最后进行了总结。https://juejin.cn/post/6874516288149028872
11.“平民化”非结构数据处理腾讯云开发者社区在全球信息产业高速发展的背景下,IDC预测,2018 到 2025 年之间,全球产生的数据量将会从 33 ZB 增长到 175 ZB, 复合增长率27%,其中超过 80%的数据都会是处理难度较大的非结构化数据,如文档、文本、图形、图像、音频、视频等。非结构化数据在大数据时代的重要地位已成为共识。近些年,伴随着大数据存储、人工智能(https://cloud.tencent.com/developer/article/2214210
12.结构化半结构化和非结构化数据都有哪些非结构化数据是指没有预定义数据模型的数据,这使得它难以通过传统的数据库和数据模型进行处理和分析。 举例: 文本文件:如新闻文章、报告、电子邮件正文等。 媒体文件:如图片、音频和视频文件。 社交媒体内容:如微博、博客文章、评论等。 每种数据类型都有其特定的存储、管理和分析技术。在大数据和数据科学领域,处理https://www.jianshu.com/p/7018b1bef624