架构算法方法论齐备,智能风控峰会完整日程!

石霖中国信通院云计算与大数据研究所内容科技部主任

个人介绍:石霖,现任中国信通院云计算与大数据研究所内容科技部主任,CCSATC602主席,主要从事人工智能、内容科技的技术研究、标准制定及测试评估工作,对信息安全、内容安全领域有丰富经验,参与智能审核、app加固、人脸识别、深伪检测等多项标准制定工作,圆满完成第二、三届中国人工智能大赛的举办工作,推动开展内容科技产业推进方阵、“护脸”计划等多项有助产业健康发展的工作。

专家团

蒋宏狮桥集团高级风控总监

个人介绍:蒋宏,狮桥智能风控高级总监,超过10年风控模型算法经验,在数据挖掘、机器学习、图谱应用、风险管理等方面有丰富的经验,主编书籍《智能风控实践指南:从模型、特征到决策》,曾任职德勤信息技术咨询顾问、百融风险部副总监、融360风控模型部负责人。上海交通大学学士、清华大学MBA。

个人介绍:刘宇,京东安全研发总监、京东安全技术委员会主席。2006年毕业于北京邮电大学计算机系,获得工学硕士学位。2006年~2014年,分别就职于摩托罗拉、雅虎中国、淘宝网,欧鹏,历任软件开发工程师、资深技术专家。2014年~2018年就职于易到用车,历任系统架构师、风控研发技术总监,亲身参与了网约车行业的百亿补贴大战及黑灰产对抗,并从0到1建设了易到风控系统-易盾。2018年加入京东集团风控,和团队一起建设京东风控体系,为京东业务保驾护航。2020年至今做为京东集团风控中台的项目经理及架构师,本着“共建共享、联防联控”的思想,联合各个业务板块的风控专家及架构师,整合各个业务板块的风控服务能力产品,实现京东生态内的风险共治。2021年《智能风控技术峰会》峰会主席及系统架构专场出品人。

个人介绍:拥有近十五年金融风险管理和智能风控领域业务策略、量化建模、解决方案、风控体系建设等工作经验,专注于商业银行、消费金融和金融科技行业,在智能风控策略模型数据体系建设、风险业务策略与量化模型、信贷资产组合管理、金融资产定价与风险管理、巴塞尔新资本协议、金融机构全面风险管理咨询、金融机构数字化转型、业务安全技术模型与策略、智能风控平台业务技术架构等方面积累了丰富的工作经验。曾在FICO、Accenture、GE等行业知名专业机构的风险咨询和分析咨询部门担任要职。

峰会议程

①风控体系建设方法论

出品人:李家琛bilibili风控负责人

个人介绍:硕士毕业于浙江大学自动化。曾就职美团风控,研究了一种通用算法对各场景进行高召回高准确。现任B站活动风控负责人,负责风控引擎以及不同业务风控。

1.互联网风控的分类

2.如何组件一支风控团队

3.如何行成一套风控体系

1.成为一个风控负责人需要哪些软技能和硬技能

2.风控体系飞轮如何旋转,对外承接业务,对外螺旋上升

3.对整个风控有全面认识

个人介绍:拥有13年安全技术研究和实战经验,曾任腾讯反诈骗实验室总监、T4-2级资深安全技术专家。在风控系统构建、策略对抗方面有丰富的实践经验。

1.风控攻防对抗中的挑战

2.风控体系中涉及到哪些情报

3.基于知识图谱的情报系统设计及实践

1.了解从攻击者的维度来思考风控体系中的攻防对抗点

2.了解到如何构建攻击情报系统,进而能够从更高维度来思考风控体系的建设

个人介绍:信息安全硕士毕业,目前在携程旅行,负责业务安全建设,主要集中在设备、账号对抗、业务防控,情报建设。

演讲题目:甲方威胁情报建设实践

演讲提纲:主要介绍甲方电商,业务威胁情报的定义、种类,落地使用的方法,情报和风控规则、风控基建如何互相驱动改进。

听众收益:

1.外部情报在甲方如何落地使用

2.内部情报如何做增益

3.情报运营中碰到的问题

个人介绍:本科毕业于中国科学技术大学少年班学院,硕士就读于伊利诺伊大学香槟分校。现就职于莉莉丝游戏,负责全游戏反欺诈业务,从0到1搭建风控系统、策略算法、风控产品,包括但不限于内容安全、支付风险、账号安全、脚本外挂、打金工作室识别等

演讲题目:手游反欺诈体系的设计与探索

演讲题目:数美风控体系建设总结与实践

演讲提纲:

1.风控体系关键元素

2.风控体系运营流程

1.一套风控体系搭建需要的考虑关键元素

2.一套风控体系搭建需要的建设流程

扫描二维码免费报名

②风控系统架构

出品人:朱杰奇富科技风控技术总监

雷柴卫奇富科技架构管理与公用平台架构师

个人介绍:雷柴卫,奇富科技架构师。主要研究方向为金融科技大数据以及AI在智能风控领域的应用以及拓展,包括图数据挖掘、AI工程、决策引擎、实验平台。

1.如何够条件智能风控与数据的生态闭环;

2.智能风控中数据的高可用与灾备;

3.智能风控的大数据实验。

1.智能风控生态闭环的搭建

2.智能风控数据高可用思考

3.大数据和人工智能在智能风控的深度探索

1.实时风险洞察面临的挑战

2.实时风险洞察的架构演进

3.核心组件剖析

4.未来的思考与展望

1.高吞吐的实时写入、高性能的实时计算与查询

2.OLAP如何选型?

3.异常检测模型在预警领域的应用

个人介绍:李瑞毕业于武大硕士研究生,在风控领域深耕6年多,对直播行业的黑产有丰富的对抗经验,目前是斗鱼业务安全的负责人。

演讲题目:斗鱼直播实时风控引擎快速对抗探索实践

1.直播行业的黑产问题

2.全栈式风控引擎的建设

3.快速对抗的有效措施

4.思考与展望

1.如何提升研发对抗策略的效率

2.介绍风控策略模型在斗鱼的实践方法

个人介绍:王欢,融360算法经理,国内线上模型负责人,硕士毕业于中科院软件所,书籍《智能风控实践指南》作者之一,曾参与国内及海外多个业务线的风控搭建、建模及特征工作,在风控模型和特征挖掘方面有丰富的实践经验。

演讲题目:风控场景全流程模型构建及应用实践

演讲提纲:针对在风控实践各场景下遇到的问题和挑战,构建模型来解决这些问题,以及介绍模型最终在业务中的应用方式。

1.贷前、贷中及贷后各场景下遇到的问题及挑战

2.针对典型场景介绍模型构建及上线应用的过程

3.模型应用的局限及优化探索

1.风控各业务场景下会遇到哪些问题及挑战?

2.如何充分利用各场景下的可用数据,搭建风控模型体系?

3.不同场景下数据获取及应用方式有哪些区别?

③风控算法

出品人:汪浩然资深风控和图计算专家

个人介绍:英国硕士,业内有算法百晓生和扫地僧之称,自幼好算法,遍干互联网诸侯,曾在蚂蚁金服,阿里巴巴,腾讯等公司主要从事风控算法,社交计算和图计算等工作,三十入风控,历抵圈内卿相,横跨金融,支付,电商,供应链,社区,社交等场景。率先工业界落地过诸多图上挖掘和机器学习算法。

个人介绍:毕业于清华大学自动化系模式识别与智能系统专业,曾就职于华为、快手负责多模态算法研发,现就职于北京枫清科技图智能分析部,复杂图算法和图机器学习设计、开发。

1.如何快速筛选环路?

2.如何优化分布式场景下的环路检测算法内存消耗?

3.环路检测在金融风控场景下如何使用?

个人介绍:许嘉蓉,复旦大学青年副研究员。主要研究方向包括图数据挖掘、图隐私计算,研究工作发表在人工智能顶级会议和期刊KDD、AAAI、NeurIPS、IJCAI、TKDE、TKDD等上,曾指导学生获得AAAI杰出论文奖,担任KDD、NeurIPS、WWW、AAAI、WSDM、TKDE等多个重要国际会议及期刊评审。

1.何时需要进行图预训练?

2.图预训练的数据是否越多越好?

此外,还提供了三个广泛的应用场景:

1.提供图预训练模型的适用范围

2.量化图预训练的可行性指标

3.挑选预训练数据的解决方案

1.预训练图神经网络

2.何时需要进行图预训练?

3.图预训练的数据是否越多越好?

演讲题目:主动学习以及样本不均衡在图数据场景的探索

演讲提纲:在风控场景中,由于异常事件相对于正常事件的发生频率较低,因此会出现样本不均衡的问题。例如,交易数据中正常交易数目远远多于欺诈交易数目,这就导致了欺诈交易数据集过小的情况。另外,标注难也是风控领域面临的一个挑战。由于涉及大量复杂的交易和操作流程,需要专业的知识和经验才能正确地标注异常事件。同时,异常交易往往会被恶意用户精心伪造,使得标注更加困难。这些问题都会导致数据集的不完备性,从而影响模型的准确率和鲁棒性,本次内容我们将会介绍我们在图主动学习以及样本不均衡技术上的一些探索。

2.图数据样本不均衡的解决方法

个人介绍:本硕毕业于西安交通大学和南加州大学,曾就职于中国银联风险管理部,加入蚂蚁后曾负责蚂蚁账户盗用类风控算法、国际卡收单业务风控算法,目前负责蚂蚁国际B类资金账户风控算法。

演讲题目:非结构化数据智能风控

演讲提纲:本次演讲介绍蚂蚁国际风控的业务背景,以及在非结构化数据场景中的智能风控解决方案,提纲如下:

1.业务背景介绍

2.非结构化数据风控的挑战

3.算法技术方案

4.智能风控解决方案

1.多模非结构化数据中如何精准获取信息?

2.多模非结构化信息的真实性如何保障?

3.账户和交易真实性智能风控解决方案如何设计?

演讲题目:内容风控对抗系统的探索与实践

1.背景

2.问题分析

3.解决方案:对抗感知、模型自动化迭代、模型融合、智能决策

4.效果

1.对内容对抗体系的基本组成及运作方式有一个大概的了解

2.模型自动化生产中涉及到的一些难点,如数据收集等

3.针对文本对抗中,最常见的形近字对抗解决方案

④图分析与关系网络

出品人:单黎平度小满AI算法资深专家

个人介绍:单黎平,硕士毕业于北京大学计算机系,度小满科技AI算法资深专家,现任度小满AI平台负责人,专注于机器学习与人工智能技术提能增效与落地应用。

1、图机器学习基础知识

2、风控场景下的图算法设计

3、图机器学习在度小满风控中的实际应用案例

1.反洗钱业务背景

2.当前反洗钱的业务流程及痛点

3.如何应用图智能进行反洗钱分析

4.案例介绍

1.如何通过应用图智能,节省业务60%工作量?

2.如何更好的让业务人员应用图智能技术解决业务问题

3.好的图智能产品需要满足何种要素

个人介绍:本硕均毕业于武汉大学数学系,目前在虎牙负责账号与营销活动的黑灰产对抗,包括图聚类算法开发,实时特征挖掘开发等工作。

演讲题目:图聚类在虎牙风控的实践

1.虎牙业务场景下的风控挑战

2.图机器学习算法在虎牙风控的实践

2.风控场景下的图算法设计

3.图聚类在虎牙风控中的实际应用案例

演讲题目:应对复杂风险的下一代风控基础设施-全图风控

⑤实时风控

出品人:付典阿里云高级技术专家

1.介绍FlinkCEP基础概念

2.介绍阿里云实时计算团队在增强FlinkCEP功能方面所做的工作,包括:

2.1.支持动态CEP、支持多规则在同一数据流上进行匹配等新特性;

2.2.拓展了FlinkSQL的MATCH_RECOGNIZE语法,增强MATCH_RECOGNIZE表达能力;

2.3.通过增加Cache机制、优化CEP内部实现逻辑、修复state泄漏等工作,大幅提高了FlinkCEP性能与稳定性。

3.介绍FlinkCEP常见业务场景及实现思路。

1.了解什么是FlinkCEP以及如何使用FlinkCEP作为规则引擎来解决风控场景中的常见问题

2.了解动态CEP的实现原理

3.了解如何优化FlinkCEP作业

个人介绍:网易互娱技术中心计费实时平台与SDK技术负责人,ApacheFlinkContributor,FlinkCDCContributor。负责计费实时数据平台与SDK的设计和开发,参与了实时风控、用户画像、异构关联分析挖掘等业务的核心工作。

1.从T+1走向实时风控

2.实时业务会话风控引擎

3.实时风控平台的建设

4.从实时风控到DataOPS

5.发展历程与展望未来

1.基于Flink构造实时风控引擎的技术思路

2.实时风控规则管理、运维和应用

3.实时风控与DataOPS

演讲题目:Airwallex基于大数据和机器学习构建智能金融风控系统

1.公司业务背景介绍

2.主要风控场景

*Onboarding

·业务场景

·技术方案

*TransactionalMonitoring

*PostMonitoring

3.另一个维度,InfrastructureforRisk

·MLPlatform

·BigDataSolution

4.CaseStudy:如何使用Graphbasedsolution应对黑产团伙

5.未来发展方向

1.了解金融风控的需求以及技术挑战

2.了解基于Flink的流批一体风控解决方案

3.了解基于图数据识别黑产团伙

⑥典型风控实践

出品人:徐德华翼支付风险管理部总监

个人介绍:风险管理部总监,模型团队负责人,负责支付、电商、通讯反诈等风控模型体系建设。

个人介绍:2017年毕业,先后从事互联网金融风控算法、业务风控算法等岗位。目前在OPPO主要负责应用分发业务的黑灰产对抗,包括搭建实时和离线防刷系统,感知、识别和处置作弊。

主要内容包括:

1.平台业务及黑灰产攻击介绍

2.流量作弊的整体防控思路及架构

3.典型案例

4.总结

1.流量反作弊体系如何搭建、评估?

2.如何感知黑灰产的变化?

3.如何评估算法的识别效果?

个人介绍:多年风控算法实践落地经验,涉及o2o,电商,泛娱乐等多个行业,现任同盾算法专家。

演讲题目:人工智能在跨境交易风控中的应用

1.智能化防控相比传统防控的区别

2.行为序列在风控场景的技术落地

3.风控算法在跨境电商场景的技术落地

4.关系图谱在业务风控场景的落地

5.智能化风控防控体系

1.风控算法在跨境电商场景的技术落地

2.关系图谱在业务风控场景的落地

3.行为序列在风控场景的技术落地

个人介绍:反欺诈风控模型团队负责人,先后负责车险、健康险领域风控模型体系建设以及保险科技创新产品的研发。

演讲题目:保险反欺诈能力建设实践

1.车险领域,反欺诈技术应用有哪些?

2.健康险领域,反欺诈技术应用有哪些?

个人介绍:硕士毕业于电子科技大学,2015年加入蚂蚁集团大安全至今,专注于风控领域,先后参与蚂蚁集团第四代、第五代风控体系的建设工作,目前负责牵头蚂蚁集团交互式风控平台建设。

演讲题目:蚂蚁集团交互式主动风控在反欺诈领域的应用

1.平台建设背景

2.平台技术挑战

3.核心思路和系统架构

4.典型应用场景-叫醒热线

5.未来的思考

1.如何通过技术手段,帮助解决电信诈骗这一愈发突出的社会问题?

2.蚂蚁集团在反诈领域做了哪些尝试和成果?

3.支付宝叫醒热线是如何运作的?

个人介绍:在算法技术应用于产业实践深耕多年,曾在宜信全面负责借贷领域的风险策略及算法应用,目前在58后负责建设高质量的风控技术并推进应用落地,对风险对抗有全面透彻的理解,善于设计系统化、体系化、完备性的风控方案。

1.58的业务主要面临的黑产形态

2.业务安全是一个长期对抗的事情

3.58同城加速黑产治理的技术设计以及应用设计

1.学习如何将复杂的业务风控问题抽象为技术问题,并把技术方案还原为应用方案

2.了解58同城关于黑产治理中遇到的重重挑战以及应对措施,如何打造体系化、智能化的风控屏障

个人介绍:研究生毕业于上海交通大学自动化系。先后职于交通银行信用卡中心、51信用卡等。现就职于中国电信翼支付(甜橙金融),参与负责C端信贷风控全流程从0到1的初始搭建及完善。

THE END
1.数据架构设计与优化策略的深度探索天翼云开发者社区2.1 数据模型设计 数据模型是数据架构的核心组成部分,它描述了数据的结构、关系和约束条件。在数据模型设计中,需要采用合适的数据建模方法和技术,如实体-关系模型(ER模型)、对象-关系模型(ORM模型)等,根据业务需求和数据特点,构建清晰、准确的数据模型。 https://www.ctyun.cn/developer/article/624399106633797
2.非结构化数据怎么治理?最近遇到几个项目,都跟非结构化数据脱不开关系。老彭刚毕业的时候,做的是数据库的活儿,那都是结构化数据。后来有了hadoop技术,可以用来处理物联网、互联网的半结构化数据。真正做非结构化的场景还是比较少的,大多是在项目中选取一两个点给意思意思一下。https://www.niaogebiji.com/article-139650-1.html
3.非结构化数据的定义及处理方法为解决上面两种方式的缺点,利用其所长,最新的非结构化数据存储技术在磁盘格式、网络协议、空间管理、重做和撤销格式、缓冲区缓存以及智能的I/O子系统等方面发生重大转变,在保证了文件数据的性能的同时,还保留了数据库的优势。较有代表性的就是OracleSecureFiles非结构化数据存储方式。https://blog.csdn.net/weixin_52189060/article/details/115489159
4.非结构化数据怎么存?——开源对象存储方案介绍但是构建一个企业级的数据湖(包括结构化和非结构化数据)已经成为了越来越多公司的目标。那么Hadoop还能满足我们的要求吗?还是我们需要更多的选择? 存储方案 如图所示,底层存储大体可以分为四类。对象存储(Object Storage),NoSQL 数据库(NoSQL Sources),关系型数据库(RDBMS Storage),大数据(Hadoop)。 对于大量的数据https://cloud.tencent.com/developer/article/1882011
5.大数据基础术语精粹来袭NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。 十三:结构化数据 结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、标准通用标记语言下的http://www.mudan.gov.cn/2c908084831c4eb30183205259ac001f/2c908084831c4eb3018320df837d0020/1669185201282129920.html
6.非结构化数据分析技术非结构化数据主要包括非结构化数据是数据结构不规则或者说是不完整,没有预设的数据模型或者结构,不便使用数据库、模型及标准的数据接口表现的数据,包括所有格式的文本、图片、各类报表、图像、音频、视频数据等。 计算机信息化系统中的数据分为结构化数据和非结构化数据。非结构化数据的形式非常多样,标准也具有多样性(即标准不确定),同时在https://blog.51cto.com/u_16099165/6757640
7.非结构化数据如何挖掘帆软数字化转型知识库数据隐私问题涉及用户数据的安全和保护,如何在挖掘数据的同时保护用户隐私是一个重要课题。未来,随着人工智能和大数据技术的发展,非结构化数据挖掘将变得更加智能和高效。新算法和新技术的出现将推动非结构化数据挖掘的发展,解决现有的挑战和问题,提高数据挖掘的准确性和效率。企业应积极关注和应用最新的技术和方法,充分https://www.fanruan.com/blog/article/611442/
8.《DAMADMBOK2》读书笔记第9章文件和内容管理内容管理在网站和门户中尤为重要,但基于关键字的索引和基于分类的组织方法可以跨技术平台应用。当在整个企业范围内进行内容管理时,称之为企业内容管理(ECM)。 内容元数据 P232 元数据对于管理非结构化数据至关重要,无论是传统上认为的内容和文件,还是现在理解的“大数据”。如果没有元数据,就无法对内容进行编目和组https://www.jianshu.com/p/fa34d269374b
9.行政管理论文15篇生活化教学可以帮助学生以社会生活实践为视觉,探究社会生活实践的种种样式所蕴含的行政管理,涉及日常的行政环境、职能、组织、领导、人事、财政、信息、政策过程及分析、伦理、法治、监督、危机、后勤、绩效和改革发展等各个环节,从中挖掘行政管理环节问题、分析问题原因和找出解决问题的方法,这对于不断培养大学生的行政https://www.ruiwen.com/lunwen/6220159.html
10.数据架构:大数据数据仓库以及DataVault非结构化数据可以进一步划分成两种基本的数据形式:重复型非结构化数据和非重复型非结构化数据。与企业数据的划分一样,非结构化数据的细分方式也有很多种。这里给出的只是其中一种细分非结构化数据的方法。图1.1.3展现了非结构化数据的这一细分方法。 重复型非结构化数据是指以同样的结构甚至同样的形态出现多次的数据https://www.ituring.com.cn/book/tupubarticle/11854
11.什么是非结构化数据?我们所处理的数据分为三类,分别是规格化数据、半结构化数据以及非结构化数据,其中非结构化数据的定义为:呈现出不规则且无明显结构特征的数据。 -规格化数据:数据与字段相对应,数据以表格和数据集形式存在。 -半结构化数据:这种数据形态介于规格化数据和非结构化数据之间,方法是结合不明晰的规则来补足规格化数据的缺陷。https://www.filez.com/news/detail/faee08ab6bdc85c2d6216e4773bcc01f.html
12.engineering):利用领域知识和现有数据,创造出新的特征,用于具体涵盖了结构化与非结构化、定量与定性数据的区分,数据清洗中的数据对齐、缺失值处理、异常值处理等方法,特征构造中的统计量构造、周期值、数据分桶、特征组合,特征选择的三种形式及多种具体方法,特征变换的标准化、归一化、区间缩放、非线性变换等,还讨论了离散变量处理和降维的多种方法,并在最后进行了总结。https://juejin.cn/post/6874516288149028872