架构算法方法论齐备,智能风控峰会完整日程!

石霖中国信通院云计算与大数据研究所内容科技部主任

个人介绍:石霖,现任中国信通院云计算与大数据研究所内容科技部主任,CCSATC602主席,主要从事人工智能、内容科技的技术研究、标准制定及测试评估工作,对信息安全、内容安全领域有丰富经验,参与智能审核、app加固、人脸识别、深伪检测等多项标准制定工作,圆满完成第二、三届中国人工智能大赛的举办工作,推动开展内容科技产业推进方阵、“护脸”计划等多项有助产业健康发展的工作。

专家团

蒋宏狮桥集团高级风控总监

个人介绍:蒋宏,狮桥智能风控高级总监,超过10年风控模型算法经验,在数据挖掘、机器学习、图谱应用、风险管理等方面有丰富的经验,主编书籍《智能风控实践指南:从模型、特征到决策》,曾任职德勤信息技术咨询顾问、百融风险部副总监、融360风控模型部负责人。上海交通大学学士、清华大学MBA。

个人介绍:刘宇,京东安全研发总监、京东安全技术委员会主席。2006年毕业于北京邮电大学计算机系,获得工学硕士学位。2006年~2014年,分别就职于摩托罗拉、雅虎中国、淘宝网,欧鹏,历任软件开发工程师、资深技术专家。2014年~2018年就职于易到用车,历任系统架构师、风控研发技术总监,亲身参与了网约车行业的百亿补贴大战及黑灰产对抗,并从0到1建设了易到风控系统-易盾。2018年加入京东集团风控,和团队一起建设京东风控体系,为京东业务保驾护航。2020年至今做为京东集团风控中台的项目经理及架构师,本着“共建共享、联防联控”的思想,联合各个业务板块的风控专家及架构师,整合各个业务板块的风控服务能力产品,实现京东生态内的风险共治。2021年《智能风控技术峰会》峰会主席及系统架构专场出品人。

个人介绍:拥有近十五年金融风险管理和智能风控领域业务策略、量化建模、解决方案、风控体系建设等工作经验,专注于商业银行、消费金融和金融科技行业,在智能风控策略模型数据体系建设、风险业务策略与量化模型、信贷资产组合管理、金融资产定价与风险管理、巴塞尔新资本协议、金融机构全面风险管理咨询、金融机构数字化转型、业务安全技术模型与策略、智能风控平台业务技术架构等方面积累了丰富的工作经验。曾在FICO、Accenture、GE等行业知名专业机构的风险咨询和分析咨询部门担任要职。

峰会议程

①风控体系建设方法论

出品人:李家琛bilibili风控负责人

个人介绍:硕士毕业于浙江大学自动化。曾就职美团风控,研究了一种通用算法对各场景进行高召回高准确。现任B站活动风控负责人,负责风控引擎以及不同业务风控。

1.互联网风控的分类

2.如何组件一支风控团队

3.如何行成一套风控体系

1.成为一个风控负责人需要哪些软技能和硬技能

2.风控体系飞轮如何旋转,对外承接业务,对外螺旋上升

3.对整个风控有全面认识

个人介绍:拥有13年安全技术研究和实战经验,曾任腾讯反诈骗实验室总监、T4-2级资深安全技术专家。在风控系统构建、策略对抗方面有丰富的实践经验。

1.风控攻防对抗中的挑战

2.风控体系中涉及到哪些情报

3.基于知识图谱的情报系统设计及实践

1.了解从攻击者的维度来思考风控体系中的攻防对抗点

2.了解到如何构建攻击情报系统,进而能够从更高维度来思考风控体系的建设

个人介绍:信息安全硕士毕业,目前在携程旅行,负责业务安全建设,主要集中在设备、账号对抗、业务防控,情报建设。

演讲题目:甲方威胁情报建设实践

演讲提纲:主要介绍甲方电商,业务威胁情报的定义、种类,落地使用的方法,情报和风控规则、风控基建如何互相驱动改进。

听众收益:

1.外部情报在甲方如何落地使用

2.内部情报如何做增益

3.情报运营中碰到的问题

个人介绍:本科毕业于中国科学技术大学少年班学院,硕士就读于伊利诺伊大学香槟分校。现就职于莉莉丝游戏,负责全游戏反欺诈业务,从0到1搭建风控系统、策略算法、风控产品,包括但不限于内容安全、支付风险、账号安全、脚本外挂、打金工作室识别等

演讲题目:手游反欺诈体系的设计与探索

演讲题目:数美风控体系建设总结与实践

演讲提纲:

1.风控体系关键元素

2.风控体系运营流程

1.一套风控体系搭建需要的考虑关键元素

2.一套风控体系搭建需要的建设流程

扫描二维码免费报名

②风控系统架构

出品人:朱杰奇富科技风控技术总监

雷柴卫奇富科技架构管理与公用平台架构师

个人介绍:雷柴卫,奇富科技架构师。主要研究方向为金融科技大数据以及AI在智能风控领域的应用以及拓展,包括图数据挖掘、AI工程、决策引擎、实验平台。

1.如何够条件智能风控与数据的生态闭环;

2.智能风控中数据的高可用与灾备;

3.智能风控的大数据实验。

1.智能风控生态闭环的搭建

2.智能风控数据高可用思考

3.大数据和人工智能在智能风控的深度探索

1.实时风险洞察面临的挑战

2.实时风险洞察的架构演进

3.核心组件剖析

4.未来的思考与展望

1.高吞吐的实时写入、高性能的实时计算与查询

2.OLAP如何选型?

3.异常检测模型在预警领域的应用

个人介绍:李瑞毕业于武大硕士研究生,在风控领域深耕6年多,对直播行业的黑产有丰富的对抗经验,目前是斗鱼业务安全的负责人。

演讲题目:斗鱼直播实时风控引擎快速对抗探索实践

1.直播行业的黑产问题

2.全栈式风控引擎的建设

3.快速对抗的有效措施

4.思考与展望

1.如何提升研发对抗策略的效率

2.介绍风控策略模型在斗鱼的实践方法

个人介绍:王欢,融360算法经理,国内线上模型负责人,硕士毕业于中科院软件所,书籍《智能风控实践指南》作者之一,曾参与国内及海外多个业务线的风控搭建、建模及特征工作,在风控模型和特征挖掘方面有丰富的实践经验。

演讲题目:风控场景全流程模型构建及应用实践

演讲提纲:针对在风控实践各场景下遇到的问题和挑战,构建模型来解决这些问题,以及介绍模型最终在业务中的应用方式。

1.贷前、贷中及贷后各场景下遇到的问题及挑战

2.针对典型场景介绍模型构建及上线应用的过程

3.模型应用的局限及优化探索

1.风控各业务场景下会遇到哪些问题及挑战?

2.如何充分利用各场景下的可用数据,搭建风控模型体系?

3.不同场景下数据获取及应用方式有哪些区别?

③风控算法

出品人:汪浩然资深风控和图计算专家

个人介绍:英国硕士,业内有算法百晓生和扫地僧之称,自幼好算法,遍干互联网诸侯,曾在蚂蚁金服,阿里巴巴,腾讯等公司主要从事风控算法,社交计算和图计算等工作,三十入风控,历抵圈内卿相,横跨金融,支付,电商,供应链,社区,社交等场景。率先工业界落地过诸多图上挖掘和机器学习算法。

个人介绍:毕业于清华大学自动化系模式识别与智能系统专业,曾就职于华为、快手负责多模态算法研发,现就职于北京枫清科技图智能分析部,复杂图算法和图机器学习设计、开发。

1.如何快速筛选环路?

2.如何优化分布式场景下的环路检测算法内存消耗?

3.环路检测在金融风控场景下如何使用?

个人介绍:许嘉蓉,复旦大学青年副研究员。主要研究方向包括图数据挖掘、图隐私计算,研究工作发表在人工智能顶级会议和期刊KDD、AAAI、NeurIPS、IJCAI、TKDE、TKDD等上,曾指导学生获得AAAI杰出论文奖,担任KDD、NeurIPS、WWW、AAAI、WSDM、TKDE等多个重要国际会议及期刊评审。

1.何时需要进行图预训练?

2.图预训练的数据是否越多越好?

此外,还提供了三个广泛的应用场景:

1.提供图预训练模型的适用范围

2.量化图预训练的可行性指标

3.挑选预训练数据的解决方案

1.预训练图神经网络

2.何时需要进行图预训练?

3.图预训练的数据是否越多越好?

演讲题目:主动学习以及样本不均衡在图数据场景的探索

演讲提纲:在风控场景中,由于异常事件相对于正常事件的发生频率较低,因此会出现样本不均衡的问题。例如,交易数据中正常交易数目远远多于欺诈交易数目,这就导致了欺诈交易数据集过小的情况。另外,标注难也是风控领域面临的一个挑战。由于涉及大量复杂的交易和操作流程,需要专业的知识和经验才能正确地标注异常事件。同时,异常交易往往会被恶意用户精心伪造,使得标注更加困难。这些问题都会导致数据集的不完备性,从而影响模型的准确率和鲁棒性,本次内容我们将会介绍我们在图主动学习以及样本不均衡技术上的一些探索。

2.图数据样本不均衡的解决方法

个人介绍:本硕毕业于西安交通大学和南加州大学,曾就职于中国银联风险管理部,加入蚂蚁后曾负责蚂蚁账户盗用类风控算法、国际卡收单业务风控算法,目前负责蚂蚁国际B类资金账户风控算法。

演讲题目:非结构化数据智能风控

演讲提纲:本次演讲介绍蚂蚁国际风控的业务背景,以及在非结构化数据场景中的智能风控解决方案,提纲如下:

1.业务背景介绍

2.非结构化数据风控的挑战

3.算法技术方案

4.智能风控解决方案

1.多模非结构化数据中如何精准获取信息?

2.多模非结构化信息的真实性如何保障?

3.账户和交易真实性智能风控解决方案如何设计?

演讲题目:内容风控对抗系统的探索与实践

1.背景

2.问题分析

3.解决方案:对抗感知、模型自动化迭代、模型融合、智能决策

4.效果

1.对内容对抗体系的基本组成及运作方式有一个大概的了解

2.模型自动化生产中涉及到的一些难点,如数据收集等

3.针对文本对抗中,最常见的形近字对抗解决方案

④图分析与关系网络

出品人:单黎平度小满AI算法资深专家

个人介绍:单黎平,硕士毕业于北京大学计算机系,度小满科技AI算法资深专家,现任度小满AI平台负责人,专注于机器学习与人工智能技术提能增效与落地应用。

1、图机器学习基础知识

2、风控场景下的图算法设计

3、图机器学习在度小满风控中的实际应用案例

1.反洗钱业务背景

2.当前反洗钱的业务流程及痛点

3.如何应用图智能进行反洗钱分析

4.案例介绍

1.如何通过应用图智能,节省业务60%工作量?

2.如何更好的让业务人员应用图智能技术解决业务问题

3.好的图智能产品需要满足何种要素

个人介绍:本硕均毕业于武汉大学数学系,目前在虎牙负责账号与营销活动的黑灰产对抗,包括图聚类算法开发,实时特征挖掘开发等工作。

演讲题目:图聚类在虎牙风控的实践

1.虎牙业务场景下的风控挑战

2.图机器学习算法在虎牙风控的实践

2.风控场景下的图算法设计

3.图聚类在虎牙风控中的实际应用案例

演讲题目:应对复杂风险的下一代风控基础设施-全图风控

⑤实时风控

出品人:付典阿里云高级技术专家

1.介绍FlinkCEP基础概念

2.介绍阿里云实时计算团队在增强FlinkCEP功能方面所做的工作,包括:

2.1.支持动态CEP、支持多规则在同一数据流上进行匹配等新特性;

2.2.拓展了FlinkSQL的MATCH_RECOGNIZE语法,增强MATCH_RECOGNIZE表达能力;

2.3.通过增加Cache机制、优化CEP内部实现逻辑、修复state泄漏等工作,大幅提高了FlinkCEP性能与稳定性。

3.介绍FlinkCEP常见业务场景及实现思路。

1.了解什么是FlinkCEP以及如何使用FlinkCEP作为规则引擎来解决风控场景中的常见问题

2.了解动态CEP的实现原理

3.了解如何优化FlinkCEP作业

个人介绍:网易互娱技术中心计费实时平台与SDK技术负责人,ApacheFlinkContributor,FlinkCDCContributor。负责计费实时数据平台与SDK的设计和开发,参与了实时风控、用户画像、异构关联分析挖掘等业务的核心工作。

1.从T+1走向实时风控

2.实时业务会话风控引擎

3.实时风控平台的建设

4.从实时风控到DataOPS

5.发展历程与展望未来

1.基于Flink构造实时风控引擎的技术思路

2.实时风控规则管理、运维和应用

3.实时风控与DataOPS

演讲题目:Airwallex基于大数据和机器学习构建智能金融风控系统

1.公司业务背景介绍

2.主要风控场景

*Onboarding

·业务场景

·技术方案

*TransactionalMonitoring

*PostMonitoring

3.另一个维度,InfrastructureforRisk

·MLPlatform

·BigDataSolution

4.CaseStudy:如何使用Graphbasedsolution应对黑产团伙

5.未来发展方向

1.了解金融风控的需求以及技术挑战

2.了解基于Flink的流批一体风控解决方案

3.了解基于图数据识别黑产团伙

⑥典型风控实践

出品人:徐德华翼支付风险管理部总监

个人介绍:风险管理部总监,模型团队负责人,负责支付、电商、通讯反诈等风控模型体系建设。

个人介绍:2017年毕业,先后从事互联网金融风控算法、业务风控算法等岗位。目前在OPPO主要负责应用分发业务的黑灰产对抗,包括搭建实时和离线防刷系统,感知、识别和处置作弊。

主要内容包括:

1.平台业务及黑灰产攻击介绍

2.流量作弊的整体防控思路及架构

3.典型案例

4.总结

1.流量反作弊体系如何搭建、评估?

2.如何感知黑灰产的变化?

3.如何评估算法的识别效果?

个人介绍:多年风控算法实践落地经验,涉及o2o,电商,泛娱乐等多个行业,现任同盾算法专家。

演讲题目:人工智能在跨境交易风控中的应用

1.智能化防控相比传统防控的区别

2.行为序列在风控场景的技术落地

3.风控算法在跨境电商场景的技术落地

4.关系图谱在业务风控场景的落地

5.智能化风控防控体系

1.风控算法在跨境电商场景的技术落地

2.关系图谱在业务风控场景的落地

3.行为序列在风控场景的技术落地

个人介绍:反欺诈风控模型团队负责人,先后负责车险、健康险领域风控模型体系建设以及保险科技创新产品的研发。

演讲题目:保险反欺诈能力建设实践

1.车险领域,反欺诈技术应用有哪些?

2.健康险领域,反欺诈技术应用有哪些?

个人介绍:硕士毕业于电子科技大学,2015年加入蚂蚁集团大安全至今,专注于风控领域,先后参与蚂蚁集团第四代、第五代风控体系的建设工作,目前负责牵头蚂蚁集团交互式风控平台建设。

演讲题目:蚂蚁集团交互式主动风控在反欺诈领域的应用

1.平台建设背景

2.平台技术挑战

3.核心思路和系统架构

4.典型应用场景-叫醒热线

5.未来的思考

1.如何通过技术手段,帮助解决电信诈骗这一愈发突出的社会问题?

2.蚂蚁集团在反诈领域做了哪些尝试和成果?

3.支付宝叫醒热线是如何运作的?

个人介绍:在算法技术应用于产业实践深耕多年,曾在宜信全面负责借贷领域的风险策略及算法应用,目前在58后负责建设高质量的风控技术并推进应用落地,对风险对抗有全面透彻的理解,善于设计系统化、体系化、完备性的风控方案。

1.58的业务主要面临的黑产形态

2.业务安全是一个长期对抗的事情

3.58同城加速黑产治理的技术设计以及应用设计

1.学习如何将复杂的业务风控问题抽象为技术问题,并把技术方案还原为应用方案

2.了解58同城关于黑产治理中遇到的重重挑战以及应对措施,如何打造体系化、智能化的风控屏障

个人介绍:研究生毕业于上海交通大学自动化系。先后职于交通银行信用卡中心、51信用卡等。现就职于中国电信翼支付(甜橙金融),参与负责C端信贷风控全流程从0到1的初始搭建及完善。

THE END
1.机器学习面临的三个关键数据挑战当前,关于捕获哪些元数据没有行业标准。然而,元数据与数据本身一样重要。当您具有填充了不同元数据字段的相同类型的数据时,如何关联和过滤数据? 如果以浮标为例,初始数据传感器每十分钟收集一次水温,而较新的浮标每三分钟收集一次水温。关联数据的唯一方法是通过元数据在捕获时公开。当科学家进行历史分析时,他们需要元https://www.528045.com/article/7f423917e5.html
2.排序不完全成功的原因是什么?这种问题如何影响数据处理?在数据处理的领域中,排序不完全成功是一个较为常见但又颇为关键的问题。造成排序不完全成功的原因多种多样。首先,数据的复杂性和多样性是一个重要因素。当数据包含多种类型、格式不一致或者存在大量的缺失值时,排序算法可能无法准确地处理和比较这些数据,从而导致排序结果不完全准确。 https://funds.hexun.com/2024-12-18/216258656.html
3.四不像正版资料,构建解答解释落实m418.39.40看点在数据分析的世界里,我们经常会遇到各种看似杂乱无章的数据,这些数据就像“四不像”一样,难以直接归类和解释,正是这些“四不像”的数据,往往蕴含着最有价值的信息,本文将深入探讨如何构建、解答和落实这些“四不像”的正版资料,以期为数据分析师提供一套实用的方法论。 https://www.yzcjl.cn/post/5569.html
4.四不像正版资料,综合解答解释落实1b93.47.84最新我们时常会遇到一些难以直接归类或解释的数据集,这些数据被形象地称为“四不像”数据,它们既不完全符合传统的结构化数据特征,也不具备典型的非结构化数据模式,同时在半结构化数据的范畴内也显得格格不入,甚至超越了多结构化数据的复杂度,本文旨在深入探讨这类特殊数据的处理策略,提供综合解答,并确保解决方案的有效落实https://vip.cshuijitang.cn/post/2894.html
5.数据分析面临的挑战是什么会计实务答:提高数据分析效率的关键在于建立一套完善的数据管理和清洗流程。通过自动化工具和算法,可以快速识别和处理数据中的错误和不一致,从而提高数据质量。同时,利用先进的分析技术和工具,如大数据平台和云服务,可以加速数据处理和分析的过程,提高整体效率。 在数据安全方面,企业应采取哪些措施来保护用户隐私? https://www.chinaacc.com/kuaijishiwu/krky/zh20241216112531.shtml
6.机器学习找不到创新点?三种特征选择的方法包你拿下顶会!文章介绍了两种新的决策树框架LDATree和FoLDTree,它们结合了不相关线性判别分析(ULDA)和前向ULDA。这些方法能够高效地进行斜切分,处理缺失值,支持特征选择,并提供类标签和概率作为模型输出。通过在模拟和真实数据集上的评估,LDATree和FoLDTree在准确率上与随机森林相当,显示出作为传统单树方法的稳健替代方案的潜力。 https://www.bilibili.com/read/cv40067807
7.数据孤岛“孤”在哪里?不同部门或系统可能采用不同的数据格式来存储和处理数据,造成了数据格式多样杂乱。https://www.zhihu.com/question/440784592/answer/57419373127
8.清博智能王欢:实时接入结构化数据的大语言模型是如何练成的?结构化数据和非结构化数据有何不同? 王欢:非结构化数据,比如说你现在访问的网页,你只看正文部分它就是文本,它的内容就是原始正文。搜素引擎看的就是原始正文,给它训练的数据也是原始正文。 结构化数据不仅知道它的原始正文信息,还对这些信息做了结构化处理,包括发布提及的地域信息、文本分词信息、内容分类以及正负https://m.cls.cn/detail/1388555
9.2022年中国知识图谱行业研究报告澎湃号·湃客澎湃新闻同时,文本、图片、各类报表和音频、视频、HTML等非结构化数据广泛存在于互联网中。互联网企业需要在现有的存量业务中,收集碎片化信息,处理非结构化数据,挖掘信息间的潜在联系,还原完整的、有价值的信息。然而,信息的关联关系挖掘是一项工作量巨大且复杂的工程。https://www.thepaper.cn/newsDetail_forward_19458208
10.行政管理论文15篇这势必导致学生处理社会现实问题和交往能力的技能很难有所提升,他们的知识结构、能力结构和素质明显存在不平衡,很难适应信息社会高速发展的需要。操作性和实践性教学严重薄弱。虽然目前我国高校《行政管理学》课程内容体系一般都设置了教学实习、实训等实践环节,但由于其时间短、任务重,而且管理松散,缺乏常态化和规范化,https://www.ruiwen.com/lunwen/6220159.html
11.RPA机器人在处理非结构化数据时,有哪些挑战和解决方案?强化异常处理能力: 开发健全的异常处理机制,包括自动化的错误恢复和报警系统,以确保RPA在面对非结构化数据处理中的异常情况时能够迅速应对。 综上所述,虽然RPA在处理非结构化数据时面临诸多挑战,但通过结合先进技术、进行数据预处理、持续监控与调整以及强化异常处理能力等措施,我们可以有效地提升RPA在这方面的性能。https://www.ai-indeed.com/encyclopedia/9960.html
12.数据治理新要求2018 年初加入度小满金融开始组建数据智能部,从0到1建设度小满金融的智能引擎的核心算法,深耕计算机视觉、自然语言处理、图模型、机器学习、因果推断等技术能力,多篇文章被EMNLP、ACL、CIKM等国际顶会收录,“智能化征信解读中台”工程荣获吴文俊人工智能科技进步奖。相关技术广泛应用于度小满营销、经营、风控、反欺诈全流程https://hub.baai.ac.cn/view/32749
13.0.技术知识介绍:工业级知识图谱方法与实践1.3.1 非结构化数据的知识建模 1.候选术语抽取[目的是过去更多、更全的术语] 2.术语过滤[剔除低质量候选术语] 领域术语与普通词汇有不同特征,可以采用统计信息和语义信息过滤噪声,常见方法:互信息(MI)、词频逆文档频率(TF-TDF),术语相关频率(RTF)等定量刻画统计特征,或者用词向量方式捕捉术语之间的语义相关度刻画https://download.csdn.net/blog/column/12167028/126426906
14.大数据一般用什么数据库大数据领域的数据库通常使用开源软件,如Hadoop、Cassandra等,相比于传统的商业关系型数据库,成本更低。 综上所述,大数据领域的数据库相对于传统的关系型数据库,具有更好的可扩展性、高可用性、更快的处理速度、更好的适应非结构化数据和更低的成本等优势。https://www.linkflowtech.com/news/2745
15.非结构化数据灾难恢复方法有哪些?非结构化信息数据恢复主要针对3种不同的故障类型进行恢复工作,其基本原理是利用日志文件、副本来对系统中的非结构化信息进行恢复。 1.事务故障恢复 对于事务故障,利用保存在磁盘上逻辑日志以及物理日志中关于故障事务的信息,来撤销故障事务对非结构化信息所产生的影响。其具体的恢复步骤如下: https://www.qinfeng.gov.cn/info/4283/194279.htm
16.研究生开题报告模板这些非结构化数据库因为可扩展性强、资源利用率高,高并发、响应速度快等优势,在大数据应用环境中得到了广泛的应用。但此种应用只解决了前端的业务处理,要真正利用大数据实现商务智能,还需要为决策支持系统和联机分析应用等提供一数据环境——数据仓库。为此,导师指导本文作者拟此题目,研究基于Hadoop框架的数据仓库解决https://www.yjbys.com/file/yanjiushengkaitibaogaomoban.html
17.大数据中非结构化数据的挖掘:文本一、 点击流中的非结构化文本数据都有哪些? 首先来定性什么是非结构化文本数据,这里指的是点击流原始数据中以文字形式展现的数据,包括原始LOG日志以及已经被结构化入库中的部分数据,比如Adobe Analytics的Data Feed,Webtrekk中的Raw Data。当然,有些数据虽然是文本或字符串的形式,但并不是真正意义上的非结构化,比如https://www.51cto.com/article/432085.html