架构算法方法论齐备,智能风控峰会完整日程!

石霖中国信通院云计算与大数据研究所内容科技部主任

个人介绍:石霖,现任中国信通院云计算与大数据研究所内容科技部主任,CCSATC602主席,主要从事人工智能、内容科技的技术研究、标准制定及测试评估工作,对信息安全、内容安全领域有丰富经验,参与智能审核、app加固、人脸识别、深伪检测等多项标准制定工作,圆满完成第二、三届中国人工智能大赛的举办工作,推动开展内容科技产业推进方阵、“护脸”计划等多项有助产业健康发展的工作。

专家团

蒋宏狮桥集团高级风控总监

个人介绍:蒋宏,狮桥智能风控高级总监,超过10年风控模型算法经验,在数据挖掘、机器学习、图谱应用、风险管理等方面有丰富的经验,主编书籍《智能风控实践指南:从模型、特征到决策》,曾任职德勤信息技术咨询顾问、百融风险部副总监、融360风控模型部负责人。上海交通大学学士、清华大学MBA。

个人介绍:刘宇,京东安全研发总监、京东安全技术委员会主席。2006年毕业于北京邮电大学计算机系,获得工学硕士学位。2006年~2014年,分别就职于摩托罗拉、雅虎中国、淘宝网,欧鹏,历任软件开发工程师、资深技术专家。2014年~2018年就职于易到用车,历任系统架构师、风控研发技术总监,亲身参与了网约车行业的百亿补贴大战及黑灰产对抗,并从0到1建设了易到风控系统-易盾。2018年加入京东集团风控,和团队一起建设京东风控体系,为京东业务保驾护航。2020年至今做为京东集团风控中台的项目经理及架构师,本着“共建共享、联防联控”的思想,联合各个业务板块的风控专家及架构师,整合各个业务板块的风控服务能力产品,实现京东生态内的风险共治。2021年《智能风控技术峰会》峰会主席及系统架构专场出品人。

个人介绍:拥有近十五年金融风险管理和智能风控领域业务策略、量化建模、解决方案、风控体系建设等工作经验,专注于商业银行、消费金融和金融科技行业,在智能风控策略模型数据体系建设、风险业务策略与量化模型、信贷资产组合管理、金融资产定价与风险管理、巴塞尔新资本协议、金融机构全面风险管理咨询、金融机构数字化转型、业务安全技术模型与策略、智能风控平台业务技术架构等方面积累了丰富的工作经验。曾在FICO、Accenture、GE等行业知名专业机构的风险咨询和分析咨询部门担任要职。

峰会议程

①风控体系建设方法论

出品人:李家琛bilibili风控负责人

个人介绍:硕士毕业于浙江大学自动化。曾就职美团风控,研究了一种通用算法对各场景进行高召回高准确。现任B站活动风控负责人,负责风控引擎以及不同业务风控。

1.互联网风控的分类

2.如何组件一支风控团队

3.如何行成一套风控体系

1.成为一个风控负责人需要哪些软技能和硬技能

2.风控体系飞轮如何旋转,对外承接业务,对外螺旋上升

3.对整个风控有全面认识

个人介绍:拥有13年安全技术研究和实战经验,曾任腾讯反诈骗实验室总监、T4-2级资深安全技术专家。在风控系统构建、策略对抗方面有丰富的实践经验。

1.风控攻防对抗中的挑战

2.风控体系中涉及到哪些情报

3.基于知识图谱的情报系统设计及实践

1.了解从攻击者的维度来思考风控体系中的攻防对抗点

2.了解到如何构建攻击情报系统,进而能够从更高维度来思考风控体系的建设

个人介绍:信息安全硕士毕业,目前在携程旅行,负责业务安全建设,主要集中在设备、账号对抗、业务防控,情报建设。

演讲题目:甲方威胁情报建设实践

演讲提纲:主要介绍甲方电商,业务威胁情报的定义、种类,落地使用的方法,情报和风控规则、风控基建如何互相驱动改进。

听众收益:

1.外部情报在甲方如何落地使用

2.内部情报如何做增益

3.情报运营中碰到的问题

个人介绍:本科毕业于中国科学技术大学少年班学院,硕士就读于伊利诺伊大学香槟分校。现就职于莉莉丝游戏,负责全游戏反欺诈业务,从0到1搭建风控系统、策略算法、风控产品,包括但不限于内容安全、支付风险、账号安全、脚本外挂、打金工作室识别等

演讲题目:手游反欺诈体系的设计与探索

演讲题目:数美风控体系建设总结与实践

演讲提纲:

1.风控体系关键元素

2.风控体系运营流程

1.一套风控体系搭建需要的考虑关键元素

2.一套风控体系搭建需要的建设流程

扫描二维码免费报名

②风控系统架构

出品人:朱杰奇富科技风控技术总监

雷柴卫奇富科技架构管理与公用平台架构师

个人介绍:雷柴卫,奇富科技架构师。主要研究方向为金融科技大数据以及AI在智能风控领域的应用以及拓展,包括图数据挖掘、AI工程、决策引擎、实验平台。

1.如何够条件智能风控与数据的生态闭环;

2.智能风控中数据的高可用与灾备;

3.智能风控的大数据实验。

1.智能风控生态闭环的搭建

2.智能风控数据高可用思考

3.大数据和人工智能在智能风控的深度探索

1.实时风险洞察面临的挑战

2.实时风险洞察的架构演进

3.核心组件剖析

4.未来的思考与展望

1.高吞吐的实时写入、高性能的实时计算与查询

2.OLAP如何选型?

3.异常检测模型在预警领域的应用

个人介绍:李瑞毕业于武大硕士研究生,在风控领域深耕6年多,对直播行业的黑产有丰富的对抗经验,目前是斗鱼业务安全的负责人。

演讲题目:斗鱼直播实时风控引擎快速对抗探索实践

1.直播行业的黑产问题

2.全栈式风控引擎的建设

3.快速对抗的有效措施

4.思考与展望

1.如何提升研发对抗策略的效率

2.介绍风控策略模型在斗鱼的实践方法

个人介绍:王欢,融360算法经理,国内线上模型负责人,硕士毕业于中科院软件所,书籍《智能风控实践指南》作者之一,曾参与国内及海外多个业务线的风控搭建、建模及特征工作,在风控模型和特征挖掘方面有丰富的实践经验。

演讲题目:风控场景全流程模型构建及应用实践

演讲提纲:针对在风控实践各场景下遇到的问题和挑战,构建模型来解决这些问题,以及介绍模型最终在业务中的应用方式。

1.贷前、贷中及贷后各场景下遇到的问题及挑战

2.针对典型场景介绍模型构建及上线应用的过程

3.模型应用的局限及优化探索

1.风控各业务场景下会遇到哪些问题及挑战?

2.如何充分利用各场景下的可用数据,搭建风控模型体系?

3.不同场景下数据获取及应用方式有哪些区别?

③风控算法

出品人:汪浩然资深风控和图计算专家

个人介绍:英国硕士,业内有算法百晓生和扫地僧之称,自幼好算法,遍干互联网诸侯,曾在蚂蚁金服,阿里巴巴,腾讯等公司主要从事风控算法,社交计算和图计算等工作,三十入风控,历抵圈内卿相,横跨金融,支付,电商,供应链,社区,社交等场景。率先工业界落地过诸多图上挖掘和机器学习算法。

个人介绍:毕业于清华大学自动化系模式识别与智能系统专业,曾就职于华为、快手负责多模态算法研发,现就职于北京枫清科技图智能分析部,复杂图算法和图机器学习设计、开发。

1.如何快速筛选环路?

2.如何优化分布式场景下的环路检测算法内存消耗?

3.环路检测在金融风控场景下如何使用?

个人介绍:许嘉蓉,复旦大学青年副研究员。主要研究方向包括图数据挖掘、图隐私计算,研究工作发表在人工智能顶级会议和期刊KDD、AAAI、NeurIPS、IJCAI、TKDE、TKDD等上,曾指导学生获得AAAI杰出论文奖,担任KDD、NeurIPS、WWW、AAAI、WSDM、TKDE等多个重要国际会议及期刊评审。

1.何时需要进行图预训练?

2.图预训练的数据是否越多越好?

此外,还提供了三个广泛的应用场景:

1.提供图预训练模型的适用范围

2.量化图预训练的可行性指标

3.挑选预训练数据的解决方案

1.预训练图神经网络

2.何时需要进行图预训练?

3.图预训练的数据是否越多越好?

演讲题目:主动学习以及样本不均衡在图数据场景的探索

演讲提纲:在风控场景中,由于异常事件相对于正常事件的发生频率较低,因此会出现样本不均衡的问题。例如,交易数据中正常交易数目远远多于欺诈交易数目,这就导致了欺诈交易数据集过小的情况。另外,标注难也是风控领域面临的一个挑战。由于涉及大量复杂的交易和操作流程,需要专业的知识和经验才能正确地标注异常事件。同时,异常交易往往会被恶意用户精心伪造,使得标注更加困难。这些问题都会导致数据集的不完备性,从而影响模型的准确率和鲁棒性,本次内容我们将会介绍我们在图主动学习以及样本不均衡技术上的一些探索。

2.图数据样本不均衡的解决方法

个人介绍:本硕毕业于西安交通大学和南加州大学,曾就职于中国银联风险管理部,加入蚂蚁后曾负责蚂蚁账户盗用类风控算法、国际卡收单业务风控算法,目前负责蚂蚁国际B类资金账户风控算法。

演讲题目:非结构化数据智能风控

演讲提纲:本次演讲介绍蚂蚁国际风控的业务背景,以及在非结构化数据场景中的智能风控解决方案,提纲如下:

1.业务背景介绍

2.非结构化数据风控的挑战

3.算法技术方案

4.智能风控解决方案

1.多模非结构化数据中如何精准获取信息?

2.多模非结构化信息的真实性如何保障?

3.账户和交易真实性智能风控解决方案如何设计?

演讲题目:内容风控对抗系统的探索与实践

1.背景

2.问题分析

3.解决方案:对抗感知、模型自动化迭代、模型融合、智能决策

4.效果

1.对内容对抗体系的基本组成及运作方式有一个大概的了解

2.模型自动化生产中涉及到的一些难点,如数据收集等

3.针对文本对抗中,最常见的形近字对抗解决方案

④图分析与关系网络

出品人:单黎平度小满AI算法资深专家

个人介绍:单黎平,硕士毕业于北京大学计算机系,度小满科技AI算法资深专家,现任度小满AI平台负责人,专注于机器学习与人工智能技术提能增效与落地应用。

1、图机器学习基础知识

2、风控场景下的图算法设计

3、图机器学习在度小满风控中的实际应用案例

1.反洗钱业务背景

2.当前反洗钱的业务流程及痛点

3.如何应用图智能进行反洗钱分析

4.案例介绍

1.如何通过应用图智能,节省业务60%工作量?

2.如何更好的让业务人员应用图智能技术解决业务问题

3.好的图智能产品需要满足何种要素

个人介绍:本硕均毕业于武汉大学数学系,目前在虎牙负责账号与营销活动的黑灰产对抗,包括图聚类算法开发,实时特征挖掘开发等工作。

演讲题目:图聚类在虎牙风控的实践

1.虎牙业务场景下的风控挑战

2.图机器学习算法在虎牙风控的实践

2.风控场景下的图算法设计

3.图聚类在虎牙风控中的实际应用案例

演讲题目:应对复杂风险的下一代风控基础设施-全图风控

⑤实时风控

出品人:付典阿里云高级技术专家

1.介绍FlinkCEP基础概念

2.介绍阿里云实时计算团队在增强FlinkCEP功能方面所做的工作,包括:

2.1.支持动态CEP、支持多规则在同一数据流上进行匹配等新特性;

2.2.拓展了FlinkSQL的MATCH_RECOGNIZE语法,增强MATCH_RECOGNIZE表达能力;

2.3.通过增加Cache机制、优化CEP内部实现逻辑、修复state泄漏等工作,大幅提高了FlinkCEP性能与稳定性。

3.介绍FlinkCEP常见业务场景及实现思路。

1.了解什么是FlinkCEP以及如何使用FlinkCEP作为规则引擎来解决风控场景中的常见问题

2.了解动态CEP的实现原理

3.了解如何优化FlinkCEP作业

个人介绍:网易互娱技术中心计费实时平台与SDK技术负责人,ApacheFlinkContributor,FlinkCDCContributor。负责计费实时数据平台与SDK的设计和开发,参与了实时风控、用户画像、异构关联分析挖掘等业务的核心工作。

1.从T+1走向实时风控

2.实时业务会话风控引擎

3.实时风控平台的建设

4.从实时风控到DataOPS

5.发展历程与展望未来

1.基于Flink构造实时风控引擎的技术思路

2.实时风控规则管理、运维和应用

3.实时风控与DataOPS

演讲题目:Airwallex基于大数据和机器学习构建智能金融风控系统

1.公司业务背景介绍

2.主要风控场景

*Onboarding

·业务场景

·技术方案

*TransactionalMonitoring

*PostMonitoring

3.另一个维度,InfrastructureforRisk

·MLPlatform

·BigDataSolution

4.CaseStudy:如何使用Graphbasedsolution应对黑产团伙

5.未来发展方向

1.了解金融风控的需求以及技术挑战

2.了解基于Flink的流批一体风控解决方案

3.了解基于图数据识别黑产团伙

⑥典型风控实践

出品人:徐德华翼支付风险管理部总监

个人介绍:风险管理部总监,模型团队负责人,负责支付、电商、通讯反诈等风控模型体系建设。

个人介绍:2017年毕业,先后从事互联网金融风控算法、业务风控算法等岗位。目前在OPPO主要负责应用分发业务的黑灰产对抗,包括搭建实时和离线防刷系统,感知、识别和处置作弊。

主要内容包括:

1.平台业务及黑灰产攻击介绍

2.流量作弊的整体防控思路及架构

3.典型案例

4.总结

1.流量反作弊体系如何搭建、评估?

2.如何感知黑灰产的变化?

3.如何评估算法的识别效果?

个人介绍:多年风控算法实践落地经验,涉及o2o,电商,泛娱乐等多个行业,现任同盾算法专家。

演讲题目:人工智能在跨境交易风控中的应用

1.智能化防控相比传统防控的区别

2.行为序列在风控场景的技术落地

3.风控算法在跨境电商场景的技术落地

4.关系图谱在业务风控场景的落地

5.智能化风控防控体系

1.风控算法在跨境电商场景的技术落地

2.关系图谱在业务风控场景的落地

3.行为序列在风控场景的技术落地

个人介绍:反欺诈风控模型团队负责人,先后负责车险、健康险领域风控模型体系建设以及保险科技创新产品的研发。

演讲题目:保险反欺诈能力建设实践

1.车险领域,反欺诈技术应用有哪些?

2.健康险领域,反欺诈技术应用有哪些?

个人介绍:硕士毕业于电子科技大学,2015年加入蚂蚁集团大安全至今,专注于风控领域,先后参与蚂蚁集团第四代、第五代风控体系的建设工作,目前负责牵头蚂蚁集团交互式风控平台建设。

演讲题目:蚂蚁集团交互式主动风控在反欺诈领域的应用

1.平台建设背景

2.平台技术挑战

3.核心思路和系统架构

4.典型应用场景-叫醒热线

5.未来的思考

1.如何通过技术手段,帮助解决电信诈骗这一愈发突出的社会问题?

2.蚂蚁集团在反诈领域做了哪些尝试和成果?

3.支付宝叫醒热线是如何运作的?

个人介绍:在算法技术应用于产业实践深耕多年,曾在宜信全面负责借贷领域的风险策略及算法应用,目前在58后负责建设高质量的风控技术并推进应用落地,对风险对抗有全面透彻的理解,善于设计系统化、体系化、完备性的风控方案。

1.58的业务主要面临的黑产形态

2.业务安全是一个长期对抗的事情

3.58同城加速黑产治理的技术设计以及应用设计

1.学习如何将复杂的业务风控问题抽象为技术问题,并把技术方案还原为应用方案

2.了解58同城关于黑产治理中遇到的重重挑战以及应对措施,如何打造体系化、智能化的风控屏障

个人介绍:研究生毕业于上海交通大学自动化系。先后职于交通银行信用卡中心、51信用卡等。现就职于中国电信翼支付(甜橙金融),参与负责C端信贷风控全流程从0到1的初始搭建及完善。

THE END
1.什么是非结构化数据?1.非数值型数据的表示 非数值型数据也是以二进制的形式保存在计算机中的。最简单的就是字符数据,其用https://www.zhihu.com/question/523983127/answer/2807829713
2.数据处理与分析涵盖七大分析方法人人都是产品经理本文针对性地讲讲数据分析整个流程最关键的阶段:数据处理与分析阶段。该阶段我分成了三块:数据采集、数据处理、数据分析,都围绕着“数据”进行,对海量或杂乱数据进行处理分析,从中找出痛点,洞察问题。 一、数据采集 该处的数据采集指的是获取分析所需要的数据,一般可以从内部数据、外部数据两个方向获取。 https://www.woshipm.com/data-analysis/5343087.html/comment-page-1
3.非结构化数据管理平台的操作流程介绍在数字化转型的背景下,非结构化数据的高效管理成为企业提升竞争力的关键。非结构化数据管理平台通过其独特的功能和流程,帮助企业实现对文档、图像、视频等非结构化数据的全面掌控。本文将详细介绍非结构化数据管理平台的操作流程,展示其如何简化数据管理,提高数据的可访问性和安全性。 https://www.gokuai.com/press/a665
4.非结构化数据治理流程2. 收集和整合,收集来自不同部门和系统的非结构化数据,并进行整合,确保数据能够被统一管理和访问。 3. 清洗和标准化,对非结构化数据进行清洗和标准化处理,包括去除重复数据、纠正错误信息、统一命名规范等,以确保数据质量和一致性。 4. 存储和管理,确定合适的存储方式和位置,建立非结构化数据的管理策略,包括数据备https://wenku.baidu.com/view/3e6040489dc3d5bbfd0a79563c1ec5da50e2d6a5.html
5.非结构化数据如何挖掘帆软数字化转型知识库非结构化数据的挖掘可以通过多种方法实现,包括自然语言处理(NLP)、机器学习、文本挖掘、图像和视频分析。自然语言处理是一种广泛应用的方法,通过分析和理解文本数据的语义结构来提取有用的信息。NLP可以帮助企业从大量的文本数据中获取有价值的洞察,例如用户评论、社交媒体帖子和电子邮件。通过使用NLP技术,企业可以识别情感https://www.fanruan.com/blog/article/611442/
6.非结构化数据管理专家深圳市连用科技有限公司(Shenzhen LinkAPP Technology Co., Ltd 简称LinkAPP)成立于2008年,是一家专注于非结构化数据管理和应用的国家认定高新技术企业和深圳市政府重点扶持的软件企业,总部位于深圳,在北京、上海、广州、海口等多地均设立有办事机构,建立了辐射全国的https://www.linkapp.cn/products/42/0
7.大数据金融第二章大数据相关技术数据处理流程 一 数据采集 大数据的采集是指在确定用户目标的基础上,对该范围内的所有结构化、半结构化、非结构化数据进行采集的过程。 (零) 数据来源 商业数据、互联网数据、传感器数据。 采集方法有以下三种 (一) 系统日志采集 1.作用:知道找谁解决问题,定位解决问题,了解客户需求进行个性化营销。 https://www.jianshu.com/p/d68251554c66
8.智慧政府管理系统卡片式流程创建 所见即所得卡片流程定义,流程数字化更加方便 图形化规则配置 图形化配置工作业务,赋能企业管理效率 智能化报表设计 AI智能报表输出,业务数据呈现一览无余 非结构化数据处理 复杂逻辑数据结构轻松处理,完善的数据仓库 移动协作平台 为企业提供一套基于移动端的工作协作平台,面向企业日常管理、生产、销售。https://www.cnet99.com/gov/
9.数据架构:大数据数据仓库以及DataVault按照数据处理方式进行划分的原因是,重复型非结构化数据几乎完全是通过一个管理Hadoop的固定设施来处理的。对于重复型非结构化数据而言,其重点完全集中在对大数据管理器(例如Hadoop)中的数据进行访问、监视、显示、分析和可视化。 非重复型非结构化数据的重点则几乎完全集中在文本消歧上。这里的重点在于消歧的类型、输出的https://www.ituring.com.cn/book/tupubarticle/11854
10.“平民化”非结构数据处理腾讯云开发者社区在全球信息产业高速发展的背景下,IDC预测,2018 到 2025 年之间,全球产生的数据量将会从 33 ZB 增长到 175 ZB, 复合增长率27%,其中超过 80%的数据都会是处理难度较大的非结构化数据,如文档、文本、图形、图像、音频、视频等。非结构化数据在大数据时代的重要地位已成为共识。近些年,伴随着大数据存储、人工智能(https://cloud.tencent.com/developer/article/2214210
11.行政管理论文15篇这势必导致学生处理社会现实问题和交往能力的技能很难有所提升,他们的知识结构、能力结构和素质明显存在不平衡,很难适应信息社会高速发展的需要。操作性和实践性教学严重薄弱。虽然目前我国高校《行政管理学》课程内容体系一般都设置了教学实习、实训等实践环节,但由于其时间短、任务重,而且管理松散,缺乏常态化和规范化,https://www.ruiwen.com/lunwen/6220159.html
12.非结构化数据提取技术在统计工作中的应用摘要结构化数据和非结构化数据是大数据的两种类型,目前非结构化数据信息已达信息总量的85%以上,且每年以55%~65%的速度增长,统计工作受到大数据的冲击,日常总会遇到一些非结构化数据提取的难题,导致工作量加大,效率低下。本文对非结构化数据及其提取技术、大数据处理语言——Python语言进行学习研究,解决实际中遇https://tjj.changzhi.gov.cn/sjfx/202207/t20220704_2588893.html
13.解析非结构化数据与结构化数据的区别与联系非结构化数据和结构化数据是两种不同的数据形式,它们在数据的结构、处理方式、获取方式等方面存在差异。非结构化数据是指没有固定格式和明确结构的数据,它包括文本、图像、视频等类型,其组织形式相对自由灵活。而结构化数据是以表格和数据库形式组织的数据,具有明确的数据结构和规范的格式。本文将通过对非结构化数据和https://www.filez.com/news/detail/8334ba6c5eb4f79c51096083f5cb75ca.html
14.什么是非结构化数据?非结构化数据完整指南Elastic定义非结构化数据并探索数据示例以理解它与结构化数据有哪些不同。了解如何分析非结构化数据,非结构化数据的优点和带来的挑战。https://www.elastic.co/cn/what-is/unstructured-data
15.高频面试知识点总结,看看你能答对多少Java知音号这些数据通常需要做结构化查询,比如join,这时候,关系型数据库就要胜出一筹。 这些数据的规模、增长的速度通常是可以预期的。 事务性、一致性。 NoSQL适合存储非结构化数据,如文章、评论: 这些数据通常用于模糊处理,如全文搜索、机器学习。 这些数据是海量的,而且增长的速度是难以预期的。 https://www.cnblogs.com/javazhiyin/p/11555823.html
16.第五届InvestDigital数字证券与资管峰会在沪圆满结束曾任国药集团MIS软件工程师、敏照计算计算机系统架构师,参与工信部《DCMM数据能力成熟度模型》等多个国家标准的建设,是《非结构化数据管理解决方案白皮书2020》等多部专著的主要撰写人。 主导鸿翼参与了贵州大数据平台、中国银联非结构化数据中心等数百个国家大数据项目;打造的鸿翼ECM解决方案服务了招商银行、上汽、扬子江https://meeting.qianzhan.com/meeting/detail/151/230424-f7c77175.html
17.非结构化数据的定义及处理方法结构化数据指有完整规则的数据模型定义,高度组织格式化,可用统一的结构逻辑表达的数据。如:日期、电话号码等。 非结构化数据指数据定义不完整或不规则,没有预定义的数据模型,无法用数据库二维表结构来逻辑表达的数据。简单来说就是字段可变的数据。常见的非结构化数据有文档、图片、音频、视频等。 https://blog.csdn.net/weixin_52189060/article/details/115489159
18.科学网—[转载]武新:大数据架构及行业大数据应用系统除标准SQL外,还需支持MapReduce等分布式处理机制,具备优秀的非结构化数据处理能力,提供完整的事务管理功能,具备完善的混合负载管理能力;具备良好的通用性,支持主流第三方工具,提供可视化开发界面,支持自定义开发。性能方面要求大数据的加载、处理、导出等关键处理性能表现优异,具备优秀的高可用性和线性扩展能力,支持在线https://blog.sciencenet.cn/blog-887780-1358813.html