CDA数据挖掘工程师脱产就业班

数据治理驱动因素、数据治理域、数据管理域、数据应用域、如何开展数据治理

解决企业数据治理问题,理清企业数据逻辑,提高企业数据质量与价值

领会数据分类中的主数据、交易数据和元数据概念;理解数据库建模中概念、逻辑、物理模型之间的关系;掌握数据治理方法与方向

EDIT数字化模型简介、业务探查(E)、问题诊断(D)、业务策略优化和指导(I)、算法工具介绍(T)

解决企业数据采集,数据模型构建,搭建数据之间的逻辑

领会数据分类中的主数据、交易数据和元数据概念;理解数据库建模中概念、逻辑、物理模型之间的关系;领会数据库范式的概念、数据仓库和数据集市、ETL过程;掌握关系模型与维度模型的使用场景

数据采集方法、数据模型管理

领会数据分类中的主数据、交易数据和元数据概念;理解数据库建模中概念、逻辑、物理模型之间的关系;掌握关系模型与维度模型的使用场景

Python标准数据类型、控制流语句、自定义函数、异常和错误、类与面向对象编程、Python连接数据库操作、Python编程面试题集训

解决使用商业智能报表分析业务、监控业务的问题

具备Python代码编写阅读能力;掌握基本的Python语法;熟悉面向对象的原理;掌握Python数据库编程;

Numpy数组基础操作、Pandas数据表的基本操作、Pandas数据探索、Pandas数据可视化、Python数据可视化包-Matplotlib介绍、Python数据可视化包-Seaborn介绍与图形绘制

完成企业实际工作中的数据清洗、转换等数据加工及可视化任务,为后续机器学习打下基础

掌握数据清洗的方法与技巧;掌握数据常用可视化的方法与技巧

实际项目检验学习成果,学以致用,更加贴近实战项目,达到学习价值

掌握Python综合使用技能,掌握numpy与pandas的用法

先导课:抽样方法、统计量及抽样分布、参数估计与假设检验、统计分析与Python实战、线性规划与二次优化;实战案例:关于饮料消费的统计学分析、快递公司的路线策略优化

熟悉常见统计分布的特点与应用;熟悉假设检验的基本概念与方法;掌握T检验、方差分析的方法步骤;掌握线性规划与二次优化

可完成电商、金融、互联网等行业的用户行为分析与预测,商业策略分析等工作。

熟悉数据分析方法与步骤;掌握方差分析与应用,回归分析与应用,分类数据分析方法,时序数据的分析预测方法

用户标签体系设计原理、用户标签的制作方法、标签体系的用户画像应用、实战案例:用户行为在营销活动的价值分析、自动预警指标推送功能框架的搭建、app静默用户触动分析

可完成电商、金融、互联网等行业的标签体系的设计与应用任务。如构建业务指标体系、构建用户画像等高价值工作。

掌握用户标签体系设计原、熟悉用户标签的制作方法、熟悉用户画像的应用

数据挖掘概要、数据挖掘方法论、基础数据挖掘技术、进阶数据挖掘技术

理解和辨别数据挖掘算法在企业不同的工作场景中的应用,

熟悉数据挖掘的基本理论与技术

特征工程概要、特征建构、特征选择、特征转换、特征学习

正确理解特征工程,为提高模型效果,正确使用特征工程方法做准备

熟悉特征工程概念与原理;掌握特征工的构建,特征工的选择、转换

KNN-最近邻分类算法:原理、实现、决策树(分类树及回归树)、聚类分析

本阶段课程学习基础机器学习算法,有分类算法与聚类算法。这些算法可应用在大部分的商业问题中:如信用评分、客户画像等。

掌握KNN算法原理与基于Python的应用;掌握决策树算法原理、scikit-learn应用以及算法优化技巧;掌握K-means聚类算法原理及应用;熟悉保险行业客户分群意义;掌握决策树算法在客户分群中的实际运用;

朴素贝叶斯、神经网络与深度学习、支持向量机、集成方法实战案例:航空客户价值分析综合案例、基于集成算法的乳腺癌疾病预测、基于神经网络的汽车燃油率预测

本阶段课程学习高阶机器学习算法与集成算法,这些算法在企业内的应用也比较多,如客户流失预警、动态定价、客户细分、欺诈检测、垃圾邮件检测、图像分类与识别等。

关联规则、序列模式、模型评估、实战项目:推荐系统实战

掌握推荐系统主要的算法,并能依据模型结果提供实际营销建议。

掌握关联规则的核心原理与应用;掌握序列算法的原理及应用;熟悉模型评估算法;掌握模型评估算法原理及应用

实战案例:以自动机器学习技术开发银行业信用风险评分模型并进行最佳模型调参、以类别不平衡处理技术开发银行业中小企业信贷营销模型并进行最佳模型调参、以半监督式学习技术开发电信业客户流失模型并进行最佳模型调参

可完成电商、金融、互联网等行业中的分类、预测问题,如用户购买预测、垃圾邮件检测、商品精准推荐等等。

掌握自动机器学习原理;熟悉类别不平衡问题的解决方法;掌握半监督学习算法原理与应用,模型优化技巧

自然语言处理概要、分词与词性标注、文本挖掘概要、关键词提取

熟悉自然语言处理的基本概念;掌握分词以及词性标注技术,文本挖掘技术流程方法,信息检索技术

实战案例:金融信用评分卡风控建模综合项目实战、以特征工程技术开发文本情感分析模型、以深度学习技术开发银行业信用卡盗刷侦测模型、以图像处理技术、深度学习及迁移学习技术,开发人脸口罩侦测模型

综合使用机器学习、深度学习、自然语言处理算法来解决金融、银行、AI科技等行业的场景应用。

职业规划、职场沟通力、团队协作力培养

了解职业现状和前景,解决职业沟通和团队协作问题

专职职业导师培养职业规划、职场沟通、以及团队协作能力。

1V1面试技巧指导、简历修改

解决面试技巧不足、简历书写不专业问题

专职就业老师1V1面试技巧辅导与简历修改指导。

何为数据产品经理?Python爬虫、Python办公自动化、数据挖掘项目选修项目

解决学员在不同数据岗位方向和行业方向的业务经验和项目经验不足的问题。

根据学员面试方向、就业方向来选择合适的选修课程来进一步进修。

喜欢钻研数据科学的人群

涵盖行业中的各个场景,运用自动机器学习技术、类别不平衡处理技术、半监督式学习技术、特征工程技术、深度学习技术、图像处理技术、深度学习及迁移学习技术等前沿挖掘模型,处理风控、信贷、客户流失、情感分析、人脸侦测等广泛的行业应用.

以自动机器学习技术开发银行业信用风险评分模型并进行最佳模型调参案例本项目将介绍如何将机器学习中的数据预处理、特征选择、算法选择、模型优化等步骤,将其放在一个“黑箱”里,通过黑箱,我们只需要输入数据,就可以得到我们想要的模型预测结果。学习并掌握自动机器学习的模型建构方法,并以银行业信用风险评分为例,进行信用风险评分模型的自动化。

以类别不平衡处理技术开发银行业中小企业信贷营销模型并进行最佳模型调参案例本项目将介绍多个类别不平衡的处理方法,以有效地对少数类别做正确的预测,帮助组织制定适当的决策,并节省许多成本与损失。学习并掌握多个目标类别分布不平衡的处理方法,并以银行业中小企业信贷营销为例,进行信贷营销模型的开发。

以半监督式学习技术开发电信业客户流失模型并进行最佳模型调参案例,本项目将介绍多个半监督式学习的方法,从未标记目标字段的数据中,找出一些模型比较有把握的预测结果当作目标字段的标记,以提升整体分类模型的预测效能。

本项目将介绍多个特征工程的技术,从原始数据中,构建、提取、并选择好的特征,并建置一个文本情感分析预测模型。学习并掌握多个特征工程的技术,并以文本情感分析预测为例,进行情感分析预测模型的开发。

本项目将通过利用信用卡的历史交易数据,进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。学习并掌握常见信用卡盗刷的种类及信用卡盗刷的侦测的方法。学习信用卡盗刷的业务逻辑,发现关键业务结点,并掌握深度学习的建模能力。

本项目将以图像处理技术并结合深度学习及迁移学习,开发人脸口罩侦测模型。学习并掌握图像处理、深度学习及迁移学习的技术,并以人脸口罩侦测为例,进行人脸口罩侦测模型的开发。

解析数据分析业务全流程厘清数字化人才技能需求

课程讲师均为国内数据挖掘领域、人工智能领域、咨询领域一线专家,具备深厚的学术背景与行业经验。同时他们也都具备丰富的讲课经验,累计讲课经验时长超过10000小时,授课能力得到长期实践与验证。

北京大学会计学博士ThoughtWorks中国金融首席数据科学家中国大数据产业生态联盟专家委员会委员反洗钱模型专家

东南大学博士,复旦大学博士后负责本科生、研究生大数据核心技术和商务数据分析等课程的教学。商务智能被评为上海市精品课程,荣获2013年高等教育上海市教学成果奖二等奖。

计算机软件与理论硕士,吉林大学计算机体系结构博士具有多年JAVA程序设计和操作系统教学经验。研究方向为智能规划、空间推理、基于大数据的时空信息系统。

北京邮电大学管理科学与工程硕士现就职于北京电信规划设计院,从事移动、联通集团及各省分公司市场、业务、财务规划,经济评价及运营咨询。重点研究方向包括离网用户挖掘,市场细分与精准营销,移动网络价值区域分析,潜在价值客户挖掘等

东北大学基础数学专业,硕士研究生近8年来,一直从事金融、电信行业数据架构、数据治理和数据分析挖掘方面工作。现任北京捷报金峰数据技术有限公司产品&技术总监,主要负责公司数据治理解决方案的建设、数据治理配套平台的研发,以及银行业数据治理应用场景的研究,该项目在17年获得北京市创新项目资金资助。

南京上度咨询数据分析总监人大经济论坛数据处理中心数据分析顾问,SAS、SPSS软件讲师、中国学习路径图国际中心技术顾问。曾参与2012国家宏观经济预测、中国城镇居民家庭投资调查、泸州老窖目标管理与绩效考核、中国卫生状况调查、江苏广电CRM数据挖掘等大型数据处理项目。

博士,国内某券商研究所高级分析师。神经网络,数据挖掘,统计分析应用领域专家,国内最大的MATLAB论坛管理员,曾多次参与TheMathWorks公司培训活动。

曾就职于阿里巴巴,饿了么,集团首席数据架构师,P10科学家。负责饿了么、百度外卖的大数据技术统筹。2014年加入百度,先后带团队建设为百度地图6大place场景做数据分析,后专注于百度外卖大数据

德勤高级咨询顾问/创业公司数据科学家经验涉及快消、通信、互联网餐饮、银行等多个领域的咨询项目;涉及短视频、电商、数据平台等多个领域的投资尽调项目;涉及快消、品牌商领域的数据建模项目,如智能定价、精准推荐、选品等。专精于企业业务数据分析、数据可视化、制定及实施商业智能业务解决方案。

Glasgow大学计量经济学博士,曾就职中国社科院、中国银行、北京工业大学从事算法研发工作。师从HisayukiYoshimoto,主攻空间计量方向,对各种回归模型和联立方程模型有深入研究。博士研究课题为神经网络的空间矩阵工具变量参数识别。曾参与多个经济数据分析项目,其中纽约市场对香港市场高频交易分析项目已在英国上线。

CDA数据科学研究院SQL与Python课程讲师擅长Python、SPSSModeler等工具进行数据挖掘,参与主编《SPSSModeler+Weka数据挖掘从入门到实战》等书籍

CDA数据科学研究院大数据课程讲师曾就职于IBM系统运维工程师,有丰富的运维工作和大数据平台搭建经验,主要负责大数据平台搭建及数据化运维

CDA数据科学研究院讲师,CDA在线助教,主要研究方向为机器学习技术以及基于大数据架构的数仓技术。

AI项目组分析师、CDA在线助教,计算机专业。精通excel、powerBI、python、R语言等数据分析常用工具。

CDA在线助教,熟悉Python基础、Python数据清洗等,在课程内容以及软硬件技术拥有丰富的经验。

课程依据大量不同行业、不同岗位的企业内训需求,结合主流的数据体系进行课程研发,课程内容更符合市场需求

课程的底蕴来自企业的信赖,上百家企业需求提炼,课程更贴合企业诉求。自2015年以来,我们已为超过百家企业提供了内训服务,见证了企业从数据分析中实现真正价值的全过程,越来越多的企业要求全员掌握数据化思维,对数据人才需求十分迫切。

课程大纲依据CDA的「EDIT数字化人才模型」设计研发。CDA是数据人才认证标准,在国内由中成协大数据专业委员会监管并是经国标委发布认定的数据分析师人才标准

该模型体现层次和纵深两个方面层次方面:强调战略、管理、操作三个层级的业务部门人员均借助数据支持创造性的优化业务流程。纵深方面:以数据使用区分企业的前、中、后台,数据用户即业务人员,数据加工者即技术人员。

THE END
1.数据挖掘算法(AnalysisServices–数据挖掘)MicrosoftLearn为特定的业务任务选择最佳算法很有挑战性。您可以使用不同的算法来执行同样的业务任务,每个算法会生成不同的结果,而某些算法还会生成多种类型的结果。例如,您不仅可以将 Microsoft 决策数算法用于预测,而且还可以将它用作一种减少数据集的列数的方法,因为决策树能够识别出不影响最终挖掘模型的列。 https://technet.microsoft.com/zh-cn/library/ms175595(v=sql.100).aspx
2.什么是数据挖掘?基本步骤,使用智能方法提取数据模式; 模式评估 根据某种兴趣度,识别代表知识的真正有趣的模式; 知识表示 使用可视化和知识表示技术,向用户提供挖掘的知识。 数据挖掘方法论 业务理解(business understanding) 从商业角度理解项目的目标和要求,接着把这些理解知识通过理论分析转化为数据挖掘可操作的问题,制定实现目标的初步https://zhuanlan.zhihu.com/p/113445650
3.PART1数据挖掘概论—数据挖掘方法论PART 1 数据挖掘概论 — 数据挖掘方法论 目录 数据库知识发掘步骤 数据挖掘技术的产业标准 CRISP-DM SEMMA 数据库知识发掘步骤 数据库知识发掘(Knowledge Discovery inDatabase,KDD)是从数据库中的大量数据中发现不明显、之前未知、可能有用的知识。 知识发掘流程(Knowledge Discovery Process)包括属性选择(attribute https://blog.csdn.net/L_15156024189/article/details/143320650
4.数据挖掘七种常用的方法汇总腾讯云开发者社区聚类分群效果可以用向量数据之间的相似度来衡量,向量数据之间的相似度定义为两个向量之间的距离(实时向量数据与聚类中心向量数据),距离越近则相似度越大,即该实时向量数据归为某个聚类。 数据挖掘方法 利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它https://cloud.tencent.com/developer/article/1892597
5.数据挖掘与分析的六种经典方法论最近梳理了一下数据挖掘与分析的常用方法论,这里简要介绍6种模型。 1、CRISP-DM 模型 CRISP-DM是CrossIndustry Standard Process for Data Mining(跨行业数据挖掘标准流程)的字母缩写。CRISP-DM是由一家欧洲财团(时称SIG组织)在20世纪90年代中后期提出来的,是一套用于开放的数据挖掘项目的标准化方法,也是业内公认https://www.niaogebiji.com/article-30475-1.html
6.常见的数据挖掘方法有哪些帆软数字化转型知识库常见的数据挖掘方法包括分类、聚类、关联规则、回归分析、时间序列分析、神经网络、决策树、贝叶斯网络。这些方法在数据挖掘中各有千秋。分类用于将数据划分到预定义的类别中、聚类则是将数据点分组成自然簇、关联规则挖掘有助于发现数据之间的有趣关系、回归分析用于预测数值型数据、时间序列分析用于处理时间相关的数据、https://www.fanruan.com/blog/article/615481/
7.PART1数据挖掘概论—数据挖掘方法论知识发掘流程(Knowledge Discovery Process)包括属性选择(attribute selection)、数据清洗(data cleasing)、属性丰富(attribute enrichment)、数据编码(data coding)、数据挖掘(data mining)和报告(reporting)。 数据挖掘技术的产业标准 数据挖掘技术的产业标准主要包括CRISP-DM和SEMMA方法论。 http://www.mynw.cn/network/15793.html
8.数据挖掘及其在金融中的应用主要是采用人工智能相关方法作出预测,它能够实现统计回归预测和统计时间序列预测的功能,并且假设条件要比统计预测要宽松得多,甚至有些没有什么假设条件,精度上也与他们相当甚至比它们要好。 数据挖掘的类型,可能还不止这些,以上仅是一般的界定,正因为我们对数据挖掘的类型作出了界定,不同的类型也有对应的挖掘模型与算法https://www.jianshu.com/p/474504df2bdd
9.两种最为常用的数据挖掘方法论51CTO博客导读:本文介绍两种最为常用的数据挖掘方法论——CRISP-DM方法论和SEMMA方法论。 01 CRISP-DM方法论 CRISP-DM方法论由NCR、Clementine、OHRA和Daimler-Benz的数据挖掘项目总结而来,并被SPSS公司大力推广。CRISP-DM方法论将数据挖掘项目的生命周期分为6个阶段,分别是商业理解、数据理解、数据准备、建模、评估和准备工作,https://blog.51cto.com/u_13389043/6250220
10.如何运营才能更深刻理解和放大数据价值?数据挖掘的方法论包括数据预处理、特征选择、模型训练等多个环节。在每个环节中,我们都需要根据具体业务需求和数据特点,选择合适的算法和工具,以确保数据挖掘的效果。 2、数据挖掘的实战案例 在我的项目中,我们曾利用数据挖掘技术成功预测了用户购买意向,并据此制定了精准的营销策略,最终实现了销售额的大幅增长。这个案https://www.batmanit.cn/blog/k/53468.html
11.IBMSPSSStatistics操作进阶?严格设计支持下的统计方法论。 ?半试验研究支持下的统计方法论。 ?偏智能化、自动化分析的数据挖掘应用方法论。 IBM SPSS Statistics作为全球最为出色的统计软件之一,在功能上完全支持上述3种方法论体系,并满足绝大多数情况下的统计分析需求,Modeler则倾向于数据挖掘方法论的具体实现需求。由于对方法论的理解比对分析https://m.360docs.net/doc/info-ba014db4ac51f01dc281e53a580216fc700a5385.html
12.数据分析方法论是什么数据分析应该以业务场景为起始思考点,以业务决策作为终点: 1、明确思路(明确数据分析的目的以及思路是确保数据分析过程有效进行的首要条件。) 2、收集数据(收集数据是按照确定的数据分析框架收集相关数据的过程,它为数据分析提供了素材和依据。) 3、处理数据(处理数据是指对收集到的数据进行加工整理,形成适合数据分析的https://www.linkflowtech.com/news/175
13.人工智能产品规划方法论:CRISPDM解读也没有特定领域和行业的局限,是适用于所有行业的标准方法论,相对于其他的数据挖掘方法路,CRISP-DM具有灵活和适用范围广的优点。 需要特别注意的是:虽然这套数据挖掘流程的完整生命周期包含六个阶段,每一个阶段都依赖于上一个阶段的产出物,但是这六个阶段的顺序却并不是固定的——尤其是商业理解和数据理解,数据准备https://www.zhuanzhi.ai/document/67b162eb7e0faa087269ca871a612b4b
14.数据挖掘的几种经典方法论PurStar比较典型的是,对于同一个数据挖掘的问题类型,可以有多种方法选择使用。如果有多重技术要使用,那么在这一任务中,对于每一个要使用的技术要分别对待。一些建模方法对数据的形式有具体的要求,因此,在这一阶段,重新回到数据准备阶段执行某些任务有时是非常必要的。https://www.cnblogs.com/purstar/p/14171002.html
15.数据挖掘导论(2002.10.31)SAS数据挖掘目 录 SAS帮助你进行数据挖掘 SAS的数据挖掘的方法论-SEMMA SAS数据挖掘的集成软件工具--SAS/EM(Enterprise Miner) SAS帮助你进行数据挖掘 早期的计算机主要就是用来进行数据处理或称数值计算的。后来随着计算机技术及其周边设备和通讯能力的发展,计算机更多地用于了大量繁杂事务的在线处理,生产设备的实时控制https://doc.mbalib.com/view/e5fc8f144c6f793cd27b2e2c500c76c7.html
16.数据挖掘与数据化运营实战(豆瓣)《数据挖掘与数据化运营实战:思路、方法、技巧与应用》是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供“菜单化”https://book.douban.com/subject/24738300/
17.大数据介绍数据挖掘与分析精品课程通过本课程的教学,使学员充分了解和认识大数据的相关知识(大数据的应用范围及相关技术思想),同时学会用主流的数据挖掘软件完成数据挖掘建模任务,使学员掌握数据挖掘方法论CRISP-DM的本质。通过几个具体的、典型的数据挖掘案例,使学员在掌握这些案例所用的技巧的同时,充分理解数据挖掘的方法论,实现举一反三的效果,提高学员http://msup.cn/course/10047
18.领域知识数据挖掘9篇(全文)例如,在零售行业中,全球的零售“巨头”沃尔玛(Wal-Mart)通过使用数据挖掘的方法分析出啤酒与尿片之间有一定的数量关系,根据这一规律,它将两者绑在一起销售,结果使得销售额上涨了30%;在银行业中,汇丰银行采用数据挖掘技术将不断增长的客户群进行了详细的分类,从而找出最有潜力的客户类型,这时期销售费用减少了三分之https://www.99xueshu.com/w/ikeyylcoxu26.html
19.数据挖掘岗位职责1、硕士以上学历,有较强的数学功底和扎实的统计学、数据挖掘功底; 2、掌握SQL语句,熟悉Oracle,具备数据处理能力; 3、精通常用数据挖掘工具软件R / SPSS Clementine / SAS/Python等工具之一,掌握聚类分析、方差分析、相关分析、回归分析、关联规则、决策树、随机模型等常用数据分析方法以及经典的.数据挖掘算法,具备一定https://www.yjbys.com/hr/gangwei/4044256.html
20.清华大学出版社图书详情本书是一本全面介绍数据挖掘基本原理、核心算法以及典型应用方法的专业书籍。第4版在前三版的基础上,对数据挖掘的方法论和知识点进行了重新归纳,按照基础篇、提高篇和应用篇进行设计。从方法论上说,数据挖掘是一个方法和原理逐步演变的过程。首先,最基础的数据挖掘方法主要有“关联规则”“分类”“聚类”,它们是数据http://www.tup.tsinghua.edu.cn/booksCenter/book_09781801.html
21.数据挖掘技术与虚假财务报表的识别研究3.1数据挖掘技术在识别虚假财务报表中的可行性数据挖掘是一些功能强大的数据分析技术的集合,这些技术用于帮助我们分析极其巨大的数据集。经过正确地应用,数据挖掘可以揭示出埋藏在企业数据库中的隐藏关系和信息。在会计领域利用数据挖掘技术识别虚假财务报告的研究目的是确定数据挖掘的方法论,建立相应的规则和算法。具体而言,https://m.renrendoc.com/paper/171390471.html
22.高效实施数据挖掘的方法和步骤yuanye1014有了优秀方法论的指导,还需要一个高效的数据挖掘工具。目前提供数据挖掘产品的厂商非常多,如著名的产品有SAS Enterprise Miner、SPSS Clementine 8.1(简体中文版)、IBM DB2 Intelligent Mine等,这些产品各有特色。 选择一款适合的数据挖掘工具,主要从以下几方面来考虑。下面我们根据CRISP-DM方法论,从数据挖掘项目的各个阶http://blog.chinaunix.net/uid-64814-id-2690182.html
23.spss估计样本量,简体中文帮助 结果文件阅读器 ODBC数据驱动包 R/Python语言插件 用户手册 系统补丁 1.5spss的帮助系统 学习向导 统计辅导 个案研究 帮助菜单 针对高级用户的帮助功能 指令语法参考 算法 spss社区 1.6数据分析方法论概述 严格设计支持下的统计方法论 半试验研究支持下的统计方法论 偏智能化、自动化分析的数据挖掘应用方法http://www.cnjit.net/spss/25908.html