千锋教育-做有情怀、有良心、有品质的职业教育机构
领取全套视频
1.1开班典礼1.1.1班主任讲话1.1.2负责人讲话1.1.3讲师讲话1.1.4摸底考试...
1.3-流程控制1.3.1分支流程控制-if1.3.2分支流程控制-switch1.3.3循环流程控制-while...
1.5-数组1.5.1数组的定义与元素访问1.5.2数组的内存分析1.5.3数组的常见操作...
1.7-面向对象进阶1.7.1包(package)的创建与使用1.7.2构造方法1.7.3代码块...
1.9-多态1.9.1对象的转型1.9.2instanceof关键字1.9.3抽象类与抽象方法...
1.11-包装类型与常用类1.11.1包装类型1.11.2常用类1.11.3枚举...
1.13–字符串1.13.1String类常用方法1.13.2StringBuffer/StringBuffer的常用方法1.13.3正则表达式...
1.15–多线程基础1.15.1多线程概念1.15.2并发与并行1.15.3创建线程的方式...
1.17–IO流1.17.1流的基础1.17.2流的分类1.17.3字节流...
1.19-反射1.19.1Class类1.19.2Class获取对象的三种方式1.19.3Constructor构造方法...
1.21-MySql1.21.1SQL简介1.21.2SQL表的概念1.21.3数据库的安装卸载...
1.23阶段考试
1.25linux中软件安装1.25.1软件安装介绍1.25.2二进制安装1.25.3rpm安装...
1.27awk1.27.1awk简介1.27.2使用方法1.27.3入门实例...
1.2-基础语法1.2.1计算机理论介绍1.2.2编程基础--进制分类,进制转换等1.2.3什么是Java1.2.4常用DOS命令...
1.4-方法1.4.1方法的定义与调用1.4.2方法的参数与返回值1.4.3方法的重载...
1.6-面向对象入门1.6.1面向对象与面向过程1.6.2类的设计1.6.3对象的实例化...
1.8-继承1.8.1继承基本的概念1.8.2继承中的特点1.8.3继承中的构造方法...
1.10-设计模式1.10.1单例设计模式1.10.2工厂设计模式1.10.3Lambda表达式...
1.12–异常1.12.1异常定义1.12.2常用结构.1.12.3finally关键的应用...
1.14-集合框架1.14.1集合框架Collection1.14.2集合中元素排序1.14.3Collections工具类...
1.16-线程1.16.1线程生命周期1.16.2临界资源问题1.16.3同步代码段synchronized关键字...
1.18-Socket网络编程1.18.1TCP1.18.2Socket1.18.3ServerSocket...
1.20–其他1.20.1代理模式1.20.2注解1.20.3Junit...
1.22-JDBC1.22.1JDBC概述1.22.2JDBC原理1.22.3JDBC的实现...
1.24linux的基础1.24.1linux的主要特性1.24.2常用的linux版本1.24.3Vmvare的安装...
1.26shell脚本1.26.1Shell介绍1.26.2Shell运行环境和运行方式1.26.3变量...
2.1CAP理论2.1.1Consistency一致性2.1.2Availability可用性2.1.3Partitiontolerance分区容忍性2.2.4数据量分布
2.3一致性、2PC和3PC2.3.1一致性2.3.22PC流程2.3.33PC流程2.3.4一致性算法
2.2数据分布方式2.2.1哈希方式2.2.2一致性哈希2.2.3范围分布2.2.4数据量分布
2.4大数据集成架构概述2.4.1大数据架构简介...
3.1协调服务ZK(1T)3.1.1zk的概念3.1.2zk架构3.1.3zk读写...
3.3数据存储alluxio(1T)3.3.1alluxio应用场景及架构组成3.3.2alluxio存储管理3.3.3alluxiowithspark...
3.5数据采集logstash3.5.1Logstash介绍3.5.2Input组件介绍3.5.3Filter组件介绍...
3.7数据同步datax(0.5T)3.7.1datax简介3.7.2datax核心架构3.7.3datax插件介绍...
3.9计算模型MR与DAG(1T)3.9.1MR计算模型及流程3.9.2DAG计算模型流程3.9.3MR过程及调优...
3.11Impala(1T)3.11.1impala简介3.11.2impala架构3.11.3impala工作原理...
3.13任务调度airflow3.13.1airflow简介3.13.2执行器3.13.3架构...
3.2数据存储hdfs(2T)3.2.1hdfs应用场景与架构组成3.2.2hdfsHA环境搭建3.2.3hdfs元数据瓶颈及解决...
3.4数据采集flume(1T)3.4.1flume简介-基础知识3.4.2flume安装与测试3.4.3flume部署方式...
3.6数据同步Sqoop(0.5T)3.6.1Sqoop简介以及使用3.6.2Sqoopshell使用3.6.3Sqoop-import...
3.8数据同步mysql-binlog(1T)3.8.1mysql-binlog简介3.8.2启停binlog3.8.3常用binlog日志操作命令...
3.10hive(5T)3.10.1Hive是什么3.10.2Hive的特点3.10.3Hive架构简述...
3.12任务调度Azkaban(1T)3.12.1Azkaban简介3.12.2Azkaban和oozie的对比3.12.3Azkabanserver安装配置...
4.1数仓仓库(1T)4.1.1数仓的历史4.1.2数仓的背景4.1.3数仓的定义...
4.3多维数据模型处理kylin(3.5T)4.3.1kylin的概览4.3.2安装部署4.3.3集群模式部署...
4.2离线数仓项目-伴我汽车(5T)4.2.1项目业务描述4.2.2项目技术4.2.3项目架构...
4.4离线数仓项目-伴我汽车升级4.4.1加入kylin进行多维分析3.7.2datax核心架构3.7.3datax插件介绍...
5.1分布式计算引擎概述5.1.1计算引擎介绍5.1.2计算引擎分类...
5.3spark5.3.1大数据架构体系5.3.2架构详解5.3.3Spark集群介绍...
5.5数据存储redis5.5.1什么是NoSQL5.5.2NoSQL数据库的分类5.5.2NoSQL数据库的分类...
5.7离线项目-某p2p平台5.7.1项目描述5.7.2项目技术5.7.3spark多数据源读写...
5.6Kudu5.6.1kudu简介5.6.2kudu架构/原理5.6.3kudu底层数据模型...
5.8第二阶段考试
6.1数据通道(4T)6.1.1Kafka的基本概念6.1.2Kafka的发展历史6.1.3Kafka的应用背景...
6.3流式数据处理flink(6T)6.3.1flink应用场景及架构组成6.3.2flink流式处理6.3.3flinksql...
6.5流式处理项目-某交通大数据平台(5T)6.5.1实时场景处理业务数据6.5.2可以进行数据明细的全文查询6.5.3实时累计业务统计...
6.2实时数仓druid(5T)6.2.1druid应用场景及架构组成6.2.2druid内部流程6.2.3druid数据摄取...
6.4SparkStreaming(2T)6.4.1SparkStreaming概述6.4.2SparkStreaming的原理介绍6.4.3SparkStreaming与Storm对比...
6.6第三阶段考试
7.1elasticsearch7.1.1全文检索技术简介7.1.2ES安装配置入门7.1.3ES插件安装7.1.4ES基本操作
7.1elasticsearch7.1.9CURL操作REST命令7.1.10Windows安装CURL7.1.11创建索引7.1.12RestApi:练习
7.1elasticsearch7.1.17新文档数据7.1.18删除文档数据7.1.19条件查询QueryBuilder7.1.20queryStringQuery搜索内容查询
7.1elasticsearch7.1.25regexpQuery正则表达式查询7.1.26matchAllQuery查询所有数据7.1.27K分词器集成ES7.1.28ES常用编程操作
7.1elasticsearch7.1.33查询文档分页操作7.1.34得分(加权)7.1.35在Query的查询中定义加权7.1.36在Field字段的映射中定义加权
7.1elasticsearch7.1.5Index的概念7.1.6Document的概念7.1.7Type的概念7.1.8map映射的概念
7.1elasticsearch7.1.13使用Java操作客户端7.1.14新建文档(自动创建索引和映射)7.1.15搜索文档数据(单个索引)7.1.16搜索文档数据(多个索引)
7.1elasticsearch7.1.21wildcardQuery通配符查询7.1.22termQuery词条查询7.1.23boolQuery布尔查询7.1.24fuzzyQuery模糊查询
7.1elasticsearch7.1.37过滤器7.1.38范围过滤器7.1.39布尔过滤器
8.1概念及构成8.1.1数据标准8.1.2数据分类8.1.3数据建模...
8.3元数据、血缘及数据质量8.3.1元数据及血缘构建8.3.2基于HiveHook的元数据及血缘构建8.3.3ApacheAtlas开源元数据及血缘管理框架介绍...
8.5SparkListener...
8.7数据治理项目-数据地图(5T)8.7.1项目描述8.7.2项目选型8.7.3项目实现...
8.2neo4j8.2.1图存储与查询介绍8.2.2环境搭建8.2.3cypher语言学习...
8.4HiveHook...
8.6JanusGraph...
10.1机器学习中的数学体系10.1.1微分学与梯度下降10.1.2数学分析与概率论10.1.3数理统计与参数估计10.1.4线性代数与信息论10.1.5凸优化...
10.2SparkMLlib机器学习算法库10.2.1机器学习框架—假设函数、目标函数和优函数10.2.2特征工程—数值型特征、类别型特征和有序特征10.2.3离散化处理10.2.4读热向量编码10.2.5TF-IDF权重...
10.3Pythonscikit-learn机器学习算法库10.3.1回归与分类算法(理论上)10.3.2回归与分类算法(代码实战下)10.3.3支持向量机(理论上)10.3.4支持向量机(实战下)10.3.5决策树(DecisionTree)—>ID3、C4.5、Gini系数(理论上)...
10.4机器学习结合大数据项目10.4.1《金融风控领域用户贷款信用评分预测》10.4.2《搜狗知识图谱》...
·数据采集:flume·数据同步:sqoop/datax·数据存储:hdfs·数据计算:hive·任务调度:azkaban
监控用户出行用车情况,实时计算停车位、待服务车辆数、报修车辆数、违规次数等,为用户提供加和的用车体检。
·数据采集:flume·数据同步:sqoop/datax·数据存储:hdfs·数据计算:hive·任务调度:azkaban·多维分析:kylin
通过交通出行记录和卡口实时数据,监控全省内车辆、道路通行和事故等状况,避免拥堵、避免交通事故、测速、防止套牌和提供便捷佳出行方案,预测拥堵系数,为全省各级提供优道路规划方案。
·数据采集:flume/kafka·数据存储:hdfs·数据计算:druid·任务调度:airflow·实时展示:Superset
某牛旅游平台,以旅游为主,集成酒店、交通、景区、保险等信息资源。通过对各业务进行统计分析,充分了解用户,了解各服务,从而好服务于用户。
·数据采集:flume/kafka/canal·数据存储:hdfs·数据计算:hive/spark/druid·任务调度:azkaban·数据服务:springboot·数据展示:echarts
·数据采集:flume/kafka·数据存储:hdfs/ElasticSearch·数据计算:spark·任务调度:azkaban·数据服务:springboot·数据展示:echarts
个人和企事业资金需求,催生联网金融迅猛发展,而金融体现管监待待成熟,企业需要自主把控风险,并通过有效的营销和切实的安全机制,不断吸引投资,优化借贷,提升盈利能力。
·数据采集:flume/kafka·数据存储:hdfs·数据计算:hive/sparkstreaming·任务调度:airflow·实时展示:Superset
数据激增,各企事业单位大数据项目落地,但大数据项目中所涉及数据质量、元数据管理越来越成为企业焦点,数据地图项目旨在二次开和借助现有开源软件共同去管理大数据项目中数据质量和元数据。
网购成熟,加离不开物流,但是物流企业众多,根据物流数据合理选择配送物流,物流业务进行合理的配送,这将会大大降低物流成本,从而降低整个购物成本,为企业获取高利益。
·数据采集:flume·数据同步:sqoop·数据存储:hdfs·数据计算:hive/spark·任务调度:azkaban·数据服务:springboot·数据展示:echarts
通信让世界变得触手可及,充值是通信行业一大业务,充值过程中会涉及到国内移动信息系统内部各个子系统之间的接口调用,接口故障监控也成为了重点监控的内容之一。为此建设一个能够实时监控国内的充值情况的平台,掌控全网的实时充值,各接口调用情况意义重大。
·数据采集:kafka·数据存储:hdfs/redis·数据计算:hive/sparkstreaming/flink·任务调度:azkaban·数据服务:springboot·数据展示:echarts
ZHAO
赵老师
原上市公司技术主管大数据国内一阶段主管授课阶段:Java阶段
「授课时长」
6周
「带班人数」
5000+
「带班薪资」
14K+19K+15K+
「学员评分」
99.56
从业10年,上市公司前主管,主持开发了多款实用app,包括前端开发及后端搭建,精通java,iOS,C,Object-c,Swift,HTML,css,javascript,jquery,react,mysql等多种开发语言。多年软件开发经验和学科经验,形成的一整套的成熟的学科体系,让你加轻松,精致的学习,掌握一手实用的开发技术,快速提升实战经验。授课耐心细致,扩展性强,学科风格通俗易懂、有亲和力,并善于从思路上引导学生自主解决问题。
擅长方向:java、mysql、hadoop、spark
李同学大数据09期
LI
李老师
北航大数据研究生大数据国内一阶段主管授课阶段:分布式理论阶段、离线场景下存储与计算、数仓建设
3000+
98.81
北航大数据技术及应用专业在职研究生。从事企业软件研发工作5年,从事大数据讲师3年加,有丰富的软件设计、软件研发、软件管理、流程控制经验。曾过旅游平台设计、电力系统研发、商城后台架构和服务器架构、商城大数据平台搭建和研发、运用大数据统计分析等工作。在千锋从事大数据学科授课和课程研发,主要授课内容:Linux、Hadoop生态圈、Spark体系、Python、数据仓库等课程、项目课程等。
擅长方向:mysql、hadoop、spark、数仓、项目
王同学大数据10期
LIANG
梁老师
原国企大数据项目负责人大数据国内三阶段主管授课阶段:分布式计算引擎
5周
98.78
10年互联网开发经验,精通Java、C#、Scala、JavaScript、Python等开发语言。熟练运用Java、.NET等开发平台,曾带领团队研发ERP、CRM大型项目。精通Hadoop、Spark、Storm等大数据平台,曾负责某国企大数据项目迁移等工作。讲课氛围轻松,注重寓教于乐,善于剖析原理。
擅长方向:spark、实时、数仓、项目
郭同学大数据09期
DONG
董老师
原互联网企业架构师大数据教研院主管授课阶段:数据治理、BI系统、项目
300+
14K+19K+16K+
99.01
原互联网企业架构师,曾就职于互联网一线研发企业,担任过技术总工程师、JAVA架构师,项目经理,大数据架构师,有13年互联网和传统项目研发经验,大数据分布式布道者,精通Apache开源的大数据,JAVA,Python,Scala等,在分布式理论基础,离线计算、实时分析、数据治理等方向有深入研究。讲课氛围轻松,注重寓教于乐,善于剖析原理。
擅长方向:擅长spark、flink、druid、hadoop、各种存储模型组件,hadoop、spark、数仓、数据治理
刘同学大数据13期
[Hadoop大数据入门经典]
[Spark大数据深入解析]
高端品质,匠心淬炼大纲每月小新,季度大升级融合企业需求技术点深度技术专题与企业级项目实操
与企业建立良好合作关系聘请企业CTO讲座剖析实用技术、洞悉行业趋势实现学员与岗位无缝对接