商务数据分析(第4次开课)大学慕课

本课程主要介绍深度学习的基本原理、卷积神经网络、循环神经网络、生成对抗网络、注意力机制等基本方法及其典型应用领域,并借助机器学习开源平台TensorFlow实现深度学习在证券趋势预测、声音质量评价、电子推荐、目标检测、社交网络情感分析等多个典型领域的应用。

——课程团队

课程概述

1.我为什么要学习这门课?

2.这门课的主题是什么?

在前面2次介绍传统的机器学习理论的基础上,讨论深度学习的典型算法原理与应用(具体美容请参考下面课程大纲),为实践打下坚实的基础。

3.学习这门课可以获得什么?

4.这门课有什么特色和亮点?

深度学习是一门理论和实践并重的课程,其中的内容比较多,很多算法也有一定的难度。深度学习的应用也需要一定的经验和技巧。本课程参阅了大量文献资料,结合过去多年的数据分析研究和项目实践,深入浅出,学生在可以钻研深度学习的算法以及应用。课程通过大量的选择题、填空和判断题检验和巩固学员对基本知识的理解。

5.这门课的学习方法建议

建议结合教材《机器学习》(人民邮电出版社,2018)、《机器学习案例实战》(人民邮电出版社,2019)、《Python机器学习实战案例》(清华大学出版社,2019)学习,先结合视频了解基本算法,然后通过各单元的测试题和作业巩固基本概念和算法,再通过具体的案例解读思路和代码,巩固算法。线下还要参考实战教材动手实验和实践练习,循序渐进。

6.课程守则(建议)

欢迎大家选修课程,请各位按照课程首页大纲的内容,根据课程内容的顺序,每周结合视频和推荐的配套教材,按时完成基本算法内容学习,并结合单元测试和章节练习,巩固基本概念和算法。在此基础上,完成每单元的实验,并可以进一步阅读推荐的实战案例,理解机器学习的思路以及每个步骤可能遇到的问题和技巧。有问题欢迎在课程讨论区讨论。

授课目标

授课团队

赵卫东董亮

课程大纲

01神经网络基础

理解前馈神经网络的结构、梯度下降法以及网络训练调优的基本方法,并能应用前馈神经网络解决实际问题。建议5个学时。打*的内容属于高级版,后面陆续推出。除了第7章外,其余章节均由赵卫东老师负责。

1.1神经网络简介

1.3神经网络效果评价

1.4神经网络优化

1.5银行客户流失预测

1.6练习题

02深度学习在人工智能系统的应用

通过众多的案例,了解深度学习的典型应用场景。建议2个学时。

2.1深度学习典型应用场景

2.2深度学习应用案例分析

2.3练习题

03卷积神经网络

理解卷积的内涵,熟悉常用的10几种卷积神经网络的结构、训练方法以及典型场景的应用。建议10个学时。

3.1卷积的理解—卷积和池化

3.2常见的卷积模型

@Lenet-5、AlexNet、VGGNet、GoogleLeNet、ResNet等

@Inceptionv2-v4、DarkNet、DenseNet、SSD等*

@MobileNet,ShuffleNet*

3.3胶囊网络*

3.4CNN卷积神经网络应用案例

3.5目标检测常用算法

@R-CNN、FastRCNN、FasterRCNN、YOLOv1-v3等

3.5图像分类

3.6动物识别

3.7物体检测

3.8人脸表情年龄特征识别*

3.9练习题

04循环神经神经网络

理解循环神经网络以及变种LSTM、GRU的结构、训练方法以及典型场景的应用。建议6个学时。

4.1RNN基本原理

4.2LSTM

4.3GRU

4.4CNN+LSTM模型

4.5Bi-LSTM双向循环神经网络结构

4.6Seq2seq模型

4.7注意力机制

4.8自注意力机制*

4.9ELMo、Transformer等*

4.10BERT、EPT、XLNet、ALBERT等*

4.11机器翻译

4.12练习题

05生成对抗网络

理解生成对抗网络的结构、训练方法以及典型场景的应用。建议5个学时。

5.1生成对抗网络模型

5.2GAN的理论知识

5.3DCGAN

5.4自动生成手写体

5.5CycleGAN

5.6WGAN*

5.7练习题

06深度学习神经网络案例

学会使用卷积神经网络、循环神经网络、生成对抗网络的常用算法的应用,解决实际问题,并能做创新性的应用。建议5个学时。

6.1股票走势预测

6.2文本情感分类

6.3图像风格转移

6.4机器翻译

6.5练习题

07强化学习

理解强化学习的基本概念和原理,了解强化学习的典型应用场景。建议2个学时。此部分由董亮老师负责讲授。

7.1强化学习基本原理

7.2强化学习常用模型

7.3强化学习典型应用

7.4深度Q网络*

7.5练习题

08项目驱动的深度学习方法

理解如何结合实际项目,强化机器学习和深度学习理论知识的深入理解,体会深度学习解决实际问题的技巧和技能。建议2个学时,加1个学时的讨论。

课时

8.1项目驱动的深度学习之路

8.2领域问题驱动的机器学习深度教学法

预备知识

学习本课程前需要掌握机器学习,尤其是前馈神经网络的基本原理、常用算法,也需要有较扎实的统计学、高等数学、线性代数、Python编程等基础。强烈建议学完第2次的开课内容再学习本次课程。

证书要求

1.按时学习每章节的视频

2.完成每章节的测试(以选择题为主,每章还至少有一个实验,一个互评的讨论题)

3.积极参加讨论和互评(每学期至少5次)

4.通过课程的结业测试(前面三项占总成绩的25%,结业考试占总成绩的75%)

注意:纸质证书需要付费申请(总分60分以上合格)

参考资料

基本的阅读教材:

1.赵卫东,董亮编著.机器学习.北京:人民邮电出版社,2018(教材,python语言)

2.赵卫东.机器学习案例实战.北京:人民邮电出版社,2019(实验和实训,python语言)

3.赵卫东,董亮著.Python机器学习实战案例.北京:清华大学出版社,2019(实验和实训,python语言)

参考资料:

龙龙.TensorFlow2.0实战案例

常见问题

1.没有基础可以学习吗?

答:强烈建议请先学习第1-2次的课程再学习,本课程需要掌握必要的高等数学、线性代数和统计基础知识以及比较扎实的机器学习基础知识。没有机器学习基础的学员请一定先学习传统的机器学习算法。此外,还需要掌握Python编程基础。

2.深度学习算法那么多,我怎么学习?

答:可以先熟悉基本的方法和算法,培养对数据分析的兴趣,奠定一定的基础后,逐步学习较难的算法。特别推荐通过案例和应用学习。有关机器学习技能的培养很重要,具体的方法请参考论文:数据分析类课程的技能培养方法探讨和基于项目实践的机器学习课程改革(《计算机教育》,2019.9)。

3.如何使用课程中提到的算法解决实际问题?

答:可以课后先阅读和调试一下经典的案例和代码,然后尝试解决一些简单的问题,通过参加比赛、各种技术研讨、仿真型的项目,直至参加实际项目,这是一个循序渐进的过程,需要耐心、兴趣和毅力。

4.本课程怎么学习?

答:本课程是深度学习的基本课程,适合有一定机器学习基础的学员,配合教材讲解实用的内容,与线下的实训练习结合。建议采用翻转教学方式,结合配套教材,首先学习在线的视频,课下结合实际项目案例讨论算法的应用以及其中关键技能,并通过实验练习数据分析的思维和技能。

5.本课程有无配套的实验资源?

答:有的,配套教材封后扫码可以下载,网课也有部分实验内容可以下载练习。

6.实验是否有推荐的平台和工具?

答:以下的机器学习平台和工具可以使用:

7.本课程采用什么语言?

答:Python3语言。

8.课程总体难度如何?

答:属于深度学习基本的内容,难度总体属于初中等,希望学员理解机器学习基础知识,可以先选读本课程第二次开课的内容

9.本课程是否有实战的内容?

答:实战练习的课程大家可以选修机器视觉与边缘计算应用课程。并以推荐的2本实战案例线下练习,提供源代码和数据。

THE END
1.17个机器学习的常用算法通过这种方式来寻找最佳的匹配。因此,基于实例的算法常常也被称为“赢家通吃”学习或者“基于记忆的学习”。常见的算法包括 k-Nearest Neighbor(KNN), 学习矢量量化(Learning Vector Quantization, LVQ),以及自组织映射算法(Self-Organizing Map , SOM)。 8.正则化方法https://zhuanlan.zhihu.com/p/552445012
2.超级干货:到底该如何学习算法?但是对大多数本科同学,尤其是第一次接触算法的同学,《算法导论》实在不是一个好的教材。但很可惜,很多同学在学习中有上面的两个毛病,既过度路径依赖,别人说《算法导论》好,学习算法要走学《算法导论》这个路径,自己就不探索其他更适合自己的学习路径了,一头扎进《算法导论》里;同时还“完美主义”的倾向,对于《https://baijiahao.baidu.com/s?id=1629846079532222044&wfr=spider&for=pc
3.如何有效学习算法?算法学习学习算法需要系统性的方法和实践,以下是一些有效的学习步骤和资源建议 基础知识学习: 数学基础:掌握离散数学、概率论、统计学等基础知识 编程基础:熟练掌握至少一种编程语言,如Python、C++、Java等 数据结构与算法基础: 数据结构:学习数组、链表、栈、队列、树、图等数据结构 https://blog.csdn.net/qq_49548132/article/details/140109291
4.机器学习常见算法类型都有哪些算法是程序员在学习软件编程开发技术的时候需要重点掌握的一个编程开发技术知识,而今天我们就通过案例分析来了解一下,机器学习常见算法类型都有哪些。 1.分类算法 这是一种监督学习方法。有很多算法帮助我们解决分类问题,比如K近邻、决策树、朴素贝叶斯、贝叶斯网络、逻辑回归、SVM等算法。人工神经网络和深度学习也往往用https://www.douban.com/note/782408490/
5.机器学习中的特征提取方法特征提取算法有哪些机器学习中的特征提取方法 特征提取算法有哪些 说明:此处暂时简单介绍下各种特征提取算法,后续完善。 前言:模式识别中进行匹配识别或者分类器分类识别时,判断的依据就是图像特征。用提取的特征表示整幅图像内容,根据特征匹配或者分类图像目标。常见的特征提取算法主要分为以下3类:https://blog.51cto.com/u_16099263/8634144
6.BAT机器学习面试1000题系列(二)109.准备机器学习面试应该了解哪些理论知识? 知乎解答 110.标准化与归一化的区别? 简单来说,标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,将样本的特征值转换到同一量纲下。归一化是依照特征矩阵的行处理数据,其目的在于样本向量在点乘运算或其他核函数计算相似性时,拥有统一的标准,也就是说都转化为“https://www.jianshu.com/p/4a7f7127eef1
7.17个机器学习的常用算法通过这种方式来寻找最佳的匹配。因此,基于实例的算法常常也被称为“赢家通吃”学习或者“基于记忆的学习”。常见的算法包括k-Nearest Neighbor(KNN),学习矢量量化(Learning Vector Quantization,LVQ),以及自组织映射算法(Self-Organizing Map,SOM) 8.正则化方法https://aidc.shisu.edu.cn/78/aa/c13626a161962/page.htm
8.下列属于监督学习的算法/方法有()。A决策树B回归分析C层次聚下列属于监督学习的算法/方法有( )。 A、决策树 B、回归分析 C、层次聚类 D、中心向量分类法 点击查看答案http://www.ppkao.com/wangke/daan/9fe1b64128614ad1b6aa71f5cb213fbd
9.基于Q学习算法的有状态网络协议模糊测试方法研究AET这种测试方法提高了测试用例有效性,但前置引导序列和回归序列这些辅助报文在测试过程中的重复交互降低了测试效率,且因是根据协议实体所处的协议状态输入报文类型相对应的测试用例,导致无法发现由报文异常输入顺序所引出的协议缺陷。 因此,本文针对有状态网络协议提出了一种基于Q-学习算法的模糊测试方法,不需要引导状态的http://www.chinaaet.com/article/3000117697
10.年薪50万!北航合肥创新研究院招募研究员!澎湃号·政务4、了解CV、机器学习、深度学习或强化学习、大数据分析等常用算法及模型,具备较强的编程能力,熟悉Tensorflow等机器学习平台; 5、有重大基础研究和应用研究经验者以及具备产学研合作和科技成果转化经验者优先; 6、能紧跟自身科研领域的发展方向,具有较强的团结协作、拼搏奉献精神,能够协助团队负责人开展科研管理工作。 https://www.thepaper.cn/newsDetail_forward_4985535
11.什么是机器学习?概要了解无监督机器学习,也就是在数据集中寻找没有标注响应的模式。这种方法可以让您探索不确定包含什么信息的数据。 如何决定使用哪种机器学习算法? 选择正确的算法看似相当困难 - 有监督和无监督机器学习算法有几十种,每种算法都使用了不同的学习方法。 机器学习算法的选择没有最佳方法或万全之策。找到正确的算法在https://ww2.mathworks.cn/discovery/machine-learning.html
12.TensorFlow机器学习常用算法解析和入门集成学习就是将很多分类器集成在一起,每个分类器有不同的权重,将这些分类器的分类结果合并在一起,作为最终的分类结果。最初集成方法为贝叶斯决策。 集成算法用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整合起来进行整体预测。集成算法的主要难点在于究竟集成哪些独立的较弱的学习模型以及如何把学习https://www.w3cschool.cn/tensorflow/tensorflow-s8uq24ti.html
13.精神病学研究中如何进行中小型数据的深度学习鉴于机器学习(尤其是深度学习)的现代算法和方法在其他学科中的出色预测性能,它们为解决这些问题提供了新希望。深度学习算法的优势在于它们可以实现非常复杂的算法,并且原则上可以高效地执行任意预测结果的映射。但是,这种实现是有代价的,需要大量的训练(和测试)样本来推断(有时超过数百万个)模型参数。这似乎与迄今为止在https://www.360doc.cn/mip/955038026.html