商务数据分析(第4次开课)大学慕课

本课程主要介绍深度学习的基本原理、卷积神经网络、循环神经网络、生成对抗网络、注意力机制等基本方法及其典型应用领域,并借助机器学习开源平台TensorFlow实现深度学习在证券趋势预测、声音质量评价、电子推荐、目标检测、社交网络情感分析等多个典型领域的应用。

——课程团队

课程概述

1.我为什么要学习这门课?

2.这门课的主题是什么?

在前面2次介绍传统的机器学习理论的基础上,讨论深度学习的典型算法原理与应用(具体美容请参考下面课程大纲),为实践打下坚实的基础。

3.学习这门课可以获得什么?

4.这门课有什么特色和亮点?

深度学习是一门理论和实践并重的课程,其中的内容比较多,很多算法也有一定的难度。深度学习的应用也需要一定的经验和技巧。本课程参阅了大量文献资料,结合过去多年的数据分析研究和项目实践,深入浅出,学生在可以钻研深度学习的算法以及应用。课程通过大量的选择题、填空和判断题检验和巩固学员对基本知识的理解。

5.这门课的学习方法建议

建议结合教材《机器学习》(人民邮电出版社,2018)、《机器学习案例实战》(人民邮电出版社,2019)、《Python机器学习实战案例》(清华大学出版社,2019)学习,先结合视频了解基本算法,然后通过各单元的测试题和作业巩固基本概念和算法,再通过具体的案例解读思路和代码,巩固算法。线下还要参考实战教材动手实验和实践练习,循序渐进。

6.课程守则(建议)

欢迎大家选修课程,请各位按照课程首页大纲的内容,根据课程内容的顺序,每周结合视频和推荐的配套教材,按时完成基本算法内容学习,并结合单元测试和章节练习,巩固基本概念和算法。在此基础上,完成每单元的实验,并可以进一步阅读推荐的实战案例,理解机器学习的思路以及每个步骤可能遇到的问题和技巧。有问题欢迎在课程讨论区讨论。

授课目标

授课团队

赵卫东董亮

课程大纲

01神经网络基础

理解前馈神经网络的结构、梯度下降法以及网络训练调优的基本方法,并能应用前馈神经网络解决实际问题。建议5个学时。打*的内容属于高级版,后面陆续推出。除了第7章外,其余章节均由赵卫东老师负责。

1.1神经网络简介

1.3神经网络效果评价

1.4神经网络优化

1.5银行客户流失预测

1.6练习题

02深度学习在人工智能系统的应用

通过众多的案例,了解深度学习的典型应用场景。建议2个学时。

2.1深度学习典型应用场景

2.2深度学习应用案例分析

2.3练习题

03卷积神经网络

理解卷积的内涵,熟悉常用的10几种卷积神经网络的结构、训练方法以及典型场景的应用。建议10个学时。

3.1卷积的理解—卷积和池化

3.2常见的卷积模型

@Lenet-5、AlexNet、VGGNet、GoogleLeNet、ResNet等

@Inceptionv2-v4、DarkNet、DenseNet、SSD等*

@MobileNet,ShuffleNet*

3.3胶囊网络*

3.4CNN卷积神经网络应用案例

3.5目标检测常用算法

@R-CNN、FastRCNN、FasterRCNN、YOLOv1-v3等

3.5图像分类

3.6动物识别

3.7物体检测

3.8人脸表情年龄特征识别*

3.9练习题

04循环神经神经网络

理解循环神经网络以及变种LSTM、GRU的结构、训练方法以及典型场景的应用。建议6个学时。

4.1RNN基本原理

4.2LSTM

4.3GRU

4.4CNN+LSTM模型

4.5Bi-LSTM双向循环神经网络结构

4.6Seq2seq模型

4.7注意力机制

4.8自注意力机制*

4.9ELMo、Transformer等*

4.10BERT、EPT、XLNet、ALBERT等*

4.11机器翻译

4.12练习题

05生成对抗网络

理解生成对抗网络的结构、训练方法以及典型场景的应用。建议5个学时。

5.1生成对抗网络模型

5.2GAN的理论知识

5.3DCGAN

5.4自动生成手写体

5.5CycleGAN

5.6WGAN*

5.7练习题

06深度学习神经网络案例

学会使用卷积神经网络、循环神经网络、生成对抗网络的常用算法的应用,解决实际问题,并能做创新性的应用。建议5个学时。

6.1股票走势预测

6.2文本情感分类

6.3图像风格转移

6.4机器翻译

6.5练习题

07强化学习

理解强化学习的基本概念和原理,了解强化学习的典型应用场景。建议2个学时。此部分由董亮老师负责讲授。

7.1强化学习基本原理

7.2强化学习常用模型

7.3强化学习典型应用

7.4深度Q网络*

7.5练习题

08项目驱动的深度学习方法

理解如何结合实际项目,强化机器学习和深度学习理论知识的深入理解,体会深度学习解决实际问题的技巧和技能。建议2个学时,加1个学时的讨论。

课时

8.1项目驱动的深度学习之路

8.2领域问题驱动的机器学习深度教学法

预备知识

学习本课程前需要掌握机器学习,尤其是前馈神经网络的基本原理、常用算法,也需要有较扎实的统计学、高等数学、线性代数、Python编程等基础。强烈建议学完第2次的开课内容再学习本次课程。

证书要求

1.按时学习每章节的视频

2.完成每章节的测试(以选择题为主,每章还至少有一个实验,一个互评的讨论题)

3.积极参加讨论和互评(每学期至少5次)

4.通过课程的结业测试(前面三项占总成绩的25%,结业考试占总成绩的75%)

注意:纸质证书需要付费申请(总分60分以上合格)

参考资料

基本的阅读教材:

1.赵卫东,董亮编著.机器学习.北京:人民邮电出版社,2018(教材,python语言)

2.赵卫东.机器学习案例实战.北京:人民邮电出版社,2019(实验和实训,python语言)

3.赵卫东,董亮著.Python机器学习实战案例.北京:清华大学出版社,2019(实验和实训,python语言)

参考资料:

龙龙.TensorFlow2.0实战案例

常见问题

1.没有基础可以学习吗?

答:强烈建议请先学习第1-2次的课程再学习,本课程需要掌握必要的高等数学、线性代数和统计基础知识以及比较扎实的机器学习基础知识。没有机器学习基础的学员请一定先学习传统的机器学习算法。此外,还需要掌握Python编程基础。

2.深度学习算法那么多,我怎么学习?

答:可以先熟悉基本的方法和算法,培养对数据分析的兴趣,奠定一定的基础后,逐步学习较难的算法。特别推荐通过案例和应用学习。有关机器学习技能的培养很重要,具体的方法请参考论文:数据分析类课程的技能培养方法探讨和基于项目实践的机器学习课程改革(《计算机教育》,2019.9)。

3.如何使用课程中提到的算法解决实际问题?

答:可以课后先阅读和调试一下经典的案例和代码,然后尝试解决一些简单的问题,通过参加比赛、各种技术研讨、仿真型的项目,直至参加实际项目,这是一个循序渐进的过程,需要耐心、兴趣和毅力。

4.本课程怎么学习?

答:本课程是深度学习的基本课程,适合有一定机器学习基础的学员,配合教材讲解实用的内容,与线下的实训练习结合。建议采用翻转教学方式,结合配套教材,首先学习在线的视频,课下结合实际项目案例讨论算法的应用以及其中关键技能,并通过实验练习数据分析的思维和技能。

5.本课程有无配套的实验资源?

答:有的,配套教材封后扫码可以下载,网课也有部分实验内容可以下载练习。

6.实验是否有推荐的平台和工具?

答:以下的机器学习平台和工具可以使用:

7.本课程采用什么语言?

答:Python3语言。

8.课程总体难度如何?

答:属于深度学习基本的内容,难度总体属于初中等,希望学员理解机器学习基础知识,可以先选读本课程第二次开课的内容

9.本课程是否有实战的内容?

答:实战练习的课程大家可以选修机器视觉与边缘计算应用课程。并以推荐的2本实战案例线下练习,提供源代码和数据。

THE END
1.头歌(第五章机器学习基本模型与算法在线实验闯关)头歌(第五章 机器学习基本模型与算法在线实验闯关)第1关:缺失值填充任务描述 本关任务:读取“银行贷款审批数据.xlsx”表,自变量为x1-x15,决策变量为y(1-同意贷款,0-不同意贷款),其中x1-x6为数值变量,x7-x15为名义变量,请对x1-x6中存在的缺失值用均值策略填充,x7-x15用最频繁值策略填充。https://blog.csdn.net/weixin_45688124/article/details/137876881
2.机器学习基本模型与算法在线实验闯关缺失值填充找到缺失值算法机器学习基本模型与算法在线实验闯关缺失值填充 找到缺失值 算法,加载数据importpandasaspdimportnumpyasnp#加载数据data=pd.read_excel('./qs.xlsx')print(data)如何确定数据里包含缺失值---缺失值检测print(data.isnull())#缺失地方的值为Trueprint(data.notnull())#不缺https://blog.51cto.com/u_13416/9118325
3.Python大数据分析与挖掘实战训练营机器学习基本模型与算法在线实验闯关 实验数 12 第六章 深度学习与实现 深度学习的精确定义,众说纷纭,简单来说,深度学习是机器学习的一个分支领域:一种从数据中学习表示的新方法,它强调学习具有越来越有意义的表示的连续层,而这些层的表示一般是通过神经网络的模型来学习得到的。“深度学习”中的“深度”指的并不https://testwebssh.educoder.net/paths/vpgzo8ne
4.矿产资源知识范文8篇(全文)也就是说,在进一步应用机器学习算法之前,需要有一个网络知识资源到文本再到数字向量表示的转化过程。词袋法(Bag of word,BOW)是表示一个文件的基本方法。该法重点是以文档中的每个词语的计数形成的频率向量去表示文档。这种文档表示法则可称为一个向量空间模型(VSM)[2]。但却仍需指出,词袋法/向量空间模型表示法https://www.99xueshu.com/w/filev30h2bcz.html
5.安恒信息2023年年度董事会经营评述未来,公司将继续结合最新的政策导向和业务发展趋势,与客户继续保持紧密合作关系,在数据安全领域进行更深入的探索和实践,以AI技术的创新迭代推动数据安全有序地流动,确保安全贯穿数据要素价值创造和实现的全过程,严守数据安全底线。数据安全产品深度融合恒脑-安全垂域大模型的能力,通过分类分级工具和恒脑大模型的深度联合http://news.10jqka.com.cn/20240425/c657307608.shtml
6.Julia数据科学应用“数据科学”是个相当含糊的名词,自从它成为科学领域一门学科后,就具有很多不同的意义。在本书中,我们这样来定义它:数据科学通过各种统计学和机器学习的技术与方法,将数据转换为有用的信息或知识。 由于数据的快速增长,数据科学必须利用各种工具的强大功能来应对大数据的挑战。因为数据科学的一大部分任务就是运行脚本https://labs.epubit.com/bookDetails?id=N1486
7.计算力学快讯,第8卷,第11期计算力学快讯计算力学快讯简介:本快讯是分享计算力学及相关软件信息的一个交流平台;由河海大学工程与科学数值模拟软件中心、江苏省力学学会信息服务部、中国力学学会计算力学软件专业组、南昌大学航空航天研究院联合主办;免费订阅,自由退订;欢迎各位计算力学同仁的投稿和反馈意见。 http://jsstam.org.cn/?list_73/1112.html
8.20机器学习开放基次程集成学习和随机森林方法假设已经为某一特定问题选中了最佳的模型,想进一步提升其准确率,就需要应用一些更高级的机器学习技术:集成(Ensemble)。集成是使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。在集成中,最终的整体输出比任何单个部分的表现更重要。 https://www.jianshu.com/p/260c7a1ba2f6