《机器学习实验》课程实验教学大纲

机器学习实验课程的目标要求学生在掌握机器学习的基本概念、基本原理和基本方法的基础上,能应用机器学习模型和算法解决实际问题的范例。课程围绕机器学习课程的主要教学内容,设置了6个典型实验,让学生编程实现,深入理解机器学习模型和算法。主要实验内容包括梯度下降法实验、线性回归与Logistic回归实验、支持向量机实验、决策树与随机森林实验、神经网络与深度学习实验、无监督学习实验等实验项目。通过实验,能够发挥学生的主动性,研究探讨机器学习模型与算法实现过程,提出并积极验证和探索自己的思路,从而更好地掌握知识,培养学生的理论联系实际能力和创新能力,最终提高他们发现问题、分析问题和解决问题的能力。

(二)课程英文简介

ThegoaloftheMachineLearningExperimentsrequiresstudentstomasterthebasicconcepts,principles,andmethodsofmachinelearning,basedonwhichsolvepracticalproblemsandcases.Thiscoursefocusesonthemainteachingcontentofmachinelearning,andsetsup6typicalexperimentsforstudentstoprogramandrealize,soastohaveanin-depthunderstandingofmachinelearningmodelsandalgorithms.Themainexperimentalcontentsincludegradientdescentexperiment,linearregressionandlogisticregressionexperiment,supportvectormachineexperiment,decisiontreeandrandomforestexperiment,neuralnetworkanddeeplearningexperiment,unsupervisedlearningexperimentandotherexperiments.Throughtheseexperiments,studentscaninitiativelystudytheimplementationofthemachinelearningmodelsandalgorithms,activelyproposeandverifytheirideastobettergraspknowledge,andcultivatetheirpracticalandinnovationabilitytofind,analyzeandsolvereal-lifeproblems.

二、实验课程目标

CO1:掌握机器学习的基本概念、基本原理、基本模型和基本方法,掌握梯度下降算法,应用线性回归与Logistic回归、支持向量机、决策树与随机森林、神经网络与深度学习、无监督学习实现分类问题的求解。

CO2:综合运用机器模型和方法,设计算法并编程实现,能够应用机器学习技术解决复杂工程问题。

CO3:掌握机器学习模型的评价方法,分析、评估实验结果,完善学习系统的性能。

课程目标与所支撑的毕业要求指标点的对应关系如表1所示。

表1课程目标与所支撑的毕业要求内涵观测点的对应关系

毕业要求内涵观测点

课程目标

GR4.1能够基于智能科学与技术的基本原理对人工智能领域复杂工程问题进行研究,根据研究对象特征,设计实验方案

CO1

GR4.3能够对实验结果进行合理分析、解释,并对多个子问题进行关联分析,找出冲突点并进行平衡,通过实验数据分析、信息综合等手段得到合理有效的结论

CO2、CO3

GR5.2能够针对人工智能领域的复杂工程问题,开发、选择与使用满足特定需求的技术、资源和现代工具,对复杂工程问题进行预测与模拟,并能够理解其局限性

三、实验内容与要求

(一)实验设计(实验类型及内容)

基于CG系统或腾讯云教学管理平台编程实现经典机器学习模型和算法,主要包含6个实验:梯度下降算法实验,线性回归与Logistic回归实验、支持向量机实验、决策树与随机森林实验、神经网络与深度学习实验、无监督学习实验。演示性实验占16.7%,验证性实验占16.7%,设计研究性实验占33.3%,综合性实验占33.3%。具体实验内容如下:

实验1梯度下降算法实验(演示性)

掌握梯度下降(GradientDescent)的工作原理,解释梯度下降算法可能降低目标函数值的原因。编程实现一维梯度下降、多维梯度下降以及随机梯度下降算法。使用适当的学习率,沿着梯度反方向更新自变量可能降低目标函数值。梯度下降重复这一更新过程直到得到满足要求的解。

实验2线性回归与Logistic回归实验(设计研究性)

了解机器学习和回归的关系、一元线性回归的基本思想和数学原理,熟练的使用Sklearn提供的一元线性回归库,将一元线性回归应用到真实世界中的预测商品价格、成本评估等问题中。掌握逻辑回归的原理,掌握如何使用逻辑回归解决实际问题。

实验3支持向量机实验(验证性)

掌握SVM算法原理,熟悉SVM算法的初步应用,使用Sklearn库创建SVM模型,并应用SVM算法实现分类问题的求解,如手写识别问题、构建垃圾邮件分类器以及变色鸢尾预测问题的核方法等。

实验4决策树与随机森林实验(设计研究性)

掌握决策树算法的基本原理,在决策树各个结点上对应信息增益准则选择特征,递归地构建决策树,依靠训练数据构造了决策树之后,我们可以将它用于实际数据的分类,使用Sklearn实现基于决策树的隐形眼镜预测。掌握集成学习的基本思想和随机森林的基本原理,应用随机森林分类算法实现墨渍数据分类、发声者性别判断、实现信用卡欺诈检测等问题。

实验5神经网络与深度学习实验(综合性)

通过本实验掌握人工神经网络的原理,理解深度学习的基础知识和其他高级深度学习算法的学习。本实验首先对人工神经网络的原理做介绍并配合一系列小的实验加深理解,之后使用TensorFlow基于人工神经网络实验实现手写数字识别、乳腺癌诊断、车牌号码识别等实验。

实验6无监督学习实验(综合性)

熟悉和掌握无监督学习中的降维技术,实现基于PCA月亮数据集降维以及基于线性判别分析法手写数字数据降维;掌握K均值聚类算法,实现墨渍数据聚类、地图上的点进行聚类等。

表2实验内容与课程目标对应关系

实验课程目标

实验模块(可选)

对应实验

实验1、3

CO2

实验2、4

CO3

实验5、6

(二)实验内容及要求

表3实验内容与要求

编号

实验项目

学时数

实验内容

实验类型

实验要求

梯度下降法实验

2

实现一维梯度下降、多维梯度下降以及随机梯度下降算法

演示性

线性回归与Logistic回归实验

4

应用一元线性回归实现商品价格预测、成本评估,实现逻辑回归算法

设计研究性

3

支持向量机实验

使用Sklearn库创建SVM模型,并应用SVM算法实现分类问题的求解,如手写识别问题、构建垃圾邮件分类器以及变色鸢尾预测问题的核方法

验证性

决策树与随机森林实验

使用Sklearn实现基于决策树的隐形眼镜预测,应用随机森林分类算法实现墨渍数据分类、发声者性别判断、实现信用卡欺诈检测

5

神经网络与深度学习实验

人工神经网络实验实现手写数字识别、乳腺癌诊断、车牌号码识别

综合性

6

无监督学习实验

实现基于PCA月亮数据集降维以及基于线性判别分析法手写数字数据降维;掌握K均值聚类算法,实现墨渍数据聚类、地图上的点进行聚类

四、实验设备与环境配置

1.计算机:IntelCore2DuoE43001.8GHZ、内存512MB、硬盘15GB以上。

2.开发环境:CourseGrading计算机专业课一体化平台、腾讯云教学管理平台

3.实验题目及结果:学生在程序在线评测系统进行实验,通过撰写的实验报告进行实验成绩评定,或使用系统题库的由系统判定实验结果。

五、课程思政、创新创业元素

教学章节

知识点

思政元素案例

培养目标

备注

实验1

举例说明机器学习问题与最优化问题的关系,介绍最优化方法在我国工业、农业、商业、交通运输、军事和科学研究等领域的应用实例。

当代大学生应胸怀祖国,放眼世界,勇做时代精神的弘扬者和改革创新的实践者

创新创业案例

实验2

介绍青岛新前湾集装箱码头有限公司的全自动化码头中的优化方法应用、滴滴公司滴滴的应用优化算法的创新之路。

培养学生终身学习的理念

课程思政

实验3

介绍最优化方法在我国工业、农业、商业、交通运输、军事和科学研究等领域的应用实例,介绍优化方法促进我国高新技术的快速发展和逐步落地

帮助学生树立应用最优化方法求解实际问题的思想,锻炼学生的逻辑思维,培养学生思路严谨、考虑周全的思考方式。培养学生的爱国主义情怀

实验4

集成学习是指组合多个弱监督分类模型以期得到一个更好更全面的强监督分类模型。集成学习的原理是只要多个分类器间差异足够大,它们犯下相同错误的概率很低。

通过分析,使学生明白我们党的民主集中制的科学性和合理性。中国古代就有“三个臭裨匠,赛过诸葛亮”,其所含的寓意便是要集思广益,单凭一人之力,往往难以周全。三个才能一般的人聚集到一起想办法,也能提出比诸葛亮这种能人更为周全的办法或者计策,比喻人多智慧多。

实验5

选取互联网行业创业成功的案例,如张旭豪在大学时代创办的“饿了么”等,学生身边的案例更能激发学生创新创业的动力。

鼓舞学生创新创业的勇气

神经网络方法模仿生物神经元之间的信息传递策略,并通过反向迭代优化的方式,完成对数据输入/输出之间的信息拟合。习近平总书记高度重视创新发展,反复强调“创新”,内容涵盖了科技、人才、文艺等方面的创新,以及在理论、制度、实践上如何创新。

让学生通过神经网络算法设计明白大自然和人类本身有很多奥妙有待进一步发掘,激发学生要善于发现、勇于创新。

介绍深度学习教父杰夫·欣顿的故事

介绍当前80%的人工智能公司用神经网络做图像识别

培养学生坚持创新的精神,鼓励学生做时代精神的弘扬者和改革创新的实践者

六、主要参考资料

[1]王磊.机器学习算法导论.北京:清华大学出版社,2019.

[2]周志华.机器学习[M].北京:清华大学出版社,2015.

[3]吴军.数学之美[M].北京:人民邮电出版社,2014.

[4]王晓东.算法设计与分析(第四版)[M].北京:清华大学出版社,2018.

[5]哈林顿,李锐.机器学习实战:Machinelearninginaction[M].人民邮电出版社,2013.

[6]李航.统计学习方法[M].清华大学出版社,2012.

七、考核方式、方法及实验成绩评定方法

考核成绩可以采用五级制或百分制。课程成绩考核主要由平时成绩组成,可以进行期末考核。平时考核包括出勤、展示、各次实验考核等形式。

(一)评分标准

表4实验评分标准

考核

环节

<60

(不及格)

60-69

(及格)

70-79

(中等)

80-89

(良好)

90-100

(优秀)

平时

①不能够完成课内实验内容,程序调试及运行结果基本不正确,不能够解决报错问题;

②按时完成实验项目数低于50%;

③不能准确描述问题,不参与交流讨论;

④报告或程序组织结构不合理,内容不规范或不完整性,逻辑性差。作品表述能力差,实验结果错误或没有。

①能够完成课内实验内容,程序调试及运行结果基本正确,基本能够解决报错问题;

②按时完成实验项目占比为

50%-69%

③基本能够提出问题,较少参与交流讨论;

④报告或程序组织结构合理性尚可,内容规范完整性尚可,逻辑性尚可。作品表述能力尚可,实验结果分析较少。

①能够完成课内实验内容,程序调试及运行结果正确,基本能够解决报错问题;

70%-89%

③能够提出问题,参与交流讨论;

④报告或程序组织结构基本合理,内容基本规范完整,基本符合逻辑性。作品表述能力一般,实验结果分析一般。

①能够较好完成课内实验内容,程序调试及运行结果正确,方法较好,能够解决报错问题;

②按时完成实验项目占比为90%以上;③能够较准确地提出问题,交流讨论较积极;

④报告或程序组织结构较合理,内容比较规范完整,符合逻辑性。作品表述能力较好,实验结果较好。

①能够出色完成课内实验内容,程序调试及运行结果稳定,能够独立解决报错问题;

②所有实验项目均按时完成;

③能够准确提出问题,积极交流讨论;

④报告或程序组织结构合理,内容规范完整,符合逻辑性。作品表述能力出色,实验结果分析准确,并有独到见解。

THE END
1.头歌(第五章机器学习基本模型与算法在线实验闯关)头歌(第五章 机器学习基本模型与算法在线实验闯关)第1关:缺失值填充任务描述 本关任务:读取“银行贷款审批数据.xlsx”表,自变量为x1-x15,决策变量为y(1-同意贷款,0-不同意贷款),其中x1-x6为数值变量,x7-x15为名义变量,请对x1-x6中存在的缺失值用均值策略填充,x7-x15用最频繁值策略填充。https://blog.csdn.net/weixin_45688124/article/details/137876881
2.机器学习基本模型与算法在线实验闯关缺失值填充找到缺失值算法机器学习基本模型与算法在线实验闯关缺失值填充 找到缺失值 算法,加载数据importpandasaspdimportnumpyasnp#加载数据data=pd.read_excel('./qs.xlsx')print(data)如何确定数据里包含缺失值---缺失值检测print(data.isnull())#缺失地方的值为Trueprint(data.notnull())#不缺https://blog.51cto.com/u_13416/9118325
3.Python大数据分析与挖掘实战训练营机器学习基本模型与算法在线实验闯关 实验数 12 第六章 深度学习与实现 深度学习的精确定义,众说纷纭,简单来说,深度学习是机器学习的一个分支领域:一种从数据中学习表示的新方法,它强调学习具有越来越有意义的表示的连续层,而这些层的表示一般是通过神经网络的模型来学习得到的。“深度学习”中的“深度”指的并不https://testwebssh.educoder.net/paths/vpgzo8ne
4.矿产资源知识范文8篇(全文)也就是说,在进一步应用机器学习算法之前,需要有一个网络知识资源到文本再到数字向量表示的转化过程。词袋法(Bag of word,BOW)是表示一个文件的基本方法。该法重点是以文档中的每个词语的计数形成的频率向量去表示文档。这种文档表示法则可称为一个向量空间模型(VSM)[2]。但却仍需指出,词袋法/向量空间模型表示法https://www.99xueshu.com/w/filev30h2bcz.html
5.安恒信息2023年年度董事会经营评述未来,公司将继续结合最新的政策导向和业务发展趋势,与客户继续保持紧密合作关系,在数据安全领域进行更深入的探索和实践,以AI技术的创新迭代推动数据安全有序地流动,确保安全贯穿数据要素价值创造和实现的全过程,严守数据安全底线。数据安全产品深度融合恒脑-安全垂域大模型的能力,通过分类分级工具和恒脑大模型的深度联合http://news.10jqka.com.cn/20240425/c657307608.shtml
6.Julia数据科学应用“数据科学”是个相当含糊的名词,自从它成为科学领域一门学科后,就具有很多不同的意义。在本书中,我们这样来定义它:数据科学通过各种统计学和机器学习的技术与方法,将数据转换为有用的信息或知识。 由于数据的快速增长,数据科学必须利用各种工具的强大功能来应对大数据的挑战。因为数据科学的一大部分任务就是运行脚本https://labs.epubit.com/bookDetails?id=N1486
7.计算力学快讯,第8卷,第11期计算力学快讯计算力学快讯简介:本快讯是分享计算力学及相关软件信息的一个交流平台;由河海大学工程与科学数值模拟软件中心、江苏省力学学会信息服务部、中国力学学会计算力学软件专业组、南昌大学航空航天研究院联合主办;免费订阅,自由退订;欢迎各位计算力学同仁的投稿和反馈意见。 http://jsstam.org.cn/?list_73/1112.html
8.20机器学习开放基次程集成学习和随机森林方法假设已经为某一特定问题选中了最佳的模型,想进一步提升其准确率,就需要应用一些更高级的机器学习技术:集成(Ensemble)。集成是使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。在集成中,最终的整体输出比任何单个部分的表现更重要。 https://www.jianshu.com/p/260c7a1ba2f6