机器学习实验课程的目标要求学生在掌握机器学习的基本概念、基本原理和基本方法的基础上,能应用机器学习模型和算法解决实际问题的范例。课程围绕机器学习课程的主要教学内容,设置了6个典型实验,让学生编程实现,深入理解机器学习模型和算法。主要实验内容包括梯度下降法实验、线性回归与Logistic回归实验、支持向量机实验、决策树与随机森林实验、神经网络与深度学习实验、无监督学习实验等实验项目。通过实验,能够发挥学生的主动性,研究探讨机器学习模型与算法实现过程,提出并积极验证和探索自己的思路,从而更好地掌握知识,培养学生的理论联系实际能力和创新能力,最终提高他们发现问题、分析问题和解决问题的能力。
(二)课程英文简介
ThegoaloftheMachineLearningExperimentsrequiresstudentstomasterthebasicconcepts,principles,andmethodsofmachinelearning,basedonwhichsolvepracticalproblemsandcases.Thiscoursefocusesonthemainteachingcontentofmachinelearning,andsetsup6typicalexperimentsforstudentstoprogramandrealize,soastohaveanin-depthunderstandingofmachinelearningmodelsandalgorithms.Themainexperimentalcontentsincludegradientdescentexperiment,linearregressionandlogisticregressionexperiment,supportvectormachineexperiment,decisiontreeandrandomforestexperiment,neuralnetworkanddeeplearningexperiment,unsupervisedlearningexperimentandotherexperiments.Throughtheseexperiments,studentscaninitiativelystudytheimplementationofthemachinelearningmodelsandalgorithms,activelyproposeandverifytheirideastobettergraspknowledge,andcultivatetheirpracticalandinnovationabilitytofind,analyzeandsolvereal-lifeproblems.
二、实验课程目标
CO1:掌握机器学习的基本概念、基本原理、基本模型和基本方法,掌握梯度下降算法,应用线性回归与Logistic回归、支持向量机、决策树与随机森林、神经网络与深度学习、无监督学习实现分类问题的求解。
CO2:综合运用机器模型和方法,设计算法并编程实现,能够应用机器学习技术解决复杂工程问题。
CO3:掌握机器学习模型的评价方法,分析、评估实验结果,完善学习系统的性能。
课程目标与所支撑的毕业要求指标点的对应关系如表1所示。
表1课程目标与所支撑的毕业要求内涵观测点的对应关系
毕业要求内涵观测点
课程目标
GR4.1能够基于智能科学与技术的基本原理对人工智能领域复杂工程问题进行研究,根据研究对象特征,设计实验方案
CO1
GR4.3能够对实验结果进行合理分析、解释,并对多个子问题进行关联分析,找出冲突点并进行平衡,通过实验数据分析、信息综合等手段得到合理有效的结论
CO2、CO3
GR5.2能够针对人工智能领域的复杂工程问题,开发、选择与使用满足特定需求的技术、资源和现代工具,对复杂工程问题进行预测与模拟,并能够理解其局限性
三、实验内容与要求
(一)实验设计(实验类型及内容)
基于CG系统或腾讯云教学管理平台编程实现经典机器学习模型和算法,主要包含6个实验:梯度下降算法实验,线性回归与Logistic回归实验、支持向量机实验、决策树与随机森林实验、神经网络与深度学习实验、无监督学习实验。演示性实验占16.7%,验证性实验占16.7%,设计研究性实验占33.3%,综合性实验占33.3%。具体实验内容如下:
实验1梯度下降算法实验(演示性)
掌握梯度下降(GradientDescent)的工作原理,解释梯度下降算法可能降低目标函数值的原因。编程实现一维梯度下降、多维梯度下降以及随机梯度下降算法。使用适当的学习率,沿着梯度反方向更新自变量可能降低目标函数值。梯度下降重复这一更新过程直到得到满足要求的解。
实验2线性回归与Logistic回归实验(设计研究性)
了解机器学习和回归的关系、一元线性回归的基本思想和数学原理,熟练的使用Sklearn提供的一元线性回归库,将一元线性回归应用到真实世界中的预测商品价格、成本评估等问题中。掌握逻辑回归的原理,掌握如何使用逻辑回归解决实际问题。
实验3支持向量机实验(验证性)
掌握SVM算法原理,熟悉SVM算法的初步应用,使用Sklearn库创建SVM模型,并应用SVM算法实现分类问题的求解,如手写识别问题、构建垃圾邮件分类器以及变色鸢尾预测问题的核方法等。
实验4决策树与随机森林实验(设计研究性)
掌握决策树算法的基本原理,在决策树各个结点上对应信息增益准则选择特征,递归地构建决策树,依靠训练数据构造了决策树之后,我们可以将它用于实际数据的分类,使用Sklearn实现基于决策树的隐形眼镜预测。掌握集成学习的基本思想和随机森林的基本原理,应用随机森林分类算法实现墨渍数据分类、发声者性别判断、实现信用卡欺诈检测等问题。
实验5神经网络与深度学习实验(综合性)
通过本实验掌握人工神经网络的原理,理解深度学习的基础知识和其他高级深度学习算法的学习。本实验首先对人工神经网络的原理做介绍并配合一系列小的实验加深理解,之后使用TensorFlow基于人工神经网络实验实现手写数字识别、乳腺癌诊断、车牌号码识别等实验。
实验6无监督学习实验(综合性)
熟悉和掌握无监督学习中的降维技术,实现基于PCA月亮数据集降维以及基于线性判别分析法手写数字数据降维;掌握K均值聚类算法,实现墨渍数据聚类、地图上的点进行聚类等。
表2实验内容与课程目标对应关系
实验课程目标
实验模块(可选)
对应实验
实验1、3
CO2
实验2、4
CO3
实验5、6
(二)实验内容及要求
表3实验内容与要求
编号
实验项目
学时数
实验内容
实验类型
实验要求
梯度下降法实验
2
实现一维梯度下降、多维梯度下降以及随机梯度下降算法
演示性
线性回归与Logistic回归实验
4
应用一元线性回归实现商品价格预测、成本评估,实现逻辑回归算法
设计研究性
3
支持向量机实验
使用Sklearn库创建SVM模型,并应用SVM算法实现分类问题的求解,如手写识别问题、构建垃圾邮件分类器以及变色鸢尾预测问题的核方法
验证性
决策树与随机森林实验
使用Sklearn实现基于决策树的隐形眼镜预测,应用随机森林分类算法实现墨渍数据分类、发声者性别判断、实现信用卡欺诈检测
5
神经网络与深度学习实验
人工神经网络实验实现手写数字识别、乳腺癌诊断、车牌号码识别
综合性
6
无监督学习实验
实现基于PCA月亮数据集降维以及基于线性判别分析法手写数字数据降维;掌握K均值聚类算法,实现墨渍数据聚类、地图上的点进行聚类
四、实验设备与环境配置
1.计算机:IntelCore2DuoE43001.8GHZ、内存512MB、硬盘15GB以上。
2.开发环境:CourseGrading计算机专业课一体化平台、腾讯云教学管理平台
3.实验题目及结果:学生在程序在线评测系统进行实验,通过撰写的实验报告进行实验成绩评定,或使用系统题库的由系统判定实验结果。
五、课程思政、创新创业元素
教学章节
知识点
思政元素案例
培养目标
备注
实验1
举例说明机器学习问题与最优化问题的关系,介绍最优化方法在我国工业、农业、商业、交通运输、军事和科学研究等领域的应用实例。
当代大学生应胸怀祖国,放眼世界,勇做时代精神的弘扬者和改革创新的实践者
创新创业案例
实验2
介绍青岛新前湾集装箱码头有限公司的全自动化码头中的优化方法应用、滴滴公司滴滴的应用优化算法的创新之路。
培养学生终身学习的理念
课程思政
实验3
介绍最优化方法在我国工业、农业、商业、交通运输、军事和科学研究等领域的应用实例,介绍优化方法促进我国高新技术的快速发展和逐步落地
帮助学生树立应用最优化方法求解实际问题的思想,锻炼学生的逻辑思维,培养学生思路严谨、考虑周全的思考方式。培养学生的爱国主义情怀
实验4
集成学习是指组合多个弱监督分类模型以期得到一个更好更全面的强监督分类模型。集成学习的原理是只要多个分类器间差异足够大,它们犯下相同错误的概率很低。
通过分析,使学生明白我们党的民主集中制的科学性和合理性。中国古代就有“三个臭裨匠,赛过诸葛亮”,其所含的寓意便是要集思广益,单凭一人之力,往往难以周全。三个才能一般的人聚集到一起想办法,也能提出比诸葛亮这种能人更为周全的办法或者计策,比喻人多智慧多。
实验5
选取互联网行业创业成功的案例,如张旭豪在大学时代创办的“饿了么”等,学生身边的案例更能激发学生创新创业的动力。
鼓舞学生创新创业的勇气
神经网络方法模仿生物神经元之间的信息传递策略,并通过反向迭代优化的方式,完成对数据输入/输出之间的信息拟合。习近平总书记高度重视创新发展,反复强调“创新”,内容涵盖了科技、人才、文艺等方面的创新,以及在理论、制度、实践上如何创新。
让学生通过神经网络算法设计明白大自然和人类本身有很多奥妙有待进一步发掘,激发学生要善于发现、勇于创新。
介绍深度学习教父杰夫·欣顿的故事
介绍当前80%的人工智能公司用神经网络做图像识别
培养学生坚持创新的精神,鼓励学生做时代精神的弘扬者和改革创新的实践者
六、主要参考资料
[1]王磊.机器学习算法导论.北京:清华大学出版社,2019.
[2]周志华.机器学习[M].北京:清华大学出版社,2015.
[3]吴军.数学之美[M].北京:人民邮电出版社,2014.
[4]王晓东.算法设计与分析(第四版)[M].北京:清华大学出版社,2018.
[5]哈林顿,李锐.机器学习实战:Machinelearninginaction[M].人民邮电出版社,2013.
[6]李航.统计学习方法[M].清华大学出版社,2012.
七、考核方式、方法及实验成绩评定方法
考核成绩可以采用五级制或百分制。课程成绩考核主要由平时成绩组成,可以进行期末考核。平时考核包括出勤、展示、各次实验考核等形式。
(一)评分标准
表4实验评分标准
考核
环节
<60
(不及格)
60-69
(及格)
70-79
(中等)
80-89
(良好)
90-100
(优秀)
平时
①不能够完成课内实验内容,程序调试及运行结果基本不正确,不能够解决报错问题;
②按时完成实验项目数低于50%;
③不能准确描述问题,不参与交流讨论;
④报告或程序组织结构不合理,内容不规范或不完整性,逻辑性差。作品表述能力差,实验结果错误或没有。
①能够完成课内实验内容,程序调试及运行结果基本正确,基本能够解决报错问题;
②按时完成实验项目占比为
50%-69%
③基本能够提出问题,较少参与交流讨论;
④报告或程序组织结构合理性尚可,内容规范完整性尚可,逻辑性尚可。作品表述能力尚可,实验结果分析较少。
①能够完成课内实验内容,程序调试及运行结果正确,基本能够解决报错问题;
70%-89%
③能够提出问题,参与交流讨论;
④报告或程序组织结构基本合理,内容基本规范完整,基本符合逻辑性。作品表述能力一般,实验结果分析一般。
①能够较好完成课内实验内容,程序调试及运行结果正确,方法较好,能够解决报错问题;
②按时完成实验项目占比为90%以上;③能够较准确地提出问题,交流讨论较积极;
④报告或程序组织结构较合理,内容比较规范完整,符合逻辑性。作品表述能力较好,实验结果较好。
①能够出色完成课内实验内容,程序调试及运行结果稳定,能够独立解决报错问题;
②所有实验项目均按时完成;
③能够准确提出问题,积极交流讨论;
④报告或程序组织结构合理,内容规范完整,符合逻辑性。作品表述能力出色,实验结果分析准确,并有独到见解。