学堂在线南京大学机器学习初步(2022秋)考试题答案.doc

Print学堂在线南京大学机器学习初步(2022秋)考试题答案1.单选题(1分)朴素贝叶斯分类器采用了()假设:即对已知类别,假设所有属性相互独立。A独依赖B道德图C有向无环图依赖D属性条件独立性

正确答案:D2.单选题(1分)下列说法错误的是()A根据训练数据是否拥有标记信息,学习任务可以大致划分为两类:监督学习、无监督学习B支持向量机的原问题和对偶问题都是二次规划问题C决策树相比于对数几率回归更适合分线性分类问题D留一法对模型性能的估计总是比交叉验证方法更准确

正确答案:D4.单选题(1分)当多隐层神经网络使用线性激活函数时,下列哪个选项是正确的A神经网络的输出是输入的线性函数B经验损失最小化具有唯一解C神经网络的输出是权重的线性函数D神经网络具有万有逼近性

正确答案:A5.填空题(1分)支持向量机原始问题目标函数最优值是对偶问题得到的目标函数最优值的______(上界/下界)

正确答案:填空1:上界6.单选题(1分)下列关于类别不平衡问题的描述中正确的是哪个A复制小类样本可以高效解决类别不平衡问题B当大类和小类一样重要时需要针对不平衡问题做特殊处理C阈值移动法需要构造平衡数据集来处理类别不平衡问题D过采样与欠采样都通过构造平衡数据集来处理类别不平衡问题

正确答案:D7.单选题(1分)下列关于多元线性回归中使用正则项的说法中正确的是A使用正则化后,多元线性回归可以找到多个最优解B即便计算机具有无限精度,多元线性回归也需要使用正则项C样例维度小于样例数是使用正则项的原因之一D使用正则项只有理论意义,实际应用中无需使用

正确答案:B8.单选题(1分)下列哪些函数可以作为核函数A以上函数均可以作为核函数B线性核C高斯核D多项式核

正确答案:A9.单选题(1分)考虑正类样本(-1,0),(0,1),(-1,1)和负类样本(1,0),(0,-1),(1,-1),通过支持向量机的基本型得到的解为A以上答案均不是By=xCy=x+1Dy=x-1

正确答案:B10.单选题(1分)以下关于模型评估与选择的说法,错误的是A当数据集很大时,通过留一法进行模型评估的计算代价是非常高昂的B交叉验证t检验是基于列联表的C训练模型时,仅仅保证训练误差为0是不够的D模型的超参选择需要在验证集上进行测试

正确答案:B11.单选题(1分)下列关于线性模型的描述中正确的是哪个A线性模型通过投票法或加权平均法可以得到非线性模型B线性模型既可以处理回归任务,也可以处理分类任务C线性模型的表达能力与神经网络相同D线性模型无法拟合与输入呈指数关系的输出

正确答案:B12.填空题(1分)Sigmoid函数在一点的函数值总是______(大于/等于/小于/无法确定)该点的导数值。

正确答案:填空1:大于13.单选题(1分)以下关于机器学习的说法错误的是()A学得模型后,待测试的样本我们称为“测试样本”,亦称“测试示例”B预测离散值的任务一般称为分类任务C在聚类任务中,我们需要事先知道数据的标记信息D同一个算法在不同数据集上,一般不能得到同样一个模型

正确答案:C14.填空题(1分)对于参数估计过程,统计学界的______(频率主义/贝叶斯主义)学派认为参数虽然未知,但却是客观存在的固定值,因此,可通过优化似然函数等准则来确定参数值。

正确答案:填空1:频率主义15.单选题(1分)下列哪一种数据集切分方式会导致划分的训练集和测试集与初始数据集分布不同A留出法B交叉验证法C自助法D以上做法均不会

正确答案:C16.单选题(1分)下列有关支持向量机,说法正确的是A利用SMO算法求解支持向量机时,只需要迭代更新参数一次B通过支持向量机求解出的划分超平面是对训练样本局部扰动的“容忍”性最好的划分超平面C支持向量机只能处理线性可分的数据D一般情况下,支持向量机训练完后解与全部样本都有关系

正确答案:B17.填空题(1分)如果决策树过拟合训练集,减少决策树最大深度______(是/否)为一个好主意。

正确答案:填空1:是18.单选题(1分)下列说法错误的是()ACART算法的评价指标是基尼系数B当样本均匀分布于所有类中时,熵最大CID3算法能解决过拟合问题D在某些情况下样本特征向量中一些分量没有值,这称为属性缺失

正确答案:C19.单选题(1分)下列关于集成学习的说法中正确的是哪个A已有的多样性定义可以作为优化目标直接优化BBagging中不同个体学习器的数据是从同一数据集中采样得到的,因而需要其他途径使基学习器具有多样性C个体学习器犯错的样本具有一定差异性是集成学习取得好性能的要求之一DBoosting中所有个体学习器的权重是相等的

正确答案:C20.单选题(1分)当西瓜收购公司去瓜摊收购西瓜时既希望把好瓜都收走又保证收到的瓜中坏瓜尽可能的少,请问他应该分别考虑什么评价指标A准确率查全率B查全率查准率C查准率查全率D查全率准确率

正确答案:B21.单选题(1分)下列说法错误的是()A机器学习一般有“独立同分布”假设B用数据建立模型的过程叫训练C学得模型适用于新样本的能力称为“泛化”能力D测试数据应和训练数据一样

正确答案:D22.单选题(1分)以下关于聚类的说法,错误的是A聚类好坏存在绝对标准B密度聚类假设聚类结构可以通过样本分布的紧密程度确定C原型聚类得到的每一个簇都是凸的D聚类可以作为其他学习算法的前驱过程

正确答案:A23.填空题(1分)决策树划分时,若其中一个属性为样本的编号(各样本编号不同),若基于该属性进行划分,则信息增益最______(大/小)

正确答案:填空1:大24.填空题(1分)若任务中数据的属性是连续值,此类任务称为______(分类/回归/不确定)。

正确答案:填空1:不确定25.填空题(1分)当查准率和查全率均为1时,F1度量为______。(计算结果保留三位小数)

正确答案:填空1:1.00026.单选题(1分)下列说法错误的是()A信息增益准则对可取值较多的属性有所偏好B基尼指数越小,数据集的纯度越高C决策树学习时,给定划分属性,若样本在该属性上的值缺失,会随机进入一个分支D随着决策树学习时的深度增加,位于叶结点的样本越来越少

正确答案:C27.填空题(1分)当学习器在训练集上把训练样本自身的一些特征当作了所有潜在样本都具有的一般性质时,泛化性能可能会因此下降,这种现象一般称为______。(过拟合/欠拟合)

正确答案:填空1:过拟合28.单选题(1分)下列关于神经网络万有逼近性的说法中正确的是哪个A万有逼近性保证了神经网络在现实任务中优异的表现B万有逼近性是神经网络独有的性质C包含足够多神经元的单隐层神经网络具有万有逼近性D万有逼近性表明任意一个神经网络都可以逼近任意函数

正确答案:C29.单选题(1分)下列说法错误的是()A决策树属于生成式模型B反映了分类器所能达到的最好性能C贝叶斯决策论是概率框架下实施决策的基本理论D如果概率都能拿到真实值,那么根据贝叶斯判定准则做出的决策是理论上最好的决策

正确答案:A30.填空题(1分)对于两个样本点(0,0),(1,1),若我们将其投影到与拉普拉斯核函数关联的RKHS中时,则两个样本投影后的点距离为______(保留三位小数)

正确答案:填空1:1.230解析

31.填空题(1分)设为一正自然数,考虑数据集。记为最小二乘法在数据集上学得的线性模型的斜率,则的值为______(保留3位小数或填写"不存在")。

正确答案:填空1:1.50032.填空题(1分)考虑如下三分类的例子,使用投票法集成的结果的精度为______(保留3位小数)。

正确答案:填空1:0.20033.填空题(1分)如果为了同时得到多个聚类簇数的聚类结果(如下图所示),最适合使用______(原型聚类/密度聚类/层次聚类)

正确答案:填空1:层次聚类34.填空题(1分)使用BP算法优化神经网络,若发现损失函数剧烈波动,可能是优化步长偏______(大/小)。

正确答案:填空1:大35.单选题(1分)下列说法错误的是()A对连续属性,计算条件概率可考虑概率密度函数B贝叶斯学习等于贝叶斯分类器C极大似然估计需要假设某种概率分布形式D朴素贝叶斯分类器中,对给定类别,模型假设所有属性间相互独立

正确答案:B36.填空题(1分)考虑如图数据集,其中与为特征,其取值集合分别为,为类别标记,其取值集合为。使用所给训练数据,学习一个朴素贝叶斯分类器,考虑样本,请计算的值______(保留2位有效数字)。

正确答案:填空1:0.0337.单选题(1分)以下哪种方式通常不能帮助解决决策树过拟合()。A限制最大树深度B预剪枝C去除训练集一半样本D后剪枝

THE END
1.机器学习:开启智能未来的钥匙腾讯云开发者社区一、机器学习概述 机器学习作为人工智能的核心方法,通过分析数据中的隐藏规律,让计算机从中获取新的经验和知识,不断提升和改善自身性能,从而像人一样根据所学知识做出决策。 机器学习涉及概率论、统计学、微积分、代数学、算法复杂度理论等多门学科,是一门多领域交叉学科。其应用范围极为广泛,涵盖自然语言处理、图像识https://cloud.tencent.com/developer/article/2478495
2.机器学习中的在线学习与离线学习离线训练是什么意思离线学习:一个batch训练完才更新权重,这样的话要求所有的数据必须在每一个训练操作中(batch中)都是可用的,个人理解,这样不会因为偶然的错误把网络带向极端。 这种理解方式在国外论文中出现比较多,国外称为online and batch learning.离线就是对应batch learning.这两种方式各有优点,在线学习比较快,但是有比较高的残差https://blog.csdn.net/a493823882/article/details/83240496
3.在线学习(Onlinelearning)在线学习(Online learning) 在线学习算法,获取连续的数据,当我们训练完后,便丢弃了,不再使用。 点击率CTR(Click through rate): 和随机梯度下降算法很像,只不过这里没有固定的训练集。https://www.jianshu.com/p/0e70dce74b39
4.在线深度学习mob64ca12d6c78e的技术博客在现代机器学习领域,深度学习作为一种强大的方法论,已经被广泛应用于计算机视觉、自然语言处理、语音识别等众多领域。而在线深度学习是一种新兴的研究方向,它使得模型可以在不断变换的数据环境中进行实时学习。本文将探讨在线深度学习的基本概念、应用场景以及提供一个简单的代码示例来展示如何实现在线深度学习。 https://blog.51cto.com/u_16213326/11689672
5.一步一步教你在线免费训练机器学习模型(启用GPU和TPU)关于Kgle、colab和机器学习的其他资源跟随Siraj Raval和Yufeng G. 由于我无法在这篇文章中涵盖所有在线训练机器学习模型的服务,因此本文将有第二部分。 所有需要学习和实践机器学习的资源都是开源的,可在线获取。从计算、数据集、算法以及免费在线提供的各种高质量教程,你只需要互联网连接和学习的热情。 https://blog.itpub.net/31545819/viewspace-2216969/
6.在文本分析中的应用01深度学习与传统机器学习的不同深度学习在这方面就做得特别好,它能够从原始的数据当中能够实现这种特征的各种结果,它通过pre-training就可以将数据里面的特征自动提取出来,再直接基于原始的数据,就能训练出一个模型,而且它的效果相比传统的机器学习甚至有显著的改善,这就是为什么说深度学习在这些年得到了这么火热的欢迎,以及在工业界得到了大量的使用https://www.ximalaya.com/sound/79094645
7.20232023-2024在线学习课堂网课《机器学习》单元测试考核答案.pdf 13页内容提供方:1sda321 大小:338.2 KB 字数:约9.61千字 发布时间:2023-06-10发布于贵州 浏览人气:242 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)https://m.book118.com/html/2023/0608/6113132015005142.shtm
8.土木学院主办“机器学习与大数据在岩土力学与岩土工程中应用新?2022年1月8日,由重庆大学土木工程学院主办,山地城镇建设与新技术教育部重点实验室、国际土力学及岩土工程协会(ISSMGE)TC303、TC309专委会以及中国土木工程学会土力学及岩土工程学会承办的“机器学习与大数据在岩土力学与岩土工程中的新进展”学术研讨会于线上顺利开展。 https://news.cqu.edu.cn/archives/news2/content/2022/01/10/83dad05ffb4d8d8d812965dde7b0c74c5350c09a.html
9.机器学习初步南京大学?机器学习(Machine Learning)是人工智能的核心研究领域之一,并取得了广泛的应用效果,是引领这一轮“人工智能热潮”的关键技术支撑。《机器学习初步》课程覆盖机器学习的入门基石内容,课程主讲人周志华教授是领域内学者,所著《机器学习》(网友昵称为“西瓜书”)正是本课程的教材。本课程的教学目标是使学生对机器学习有https://www.xuetangx.com/course/nju0802bt/14363483&wd=&eqid=e751ab060004056400000003647fed08
10.教程:在PowerBI中生成机器学习模型按照本教程操作,可以了解如何在 Power BI 中生成和使用机器学习模型。https://docs.microsoft.com/zh-cn/power-bi/service-tutorial-build-machine-learning-model
11.机器学习方法在数字芯片设计中的应用电子创新网Imgtec社区随着深度学习的概念深入人心,相比于传统方法,机器学习(ML, Machine learning)的方法对于处理NP-complete问题提供了一整套新的解决方案。芯片设计过程可以看成不断的伴随着从一个step到另外一个step的抽象化任务模型建模的过程,其方法论在半导体发展的过程中不断的完善,汇集了种类繁多的各种抽象化模型任务,几乎可以包含所https://imgtec.eetrend.com/blog/2022/100565005.html
12.机器学习在肉类微生物安全中的应用研究进展机器学习方法可以从海量、复杂的数据中提取关键信息,学习数据集中各变量间的隐藏关系,现已逐渐成为食品安全领域数据密集型分析任务的强有力工具。 本文通过归纳近年来国内外相关研究,总结了机器学习方法在肉品中有害微生物的检测和预测建模中所起到的关键作用,分析了该法在实际应用时的不足之处,并展望了该法在肉类https://www.rlyj.net.cn/fileup/HTML/2022-36-11-006.shtml
13.「机器学习」机器学习在计量经济学中的运用「机器学习」机器学习在计量经济学中的运用,伴随着电子信息技术的发展趋势,机器学习技术性广泛运用于工业领域各行各业。传统计量经济学与机器学习拥有 一同的理论基础和同样的研究思路,另外从科学研究方法与目地,对模型的规定、模型检测方法都拥有 显著的差别。针对传统计量经济学存有众多不够,比如基础理论假定过强、样https://www.dtstack.com/news/7620
14.七月在线具身智能机器人复现实战营 [复现实战UMI/DexCap] 免费试听 录播 实训 答疑结合,且每天答疑 机器学习集训营19 [双11期间2799¥秒杀,24年最新一期新增大模型] 免费试听 随到随学,项目代码课件答疑一应俱全 CV高级小班 第12期 [最好CV课程,一次报名 服务三年] http://julyedu.com/
15.文本分析及机器学习在影视传媒中的应用——以电视剧《狂飙》为例可见,将《狂飙》作为研究对象,可以很好的探究“顶流热剧”何以生成与建构,溯源其“走红”内在肌理、必备要素与发生机制,为今后的影视剧创作具有重要的借鉴意义。本文以豆瓣网为数据库,通过Python工具对《狂飙》豆瓣网长评进行数据抓取,利用文本分析与机器学习的技术,从观众回馈角度使用定量方法对《狂飙》http://ex.chinadaily.com.cn/exchange/partners/82/rss/channel/cn/columns/snl9a7/stories/WS64be1db0a3109d7585e4635f.html
16.谭庆收(博士)1.国家自然科学基金面上项目,噪声环境中机器学习辅助的量子计量学 研究,批准号:12275077,2023年1月至2026年12月。 2.国家自然科学基金青年项目,超冷原子腔光机械系统中的量子效应及 应用,批准号:11805047,2019年1月至2021年12月。 3.国家自然科学基金地区项目,玻色-爱因斯坦凝聚体中偶极-偶极与三 https://wdxy.hnist.cn/info/1102/4517.htm