机器学习知到智慧树章节测试课后答案2024年秋山东科技大学.docx

机器学习知到智慧树章节测试课后答案2024年秋山东科技大学第一章单元测试

机器学习最主要的两种形式是监督学习和无监督学习。()

A:错B:对

答案:对机器学习的核心是算法。()

A:对B:错

答案:对过拟合只是监督学习中的问题,对于无监督学习影响不大。()

答案:错下面哪句话是正确的()

A:机器学习模型的精准度越高,则模型的性能越好B:其余说法都不对C:增加模型的复杂度,总能减小测试样本误差D:增加模型的复杂度,总能减小训练样本误差

答案:增加模型的复杂度,总能减小训练样本误差下列属于无监督学习的是()

A:K-MeansB:决策树C:逻辑回归D:SVM

答案:K-Means

第二章单元测试

在实际应用中,选取损失函数的制约因素包括()。

答案:错线性回归算法、逻辑回归算法和支持向量机等监督式学习算法,都是经验损失最小化架构在具体问题中的表现。()

答案:对以下关于无约束经验损失最小化算法的说法哪个是正确的()

A:“无约束”的意思是模型的选择不受任何约束,可以输出模型空间中的任何模型B:可以精确地拟合训练数据C:为了降低过拟合,在实际应用中大多会采用无约束经验损失最小化算法D:容易发生过渡拟合

答案:“无约束”的意思是模型的选择不受任何约束,可以输出模型空间中的任何模型;可以精确地拟合训练数据;容易发生过渡拟合以下关于结构损失最小化算法的说法哪个是错误的()

A:任何经验损失最小化算法,都可以通过正则化方法转化成结构损失最小化算法B:体现了奥卡姆剃刀法则思想C:不会发生过渡拟合D:带有正则化方法的经验损失最小化算法被称为结构损失最小化算法

答案:不会发生过渡拟合

第三章单元测试

以下是线性回归应用场景的是()

A:银行个人信用评估B:房价预测C:医生病理诊断D:垃圾邮件判断

答案:房价预测下列属于线性回归的分类的有()

A:单变量线性关系B:多变量线性关系C:非线性关系D:ABC都是

答案:ABC都是以下关于随机森林算法说法错误的是()

答案:随机森林分类算法的输出类别是由所有决策树输出类别的平均数来确定的。K均值算法的关键是?()

A:计算每一个样本和质心之间相似度所用的距离算法B:所选取数据集的大小C:选取数据样本的K个中心D:确定最终聚类类别数K

答案:错

第四章单元测试

梯度下降算法的正确步骤是什么?

(a)计算预测值和真实值之间的误差;(b)迭代更新,直到找到最佳权重;(c)把输入传入网络,得到输出值;(d)初始化随机权重和偏差;(e)对每一个产生误差的神经元,改变相应的(权重)值以减少误差。()

A:e,d,c,b,aB:c,b,a,e,dC:a,b,c,d,eD:d,c,a,e,b

答案:d,c,a,e,b随机梯度下降法缺点在于每次更新可能并不会按照正确的方向进行,参数更新具有高方差,从而导致损失函数剧烈波动。()

答案:对牛顿法是梯度下降法的进一步发展,牛顿法不仅使用目标函数的一阶偏导数,还进一步利用了目标函数的二阶偏导数,这样就考虑了梯度变化的趋势,因而能更全面地确定合适的搜索方向加快收敛,它具二阶收敛速度。()

答案:对坐标下降算法的优点是容易计算,同时收敛很快;缺点是当loss比较复杂时,会很明显的降低速度。()

答案:对通过梯度下降算法,计算方程取最小值(极小值)时候的最优解x。求解过程主要通过迭代优化方法完成迭代的方程为:

其中x为要求的解,为梯度(也就是导数或偏导,我们在这里用最简单的一元函数演示,所以直接写成导数),a为学习率(或称步长,是一个重要的参数,a的选择直接影响这着算法的效率)

答案:/zhs/onlineexam/ansewerImg/202210/8c1640e3e9a74f8b99972986850f0140.png

第五章单元测试

Logistic回归算法是模型假设为Sigmoid函数的经验损失最小化算法。()

答案:对Logistic回归属于()

A:概率型线性回归B:非概率性线性回归C:概率型非线性回归D:非概率型非线性回归

答案:概率型非线性回归Logistic回归可用于()

A:影响因素分析B:校正混杂因素C:预测D:其余选项都是

答案:其余选项都是关于分类和回归问题,下面说法正确的是()

A:回归和分类都是有监督学习问题。B:回归问题和分类问题都有可能发生过拟合。C:输出变量为有限个离散变量的预测问题是回归问题;输出变量为连续变量的预测问题是分类问题。D:一般来说,回归不用在分类问题上,但是也有特殊情况,比如Logistic回归可以用来解决0/1分类问题。

答案:回归和分类都是有监督学习问题。;回归问题和分类问题都有可能发生过拟合。;一般来说,回归不用在分类问题上,但是也有特殊情况,比如Logistic回归可以用来解决0/1分类问题。我们知道二元分类一般设定输出概率大于或等于0.5,则预测为正类;若输出概率小于0.5,则预测为负类。那么,如果将阈值0.5提高,例如0.6,大于或等于0.6的才预测为正类,则精确率(Precision)和召回率(Recall)会发生什么变化?()

A:召回率(Recall)增大。B:召回率(Recall)减小或者不变。C:精确率(Precision)减小。D:精确率(Precision)增大或者不变。

答案:召回率(Recall)减小或者不变。;精确率(Precision)增大或者不变。

第六章单元测试

SVM决策边界只会被支持向量影响,跟其它样本点无关。()

答案:对SVM使用高斯核函数之前通常会进行特征归一化,经过特征归一化得到的新特征通常优于旧特征。()

答案:对下面关于SVM原理的说法错误的是:()

A:分类超平面的法向量可用于计算样本与分类超平面之间的最短距离。B:最大化间隔就是最大化,其中w是分类超平面的法向量C:在样本线性不可分的情况下引入核函数是一个明智的选择。D:SVM通过计算样本到分类超平面的最大距离来确定最优模型。

答案:最大化间隔就是最大化,其中w是分类超平面的法向量下列关于SVM的应用场景说法正确的是(多选):()

A:SVM在二分类问题上表现突出。B:SVM思想能够应用于回归问题。C:SVM能够解决多分类问题。D:SVM能够实现异常值检测。

答案:SVM在二分类问题上表现突出。;SVM思想能够应用于回归问题。;SVM能够解决多分类问题。;SVM能够实现异常值检测。关于SVM核函数,下列说法中错误的是:()

A:常见的核函数有线性核、高斯核、多项式核、Sigmoid核等。B:核函数把特征映射到的空间维度越高越好。C:核函数是一种将某一类输入映射为某一类输出的函数。D:核函数的引入极大地提升了SVM在线性不可分场景下的模型的稳健性。

答案:核函数把特征映射到的空间维度越高越好。

第七章单元测试

以下哪项关于决策树的说法是错误的()

A:子树可能在决策树中重复多次B:决策树算法对于噪声的干扰非常敏感C:冗余属性不会对决策树的准确率造成不利的影响D:寻找最佳决策树是NP完全问题

答案:决策树算法对于噪声的干扰非常敏感以下关于决策树原理介绍错误的有()。

A:决策树算法本质上是贪心算法B:决策树生成过程中需要用到分割法C:决策树算法属于无监督学习D:决策树决策过程从根节点开始

A:增加树的深度B:减少树的数量C:减少树的深度D:增大学习率

答案:减少树的深度决策树的说法正确的是()。

A:它易于理解、可解释性强B:CART使用的是二叉树C:其可作为分类算法,也可用于回归模型D:不能处理连续型特征

答案:它易于理解、可解释性强;CART使用的是二叉树;其可作为分类算法,也可用于回归模型决策树的生成只考虑局部最优,相对地,决策树的剪枝则考虑全部最优。()

答案:对

第八章单元测试

有关循环神经网络(RNN)的理解,以下哪些说法是正确的?()

A:对于只有在最后一个时刻有输出的RNN,可以拟合输出的时序数据之间的关系对应的类别,例如商超客户的消费行为分析B:某个时刻t,隐层神经元拟合了上一时刻输入与输出以及当前输入与输出的关系C:RNN不能处理数值型时序的数据,例如由某行业几个月的平均股票价格预测未来月份的平均股票价格D:某个时刻t输入和输出之间的关系可以通过隐层神经元拟合

答案:对于只有在最后一个时刻有输出的RNN,可以拟合输出的时序数据之间的关系对应的类别,例如商超客户的消费行为分析;某个时刻t,隐层神经元拟合了上一时刻输入与输出以及当前输入与输出的关系;某个时刻t输入和输出之间的关系可以通过隐层神经元拟合长短期记忆网络(LSTM)通过遗忘门减少一般循环神经网络(RNN)的短期记忆不足,但增加算法的计算复杂度。()

答案:对误差的反向传播,即从第一个隐藏层到输出层,逐层向前修改神经元的连接权值参数,使得损失函数值最小。()

答案:对Sigmoid函数在变量取绝对值非常大的正值或负值时会出现饱和现象,意味着函数会变得很平,并且对输入的微小改变会变得不敏感。在反向传播时,当梯度接近于0,权重基本不会更新,很容易就会出现梯度消失的情况,从而无法完成深层网络的训练。()

答案:对设输入为,滤镜(卷积核)为,在步幅为1且无填充等其他特殊处理的情况下,请计算卷积生成的镜像V

答案:/zhs/onlineexam/ansewerImg/202210/052ff6ac98984a6a98e61c1323130b31.png

第九章单元测试

局部线性嵌入法的基本思想是保持样本点之间距离经降维后不改变。()

答案:错下列关于自动编码器说法错误的是()

A:自动编码器是神经网络在降维问题中的应用。B:自动编码器是一种无监督学习,不需要损失函数。C:自动编码器由编码器和解码器两部分组成。D:自动编码器算法的目标是:训练编码器与解码器,使得重构误差最小。

答案:自动编码器是一种无监督学习,不需要损失函数。线性判别分析法的目标是()

A:类间区别尽可能小,类内区别尽可能大。B:类间区别尽可能小,类内区别尽可能小。C:类间区别尽可能大,类内区别尽可能小。D:类间区别尽可能大,类内区别尽可能大。

答案:类间区别尽可能大,类内区别尽可能小。下列方法中,可以用于特征降维的方法包括()

A:最小二乘法LeastSquaresB:线性判别分析法LDAC:主成分分析法PCAD:自动编码器AE

答案:线性判别分析法LDA;主成分分析法PCA;自动编码器AE下列关于PCA说法正确的是()

A:在使用PCA之前,通常需要对数据进行标准化放缩。B:可以使用PCA在低维空间中可视化数据。C:优先选择具有最小方差的主成分。D:优先选择具有最大方差的主成分。

答案:在使用PCA之前,通常需要对数据进行标准化放缩。;可以使用PCA在低维空间中可视化数据。;优先选择具有最大方差的主成分。

第十章单元测试

下列哪些属于聚类算法()

A:K-中心点B:KNNC:K-meansD:DBSCAN

答案:K-中心点;K-means;DBSCANK-means的主要缺点之一是其简单地使用了平均值作为簇的中心。()

答案:对合并聚类算法是经典的层级聚类算法,合并聚类算法不是贪心算法。()

答案:错DBSCAN算法的优点有?()。

A:不需要指定最小样本量和半径两个参数B:可以处理噪声点C:不需要划分个数。跟K-means比起来,DBSCAN可以自动分出类别个数D:可以处理任意形状的空间聚类问题

答案:可以处理噪声点;不需要划分个数。跟K-means比起来,DBSCAN可以自动分出类别个数;可以处理任意形状的

THE END
1.databook随笔分类wangyb摘要:一个优秀的数据应用不仅仅是功能的强大,更在于其用户体验的打造。 而良好的页面布局,作为用户体验的重要组成部分,不仅能够提升信息的可读性,还能引导用户高效地完成操作。 反之,混乱的布局会让人感到困惑和挫败,甚至导致用户放弃使用应用。 在Streamlit中,Sidebar(侧边栏)、Columns(列阅读全文 https://www.cnblogs.com/wang_yb/category/2017844.html
2.社区Edge AI是边缘计算的研究方向之一,它将人工智能算法和模型推送到边缘设备,使其具备处理复杂数据的能力。随着硬件的不断进步,越来越多的智能设备能够在本地进行推理和决策,而无需将数据发送到云端。Intel和NVIDIA等公司也在加速边缘计算硬件的研发,提升计算能力以应对复杂的AI任务。 https://open.alipay.com/portal/forum/post/192201027
3.中国建设银行申请数据分析方法相关专利,能解决无法及时有效识别和发专利摘要显示,本申请提供了一种数据分析方法、装置、设备、介质及产品。属于网络安全技术领域,该方法包括:获取各机构报送的各机构的从业人员的行为数据;对行为数据进行数据清洗和数据格式转换后,存入空白数据集中,得到行为数据集;采用关联规则挖掘算法挖掘行为数据集中行为数据之间的关联性,得到目标关联规则;根据聚类分析算https://www.163.com/dy/article/JJN5Q8DK0519QIKK.html
4.科学网—人工智能赋能科学与工程前沿——知识与数据融合之径人类的认知过程是从数据、信息、知识到智慧螺旋上升的,数据驱动的人工智能在这段时间已明显发现短板,数据和物理规律、数据与模型、物理信息神经网络等等旨在知识和数据双驱动的人工智能被提上日程。 但知识与数据如何双驱动属于探索的“前沿”。在数据集、特征工程、激活函数、网络结构(比如,约束条件,网络参数)、损失函https://blog.sciencenet.cn/home.php?mod=space&uid=32670&do=blog&id=1465224
5.恒生活:人工智能升级传统商业智能太原新闻网在商业智能中,AI可以通过自动化数据挖掘、实时数据分析等技术,为企业提供更加及时、准确的数据支持和分析结果。 三、人工智能升级商业智能的优势 提高效率和准确性 AI技术能够自动化处理大量数据,提高数据处理和报表生成的效率。 AI的预测和决策支持功能能够为企业提供更加准确的业务洞察和决策依据。 http://www.tynews.com.cn/system/2024/12/16/030834478.shtml
6.电子商务运营与管理练习题库及答案3. 在电子商务运营中,客户关系管理主要包括客户信息管理。() 4. 电子商务运营策略包括安全策略。() 5. 电子商务运营成功的关键因素是广告投放。() 6. 电子商务运营的法律法规包括《中华人民共和国反不正当竞争法》。() 7. 电子商务运营中的知识产权保护措施包括数据挖掘。() 8. 电子商务运营中的物流管理不包https://wenku.baidu.com/view/0c23642ede88d0d233d4b14e852458fb760b38d3.html
7.10.ChatGPT实战:10个实用技巧和窍门(10/10)简洁性:用户不需要进行复杂的查询操作,只需提出问题即可。 扩展性:如果需要更详细的信息,可以通过调整max_tokens参数来增加生成文本的长度。 使用ChatGPT快速获取信息的技巧可以应用于多种场景,包括学术研究、市场分析、技术问题解答等,大大提高了信息检索的效率和便捷性。 https://cloud.tencent.com/developer/article/2478408
8.数据挖掘主要包含哪些功能?数据挖掘的功能数据挖掘的功能主要包括,数据分类、数据估计、数据预测、数据关联分组、数据聚类,及数据循序样式采矿等六大功能。 数据分类 数据分类为数据挖掘中常见的功能之一,顾名思义即是将分析对象依不同的属性分类加以定义,建立不同的类组。数据挖掘中的分类是指针对未发生的结果进行预测分类,主要包括归纳和推论两步骤,其主要目https://blog.csdn.net/duozhishidai/article/details/87968943
9.数据挖掘的功能不包括下列哪种分析?A聚类分析B关联分析C数据挖掘的功能不包括下列哪种分析? A、聚类分析 B、关联分析 C、挖掘分析 D、分类分析 点击查看答案进入小程序搜题 你可能喜欢 霍兰德职业倾向测验结果不是简单的类型对应,这一测试只提供了一些适合的职业方向,并不代表最终的定位。( ) 点击查看答案进入小程序搜题 ( )由电位移矢量和电场强度的关系式可知,二者https://m.ppkao.com/wangke/daan/a0fbb091e7a44f7f9c79fcf582a2db67
10.数据挖掘的功能不包括()A聚类B概念描述C偏差检测D数据存储数据挖掘的功能不包括( )A.聚类 B.概念描述 C.偏差检测 D.数据存储该题目是单项选择题,请记得只要选择1个答案!正确答案 点击免费查看答案 试题上传试题纠错TAGS数据挖掘发掘功能不包括聚类概念描述 关键词试题汇总大全本题目来自[12题库]本页地址:https://www.12tiku.com/newtiku/919819/27403562.htmlhttps://m.12tiku.com/newtiku/919819/27403562.html
11.数据挖掘论文1.Intelligent Miner这是IBM公司的数据挖掘产品,它提供了很多数据挖掘算法,包括关联、分类、回归、预测模型、偏离检测、序列模式分析和聚类。有2个特点:一是它的数据挖掘算法的可伸缩性;二是它与IBM/DB/2关系数据库系统紧密地结合在一起。 2.EineSet是由SGI公司开发的,它也提供了多种数据挖掘方法,包括关联分析和https://www.unjs.com/lunwen/f/20220924130749_5650839.html
12.数据挖掘的主要功能包括()。数据挖掘的主要功能包括( )。 A. 关联分析 B. 趋势分析 C. 分类和预测 D. 聚类分析 E. 离群点分析 如何将EXCEL生成题库手机刷题 如何制作自己的在线小题库 > 手机使用 参考答案: A C D E 复制 纠错 参考解析: 关联分析;分类和预测;聚类分析 AI解析https://www.shuashuati.com/ti/066734b2c76544febe60ea86e6715b2f.html
13.数据仓库和数据挖掘12篇(全文)(一) 数据挖掘的功能特征 (1) 自动预测趋势和行为:数据挖掘摒弃了以往的采用大量手工方式分析问题的路线, 能够自动的从大型的数据库中找到预测性信息。迅速而直接的根据数据本身, 得出结论。 (2) 关联分析:数据关联是数据库中一类存在的可被发现的重要知识。假若两个或多个变量的取值之间存在某种规律性, 就可以称https://www.99xueshu.com/w/ikeyy9nb2adc.html
14.急诊业务系统有哪些功能急诊科需要对患者的病情、治疗效果以及医疗资源的利用情况进行统计分析,以便及时发现并解决存在的问题。系统可以提供常规的统计分析功能,包括患者的年龄段、病种分布、病床使用率等等。 小标题二:数据挖掘分析 通过对急诊科的大量数据进行挖掘和分析,可以发现一些隐藏的规律和特征,为急救工作提供更加精准的指导和支持。系统https://h.chanjet.com/ask/c56fea98ed6b6.html
15.2022年泸州公需科目答案51教学网2.信息检索和数据挖掘都是从数据中发现有价值的“东西"A.正确 正确答案:A 3.百度搜索引擎是一个集信息控集、信息存储、信息组织。信息交流等信息功能为-体的,具备强大信息辅助功能的网络信息工具。A.正确 正确答案:A 4.本讲是到习近平总书记在党的十九大报告中指出:“有事好商量众人的事情由众人商量是人民民主https://www.51jiaoxue.cn/post/1321.html
16.大连理工大学学科评价中心数据库与数据平台简介2.2数据挖掘功能 数据挖掘功能主要包括学科研究方向分析、高层次人才分析、学科诊断性分析、学科发展趋势分析。 图2-3展示了数据库的学科方向分析功能,主要通过带有论文关键字和教师姓名的中外文学术论文数据,借用知识图谱等分析工具,分析不同高校某一学科的领域及研究热点。该功能还能实现研究领域和热点的地区与全国对比、http://xkpj.dlut.edu.cn/info/1072/1599.htm
17.怎么激活RapidMiner数据挖掘软件RapidMiner安装激活教程详解今天新片场素材小编给大家分享得是RapidMiner 9的激活教程,此教程可以帮助大家,只需要简单的复制粘贴即可免费使用全部功能,下面有详细的激活教程,需要的朋友不要错过哦! RapidMiner下载地址: RapidMiner(数据挖掘) v9.10 32位 英文破解版 附激活教程 类型:数据库类 https://edu.xinpianchang.com/article/baike-1672.html
18.样题47.箱式穿梭车系统组成不包括()。 储存与搬运系统 发货系统 托盘式穿梭车系统 收货系统 48.()借鉴仿生学思想,用数学语言抽象描述知识,用以模仿生物体系和人类的智能机制。 自动识别技术 物流仿真技术 人工智能技术 数据挖掘技术 49.()是指企业必须拥有的终极信念,是企业哲学中起主导性作用的重要组成部分。 核心价值https://www.wjx.cn/jq/98260724.aspx
19.单细胞分析的相关数据库教程其中scRNASeqDB主要收录的是来自GEO的生物医学单细胞测序数据。 CellMarker:CellMarkers可以查看不同细胞群体的marker基因,或者输入一个基因,数据库就可以告诉我们该基因属于哪种组织、哪种细胞。 ArrayExpress:这个数据库的优势在于能够做简单数据挖掘,有专门的单细胞测序板块、方便用户使用有整理好的数据供下载分析挖掘,http://m.yunbios.net/Database-on-single-cell-analysis.html
20.数据挖掘有哪些功能导读随着大数据发展越来越好,数据挖掘成为了未来发展的一大趋势,数据挖掘和分析技术在各行业发挥着重要作用,小编为大家整理了数据挖掘的具体功能介绍,一起来看看吧。 数据挖掘有哪些功能: 数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五https://www.baijiao.org/school/zhengzhouxinyingdajiaoyu/news/14499.html
21.定量数据分析工具有哪些帆软数字化转型知识库SAS提供了丰富的统计分析和数据挖掘功能,包括描述统计、回归分析、时间序列分析、因子分析、聚类分析等。SAS的核心功能是其强大的数据处理和分析能力,用户可以通过编写SAS程序对数据进行处理和分析。SAS还支持多种数据格式的导入和导出,包括Excel、CSV、TXT等,用户可以方便地将数据导入到SAS中进行分析。https://www.fanruan.com/blog/article/107356/