《百面机器学习》拾贝第二章:模型评估Ariel一只猫的旅行

“没有测量,就没有科学。”这是科学家门捷列夫的名言。在计算机科学特别是机器学习领域中,对模型的评估同样至关重要。只有选择与问题相匹配的评估方法,才能快速地发现模型选择或训练过程中出现的问题,迭代地对模型进行优化。模型评估主要分为离线评估和在线评估两个阶段。针对分类、排序、回归、序列预测等不同类型的机器学习问题,评估指标的选择也有所不同。知道每种评估指标的精确定义、有针对性地选择合适的评估指标、根据评估指标的反馈进行模型调整,这些都是机器学习在模型评估阶段的关键问题,也是一名合格的算法工程师应当具备的基本功。

01评估指标的局限性

在模型评估过程中,分类问题、排序问题、回归问题往往需要使用不同的指标进行评估。在诸多的评估指标中,大部分指标只能片面地反映模型的一部分性能。如果不能合理地运用评估指标,不仅不能发现模型本身的问题,而且会得出错误的结论。

Q1:准确率的局限性

A1:准确率是分类问题中最简单也是最直观的评价指标,但存在明显的缺陷。比如,当负样本占99%时,分类器把所有样本都预测为负样本也可以获得99%的准确率。所以,当不同类别的样本比例非常不均衡时,占比大的类别往往成为影响准确率的最主要因素。

Q2:精确率与召回率的权衡

A:首先要明确两个概念,精确率和召回率.

精确率是指分类正确的正样本个数占分类器判定为正样本个数的比例;

召回率是指分类正确的正样本个数占真正的正样本个数的比例.

在排序问题中,通常没有一个确定的阈值把得到的结果直接判定为正样本或负样本,而是采用TopN返回结果的Precision值和Recall值来衡量排序模型的性能,即认为模型返回的TopN的结果就是模型判定的正样本,然后计算前N个位置上的准确率Precision@N和前N个位置上的召回率Recall@N。Precision值和Recall值是既矛盾又统一的两个指标,为了提高Precision值,分类器需要尽量在“更有把握”时才把样本预测为正样本,但此时往往会因为过于保守而漏掉很多“没有把握”的正样本,导致Recall值降低。

Q3:平方根误差的"意外"

A3:RMSE经常被用来衡量回归模型的好坏,公式:

每个评估指标都有其价值,但如果只从单一的评估指标出发去评估模型,往往会得出片面甚至错误的结论;只有通过一组互补的指标去评估模型,才能更好地发现并解决模型存在的问题,从而更好地解决实际业务场景中遇到的问题。

02ROC曲线

Q1:什么是ROC曲线?

A1:

只看定义确实有点绕,为了更直观地说明这个问题,我们举一个医院诊断病人的例子。假设有10位疑似癌症患者,其中有3位很不幸确实患了癌症(P=3),另外7位不是癌症患者(N=7)。医院对这10位疑似患者做了诊断,诊断出3位癌症患者,其中有2位确实是真正的患者(TP=2)。那么真阳性率TPR=TP/P=2/3。对于7位非癌症患者来说,有一位很不幸被误诊为癌症患者(FP=1),那么假阳性率FPR=FP/N=1/7。对于“该医院”这个分类器来说,这组分类结果就对应ROC曲线上的一个点(1/7,2/3)。

Q2:如何绘制ROC曲线

Q3:如何计算AUC?

A3:AUC指的是ROC曲线下的面积大小,该值能够量化地反映基于ROC曲线衡量出的模型性能。计算AUC值只需要沿着ROC横轴做积分就可以了。由于ROC曲线一般都处于y=x这条直线的上方(如果不是的话,只要把模型预测的概率反转成1p就可以得到一个更好的分类器),所以AUC的取值一般在0.5~1之间。AUC越大,说明分类器越可能把真正的正样本排在前面,分类性能越好。

Q4:ROC曲线相比P-R曲线有什么特点?

A4:相比P-R曲线,ROC曲线有一个特点,当正负样本的分布发生变化时,ROC曲线的形状能够基本保持不变,而P-R曲线的形状一般会发生较剧烈的变化。这个特点让ROC曲线能够尽量降低不同测试集带来的干扰,更加客观地衡量模型本身的性能。

03余弦距离的作用

在机器学习问题中,通常将特征表示为向量的形式,所以在分析两个特征向量之间的相似性时,常使用余弦相似度来表示。余弦相似度的取值范围是[1,1],相同的两个向量之间的相似度为1。如果希望得到类似于距离的表示,将1减去余弦相似度即为余弦距离。因此,余弦距离的取值范围为[0,2],相同的两个向量余弦距离为0。

Q1:结合你的学习和研究经历,探讨为什么在一些场景中要使用余弦相似度而不是欧氏距离?

Q2:余弦距离是否是一个严格定义的距离

04A/B测试的陷阱

在互联网公司中,A/B测试是验证新模块、新功能、新产品是否有效,新算法、新模型的效果是否有提升,新设计是否受到用户欢迎,新更改是否影响用户体验的主要测试方法。在机器学习领域中,A/B测试是验证模型最终效果的主要手段。

Q1:在对模型进行过充分的离线评估之后,为什么还要进行在线A/B测试?

Q2:如何进行线上A/B测试

A2:进行A/B测试的主要手段是进行用户分桶,即将用户分成实验组和对照组,对实验组的用户施以新模型,对对照组的用户施以旧模型。在分桶的过程中,要注意样本的独立性和采样方式的无偏性,确保同一个用户每次只能分到同一个桶中,在分桶过程中所选取的user_id需要是一个随机数,这样才能保证桶中的样本是无偏的。

Q3:如何划分实验组和对照组

A3:P56-P57

05模型评估的方法

Q1:在模型评估过程中,有哪些主要的验证方法,它们的优缺点是什么

A1:

>Holdout检验

>交叉检验

>自助法

Q2:在自助法的采样过程中,对n个样本进行n次自助抽样,当n趋于无穷大时,最终有多少数据从未被选择过?

06超参数调优

Q:超参数有哪些调优方法

A:

07过拟合与欠拟合

Q1:在模型评估过程中,过拟合和欠拟合具体是指什么现象?

A1:过拟合是指模型对于训练数据拟合呈过当的情况,反映到评估指标上,就是模型在训练集上的表现很好,但在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好的情况。

Q2:能否说出几种降低过拟合和欠拟合风险的方法?

A2:

■降低“过拟合”风险的方法(1)从数据入手,获得更多的训练数据。使用更多的训练数据是解决过拟合问题最有效的手段,因为更多的样本能够让模型学习到更多更有效的特征,减小噪声的影响。当然,直接增加实验数据一般是很困难的,但是可以通过一定的规则来扩充训练数据。比如,在图像分类的问题上,可以通过图像的平移、旋转、缩放等方式扩充数据;更进一步地,可以使用生成式对抗网络来合成大量的新训练数据。(2)降低模型复杂度。在数据较少时,模型过于复杂是产生过拟合的主要因素,适当降低模型复杂度可以避免模型拟合过多的采样噪声。例如,在神经网络模型中减少网络层数、神经元个数等;在决策树模型中降低树的深度、进行剪枝等。(3)正则化方法。给模型的参数加上一定的正则约束,比如将权值的大小加入到损失函数中。以L2正则化为例:

THE END
1.线上教育最新动态,最新趋势挑战与展望核心团队摘要:线上教育正逐渐成为最新的教育趋势,其灵活性和便捷性备受推崇。线上教育也面临着诸多挑战,如技术难题、教学质量保障、学生学习效果评估等。本文简要概述了线上教育的最新动态,重点探讨了其发展趋势以及所面临的挑战,旨在帮助人们更全面地了解线上教育的现状和未来发展方向。 https://www.xcyiot.cn/post/4759.html
2.线上学习优缺点.pdf线上学习优缺点 线上学习虽然让孩子们离开了校园在家进行学习,但依然按照学校的作息进 行学习,这样的学习方式让孩子们更独立,每天坚持读书,坚持运动,有助于意 志培养,更加自律。另外线上的授课虽然少了老师的督促,但也促使着孩子有更 多的时间去思考学习的动机,养成自主学习的好习惯。 https://max.book118.com/html/2024/1021/7060151101006163.shtm
3.线上教学的优缺点是什么?前几年,由于种种原因,线上教学方式得到极大地普及,上网课一度成为各大中小学及高校的常态,在此期间,线上教学平台也获得了极大的发展。如今,线下教学回归正常,那么线上教学是否还有存在的必要,这要从线上教学是是否还有需求及线上教学的优缺点进行全面分析,本文将结合博思白板boardmix来为大家分析线上教学的优缺点及https://boardmix.cn/article/onlineteachinganalysis/
4.线上学习的优势与挑战培训动态课程动态随着互联网的发展,线上学习作为一种新兴的学习方式,逐渐受到人们的关注和青睐。线上学习以其便捷、灵活的特点,成为许多人获取知识、提升技能的重要途径。然而,在享受线上学习带来便利的同时,我们也需要正视其存在的挑战和问题,以更好地应对并优化学习体验。 http://www.hr188.cn/news_34.html
5.线上教学的优缺点是什么线上教学的优缺点是什么 疫情期间,在这样一个学生不能正常上学的特殊时期,开展网络直播教学成了我们当前落实“停课不停学”工作的主要方法,线上教学的效果如何?有什么优势和缺点呢? 1线上教学的优点 1、线上教学突破了地域限制。老师和学生只要通过一台电脑、一部手机就可以开展教学活动,解决了因疫情防控而不能http://m.gaosan.com/gaokao/317420.html
6.网课优缺点总结(通用13篇)3、多进行统一时间的检测。及时掌握学生学习动态并反馈。 网课优缺点总结4 线上教学工作总结本该热闹的校园静悄孤寂,看不到升旗台上飘扬的国旗,感受不到老师们讲课的热情洋溢,听不到孩子们在走廊上富有生气的喧哗,显然,是疫情让这一切定格在了暂停键。 https://www.ruiwen.com/zongjie/6783578.html
7.线上学习的优缺点线上学习是先下疫情形势下保持学生学习状态下的学习方式之一。线上学习,对于大家来说并不陌生,在这我们一起讨论一下这个线上学习的优缺点。 优点: 1、线上学习是当前形式下的学习形式之一。 2、线上学习,让学生在老师的直播课堂结束后查漏补缺,再观看回放,找寻不懂的问题的答案。 https://quan.qlteacher.com/u/573eb7140cf223fc04745a15/blog/62495f6830b9d912b26c0731
8.线上学习和线下学习的优缺点英文免费文案+PPT模板下载在当今数字化时代,线上学习和线下学习都为学习者提供了不同的学习体验和效果。这两种学习方式各有其优缺点,下面我们将详细探讨它们。线上学习的优点灵活性线上学习 在当今数字化时代,线上学习和线下学习都为学习者提供了不同的学习体验和效果。这两种学习方式各有其优缺点,下面我们将详细探讨它们。线上学习的https://www.pptsupermarket.com/richbodyshow/aWQ9NTMwMDc3JmtleXdvcmQ9
9.线上作业和线下作业的优缺点线上作业和线下作业各有优缺点,具体如下:线上作业的优点:1.灵活性强:学生可以在任何时间、任何地点完成作业,不受时间和空间限制。2.反馈及时:线上作业通常可以自动批改,学生可以即时获得成绩和反馈,及时调整学习进度和方向。节省资源:线上作业不需要纸质材料和手写答题,节省了大量纸张和笔墨等资源https://wen.baidu.com/question/754930843102359972.html
10.线上学画画出精彩(网上中国)傅东黎重视教学的及时互动,充分利用线上平台的视频会议模式。例如,在作品点评环节,被点评到的同学需要打开摄像头对着作品,这样傅东黎可以及时查看学生的进展,在需要时放大画面,指出优缺点,也供其他学生学习参考。 《清明上河图》中的城市与建筑、《怪木竹石图》与苏轼的书画实践、《富春山居图》探析、《韩熙载夜宴图https://m.haiwainet.cn/middle/3541093/2022/0516/content_32420188_1.html
11.线上线下混合教学总结范文(精选22篇)从中我也有很大的感悟,首先我通过这次线上教学对学生们每个人的学习有了一定的把控,哪些学生的自觉性高,哪些学生对待学习的态度懒散,其实这一眼就可以看出来,这比平时线下教学要更加明晰一些。此外,我也能够看到整个班级的一些优缺点,学生们对待学习的积极性和专一度都是有所不同的,在我教的两个班里,有一个班https://www.oh100.com/kaoshi/jiaoxuezongjie/644221.html
12.线上教学的优缺点及建议线上教学过程中,教师应尽可能避免单纯的"主播"表演、学生收看的模式,应该转变为网络"导播",让学生跟随老师的指导参与教学互动。授课过程中尽可能加强师生互动,可以通过课堂连麦、线上答疑、评论作答等形式,提升学生的参与度和专注度,引导学生自主完成学习任务。 以上就是小编整理的线上教学的优缺点,供参考!http://m.chusan.com/zhongkao/121165.html
13.2023年小学线上教学工作方案根据学生数学程度不同进行分组,每个组都有优、中、差三类学生,确定小组长,组内成员依据个人能力可以帮一个或多个同学,组长进行监督并提醒组员按时完成每天的任务,充分利用尖子生的带动作用,让每个人都找到自己的价值。 4.分层辅导,注重实效 根据线上学习效果检测情况,确定班级数学尖子生、中等生和学困生,具体到人。https://www.pinda.com/zhichang/gongzuofangan/131575.html
14.招生网代理平台线上招生招生合作公司2.售后保障 未通过学员可以免费线上继续跟班课,直到考过。3.低于市场价格学习减轻学员学习负担,降低入门门槛 4.每位老师都有丰富的授课经验会根据学生薄弱(培养良好习惯与以前缺点形成互补以达到和谐状态)”原则,实现“以心理辅导与行为习惯训练为基础,以军事训练、亲情教育与感恩励志教育为补充,推动学员成人成才https://yx.360yuxue.com/
15.线上学习简报(通用15篇)线上学习简报(通用15篇) 在不断进步的社会中,许多人对一些广为流传的简报都不陌生吧,简报不是“刊”,而是“报”,说它是刊物,不如说是“小报”更恰切些。你知道简报怎样才能写的好吗?下面是小编收集整理的线上学习简报,欢迎大家分享。 线上学习简报1 https://www.unjs.com/fanwenwang/jianbao/20230308152049_6615209.html