《百面机器学习》拾贝第二章:模型评估Ariel一只猫的旅行

“没有测量,就没有科学。”这是科学家门捷列夫的名言。在计算机科学特别是机器学习领域中,对模型的评估同样至关重要。只有选择与问题相匹配的评估方法,才能快速地发现模型选择或训练过程中出现的问题,迭代地对模型进行优化。模型评估主要分为离线评估和在线评估两个阶段。针对分类、排序、回归、序列预测等不同类型的机器学习问题,评估指标的选择也有所不同。知道每种评估指标的精确定义、有针对性地选择合适的评估指标、根据评估指标的反馈进行模型调整,这些都是机器学习在模型评估阶段的关键问题,也是一名合格的算法工程师应当具备的基本功。

01评估指标的局限性

在模型评估过程中,分类问题、排序问题、回归问题往往需要使用不同的指标进行评估。在诸多的评估指标中,大部分指标只能片面地反映模型的一部分性能。如果不能合理地运用评估指标,不仅不能发现模型本身的问题,而且会得出错误的结论。

Q1:准确率的局限性

A1:准确率是分类问题中最简单也是最直观的评价指标,但存在明显的缺陷。比如,当负样本占99%时,分类器把所有样本都预测为负样本也可以获得99%的准确率。所以,当不同类别的样本比例非常不均衡时,占比大的类别往往成为影响准确率的最主要因素。

Q2:精确率与召回率的权衡

A:首先要明确两个概念,精确率和召回率.

精确率是指分类正确的正样本个数占分类器判定为正样本个数的比例;

召回率是指分类正确的正样本个数占真正的正样本个数的比例.

在排序问题中,通常没有一个确定的阈值把得到的结果直接判定为正样本或负样本,而是采用TopN返回结果的Precision值和Recall值来衡量排序模型的性能,即认为模型返回的TopN的结果就是模型判定的正样本,然后计算前N个位置上的准确率Precision@N和前N个位置上的召回率Recall@N。Precision值和Recall值是既矛盾又统一的两个指标,为了提高Precision值,分类器需要尽量在“更有把握”时才把样本预测为正样本,但此时往往会因为过于保守而漏掉很多“没有把握”的正样本,导致Recall值降低。

Q3:平方根误差的"意外"

A3:RMSE经常被用来衡量回归模型的好坏,公式:

每个评估指标都有其价值,但如果只从单一的评估指标出发去评估模型,往往会得出片面甚至错误的结论;只有通过一组互补的指标去评估模型,才能更好地发现并解决模型存在的问题,从而更好地解决实际业务场景中遇到的问题。

02ROC曲线

Q1:什么是ROC曲线?

A1:

只看定义确实有点绕,为了更直观地说明这个问题,我们举一个医院诊断病人的例子。假设有10位疑似癌症患者,其中有3位很不幸确实患了癌症(P=3),另外7位不是癌症患者(N=7)。医院对这10位疑似患者做了诊断,诊断出3位癌症患者,其中有2位确实是真正的患者(TP=2)。那么真阳性率TPR=TP/P=2/3。对于7位非癌症患者来说,有一位很不幸被误诊为癌症患者(FP=1),那么假阳性率FPR=FP/N=1/7。对于“该医院”这个分类器来说,这组分类结果就对应ROC曲线上的一个点(1/7,2/3)。

Q2:如何绘制ROC曲线

Q3:如何计算AUC?

A3:AUC指的是ROC曲线下的面积大小,该值能够量化地反映基于ROC曲线衡量出的模型性能。计算AUC值只需要沿着ROC横轴做积分就可以了。由于ROC曲线一般都处于y=x这条直线的上方(如果不是的话,只要把模型预测的概率反转成1p就可以得到一个更好的分类器),所以AUC的取值一般在0.5~1之间。AUC越大,说明分类器越可能把真正的正样本排在前面,分类性能越好。

Q4:ROC曲线相比P-R曲线有什么特点?

A4:相比P-R曲线,ROC曲线有一个特点,当正负样本的分布发生变化时,ROC曲线的形状能够基本保持不变,而P-R曲线的形状一般会发生较剧烈的变化。这个特点让ROC曲线能够尽量降低不同测试集带来的干扰,更加客观地衡量模型本身的性能。

03余弦距离的作用

在机器学习问题中,通常将特征表示为向量的形式,所以在分析两个特征向量之间的相似性时,常使用余弦相似度来表示。余弦相似度的取值范围是[1,1],相同的两个向量之间的相似度为1。如果希望得到类似于距离的表示,将1减去余弦相似度即为余弦距离。因此,余弦距离的取值范围为[0,2],相同的两个向量余弦距离为0。

Q1:结合你的学习和研究经历,探讨为什么在一些场景中要使用余弦相似度而不是欧氏距离?

Q2:余弦距离是否是一个严格定义的距离

04A/B测试的陷阱

在互联网公司中,A/B测试是验证新模块、新功能、新产品是否有效,新算法、新模型的效果是否有提升,新设计是否受到用户欢迎,新更改是否影响用户体验的主要测试方法。在机器学习领域中,A/B测试是验证模型最终效果的主要手段。

Q1:在对模型进行过充分的离线评估之后,为什么还要进行在线A/B测试?

Q2:如何进行线上A/B测试

A2:进行A/B测试的主要手段是进行用户分桶,即将用户分成实验组和对照组,对实验组的用户施以新模型,对对照组的用户施以旧模型。在分桶的过程中,要注意样本的独立性和采样方式的无偏性,确保同一个用户每次只能分到同一个桶中,在分桶过程中所选取的user_id需要是一个随机数,这样才能保证桶中的样本是无偏的。

Q3:如何划分实验组和对照组

A3:P56-P57

05模型评估的方法

Q1:在模型评估过程中,有哪些主要的验证方法,它们的优缺点是什么

A1:

>Holdout检验

>交叉检验

>自助法

Q2:在自助法的采样过程中,对n个样本进行n次自助抽样,当n趋于无穷大时,最终有多少数据从未被选择过?

06超参数调优

Q:超参数有哪些调优方法

A:

07过拟合与欠拟合

Q1:在模型评估过程中,过拟合和欠拟合具体是指什么现象?

A1:过拟合是指模型对于训练数据拟合呈过当的情况,反映到评估指标上,就是模型在训练集上的表现很好,但在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好的情况。

Q2:能否说出几种降低过拟合和欠拟合风险的方法?

A2:

■降低“过拟合”风险的方法(1)从数据入手,获得更多的训练数据。使用更多的训练数据是解决过拟合问题最有效的手段,因为更多的样本能够让模型学习到更多更有效的特征,减小噪声的影响。当然,直接增加实验数据一般是很困难的,但是可以通过一定的规则来扩充训练数据。比如,在图像分类的问题上,可以通过图像的平移、旋转、缩放等方式扩充数据;更进一步地,可以使用生成式对抗网络来合成大量的新训练数据。(2)降低模型复杂度。在数据较少时,模型过于复杂是产生过拟合的主要因素,适当降低模型复杂度可以避免模型拟合过多的采样噪声。例如,在神经网络模型中减少网络层数、神经元个数等;在决策树模型中降低树的深度、进行剪枝等。(3)正则化方法。给模型的参数加上一定的正则约束,比如将权值的大小加入到损失函数中。以L2正则化为例:

THE END
1.在线学习的好处与坏处在线学习自诞生以来人们对其就褒贬不一,家长对孩子在线教育的不放心可以理解。其实,任何一种教育方式的存在,都有他的优缺点,这也包括家长们已经接受了的传统教育模式即班级授课制,接下来就跟随小编一起来了解一下 在线学习的好处与坏处吧 一、在线学习的好处 http://gaoweifuwu.com/pch5/article.php?id=1401
2.线上学习优缺点.pdf线上学习优缺点 线上学习虽然让孩子们离开了校园在家进行学习,但依然按照学校的作息进 行学习,这样的学习方式让孩子们更独立,每天坚持读书,坚持运动,有助于意 志培养,更加自律。另外线上的授课虽然少了老师的督促,但也促使着孩子有更 多的时间去思考学习的动机,养成自主学习的好习惯。 https://max.book118.com/html/2024/1021/7060151101006163.shtm
3.线上教学的优缺点及建议有哪些2线上教学缺点 1. 自主性加大,易忽视学科逻辑:学生在网络背景下学习,自主性加大,容易只关注心理顺序而忽视学科逻辑。 2. 教师不放心,干预过多:教师不习惯学生自主学习,担心学生无法抓住重点,不敢放手让学生获取知识、交流讨论、探求答案,导致过多干预。 http://m.chusan.com/zhongkao/366870.html
4.线上教学的优缺点是什么?前几年,由于种种原因,线上教学方式得到极大地普及,上网课一度成为各大中小学及高校的常态,在此期间,线上教学平台也获得了极大的发展。如今,线下教学回归正常,那么线上教学是否还有存在的必要,这要从线上教学是是否还有需求及线上教学的优缺点进行全面分析,本文将结合博思白板boardmix来为大家分析线上教学的优缺点及https://boardmix.cn/article/onlineteachinganalysis/
5.线上学习的优缺点线上学习是先下疫情形势下保持学生学习状态下的学习方式之一。线上学习,对于大家来说并不陌生,在这我们一起讨论一下这个线上学习的优缺点。 优点: 1、线上学习是当前形式下的学习形式之一。 2、线上学习,让学生在老师的直播课堂结束后查漏补缺,再观看回放,找寻不懂的问题的答案。 https://quan.qlteacher.com/u/573eb7140cf223fc04745a15/blog/62495f6830b9d912b26c0731
6.线上学习和线下学习的优缺点英文免费文案+PPT模板下载在当今数字化时代,线上学习和线下学习都为学习者提供了不同的学习体验和效果。这两种学习方式各有其优缺点,下面我们将详细探讨它们。线上学习的优点灵活性线上学习 在当今数字化时代,线上学习和线下学习都为学习者提供了不同的学习体验和效果。这两种学习方式各有其优缺点,下面我们将详细探讨它们。线上学习的https://www.pptsupermarket.com/richbodyshow/aWQ9NTMwMDc3JmtleXdvcmQ9
7.网课优缺点总结(通用13篇)3、多进行统一时间的检测。及时掌握学生学习动态并反馈。 网课优缺点总结4 线上教学工作总结本该热闹的校园静悄孤寂,看不到升旗台上飘扬的国旗,感受不到老师们讲课的热情洋溢,听不到孩子们在走廊上富有生气的喧哗,显然,是疫情让这一切定格在了暂停键。 https://www.ruiwen.com/zongjie/6783578.html
8.线上培训心得(通用15篇)这种线上教学优缺点都比较明显。优点是具有较强的灵活性,缺点是缺少当面的沟通交流。建议条件允许的情况下,可以采取线上线下相结合的方式开展。 4、你觉得线上培训更适合哪些培训对象?或者哪类课程更适合线上培训? 个人觉得线上培训可能更适合理论知识学习或管理能力提升等方面,后面有机会的话,希望还能参加类似培训。https://www.yjbys.com/xuexi/xinde/3584655.html
9.线上教学存在哪些弊端?在互联网时代快速发展下的今天,很多人都顺其自然的选择了线上教学。而线上教学是否能够完全替代传统教学呢?答案是否定的。无论是何种教学方式都会有自己优缺点,线上教学也是如此,只有不断优化填补不足之处才能发挥出更大的价值。 在互联网时代快速发展下的今天,很多人都顺其自然的选择了线上教学。而线上教学是否https://www.ckjr001.com/newsdetail/1314.html
10.线上雅思选择,雅思是线上学好还是线下学好,雅思线上哪个机构好随着人们经济水平的提高,对于很多家庭来说,留学不再是一个可望而不可及的事情,许多人都想要留学,那其中线上雅思选择,雅思是线上学好还是线下学好,雅思线上哪个机构好?针对这个问题,下面中国教育在线小编就来和大家分享一下。 无论是线上学习还是线下学习,都有其优缺点。具体选择哪种方式,需要根据你的时间、经济https://www.eol.cn/waiyu/yasi/214767.html
11.2023年小学线上教学工作方案根据学生数学程度不同进行分组,每个组都有优、中、差三类学生,确定小组长,组内成员依据个人能力可以帮一个或多个同学,组长进行监督并提醒组员按时完成每天的任务,充分利用尖子生的带动作用,让每个人都找到自己的价值。 4.分层辅导,注重实效 根据线上学习效果检测情况,确定班级数学尖子生、中等生和学困生,具体到人。https://www.pinda.com/zhichang/gongzuofangan/131575.html
12.线上教学平台运行总结(通用15篇)总结就是对一个时期的学习、工作或其完成情况进行一次全面系统的回顾和分析的书面材料,写总结有利于我们学习和工作能力的提高,我想我们需要写一份总结了吧。我们该怎么去写总结呢?下面是小编帮大家整理的线上教学平台运行总结(通用15篇),欢迎大家借鉴与参考,希望对大家有所帮助。 https://m.oh100.com/kaoshi/jiaoxuezongjie/646722.html