《百面机器学习》拾贝第二章:模型评估Ariel一只猫的旅行

“没有测量,就没有科学。”这是科学家门捷列夫的名言。在计算机科学特别是机器学习领域中,对模型的评估同样至关重要。只有选择与问题相匹配的评估方法,才能快速地发现模型选择或训练过程中出现的问题,迭代地对模型进行优化。模型评估主要分为离线评估和在线评估两个阶段。针对分类、排序、回归、序列预测等不同类型的机器学习问题,评估指标的选择也有所不同。知道每种评估指标的精确定义、有针对性地选择合适的评估指标、根据评估指标的反馈进行模型调整,这些都是机器学习在模型评估阶段的关键问题,也是一名合格的算法工程师应当具备的基本功。

01评估指标的局限性

在模型评估过程中,分类问题、排序问题、回归问题往往需要使用不同的指标进行评估。在诸多的评估指标中,大部分指标只能片面地反映模型的一部分性能。如果不能合理地运用评估指标,不仅不能发现模型本身的问题,而且会得出错误的结论。

Q1:准确率的局限性

A1:准确率是分类问题中最简单也是最直观的评价指标,但存在明显的缺陷。比如,当负样本占99%时,分类器把所有样本都预测为负样本也可以获得99%的准确率。所以,当不同类别的样本比例非常不均衡时,占比大的类别往往成为影响准确率的最主要因素。

Q2:精确率与召回率的权衡

A:首先要明确两个概念,精确率和召回率.

精确率是指分类正确的正样本个数占分类器判定为正样本个数的比例;

召回率是指分类正确的正样本个数占真正的正样本个数的比例.

在排序问题中,通常没有一个确定的阈值把得到的结果直接判定为正样本或负样本,而是采用TopN返回结果的Precision值和Recall值来衡量排序模型的性能,即认为模型返回的TopN的结果就是模型判定的正样本,然后计算前N个位置上的准确率Precision@N和前N个位置上的召回率Recall@N。Precision值和Recall值是既矛盾又统一的两个指标,为了提高Precision值,分类器需要尽量在“更有把握”时才把样本预测为正样本,但此时往往会因为过于保守而漏掉很多“没有把握”的正样本,导致Recall值降低。

Q3:平方根误差的"意外"

A3:RMSE经常被用来衡量回归模型的好坏,公式:

每个评估指标都有其价值,但如果只从单一的评估指标出发去评估模型,往往会得出片面甚至错误的结论;只有通过一组互补的指标去评估模型,才能更好地发现并解决模型存在的问题,从而更好地解决实际业务场景中遇到的问题。

02ROC曲线

Q1:什么是ROC曲线?

A1:

只看定义确实有点绕,为了更直观地说明这个问题,我们举一个医院诊断病人的例子。假设有10位疑似癌症患者,其中有3位很不幸确实患了癌症(P=3),另外7位不是癌症患者(N=7)。医院对这10位疑似患者做了诊断,诊断出3位癌症患者,其中有2位确实是真正的患者(TP=2)。那么真阳性率TPR=TP/P=2/3。对于7位非癌症患者来说,有一位很不幸被误诊为癌症患者(FP=1),那么假阳性率FPR=FP/N=1/7。对于“该医院”这个分类器来说,这组分类结果就对应ROC曲线上的一个点(1/7,2/3)。

Q2:如何绘制ROC曲线

Q3:如何计算AUC?

A3:AUC指的是ROC曲线下的面积大小,该值能够量化地反映基于ROC曲线衡量出的模型性能。计算AUC值只需要沿着ROC横轴做积分就可以了。由于ROC曲线一般都处于y=x这条直线的上方(如果不是的话,只要把模型预测的概率反转成1p就可以得到一个更好的分类器),所以AUC的取值一般在0.5~1之间。AUC越大,说明分类器越可能把真正的正样本排在前面,分类性能越好。

Q4:ROC曲线相比P-R曲线有什么特点?

A4:相比P-R曲线,ROC曲线有一个特点,当正负样本的分布发生变化时,ROC曲线的形状能够基本保持不变,而P-R曲线的形状一般会发生较剧烈的变化。这个特点让ROC曲线能够尽量降低不同测试集带来的干扰,更加客观地衡量模型本身的性能。

03余弦距离的作用

在机器学习问题中,通常将特征表示为向量的形式,所以在分析两个特征向量之间的相似性时,常使用余弦相似度来表示。余弦相似度的取值范围是[1,1],相同的两个向量之间的相似度为1。如果希望得到类似于距离的表示,将1减去余弦相似度即为余弦距离。因此,余弦距离的取值范围为[0,2],相同的两个向量余弦距离为0。

Q1:结合你的学习和研究经历,探讨为什么在一些场景中要使用余弦相似度而不是欧氏距离?

Q2:余弦距离是否是一个严格定义的距离

04A/B测试的陷阱

在互联网公司中,A/B测试是验证新模块、新功能、新产品是否有效,新算法、新模型的效果是否有提升,新设计是否受到用户欢迎,新更改是否影响用户体验的主要测试方法。在机器学习领域中,A/B测试是验证模型最终效果的主要手段。

Q1:在对模型进行过充分的离线评估之后,为什么还要进行在线A/B测试?

Q2:如何进行线上A/B测试

A2:进行A/B测试的主要手段是进行用户分桶,即将用户分成实验组和对照组,对实验组的用户施以新模型,对对照组的用户施以旧模型。在分桶的过程中,要注意样本的独立性和采样方式的无偏性,确保同一个用户每次只能分到同一个桶中,在分桶过程中所选取的user_id需要是一个随机数,这样才能保证桶中的样本是无偏的。

Q3:如何划分实验组和对照组

A3:P56-P57

05模型评估的方法

Q1:在模型评估过程中,有哪些主要的验证方法,它们的优缺点是什么

A1:

>Holdout检验

>交叉检验

>自助法

Q2:在自助法的采样过程中,对n个样本进行n次自助抽样,当n趋于无穷大时,最终有多少数据从未被选择过?

06超参数调优

Q:超参数有哪些调优方法

A:

07过拟合与欠拟合

Q1:在模型评估过程中,过拟合和欠拟合具体是指什么现象?

A1:过拟合是指模型对于训练数据拟合呈过当的情况,反映到评估指标上,就是模型在训练集上的表现很好,但在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好的情况。

Q2:能否说出几种降低过拟合和欠拟合风险的方法?

A2:

■降低“过拟合”风险的方法(1)从数据入手,获得更多的训练数据。使用更多的训练数据是解决过拟合问题最有效的手段,因为更多的样本能够让模型学习到更多更有效的特征,减小噪声的影响。当然,直接增加实验数据一般是很困难的,但是可以通过一定的规则来扩充训练数据。比如,在图像分类的问题上,可以通过图像的平移、旋转、缩放等方式扩充数据;更进一步地,可以使用生成式对抗网络来合成大量的新训练数据。(2)降低模型复杂度。在数据较少时,模型过于复杂是产生过拟合的主要因素,适当降低模型复杂度可以避免模型拟合过多的采样噪声。例如,在神经网络模型中减少网络层数、神经元个数等;在决策树模型中降低树的深度、进行剪枝等。(3)正则化方法。给模型的参数加上一定的正则约束,比如将权值的大小加入到损失函数中。以L2正则化为例:

THE END
1.如何利用科技进行有效学习:网络课程的优势随着科技的不断进步,网络课程已成为现代教育领域的一大创新,它突破了传统教育模式的时间和空间限制,为广大学习者提供了灵活、多样化的学习方式。网络课程的优势不仅体现在提供便捷的学习渠道,更在于其高度的可访问性、个性化学习体验以及丰富的资源和工具。以下详细探讨如何利用科技进行有效学习,特别是网络课程的多方面https://baijiahao.baidu.com/s?id=1812129908899893159&wfr=spider&for=pc
2.线上学习的优点有哪些?自从在线教育问世之后,线上线下的教学方式一直在被比较中,有人认为传统的教学方式好,也有人认为在线教育好,但其实不管是线下还是线上都是不可少的,那么线上学习的优点有哪些呢? 1、资源利用 线下教育有地域限制,但是互联网却没有,各种教育资源通过互联网的形式无视地域和空间的限制,让学生即使在校园仍然可以学习到https://m.grazy.cn/article/11200.htm
3.线上学习的优缺点线上学习是先下疫情形势下保持学生学习状态下的学习方式之一。线上学习,对于大家来说并不陌生,在这我们一起讨论一下这个线上学习的优缺点。 优点: 1、线上学习是当前形式下的学习形式之一。 2、线上学习,让学生在老师的直播课堂结束后查漏补缺,再观看回放,找寻不懂的问题的答案。 https://quan.qlteacher.com/u/573eb7140cf223fc04745a15/blog/62495f6830b9d912b26c0731
4.少儿编程的作用及优点少儿编程线上还是线下学?只需回答三个问题优点: l 学习时间和地点相对随意 l 教学针对性更好 l 学习费用免费 缺点: l 教学情况不稳定 l 对父母要求较高 适用人群:通常适合具备充足时间及精力的父母,以体验接触为主,培养编程兴趣的孩子。 代表品牌:- B线上录播课 上课模式:老师提前录制好课程内容。上课时,孩子通过看视频方式理解学习内容,完成任务操作。https://blog.csdn.net/weixin_39942474/article/details/110899077
5.线上教学平台运行总结(通用15篇)总结就是对一个时期的学习、工作或其完成情况进行一次全面系统的回顾和分析的书面材料,写总结有利于我们学习和工作能力的提高,我想我们需要写一份总结了吧。我们该怎么去写总结呢?下面是小编帮大家整理的线上教学平台运行总结(通用15篇),欢迎大家借鉴与参考,希望对大家有所帮助。 https://m.oh100.com/kaoshi/jiaoxuezongjie/646722.html
6.赵灿晖:停课不停学,育人先育心——关于线上“教”与“学”的总之,选择在线教学方式时,一定要充分认识到所选择的教学模式的优点和不足,充分发挥优点的同时想办法克服其不足之处,从而实现最佳的教学效果。 3.线上学习的几点建议 前面都是从教师角度谈的该如何“教”,下面我也给同学们提几点建议,帮助大家如何实现高效的“学”。 https://fdc.swjtu.edu.cn/info/1056/2635.htm
7.网课优缺点总结(通用13篇)线上学习对学生和家长来说是不小的挑战,也给了学生学会自律和独立学习的机会。在家网课学习,没有想像中的那么不可控制和随意,反而给了一些负责家长更负责任的机会,其它家长也不干示弱,纷纷学习。一些在学校学习不怎么主动的学生,在家里被一对一,甚至多对一的督促下,学习效果还不错。当然缺点就是,老师不能在课上https://www.ruiwen.com/zongjie/6783578.html
8.线上教学的优缺点是什么?1.线上教学的优点 线上教学有很多好处,比如学生和教师可以在舒适的家中建立联系、学生在上课时也节省了通勤时间、支持异地学习(学生不需要参加现场讲座和讨论),可以很方便的获取学习资料和教学材料。 便捷性。在线学习的一个突出优势是便捷性,只需要拥有设备和网络,学生就能够通过教学平台远程与教师沟通。 https://boardmix.cn/article/onlineteachinganalysis/
9.线上教学的优缺点及建议有哪些在线学习灵活便利,个性化资源丰富,成本效益高,但要求学生自律,受技术问题影响;传统课堂师生互动直接,学习环境全面,学习系统化,但受时间和地点限制,教学资源有限,个性化学习受限。两者各有优劣,需根据个人需求选择。 1在线学习的优点 1.灵活性和便利性 在线学习的最大优势之一是其灵活性和便利性。学生可以在任何时间、http://www.chusan.com/zhongkao/366870.html
10.什么是混合式教学?混合式教学模式有什么优缺点?传统的教学模式主要分为线上教学及线下面授两种模式,一场培训项目涉及课前调研、报名、课堂材料发放、培训签到、课后考核等等流程,工作繁琐,效率低,线上线下数据如何打通也是个难题。 混合式教学模式是如何解决培训难题的呢?我们以道一云大学为例,其提供了在线报名、报名审核、线上学习、面授课程、考试调研、评分反馈https://wbg.do1.com.cn/xueyuan/12863.html
11.腾讯ABCmouse课程简介及注册购买教程(优惠码+$2返利)打造沉浸式此外,在腾讯开心鼠英语(腾讯ABCmouse)中,还拥有8000多个海量互动课程,不仅包含知识丰富、体系健全的外教口语课、英语跟读练习、原版英语儿歌等内容,更含有趣味生动的英语动画视频、原版分级图书、英语互动游戏等丰富的学习课程。利用互动的方式,让孩子能保持好奇心和探索欲。以线上的兴趣培养结合线下的知识补全,通过搭配智https://www.extrabux.cn/chs/guide/4415815
12.线上教学的优缺点疫情之下,线上教学发展得十分快速,这种模式弥补了线下授课的劣势,受到了很多学生和老师的青睐。但是它也存在着一些劣势。所以在选择进行线上教学的时候,大家还需要了解清楚线上教学的优缺点,再根据自己的需求做出选择。 一、线上教学的优点: 1、知识获取便捷 “停课不停学”让网络教学成为学生学习的主要来源。线上https://www.yunduoketang.com/article/hq989.html
13.线上培训心得(通用18篇)线上培训心得 篇11 两周的线上学习,发现了很多优点,也出现了一些不足,现具体总结一下。 一、线上教学优点: 1.态度端正,认真开展:从教办到学校,从学校到教师,都提前做了充足的准备,能够有计划地按部就班地开展线上教学活动。 2.线上开展,形式多样:各校都利用自己已有的资源和熟悉的渠道。崔寨使用了钉钉,其https://www.jy135.com/xindetihui/1024902.html
14.绣花制版网络线上一对一培训,广州电脑绣花打带培训四:新旧学习方式的比较 传统实体线下教学 优点:直观,有老师督促、同学之间你追我赶相互交流,学习起来有气氛见效快。 缺点:费用相对高。 新型线上一对一教学: 优点:费用低,班照上工资照拿,下班休息有空学下,用线下学费可买一台不错的手提电脑(电脑坑很多,可咨询老师介绍性价比最高的手提),用线下生活费足够付线https://www.6xiu.com/ydypx.html
15.石家庄炎黄针灸推拿专修学校线上教学特点 1、录播+直播 录播+直播课程,名师授课,真人演示,听得懂,学的会。 2、随时随地学习 随时随地手机登录学习,不限时间不限次数 3、互动答疑 免费试看网课,每天在线和老师互动答疑。 培训优势 1、师资优势 专业师资力量 在李玉森校长的带领下,聘请经方学传承人、针推系中医师、崔氏无痛催乳疗法创始人、http://www.hebjxw.com/ShowInfo_zxzk.asp?id=1324