人工智能教案05章机器学习5.4实例学习方法

1、54实例学习方法基于实例的学习是典型的归纳学习方法。该方法的学习过程基于环境提供的大量特殊的实例,系统通过对事先标注了正例、反例的示教例子的分析,进行归纳推理,得到一般的规则。机器将系统的低水平的信息归纳成为高水平的信息,一般情况下,用这些信息(规则)指导执行环节。整个过程有一整套比较完善的算法。实例方法早在50年代就引起了人工智能学者的注意,是在机器学习领域中研究最充分成果最丰富的一个分支。实例学习在某些系统中的应用已经成为机器学习走向实用的先导。541实例学习的基本理论如上一节所述,实例学习是一种归纳学习方法,从大量的学习样本中归纳总结出相应的规则、概念。首先我们使用Winston(197

2、5年开发)提出的结构化概念学习程序的例子作为模型来说明实例学习的过程。Winston的程序是对简单的积木世界领域中进行操作,其目的是要建立积木世界中物体概念定义的结构化表示,例如学习房子、帐篷和拱的概念,构造出这些概念定义的结构化描述。系统的输入是积木世界某物体(或景象)的线条图,使用语义网络来表示该物体结构化的描述。例如,系统要学习拱桥的概示,这个结构化的描述就是拱桥概念的定义。接着再向程序输入第二个拱桥示例,其描述如图2所示。这时学习程序可归纳出图3所示的描述。念,就给学习程序输入第一个拱桥示例,得到的描述如下图1所假定下一步向程序输入一个拱桥概念的近似样品,并告知程序,这不是拱桥(即拱桥

3、的反例),则比较程序会发现当前的定义描述(图)与近似样品的描述只是在和节点之间,不接触”的链接弧有区别。由于近似样品不是拱桥,不是推广当前定义描述去概括它,而是要限制该定义描述适用的范围,因而就要把“不接触”链接修改为“必须不接触”,这是拱桥概念的描述如图4所示。这就是机器最后学习得到的拱桥概念。图5-拱4桥概念的归纳学习过程下图是实例学习的两个空间模型。实例空间是所有示教例子的集合,而规则空间是所有规则的集合。实例学习应在规则空间中搜索、匹配所求的规则,并在实例空间中选择一些示教例子,以便解决规则空间中某些规则的歧义性,系统就是这样在实例空间和规则空间中交替进行搜索,直到找到所要求的规则。图

4、5-实5例学习的两个空间模型首先由示教者给实例空间提供一些初始示教例子,由于示教例子的形式往往不同于规则的形式,程序必须对示教例子进行解释,然后再利用被解释的示教例子去搜索规则空间。一般情况下,不能一次就从规则空间中搜索到要求的规则,因此还要寻找一些新的示教例子,这个过程就是选择示教例子。解释例子和选择例子这两个过程如此循环,直到搜索到要求的规则。实例空间和规则空间的例子:下面考虑教计算机程序扑克牌中“同花”概念的问题,同花是指五张牌同一花色所组成的一手牌。在这个学习问题中,实例空间是五张牌的全部各手牌的集合。我们把这个空间中单个的点表示为一组五个有序对,比如(2梅花),(3梅花),(5梅花)

5、,(J梅花),(,梅花)每一有序对指明一张牌的点数和花色。整个实例空间是所有这样的五张牌集合的空间。这个问题的规则空间是描述一手牌的全部谓词表达式的集合。这些表达式使用下列符号描述:谓词:(花色)、(点数)表示牌的变量:,和某些必要的自由变量:x,yz,某些必要的常量:梅花、方块、红心、黑桃、4、5、6、7、8、9、10、J、Q、K1.1.15223.3.22323235,222.规则的表示形式应适应归纳推理542实例学习方法的分类实例学习的方法有几种,可以根据搜索策略的不同进行分类,也可以根据所处理的任务的复杂度的不同进行分类。1按搜索方法分类1按搜索方法分类:也就是搜索规则空间的方法,可分

6、为数据驱动方法和模型驱动方法。主要有:变形空间法、改进假设法、产生与测试法、方案示例法。学习的最终目的是为了搜索,有了假设空间H的基础,在该空间中进行搜索。改进假设空间的假设规则集,以便得到所要求的规则。下面介绍几种搜索规则空间的方法。这些方法都具有一个假设规则集合H,不同的仅仅是对H的改进方法。口变型空间法:变型空间法(version-spacmeethod)是一种数据驱动方法(data-drivemethod)。这种方法对规则和实例都采用同一种表示形式。初始的假设规则集H包括满足第一个示教例子和全部规则。在得到下一个示教例子时,对集合H进行一般化或特殊化处理,最后使集合H收敛为仅含要求的规

7、则。口改进假设法:改进假设皿hypothesis-refinememnethod)也是一种数据驱动方法。这种方法表示规则和实例的形式不统一。程序根据例子选择一种操作,用该操作去改进假设规则集H中的规则。产生与测试法:产生与测试法(generateandtes)t是一种模型驱动方法(model-drivenmethod)。这种方法针对示教例子反复产生和测试假设的规则。在产生假设规则时,使用基于模型的知识,以便只产生可能合理的假设。方案示例法:方案示例皿schemainstantiat)也是一种模型驱动方法。该方法使用规则方案的集合来约束可能合理的规则的形式,其中最符合示教例子的规则方案被认为是最

8、合理的规则。数据驱动方法的优点是可以逐步接受示教例子,以渐进方H,因此一个错误实例就会造成集合式学习,特别是变型空间法,它很容易修改集合回溯就可以考虑新的实例。模型驱动方法难以逐步学习,假设。在使用新假设时,它必须回溯或重新搜索规则空间。因为原来对假设的测试已不适用于新实例加入后的情况。模型驱动方法的优点是抗干扰性良好。合,程序就可以对假设进行统计测量。它不因一、二个错误实例而放弃正确的假设。当前新的实例去修改集合的混乱。解决的方法是每次用新实例去修改集合小的修改,这样可以减少错误实例带来的影响,得学习的进程变慢了。H,不要求程序它是通过检查全部实例来测试由于使用整个实例集在用错误实例测试假设

9、时,而数据驱动方法用HH时,只作较当然这也同时使2按任务复杂程度55系统的任务不同,相应的学习方法的目的、方法也不同。可以分为:学习单个概念、学习多个概念、学习执行多步任务。学习单个概念是最基本的理论方法,本节只介绍学习单个概念的方法步骤。学习多个概念是在学习单个概念的基础上进行的,但不仅仅是简单的运算次数的增加。学习执行多步任务时,执行环节对任务要进行规划,这也是学习的目标之一。对于单概念学习,学习的目的是从概念空间(即规则空间)中寻找某个与实例空间一致的概念;对于多概念学习,任务是在概念空间中找出若干概念描述,对于每一概念描述,实例空间中均有相应的空间与之相应。下图给出了两种学习方法实例空

10、间划分上的差异。图5-单6个概念与多个概念学习空间划分示意图单概念学习系统实例空间划分多概念学习系统实例空间划分单个概念的学习是提供给系统一个概念的若干正例和若干反例,系统由此构成规则空间,并可得到在这个规则空间中的一个概念。这个概念应包含所有的正例,但不包含任何反例。该学习方法有两个假设,其一是示教例子必须是系统所学的概念的例子,要么是正例,要么是反例(如果违反了这一假设,那么就变55543变型空间法15.4.3.155少有一张梅花牌且至少有一张红心牌,它比前两个概念更特殊。图中的箭头用来指向从特殊概念到一般概念。图中最下面一行的各点是正例直接对应的概念,每一个点的概念只符合一个正例。现在一

11、手牌,例子是每张牌的花色和点数,比如:SUIT(CLUBS.JARANK7)这是一个正例,一个最特殊的概念。而概念是规则空间中的点,它比没有描述要特殊,比示教正例要一般。示教例子应该是有具体花色、具体点数的某一张或一组牌。规则空间结构图如下:图5-规8则空间的结构如图所示,规则空间中最一般的元素构成子集;规则空间中最特殊的元素构成的子集为。在假设规则集合是以为上确界和以为下确界的一段。因此,可以用和来表示集合。学习过程就是向下、向上变化的过程,也就是说学习时规则空间的形状在发生变化,所以称为变形空间法。最后,成为一个点,学习结束。上图中规则空间初始时,最上边是一般规则(概念),没有描述、没有条

THE END
1.机器学习方法(豆瓣)机器学习是以概率论、统计学、信息论、最优化理论、计算理论等为基础的计算机应用理论学科,也是人工智能、数据挖掘等领域的基础学科。 《机器学习方法》全面系统地介绍了机器学习的主要方法,共分三篇。第一篇介绍监督学习的主要方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机https://book.douban.com/isbn/978-7-302-59730-8/
2.机器学习的方法机器学习方法本文介绍了机器学习的三大方法:监督学习(分类、回归)、无监督学习(聚类、降维)和强化学习。监督学习利用带类标的训练数据构建模型进行预测;无监督学习在无类标数据中寻找潜在规律;强化学习通过系统与环境交互提升性能。各种方法在自然语言处理、计算机视觉等领域有广泛应用。 https://blog.csdn.net/sinat_29957455/article/details/78817379
3.机器学习方法李航PDFmob64ca12e2ba6f的技术博客机器学习方法 李航 PDF 简介 一、引言 随着人工智能的发展,机器学习作为一种重要的技术手段,受到越来越多的关注。而李航的《统计学习方法》(PDF版)是一本经典的机器学习教材,被广泛应用于教学和实践中。本文将介绍该书的主要内容,并结合代码示例进行解释,帮助读者更好地理解机器学习方法。 https://blog.51cto.com/u_16213374/9990067
4.机器学习中常见分类方法【嵌牛导读】机器学习的分类方法,你知道几种? 【嵌牛鼻子】决策树,基于规则分类,最近邻分类,朴素贝叶斯,人工神经网络,支持向量机 【嵌牛提问】这几种分类方式各自适用于什么样的数据? 【嵌牛正文】 Content 1. 决策树分类(链接:http://blog.csdn.net/github_36299736/article/details/52749999) https://www.jianshu.com/p/45fdbdeb186b
5.机器学习(一)2万多字的监督学习模型总结用于回归和分类的随机森林是目前应用最广泛的机器学习方法之一。这种方法非常强大,通常不需要反复调节参数就可以给出很好的结果,也不需要对数据进行缩放。 从本质上看,随机森林拥有决策树的所有优点,同时弥补了决策树的一些缺陷。 如果你用的是多核处理器(几乎所有的现代化计算机都是),你可以用n_jobs 参数来调节使用https://www.flyai.com/article/515
6.全面盘点统计学和机器学习领域八大数据分析方法!空间模型:利用统计学和机器学习方法,建立空间数据的预测和分类模型,例如空间回归模型、地理加权回归(Geographically Weighted Regression,GWR)等。 网络分析:研究空间网络中的路径、连接和网络关系,通常应用于交通规划、电信网络等领域。 遥感分析:使用遥感技术获取地球表面的信息,通过分析遥感图像,了解地表特征、覆盖类型和变https://www.fanruan.com/bw/da-methods
7.上海药物所提出机器学习辅助定向进化新方法近年来,机器学习辅助定向进化得到越来越多的关注,通过计算机模型模拟实验筛选过程,可以显著减少实验筛选负担、提高筛选效率。机器学习方法最重要的是建立模型学习目标蛋白的序列突变体-功能的函数映射关系。这种映射关系被称为蛋白质适应度图景(protein fitness landscape),其中适应度(fitness)是一个抽象概念,可定量https://www.shanghai.gov.cn/nw31406/20230830/f7032dd73e0645a78574436b55d5cde4.html
8.2020全国大学生计算机设计大赛广东省大学生计算机设计大赛校内选拔赛通知9) 图像处理与模式识别方法研究。 10)机器学习方法研究 ? 人工智能挑战赛采用组委会命题方式,一般为3-5题,各参赛队任选一赛题参加,赛题将适时公布。挑战类项目将进行现场测试,并以测试效果与答辩成绩综合评定最终排名。 6.信息可视化设计包括以下小类: https://www.gdufs.edu.cn/info/1006/53874.htm
9.一文看懂机器学习「3种学习方法+7个实操步骤+15种常见算法」机器学习研究和构建的是一种特殊算法(而非某一个特定的算法),能够让计算机自己在数据中学习从而进行预测。 所以,机器学习不是某种具体的算法,而是很多算法的统称。 机器学习包含了很多种不同的算法,深度学习就是其中之一,其他方法包括决策树,聚类,贝叶斯等。 https://easyai.tech/ai-definition/machine-learning/
10.机器学习模型评估的常见方法有哪些?机器学习模型评估是确定模型在处理未见示例时的有效性和性能的关键过程。在进行模型评估时,我们需要采用一系列常见的方法来测量和比较不同模型之间的表现。下面是常见的机器学习模型评估方法: 训练集与测试集划分:通常将数据集划分为训练集和测试集两部分。训练集用于训练模型,而测试集则用于评估模型的泛化能力。这种方法https://www.cda.cn/view/203855.html
11.机器学习中常见4种学习方法13种算法和27张速查表!-免费加入AI技术专家社群>> 机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的分类。 一、4大主要学习方式1.监督式学习 在监督式学习https://cloud.tencent.com/developer/article/1029070
12.植被生态遥感参数定量反演研究方法进展精度显著提高 中小区域 数理统计方法 约束高斯垂直后向散射(CGVB)模型(Sun 等,2018) 简化了GVB模型,精度明显提高 中小区域 物理方法 辐射传输模型(Koetz等,2006) 参数具有实际意义 大尺度、大区域 下载: 导出CSV 3.1 植被覆盖度 植被覆盖度反演方法大致可分为回归分析法、基于像元尺度分解法和机器学习方法3大类。https://www.ygxb.ac.cn/thesis/91/10706233/zh/
13.总结673篇论文,UIUC等发表可信机器学习综述,20个月完成前文介绍的可信机器学习方法具有坚实的理论基础,也在多种场景中验证有效,如果用于训练大模型,将有望提高模型的可信性。然而大模型的训练需要极大的成本,为了改进现有的大模型,可以借助高效使用大模型的技术,如微调 (finetuning),参数高效微调 (parameter-efficient fine-tuning),提示学习 (prompting),以及从人类反馈进行https://www.thepaper.cn/newsDetail_forward_24210113