1、机器学习算法的发展及其在食品领域的应用朱尹摘要:简介了机器学习,叙述了机器学习的发展,叙述了机器学习算法在食品领域的应用。关键词:机器学习,人工神经网络,食品在机器学习一书中,机器学习(MachineLearning,ML)的定义为:关于某类任务T和性能度量P,如果一个计算机程序能在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E中学习。通俗来说,机器学习是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。下面
3、人类的概念学习过程,并采用逻辑结构或图结构作为机器内部描述。本阶段的代表性工作有温斯顿(Winston)的结构学习系统和海斯罗思(Hayes-Roth)等的基本逻辑的归纳学习系统。1.3第三阶段:复兴时期第三阶段从20世纪70年代中叶到80年代中叶,称为复兴时期。在此期间,人们从学习单个概念扩展到学习多个概念,探索不同的学习策略和方法,且在本阶段已开始把学习系统与各种应用结合起来,并取得很大的成功,促进机器学习的发展。1980年,在美国的卡内基梅隆(CMU)召开了第一届机器学习国际研讨会,标志着机器学习研究已在全世界兴起。机器学习的最新阶段始于1986年。1.4新时期机器学习进入新阶段的重要
4、表现在下列诸方面:(1)机器学习已成为新的边缘学科并在高校形成一门课程。它综合应用心理学、生物学和神经生理学以及数学、自动化和计算机科学形成机器学习理论基础。(2)结合各种学习方法,取长补短的多种形式的集成学习系统研究正在兴起。特别是连接学习符号学习的耦合可以更好地解决连续性信号处理中知识与技能的获取与求精问题而受到重视。(3)机器学习与人工智能各种基础问题的统一性观点正在形成。例如学习与问题求解结合进行、知识表达便于学习的观点产生了通用智能系统SOAR的组块学习。类比学习与问题求解结合的基于案例方法已成为经验学习的重要方向。(4)各种学习方法的应用范围不断扩大,一部分已形成商品。归纳
5、学习的知识获取工具已在诊断分类型专家系统中广泛使用。连接学习在声图文识别中占优势。分析学习已用于设计综合型专家系统。遗传算法与强化学习在工程控制中有较好的应用前景。与符号系统耦合的神经网络连接学习将在企业的智能管理与智能机器人运动规划中发挥作用。(5)与机器学习有关的学术活动空前活跃。国际上除每年一次的机器学习研讨会外,还有计算机学习理论会议以及遗传算法会议。2.机器学习算法在食品领域的应用机器学习的目标就是在一定的网络结构基础上,构建数学模型,选择相应的学习方式和训练方法,学习输入数据的数据结构和内在模式,不断调整网络参数,通过数学工具求解模型最优化的预测反馈,提高泛化能力、防止过拟合。机
6、器学习算法主要是指通过数学及统计方法求解最优化问题的步骤和过程,在食品领域具有广泛应用,下面以机器人工神经网络举例介绍。2.1人工神经网络简介人工神经网络(ArtificialNeuralNetwork,即ANN)是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种
7、特定的输出函数,称为激励函数(activationfunction)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。常用的神经网络有BP、RBF、SOM、Hopfield等等,其功能不经相同2.2人工神经网络在食品领域的应用2.2.1水果分级和分类杨宝华等人利用BP神经网络研究了西瓜种仁质量的预测。根据园艺试验田多年跟踪测量西瓜生长指标,随机抽取每年的部分数据来预测种仁质量,输出层节点代表种仁质量。其
8、设计的神经网络的预测模型确定输入层为4个神经元,计算隐层神经元数确定为4,输出因子为1个,所以确定输出层为1个神经元。设定最大的迭代次数为100次,系统全局误差小于0.001。经过6次训练后,网络的目标误差达到要求,用训练好的网络预测输入向量,仿真输出结果。将预测值与待预测目标值比较,计算相对误差,结果相对误差在20%上下波动。考虑到样本的数据较少,还有数据测量的偏差,这个误差是可以接受的。BP网络经有效训练后应用于西瓜仁质量预测,具有较高的预测精度和良好的泛化能力。Kondo等人通过机器视觉系统采集“Izokan”甜橙图像,以图像红色分量R与绿色分量G的比率、果形指数、质量和果面粗糙度为输