开通VIP,畅享免费电子书等14项超值服
首页
好书
留言交流
下载APP
联系客服
2019.10.15
阅读大概需要34分钟
跟随小博主,每天进步一丢丢
导读:作者用超过1.2万字的篇幅,总结了自己学习机器学习过程中遇到知识点。“入门后,才知道机器学习的魅力与可怕。”希望正在阅读本文的你,也能在机器学习上学有所成。
00准备
机器学习是什么,人工智能的子类,深度学习的父类。
机器学习:使计算机改进或是适应他们的行为,从而使他们的行为更加准确。也就是通过数据中学习,从而在某项工作上做的更好。
引用王钰院士在2008年会议的一句话,假定W是给定世界的有限或者无限的所有对象的集合,Q是我们能够或得到的有限数据,Q是W的一个很小的真子集,机器学习就是根据世界的样本集来推算世界的模型,使得模型对于整体世界来说为真。
机器学习的两个驱动:神经网络,数据挖掘。
机器学习的分类:
优点:泛化,对于未曾碰到的输入也能给出合理的输出。
监督学习:回归、分类。
机器学习过程:
专业术语:
真正例(TP)
假正例(FP)
假反例(FN)
真反例(TN)
对于指定的内核和内核参数,计算数据之间距离的内核
这里主要的工作是计算K=XX^T。
对于线性内核,返回K,对于多项式的次数d,返回1/σ8K^d。
对于RBF核,计算K=exp(-(x-x')^2/2σ*σ。
训练:
将这些矩阵传递给求解器。
▲左边:如果方向之间是相互正交的并且步长是正确的,每一个维度只需要走一步,这里走了两步。右边:在椭圆上共轭的方向不是相互正交的。
Exhaustivesearch
((1,5,10,6,3,9,2,4,8,7,0),4.18)
1781.0613
Greedysearch
((3,9,2,6,10,5,1,8,4,7,0]),4.49)
0.0057
HillClimbing
((7,9,6,2,4,0,3,8,1,5,10]),7.00)
0.4572
SimulatedAnnealing
((10,1,6,9,8,0,5,2,4,7,3]),8.95)
0.0065
▲交叉算子的不同形式。(a)单点交叉。随机选择字符串中的一个位置,然后用字符串1的第一部分和字符串2的第二部分组成后代。(b)多点交叉。选择多个点,后代的生成方式和前面一样。(c)均匀交叉。每个元素都随机的选自于它的父母。
使用如下公式更新权值:
其中Zn为标准化常量
计算属于每一个可能的类别的输入的概率,通过如下公式计算(其中w_i是对于每个分类器的权重):
选择大小(神经元数目)和映射的维度d
或者
随机选择权重向量的值使得它们都是不同的OR
设置权值来增加数据的前d个主成分的方向
重复
对每一个数据点:
用下面的公式来更新最匹配节点的权重向量:
这里η(t)是学习效率
其他的神经元用下面的公式更新权重向量:
直到映射停止改变或超出了最大迭代的次数
对每个测试点:
用权重和输入间的欧氏距离的最小值来选择最匹配的神经元n_b: