首先,对比一下传统机器学习和深度学习的训练过程差异:
下图展示了传统机器学习算法与深度学习技术在数据量方面的性能比较。从图表中可以明显看出,随着数据量的增加,深度学习算法的性能也随之提升。
相比之下,传统机器学习算法的性能虽然会在一定程度上提升,但之后会趋于稳定(表现为一条水平线)。
随着数据量的持续增长,深度学习算法的性能优势将更加显著
从数据量角度出发,深度学习模型,尤其是深度神经网络,需要大量的数据进行训练。这种对大数据的需求使得深度学习能够在处理大规模数据集时表现出色。相比之下,传统机器学习算法在处理大数据集时可能会遇到计算瓶颈或性能下降的问题。
上述图像可以直观地表示神经网络(NeuralNetwork)的基本结构,主要由三个部分组成:
上述图像中仅展示了一个隐藏层,我们可以将其称为人工神经网络(ArtificialNeuralNetwork)或简称神经网络。另一方面,深度神经网络(DeepNeuralNetwork)则包含多个隐藏层,这也是它被称为“深度”的原因。
这些隐藏层之间相互连接,用于让我们的模型学习如何给出最终输出。通过增加隐藏层的数量,深度神经网络能够处理更复杂的数据和任务,捕捉数据中的高级抽象特征。
每个带有信息的节点以输入的形式传递,该节点将输入与随机的权重值相乘,并加上一个偏置项,然后进行计算。
之后,应用一个非线性函数或激活函数来确定哪个特定的节点将决定输出。这个过程是神经网络中信息处理的基本单元,其中权重和偏置是可学习的参数,通过训练过程进行调整,以优化网络的性能。
激活函数的选择对于网络的性能和学习能力至关重要,因为它引入了非线性,使得网络能够学习复杂的数据表示和模式。
MLP(多层感知机,Multi-LayerPerceptron)是最基本的深度学习算法之一,也是最早的深度学习技术之一。
深度学习的初学者建议你从MLP开始学起。MLP可以被视为一种前馈神经网络(FeedforwardNeuralNetwork)的形式。
前馈神经网络是一种人工神经网络,其中信息(或信号)只向一个方向流动,即从前一层的神经元流向后一层的神经元,不形成环路。
MLP通过堆叠多个这样的层(包括至少一个隐藏层)来构建,每个层都包含一定数量的神经元,层与层之间通过权重和偏置进行连接。通过训练过程,MLP能够学习输入数据中的复杂模式,并用于预测、分类或回归等任务。
一种基于径向基函数(RadialBasisFunction)的神经网络。来自维基百科的解释:
常用的径向基函数:
RBFN(径向基函数网络)使用试错法来确定网络的结构,这一过程主要分为两个步骤:
总之,RBFN通过无监督学习确定隐藏层中心,然后通过线性回归和误差最小化来确定权重,从而构建出能够处理复杂非线性关系的神经网络模型。
卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),是深度学习的代表算法之一。
通过卷积、池化等操作来提取特征,将输入数据映射到一个高维特征空间中,再通过全连接层对特征进行分类或回归。
其核心思想是利用局部连接和权值共享来减少模型参数,提高模型泛化能力。
卷积神经网络通常由以下几个部分组成:
循环神经网络(RecurrentNeuralNetwork,RNN)是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络(recursiveneuralnetwork)。
RNN的工作过程可以分为以下几个步骤:
RNN的工作过程可以用以下公式来描述:
LSTM,全称LongShort-TermMemory,即长短期记忆网络,是一种特殊的循环神经网络(RNN)结构。
LSTM通过引入具有长期记忆性的门控单元,解决了传统RNN在处理长序列数据时容易出现的长期依赖问题。
受限玻尔兹曼机是一种双层神经网络,具有特定的拓扑结构,即两层之间的神经元完全连接,但同一层的神经元之间互不相连。RBM是一种可通过输入数据集学习概率分布的随机生成神经网络。
RBM由两个主要部分组成:
可见层对应于输入数据,而隐层则用于捕捉数据中的隐藏特征。两层之间的神经元通过权重连接,但同一层内的神经元之间无连接。
在RBM中,对于单个输入x,如果输入层有两个节点而隐藏层有四个节点,那么总共会有8个权重(每个输入节点与每个隐藏节点之间都有一个权重)。
这些权重决定了输入信号如何传递到隐藏层。除了权重之外,每个隐藏节点还会接收一个偏置值。
SOMs作用:当数据集特征过多,难以直接用常规方法可视化时,自组织映射(SOMs)通过降低数据维度,帮助我们更好地理解和分析数据特征之间的分布和关系。
GenerativeAdversarialNetworks(GANs,生成对抗网络)是由IanGoodfellow等人在2014年提出的一种深度学习模型。
其核心理念是通过两个神经网络——生成器(Generator)和判别器(Discriminator)——的对抗过程,来生成与真实数据分布相似的新数据。
自编码器是一种神经网络,其输入和输出是一致的,目标是使用稀疏的高阶特征重新组合来重构自己。
在自动编码器中,数据首先被压缩成一个潜在空间表征(或称为编码),然后通过这个表征来重构原始数据。
自编码器和PCA(降维算法)的作用是比较类似的。它们被用于将高维数据转换为低维数据。如果我们需要原始数据,我们可以将其重新生成回来。
深度信念网络是一种基于无监督学习的生成模型,具有多层的堆叠结构,由多层受限玻尔兹曼机(RestrictedBoltzmannMachines,RBM)堆叠而成。