论文题目《3-DDeepLearningApproachforRemoteSensingImageClassification》
论文作者:AminaBenHamida,AlexandreBenoit,PatrickLambert,andChokriBenAmar,SeniorMember,IEEE
论文发表年份:2018
网络简称:3D-CNN
发表期刊:IEEETransactionsongeoscienceandremotesensing
Motivation
现有的方法仍然局限于当今大型数据集中丰富的空间光谱内容。然而,遥感数据集中光谱和空间内容共存所带来的特异性扩大了将DL方法应用于这些背景的挑战范围。因此,本文的目的是首先探索用于RS高光谱数据集分类的DL体系结构的性能,然后引入一种新的三维DL方法,使光谱和空间信息处理相结合。
Challenges
1)高维数据:当处理高维数据时,DL方法的计算成本变得很高。这些高成本主要是由于学习数据抽象和建立从低层次到最高语义解释的有效表示需要缓慢的学习过程。
2)重型模型:目前DL模型依靠深度和广度模型取得了显著的成果。因此,需要大量参数从数据本身学习复杂的特征和表示。此外,这种重模型在标记数据方面是贪婪的。这一要求很难建立,因为该领域严重缺乏丰富的高光谱标注数据。
3)架构优化:今天支持使用DL的关键点是它能够处理大量的应用程序。然而,这导致建立深度模型的任务变得更加困难和复杂,而这些模型在处理数据时既便宜又有效。
Proposed3-DDeepArchitecture
下图为每一层的特征形状(SizeOut)的演化(example):
Experiment
本文设计了多种不同层次结构的网络来进行对比,以选择最优的网络结构。
实验证明,八层网络架构取得最好的效果和计算性能,它不仅减少了参数的数量,而且提高了准确率。。原因:多的Conv层确保了数据的更高语义级表示,而Pooling层则保证了表示的降维。这样,FC层入口的向量维数显著降低,从而显著减少了参数的数量。随着准确率的提高,参数数量显著减少。这些测试还证明了空间邻域的选择高度依赖于数据内容。在拥有3×3邻域的PaviaCenter数据集的情况下,同一模型可以优于中的结果,而在PaviaUniversity的情况下,即使使用5×5邻域,它也不能达到最先进的方法结果。下图为不同层数的网络的训练迭代次数等统计:
本文还测试了高光谱图像分类迁移学习的可能,在帕维亚大学和帕维亚中心之间进行迁移学习(微调)实验:
深度神经网络在进行微调和从零开始训练时,能够保持几乎相同的精度水平(98.4%对98.9%和90.4%对92.9%)。基本上,本文提出的预训练体系结构具有很强的泛化能力。