技术交流▏空间数据挖掘及其在海洋地理信息系统中的应用

所谓空间数据挖掘,是数据挖掘技术在空间数据集合中的一种应用,主要通过对空间数据的分析和比对,发现蕴含在数据中,不能够直观发现的关系、趋势、模式等特征,为预测未来现象提供依据,为系统决策提供支持。然而由于空间数据的特点和海洋地理信息系统应用的特殊性,空间数据挖掘与传统的数据挖掘方法也略有不同。本文在对空间数据挖掘技术进行深入研究的基础上,介绍了空间数据挖掘技术的主要原则,分析了该技术能够取得的潜在效果,并结合海洋地理信息系统的特点和需求,研究了空间数据挖掘技术在海洋地理信息系统中的应用方法和运行模式,为进一步完善该系统,更加充分地对海洋空间数据进行利用,提供依据。

一、空间数据挖掘的基本原则

⒈空间数据挖掘的概念

空间数据挖掘是空间数据库、计算机管理技术和决策技术发展到新阶段的产物。其集成了多种当前流行的技术,如人工智能、概率统计、专家系统、机器学习、空间数据库、模糊数学、网络技术和数据可视化技术等,是一种数据挖掘技术在空间数据领域的重要扩展和应用。

⒉空间数据挖掘的框架

当前,存在多种空间数据挖掘框架,例如由Maheus提出的多组件数据挖掘框架,由Hoslsheimer提出的特征挖掘框架,由Han提出的数据挖掘通用模型等。从适用性的角度考虑,最适合空间数据挖掘的框架应当为多组件数据挖掘框架,该框架的基本结构如图1所示。

图1空间数据挖掘框架

空间数据挖掘框架为整个空间数据挖掘过程提供依据,并为海洋地理信息系统中的数据分析和利用提供设计思路。

二、空间数据挖掘的内容

与空间数据处理不同,空间数据挖掘能够提取出隐含的知识、空间数据之间的关系和其他有价值的模式信息,从而能够进一步发现更多有用的知识,为其他系统和应用提供决策依据。

⒈空间关系

⒉对象特征

对象特征描述的是一种或多种对象实体所共有的属性特征,包括类型、尺寸、形状等其他常见或特殊的属性。并且如果数据样本的数量足够时,我们还能够获得对象的先验概率知识,例如海底沉积物的经纬度分布等。

⒊数据分类

通过空间分类规则,空间数据集中的数据能够被映射为特定的类,通常在数据预测的过程中使用。同时,分类规则是一种全局适用的知识,本质上是对数据集的一种抽象和一般化。

⒋数据聚类

通过聚类能够将类型相近的数据集合为一种类型,同时使得不同类型之间的差异最大化,而使得同一类型之间的差异最小化,能够应用于生成和划分多种异构信息。与分类规则不同,在聚类之前,并不知道划分的每一类的特征和属性,也不清楚数据能够被划分为哪些类别。

需要注意的是,在空间数据挖掘的过程中,挖掘的内容和结果,并不一定是以上几类的一种,而大多数需要涉及到多种。因为,在对信息进行分析和可视化的过程中,对一个对象的感知,仅仅知道其特征、空间关系、类别等的一种,并不能完全认识该对象,更无法深度挖掘该对象与其他对象存在的其他隐含关系,因而,在实际使用中,从实践角度考虑,我们需要获得包括以上各种内容的多种或全部,从而完成对对象的全维感知,也能够使得在下一步的挖掘中,获得的知识更加完备和详细。

三、空间数据挖掘流程

在传统的数据处理方法中,往往采用专家系统方法,采用处理规则或模板,将专家知识固化为某种知识的固定提取方法和处理措施。这种方法具有2个主要缺点:一是其仅仅能够对数据进行表面化的处理,而不能够进行多层次和持续的挖掘,因而这种数据处理方式,仅仅能够发现事先已知类型和符合规定的知识;二是其难以应对大量的数据,采用该种方法的数据处理系统,往往采用线性处理方法,对于某一类的数据处理往往需要遍历所有的规则和模板,造成不必要的算法复杂性,当数据量较大时,其效率较低。而空间数据挖掘算法,能够克服以上问题,采用聚类、分类等措施和循环迭代的方法,不仅能够发现大量隐含知识,同时能够处理海量知识,其主要过程有以下几个步骤:

⑴数据滤波:对于海上地理信息系统来说,其中包含了大量来自不同设备和不同种类的数据,由于海上环境的多变性,必然会存在错误和异常数据,为了确保能够得到正确结果,在对数据进行处理之前,需要对数据进行滤波,得到无噪声的可用数据;

⑵数据聚类:相比于数据分类,数据聚类具有更广泛的适用性,能够发现实现未被定义的数据类型。通过数据聚类,能够完善数据的结构性,从而为下一步数据挖掘提供依据;

⑶数据挖掘:当前数据挖掘、分类与分析的算法种类较多,主要的方法有神经网络、SVM等。需要注意的是,空间数据挖掘与传统方法不同,完成整个挖掘过程需要多次迭代。具体流程如图2所示。

图2空间数据挖掘流程图

四、空间数据挖掘在海洋GIS中的应用

海洋学和地图学数据是海洋地理信息系统中的重要组成部分,有着GIS数据的典型特征。因此,可以利用空间数据挖掘,最大化的发挥海洋测量和电子地图数据的价值,开发多种类型的应用,扩展海洋测绘和电子地图产品的种类,从而向用户提供丰富多样的服务。

⒈海底地形数据挖掘

海图是一种用来描述某个海域及其邻接陆地的地图,其中对于海底地形的描述主要采用虚线点迹表示。由于图幅限制,海图中的虚线点迹通常采用互相隔离和离散的形式出现,难以直观地表示出海底地形的全貌,从而为安全航线的划定造成不便。

使用空间数据挖掘中的统计学方法,能够从离散的虚线点迹中发现出海底地形走势的固有规律,从而建立一个等高线模型,结合可视化技术,我们能够得到海底地形的3D全景显示,从而能够方便直观地对海底地形进行分析和利用。

⒉海洋沉积物数据挖掘

海洋沉积物是海底地形的重要组成部分之一,同时也是航海导航、船舶抛锚和海底航行等活动的重要影响因素之一。

通过使用数据挖掘工具,如概率统计、模糊集理论和集群方法,海洋沉积物的分布区域和时空变化规律将能够被发现,使得船舶航行的安全性得到加强,同时水上航线的利用率也能够得到提高。此外,也能够为国防和海洋工程建设等活动,提供决策依据。

⒊航行障碍数据挖掘

在船舶的航行过程中往往需要考虑诸如暗礁、残骸、障碍物等,并及时进行规避以保证航行安全。尽管大多数航行障碍物的位置固定,但是由于洋流和其他原因,某些类型的障碍物将会发生移动。对于航行障碍物来说,其空间数据并不仅仅包括其所在位置信息和属性等,同时也包括其影响范围、移动趋势及其他时空信息。

在空间数据挖掘理论的支持下,海洋地理信息系统能够自动映射出航行障碍物所处的水域,并在不同的航行条件下,给出航行的安全指数。当船舶进入某个危险水域时,系统能够智能化地向船员发送警报,从而最大限度地保证船舶的航行安全。

⒋航行助航数据挖掘

助航设施,例如导航标记、海上浮标等,通常用来指示暗礁位置,或进行海洋观测,是一种重要的人工实施,使得船舶能够借助这些设施进行位置测量,航线导航和障碍规避。

航行助航数据储存了大量助航设施的属性特征和地理位置。这些知识并不仅仅反应了安全航道信息,还指示了海拔信息,可航行水深等信息。

使用空间数据统计分析及聚类,遗传算法和其他空间数据挖掘技术,系统能够根据助航设施的特征和级别进行重分类。最终,可以向船舶提供最优化的航线,实现自动化的航线选择等功能。

⒌水文数据挖掘

水文数据指示了水力、洋流等海水的物理和化学特征,包含潮汐、浪高、洋流速度、漩涡、冰山、浮冰等数据,以及盐度、密度、海水颜色等数据。

使用空间数据挖掘,系统不仅能够自动化地发现各种数据的隐含关系和规则,同时也能够在一定的需求下进行最优化分析和未来数据的预测,从而为决策提供有力支持。

五、结语

海洋地理信息系统是当前人类活动必不可少的信息化系统,其中产生和储存的海量数据,更蕴含着巨大的价值,随着大数据时代的来临,如何发挥这些数据的巨大作用,将是海洋地理信息系统下一步研究和完善的重点。本文对空间信息挖掘技术进行详细介绍,从该技术的基本原则、内容和流程等方面进行深入研究,并结合空间信息挖掘技术的特点,研究了其在海洋地理信息系统中的引用方法,为之后系统的进一步完善提供基础。

THE END
1.数据挖掘概念(AnalysisServices该步骤包括分析业务需求,定义问题的范围,定义计算模型所使用的度量,以及定义数据挖掘项目的特定目标。这些任务转换为下列问题: 您在查找什么?您要尝试找到什么类型的关系? 您要尝试解决的问题是否反映了业务策略或流程? 您要通过数据挖掘模型进行预测,还是仅仅查找受关注的模式和关联? https://technet.microsoft.com/zh-cn/library/ms174949(en-us,sql.105).aspx
2.数据挖掘的具体过程根据挖掘的结果做出决策,优化业务流程,提高效率和效益。比如说,根据客户的购买习惯精准推荐商品,那销售额不就蹭蹭往上涨啦? 数据挖掘的过程可不简单,但只要一步步来,就能从海量的数据中挖出金子来。你说,这么神奇又有用的本事,咱能不好好学学,不好好琢磨琢磨吗?朋友,行动起来,说不定你就是下一个数据挖掘的高手https://wenku.baidu.com/view/d41db64707a1b0717fd5360cba1aa81145318ffa.html
3.深度学习数据挖掘的关系mob64ca12f66e6c的技术博客4. 序列图 下图是深度学习模型与数据挖掘过程的序列图: 结尾 以上便是有关深度学习与数据挖掘之间关系的基本流程及其代码实现。在整个过程中,深度学习能够为我们提供强大的预测能力,而数据挖掘则提供了将这些预测结果转化为实际知识的能力。希望这篇文章能够帮助你理解二者之间的关系,并给你在未来的学习和工作中提供指https://blog.51cto.com/u_16213457/12827856
4.机器学习找不到创新点?三种特征选择的方法包你拿下顶会!文章介绍了一种新的特征选择框架shap-select,该框架通过在验证集上对目标变量与原始特征的SHAP值进行线性或逻辑回归,并根据回归系数的符号和显著性水平来实现高效的特征选择。在Kaggle信用卡欺诈数据集上的评估表明,shap-select在解释性、计算效率和性能方面均表现出色。 https://www.bilibili.com/read/cv40067807
5.数据挖掘的实现流程数据挖掘流程图本文介绍了数据挖掘的实现流程,包括数据准备、数据挖掘、模型评估解释和知识运用四个步骤。数据准备是关键,涉及数据选择、净化、推测、转换和缩减。数据挖掘阶段应用各种算法如决策树、聚类等寻找模式。模型评估解释确保模式的有效性和易理解性,知识运用则涉及知识的实际应用和优化。 https://blog.csdn.net/weixin_44997802/article/details/110630028
6.组织结构流程图怎样绘制?绘制的步骤是什么绘制的步骤是什么 组织结构图用官方的解释就是在管理工作中进行分工协作,在职务范围,责任权利方面所形成的结构体系称之为组织结构图,所以组织结构图运用在公司的管理中是比较常见的,那具体要怎样操作呢?下面就为大家讲述怎样绘制组织结构流程图。 绘制工具:迅捷画图 在线画图是一款网站,可以绘制思维导图以及流程图,https://www.pianshen.com/article/44931903099/
7.erp系统的管理流程erp系统管理流程最新流程图和详细步骤搞定因此,在ERP系统的管理流程中,需要建立完善的数据分析流程。对于数量庞大的数据,需要采用数据挖掘和机器学习来获取有效信息,进而优化企业运营流程。此外,企业管理者还需要关注数据的时效性,并及时进行对数据进行分析和汇总,以便及时做出决策。 △好生意产品截图https://hsy.chanjet.com/hsyzg/f104b55d15648.html
8.数据处理分析的一般流程图怎么画的帆软数字化转型知识库数据处理分析的一般流程图通常包括以下几个关键步骤:数据收集、数据清洗、数据转换、数据建模、结果评估和报告发布。其中,数据收集是基础,确保数据的质量和完整性;数据清洗是为了去除噪声和错误数据,保证数据的准确性;数据转换是将数据转化为适合分析的格式;数据建模是核心步骤,通过各种算法和技术对数据进行分析和预测;结果https://www.fanruan.com/blog/article/542899/
9.在一个利用SmartArt图形制作的流程图包含四个步骤,现在需要在最刷刷题APP(shuashuati.com)是专业的大学生刷题搜题拍题答疑工具,刷刷题提供在一个利用SmartArt图形制作的流程图包含四个步骤,现在需要在最前面增加一个步骤,操作方法是什么?的答案解析,刷刷题为用户提供专业的考试题库练习。一分钟将考试题Word文档/Excel文档/PDF文档转https://www.shuashuati.com/ti/bcfbc7f255a14abca3e3e8b604205f4a.html?fm=bd0033c9107724b34a7200850bce34b2b7
10.机器学习包裹式特征选择之递归特征添加法流程图 接下来是对每一个步骤的具体介绍。 2.1 选择模型: 根据问题的类型(分类、回归、聚类等)和数据的特性(如特征数量、特征类型、数据规模等)选择一个或多个候选模型。 考虑模型的复杂度、可解释性、训练时间和预测性能等因素。 常用的模型包括线性模型、决策树、随机森林、梯度提升机、神经网络等。 https://developer.aliyun.com/article/1456852
11.商品进销存系统流程图零代码企业数字化知识站在商品进销存系统的流程图中,关键步骤包括采购管理、库存管理、销售管理、财务管理、数据分析。这些步骤形成了一个闭环,确保商品从采购到销售的各个环节都能被有效管理。在采购管理中,系统会记录供应商信息、采购订单以及入库情况;库存管理则负责监控库存水平、商品调拨和库存盘点;销售管理涉及订单处理、发货和售后服务;财https://www.jiandaoyun.com/blog/article/814472/
12.好书推荐《数据挖掘技巧》数据挖掘一般是从大量的数据中通过计算机算法,去搜索隐藏于其中信息的过程。用通俗的话说,就是面临大量的数据,使用数据挖掘工具“探勘”一遍之前,审计人员不一定有明确的目标,挖掘出来的结果也不一定在审计人员的预料之中。数据挖掘作为一种新的计算机审计方法,能够辅助审计人https://mp.weixin.qq.com/s?__biz=MzU0ODk2NjA0Nw==&mid=2247509056&idx=3&sn=efa3fad8b2f29bc4520c0acc7354b793&chksm=fbb5ffb0ccc276a6cbbf6d12458f702a0a731627617b65747658b89c3bbcd90cde9b3f9a9192&scene=27
13.钢铁大数据(精选三篇)根据以上数据挖掘的分析步骤, 由上文选定的关联规则数据挖掘模型来分析。SAS平台中关联规则数据挖掘的流程图, 如图3所示。 根据SAS关联规则挖掘算法, 运行后得到的结果如表2所示。 上图结果转化为图形, 如图4所示: 实例分析:如表2所示, 其中的9条关联规则都体现在图4中。具体分析其中的某条数据, 以中间的圆圈为https://www.360wenmi.com/f/cnkeyr4u3a4t.html
14.数据挖掘如何入门决策树是根据对目标变量产生效用的不同而构建分类的规则,通过一系列的规则对数据进行分类的过程,其表现形式类似于树形结构的流程图。采用决策树法的优点是决策制定的过程是可见的、不需要长时间构造过程、描述简单、易于理解、分类速度快;缺点是很难基于多个变量组合发现规则。决策树法擅长处理非数值型的数据,而且特别适https://www.linkflowtech.com/news/228
15.数据挖掘(业务向)数据分析知识+产品包含:业务流程图、功能结构图、功能细节描述、界面原型等 竞品分析 通过分析竞争对手的产品,发现痛点,更好地发掘并满足用户需求。 步骤:竞品基础数据管理、竞品流程管理、竞品分析、竞品展示 用户体验五要素 ToB和ToC产品区别 区别ToBToC商业模式基本是签合同,卖产品付费模式免费试用,基本是流量间接变现模式使用场景使用场http://51969.com/post/17799744.html
16.一文读懂数据战略及如何赋能业务成功数据质量管理:建立流程,通过标准、验证和清理来确保数据质量。 启用分析和见解:确定分析功能并选择适当的工具和技术。 解决数据隐私和安全问题:纳入数据保护和遵守法规的措施。 培养数据文化和技能:促进数据驱动文化并提供培训以提高员工的数据技能。 制定实施路线图:创建包含优先事项、里程碑和资源要求的详细计划。 https://36kr.com/p/2496198407493506
17.网络数据挖掘的方法及装置存储介质及电子设备与流程1.本公开涉及网络数据安全技术领域,尤其涉及一种网络数据挖掘的方法及装置、存储介质及电子设备。 背景技术: 2.对重要数据的关键性识别是网络数据安全技术的基础,在相关技术中,一般是通过匹配关键数据库或关键数据组合数据库,并通过对不同的关键数据或数据组合单一权重来实现关键性识别。但是,这种方法容易导致错误接受率http://mip.xjishu.com/zhuanli/55/202210988582.html
18.数据挖掘论文基于此背景下, 本文通过数据挖掘技术对橡胶树生长地的土壤进行评价研究, 为寻找出最适合橡胶树生长的土壤和寻找橡胶树种植地提供依据, 一方面可以降低种植橡胶的成本, 另一方面可以让新的橡胶农更容易掌握种植橡胶技巧, 让更多的人加入种植橡胶的队伍中。 2 数字化流程图https://www.ruiwen.com/lunwen/7945818.html
19.管理师教程》读书笔记思维导图模板一级(规划级):企业应开始对实施智能制造的基础和条件进行规划,能够对核心业务活动(设计、生产、物流、销售、服务) 进行流程化管理。 应聚焦智慧城市与城市经济社会发展深度融合,基于数据与知识模型实施城市经济、社会精准化治理,推动数据要素的价值挖掘和开发利用,推进城市竞争力持续提升。 https://www.processon.com/view/65eeaf4b9a343d3e89b6faf6
20.基于Python招聘信息数据采集与分析系统的设计与实现.doc基于Python招聘信息数据采集与分析系统的设计与实现 PAGE 39 摘要本次毕业设计论文主要是基于 python语言对智联招聘网的数据进行数据挖掘分析和建模,进而得出招聘信息薪资待遇预测分类模型。本次毕业设计论文分为如下步骤:数据源选择、数据采集与解析、数据存储、数据预处理、数据建模和模型评估,通过算法构建了近邻和决策树https://m.book118.com/html/2023/0114/5334200031010044.shtm