浅谈对历史频谱数据的数据挖掘

国家新闻出版广电总局五五三台自1955年建立伊始就承担着我国广播监测的繁重任务,60多年来频谱负荷收测一直是我台的主要工作之一,经过台内几代收测人员的辛勤劳动,我台现存放着自上世纪50年代至今的海量频谱原始数据,包括国内中央台广播数据,以及大量我台能够收测到的海外对华广播及途径我台的海外广播,所涉电台、语种数目都极其庞大。通过合理利用这些数据,我们将能够得以从中窥探出世界广播发展、变革的轨迹,进而对我国目前的频谱资源管理提供有价值的信息和解决方案。然而,要达到这一目标,首先要解决如何从巨大体量的数据中挖掘有用信息和知识这一难题。

一、基于大数据的数据挖掘技术

(一)大数据的定义

(二)基于大数据的数据挖掘技术

二、对历史频谱数据的数据挖掘

(一)频谱资源和频谱资源管理

无线电频谱是一种非常宝贵且有限的自然资源,是属于国家的重要战略性资源。近年来,无线电频谱需求不断增加,频率冲突越来越严峻,给频谱资源的监测和管理带来了新的困难与挑战,对无线电频谱的监测与管理是有效使用无线电资源的前提,因此,如何开展对信道和频段使用情况的有效监测,记录全频段和全时段内所有信号的基础数据,掌握用频变化,评估信道占用度和利用率,把握频谱的整体使用情况,提高频谱感知与管理能力成为亟需解决的问题。

频谱资源管理是指对无线电频谱资源的使用进行规划与控制的活动,而无线电频率管理是无线电频谱管理的核心。为了对频谱资源进行合理的管理,我们不但必须掌握现阶段的用频情况,也需要对以往的频谱数据进行分析,掌握一段时期内的用频变化,以此来对下个阶段的无线电频率划分进行决策。

(二)历史频谱数据挖掘的过程模型

对于数据挖掘项目首先要建立过程模型,这里运用美国SPSS公司提出的5A模型,即评价需求(Assess)、存取数据(Access)、完备分析(Analyze)、模型演示(Act)、结果展现(Automate),来对历史频谱数据挖掘进行过程分析。

1.评价需求

通过对海量历史频谱监测数据的深入挖掘与分析,采用形式多样、丰富的统计方法,我们可以以文本、图片等多种形式提供直观、有效、全面的历年频谱资源展示,从而为目前的频谱资源管理提供综合性决策依据。我台频谱负荷收测主要涉及中短波广播业务,故此项目主要针对中短波广播频段频谱数据进行数据挖掘。

2.存取数据

利用Hadoop数据挖掘构架实现海量数据的快速存取,主要包括了大规模数据分析工具Pig、数据仓库工具Hive、分布式编程框架MapReduce、数据状态存储HCatalog、分布式数据库Hbase以及分布式文件系统HDFS等。

3.对历史频谱数据的分析

(1)频谱占用度分析

(2)已知电台分析

已知电台分析是以已知晓的各国际国内电台作为分类,在横向、纵向上对该台在我收测点附近的,可收测到的播音情况进行统计分析。通过电台分析,可以得知某一电台的播音总体变化,包括用频变化(点阵图或柱状图显示)、历年频时数变化(折线图显示)等等。同时,按照国家、地区、使用语言(节目内容)等对电台进行分类。建立数据字典,将某一台曾使用过的台名、归属、发射地进行统一录入,方便在统计分析数据时保持完整性。

(3)使用语言分析

使用语言分析是对已知电台所播的语言种类进行统计分析。通过对各台各频率使用语言的统计筛选,可以对以我国作为主要播向区的电台频率做进一步分析,包括用频变化(点阵图或柱状图显示)、频时总数变化(折线图显示)、发射方向图展示等等,对我们把握此类电台频率的整体变化趋势有着重要的作用。

(4)未知电台、语言分析

我台的历年频谱数据中,包括了一部分未知电台以及未知语言的频率。这一部分频率在频谱负荷表中以“?”表示,大多为能够收听到播音但无法通过播音内容或国际资料确定电台归属或播音语言的频率。对该类频率,可以通过对已知电台频率的数据分析,判断其可能的归属及播音语言。

4.频谱资源挖掘模型

数据挖掘的任务模式按照功能类型可以分成描述型和预测型两类,描述型任务一般用来刻画数据的常用特征,预测型任务则通过分析目标对象的模式和规律,对未来趋势做出合理判断。在频谱数据任务中,对历史频谱数据的分析可以归为描述型,而通过对未来频谱资源分配走向的分析则应归为预测型。

将任务进行分类后,需要将各个任务归纳入某一模型类型中。数据挖掘模型可以概括为三大类:聚类、分类、关联。聚类分析旨在发现不同的簇间的差异性;分类是将历史数据按照用户的需求进行区分;关联分析则是重在挖掘两个不同关键词的内在共性。对历史频谱数据的数据挖掘可以归为分类模型。

5.数据结果可视化展现

项目最终能够通过快捷全面的前端展示平台,快速显示历史频谱数据挖掘结果,以及对未来各电台频率变化走势的分析结果,让数据以更为灵活、直观、可视化的方式表达出来。展示平台主要应能实现:3D频谱、频谱数据地域性展示、统计数据多样化展示等。

三、结束语

无线广播频谱监测与管理系统通过对大量实测数据的分析,能够直观的向用户展示各项历史数据、频谱占用情况、非法电台等大数据背后的信息,这些对频谱资源的分析、合理利用正是我们搭建无线广播频谱监测与管理系统的最终目标。而如何在庞大的数据中更高效地进行对数据的甄别、挖掘,从而向用户提出有用、合理的频谱资源问题的解决方案,是我们亟待解决的问题。

THE END
1.数据挖掘算法(AnalysisServices–数据挖掘)MicrosoftLearn数据挖掘算法的类型 应用算法 算法详细信息 请参阅 “数据挖掘算法”是创建数据挖掘模型的机制。为了创建模型,算法将首先分析一组数据并查找特定模式和趋势。算法使用此分析的结果来定义挖掘模型的参数。然后,这些参数应用于整个数据集,以便提取可行模式和详细统计信息。 https://technet.microsoft.com/zh-cn/library/ms175595(v=sql.100).aspx
2.数据挖掘的基本步骤和流程解析请阐述数据挖掘的基本过程和步骤5. 结果验证与优化:对挖掘结果进行验证,优化模型参数,提高挖掘效果。 6. 知识应用与反馈:将挖掘结果应用于实际业务,收集反馈,为后续挖掘提供依据。 总之,数据挖掘的基本步骤和流程是相互关联、循环往复的。 在实际操作过程中,需根据业务需求和数据特点灵活调整,以达到最佳的挖掘效果。 https://blog.csdn.net/m0_67484548/article/details/142665300
3.数据挖掘的挖掘模型有哪些帆软数字化转型知识库数据挖掘的挖掘模型有分类模型、回归模型、聚类模型、关联规则模型、序列模式模型、神经网络模型。分类模型用于将数据分成不同的类别,回归模型用于预测连续的数值型数据,聚类模型用于将数据分成不同的组,关联规则模型用于发现数据之间的关联,序列模式模型用于挖掘数据的时间序列模式,神经网络模型用于处理复杂的数据模式。分类https://www.fanruan.com/blog/article/593352/
4.数据仓库与数据挖掘技术—数据挖掘分类及过程模型数据挖掘:首先根据对问题的定义明确挖掘的任务或目的,如分类、聚类、关联规则发现或序列模式发现等。然后选择算法 结果解释与评估:对发现的模式进行可视化,或者把结果转换为用户容易理解的其他表示形式 Fayyad过程模型从某种意义上来说是面向理论,偏向技术的模型,而不是面向工程、面向应用的模型。虽然有模型的评估,但侧重https://www.jianshu.com/p/da25173289b9
5.数据挖掘的步骤包括什么在数据预处理后,可以通过可视化、统计等方法对数据进行探索性分析,以初步了解数据的分布和特征。这有助于确定后续分析的方向和重点。 4、特征工程 根据数据探索的结果,选择与待挖掘主题密切相关的特征,并构造新的特征以更有效地表示数据。特征工程是数据挖掘过程中非常关键的一步,直接影响模型的性能和效果。 https://www.pxwy.cn/news-id-81213.html
6.数据挖掘的过程包括:问题定义数据采集数据探索[填空1数据挖掘的过程包括:问题定义、数据采集、数据探索、[填空1]、数据挖掘和模型评价与部署。参考答案:1、数据预处理 点击查看答案&解析进入小程序搜题你可能喜欢关于带薪年假制度,下列说法正确的是 A. 用人单位安排职工休年休假,但是职工口头提出不休年休假的,用人单位可以只支付其正常工作期间的工资收入 B. 对职工https://m.ppkao.com/wangke/daan/9fae4403b31242df8b9065eeeaf10ed4
7.数据挖掘的步骤特征工程mob64ca12e83232的技术博客在数据挖掘的过程中,特征工程是一项不可忽视的工作。通过正确的特征选择、转换和创造,可以提升模型的表现,使得数据更好地服务于实际问题。回顾整个数据挖掘的过程,我们可以看到,特征工程不仅是技术的实现,更是业务理解的深度反映。 在未来的数据科学项目中,希望每一个数据挖掘的参与者都能更加强调特征工程的重要性,为https://blog.51cto.com/u_16213397/12325092
8.python数据挖掘算法的过程详解python这篇文章主要介绍了python 数据挖掘算法,首先给大家介绍了数据挖掘的过程,基于sklearn主要的算法模型讲解,给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下+ 目录 1、首先简述数据挖掘的过程 第一步:数据选择 可以通过业务原始数据、公开的数据集、也可通过爬虫的方式获取。 第二https://www.jb51.net/article/238548.htm
9.数据挖掘的流程包含哪些步骤?数据挖掘是从大量数据中挖掘出有用的信息和模式的过程。它涉及多个步骤,从数据收集到模型评估。以下是数据挖掘的常见流程步骤: 理解业务目标:在进行数据挖掘之前,需要明确业务目标和问题。确定要解决的问题以及所需的结果有助于指导整个流程。 数据收集:在这一阶段,需要收集与业务目标相关的数据。数据可以来自各种来源,https://www.cda.cn/view/202981.html
10.什么是数据挖掘?——数据挖掘的过程,方法和实例1. 数据挖掘的过程 数据挖掘的过程通常包括以下步骤:问题定义、数据采集、数据处理与清洗、特征选择与转换、模型构建与评估、模型应用与验证。首先,我们需要明确问题定义,确定我们想要从数据中获取什么样的信息。然后,进行数据采集工作,收集相关的数据。接下来,对数据进行处理和清洗,清除异常值和缺失数据。然后,进行特征https://www.jiandaoyun.com/fe/sjwjsjwjdg/
11.数据挖掘论文范文8篇(全文)而且对于问题数据还可以进行精准的识别与处理分析, 所以应用的频次更多。人工神经网络依赖于多种多样的建模模型来进行工作, 由此来满足不同的数据需求。综合来看, 人工神经网络的建模, 它的精准度比较高, 综合表述能力优秀, 而且在应用的过程中, 不需要依赖专家的辅助力量, 虽然仍有缺陷, 比如在训练数据的时候耗时较https://www.99xueshu.com/w/filedo12vrm4.html
12.大数据挖掘技术和流程数据理解指的是对用于挖掘数据的预处理和统计分析过程,有时也称为ETL过程。主要包括数据的抽取、清洗、转换和加载,是整个数据挖掘过程最耗时的过程,也是最为关键的一环。数据处理方法是否得当,对数据中所体现出来的业务特点理解是否到位,将直接影响到后面模型的选择及模型的效果,甚至决定整个数据挖掘工作能否完成预定目标https://gxq.guiyang.gov.cn/zjgxq/zjgxqxyzs/zjgxqxyzsdsjqy/201412/t20141225_17120452.html
13.大数据在高等教育领域中的应用及面临的挑战国家政策法规在大数据分类和预测分析中,采用的算法或方法有很多。例如,Sivasakthi应用学生人口统计数据以及编程导论课程的成绩,采用multilayer perception, Na?ve Bayes, SMO, J48和REPTree等分类算法对学生进行分类,并利用基于上述分类算法的预测数据挖掘模型,对修读编程导论课程的一年级本科生的成绩进行了预测。https://manager.hkxy.edu.cn/s.php/pgztw/item-view-id-54267.html
14.商业环境中的数据科学:课程开发的技能分析虽然最广泛使用的分析方法是CRISP-DM,即数据挖掘的跨行业标准流程,但数据科学还没有一个既定的流程模型。由于数据挖掘过程将从数据中发现模式的总体任务分解为一组定义良好的子任务,因此它也有助于构建关于数据科学的讨论。图2显示了基于与SFIA相关技能相关的活动和任务的适用于数据科学的过程模型。模型的核心是数据管https://maimai.cn/article/detail?fid=1765949956&efid=xiMUYryvYPolD-afmus_4g