浅谈对历史频谱数据的数据挖掘

国家新闻出版广电总局五五三台自1955年建立伊始就承担着我国广播监测的繁重任务,60多年来频谱负荷收测一直是我台的主要工作之一,经过台内几代收测人员的辛勤劳动,我台现存放着自上世纪50年代至今的海量频谱原始数据,包括国内中央台广播数据,以及大量我台能够收测到的海外对华广播及途径我台的海外广播,所涉电台、语种数目都极其庞大。通过合理利用这些数据,我们将能够得以从中窥探出世界广播发展、变革的轨迹,进而对我国目前的频谱资源管理提供有价值的信息和解决方案。然而,要达到这一目标,首先要解决如何从巨大体量的数据中挖掘有用信息和知识这一难题。

一、基于大数据的数据挖掘技术

(一)大数据的定义

(二)基于大数据的数据挖掘技术

二、对历史频谱数据的数据挖掘

(一)频谱资源和频谱资源管理

无线电频谱是一种非常宝贵且有限的自然资源,是属于国家的重要战略性资源。近年来,无线电频谱需求不断增加,频率冲突越来越严峻,给频谱资源的监测和管理带来了新的困难与挑战,对无线电频谱的监测与管理是有效使用无线电资源的前提,因此,如何开展对信道和频段使用情况的有效监测,记录全频段和全时段内所有信号的基础数据,掌握用频变化,评估信道占用度和利用率,把握频谱的整体使用情况,提高频谱感知与管理能力成为亟需解决的问题。

频谱资源管理是指对无线电频谱资源的使用进行规划与控制的活动,而无线电频率管理是无线电频谱管理的核心。为了对频谱资源进行合理的管理,我们不但必须掌握现阶段的用频情况,也需要对以往的频谱数据进行分析,掌握一段时期内的用频变化,以此来对下个阶段的无线电频率划分进行决策。

(二)历史频谱数据挖掘的过程模型

对于数据挖掘项目首先要建立过程模型,这里运用美国SPSS公司提出的5A模型,即评价需求(Assess)、存取数据(Access)、完备分析(Analyze)、模型演示(Act)、结果展现(Automate),来对历史频谱数据挖掘进行过程分析。

1.评价需求

通过对海量历史频谱监测数据的深入挖掘与分析,采用形式多样、丰富的统计方法,我们可以以文本、图片等多种形式提供直观、有效、全面的历年频谱资源展示,从而为目前的频谱资源管理提供综合性决策依据。我台频谱负荷收测主要涉及中短波广播业务,故此项目主要针对中短波广播频段频谱数据进行数据挖掘。

2.存取数据

利用Hadoop数据挖掘构架实现海量数据的快速存取,主要包括了大规模数据分析工具Pig、数据仓库工具Hive、分布式编程框架MapReduce、数据状态存储HCatalog、分布式数据库Hbase以及分布式文件系统HDFS等。

3.对历史频谱数据的分析

(1)频谱占用度分析

(2)已知电台分析

已知电台分析是以已知晓的各国际国内电台作为分类,在横向、纵向上对该台在我收测点附近的,可收测到的播音情况进行统计分析。通过电台分析,可以得知某一电台的播音总体变化,包括用频变化(点阵图或柱状图显示)、历年频时数变化(折线图显示)等等。同时,按照国家、地区、使用语言(节目内容)等对电台进行分类。建立数据字典,将某一台曾使用过的台名、归属、发射地进行统一录入,方便在统计分析数据时保持完整性。

(3)使用语言分析

使用语言分析是对已知电台所播的语言种类进行统计分析。通过对各台各频率使用语言的统计筛选,可以对以我国作为主要播向区的电台频率做进一步分析,包括用频变化(点阵图或柱状图显示)、频时总数变化(折线图显示)、发射方向图展示等等,对我们把握此类电台频率的整体变化趋势有着重要的作用。

(4)未知电台、语言分析

我台的历年频谱数据中,包括了一部分未知电台以及未知语言的频率。这一部分频率在频谱负荷表中以“?”表示,大多为能够收听到播音但无法通过播音内容或国际资料确定电台归属或播音语言的频率。对该类频率,可以通过对已知电台频率的数据分析,判断其可能的归属及播音语言。

4.频谱资源挖掘模型

数据挖掘的任务模式按照功能类型可以分成描述型和预测型两类,描述型任务一般用来刻画数据的常用特征,预测型任务则通过分析目标对象的模式和规律,对未来趋势做出合理判断。在频谱数据任务中,对历史频谱数据的分析可以归为描述型,而通过对未来频谱资源分配走向的分析则应归为预测型。

将任务进行分类后,需要将各个任务归纳入某一模型类型中。数据挖掘模型可以概括为三大类:聚类、分类、关联。聚类分析旨在发现不同的簇间的差异性;分类是将历史数据按照用户的需求进行区分;关联分析则是重在挖掘两个不同关键词的内在共性。对历史频谱数据的数据挖掘可以归为分类模型。

5.数据结果可视化展现

项目最终能够通过快捷全面的前端展示平台,快速显示历史频谱数据挖掘结果,以及对未来各电台频率变化走势的分析结果,让数据以更为灵活、直观、可视化的方式表达出来。展示平台主要应能实现:3D频谱、频谱数据地域性展示、统计数据多样化展示等。

三、结束语

无线广播频谱监测与管理系统通过对大量实测数据的分析,能够直观的向用户展示各项历史数据、频谱占用情况、非法电台等大数据背后的信息,这些对频谱资源的分析、合理利用正是我们搭建无线广播频谱监测与管理系统的最终目标。而如何在庞大的数据中更高效地进行对数据的甄别、挖掘,从而向用户提出有用、合理的频谱资源问题的解决方案,是我们亟待解决的问题。

THE END
1.通俗易懂,数据挖掘的过程是什么?数据挖掘的流程导读:数据挖掘过程包含数据清洗、特征提取、算法设计等多个阶段,本文将讨论这些阶段。 01 数据挖掘过程 典型数据挖掘应用的过程包含以下几个阶段。 1. 数据采集 数据采集工作可能是使用像传感器网络这样的专门硬件、手工录入的用户调查,或者如Web爬虫那样的软件工具来收集文档。虽然这个阶段与具体应用息息相关,但常常落在https://blog.csdn.net/maiya_yayaya/article/details/131590669
2.数据挖掘的六大过程数据挖掘的六大过程通常包括:数据清洗、数据集成、数据选择、数据变换、数据挖掘、模式评估。 这六个过程构成了一个系统而复杂的工作流程,旨在从大量数据中提取有用的模式和知识,支持决策和预测。 以下是每个过程的详细解释: 一、数据清洗 定义:数据清洗是对原始数据进行预处理的过程,旨在解决数据缺失、不一致、噪声等https://www.ai-indeed.com/encyclopedia/10656.html
3.什么是数据挖掘的流程?一步步带你掌握数据挖掘的完整过程数据预处理是数据挖掘过程中最耗时的一步,但也是最关键的一步。它包括数据清洗、数据集成、数据规约和数据变换等。数据清洗的目的是去除噪声和不一致数据,例如处理缺失值和异常值。数据集成则是将来自不同来源的数据合并,例如将不同部门的数据统一到一个数据仓库中。数据规约和变换则是为了减少数据量但保留其本质特征https://www.cda.cn/view/204893.html
4.python数据挖掘算法的过程详解python这篇文章主要介绍了python 数据挖掘算法,首先给大家介绍了数据挖掘的过程,基于sklearn主要的算法模型讲解,给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下+ 目录 1、首先简述数据挖掘的过程 第一步:数据选择 可以通过业务原始数据、公开的数据集、也可通过爬虫的方式获取。 第二https://www.jb51.net/article/238548.htm
5.数据挖掘论文其次,对档案进行鉴定与甄别,这也是档案工作中较困难的过程,过去做好这方面的工作主要依靠管理档案管理员自己的能力和水平,主观上的因素影响很大,但是数据挖掘技术可以及时对档案进行编码和收集,对档案进行数字化的管理和规划,解放人力资源,提升档案利用的服务水平。第三,数据挖掘技术可以减少档案的收集和保管成本,根据https://www.unjs.com/lunwen/f/20220924130749_5650839.html
6.问答题:请简述数据挖掘的过程。答案:数据挖掘的过程包括以下几个步骤:首先,明确挖掘的目标和任务;其次,收集和准备相关数据,包括数据清理、集成、转换和归约等;然后,通过可视化等方法对数据进行探索和分析,进一步了解数据的分布和特征;接着,选择合适的算法和技术对数据进行挖掘,提取有用的信息和知识;最后,对挖掘得到的结果进行解释和评估,并将结果应https://easylearn.baidu.com/edu-page/tiangong/questiondetail?id=1776600138197517981&fr=search
7.数据挖掘的步骤包括什么数据挖掘是一个通过特定算法对大量数据进行处理和分析,以发现数据中的模式、趋势或关联性的过程。下面详细介绍数据挖掘的步骤包括什么? 1、数据收集 首先,需要收集与待挖掘主题相关的数据。可能涉及从各种来源(如数据库、文件、网络等)获取数据,并将其清洗、整合到一个统一的格式中。 https://www.pxwy.cn/news-id-81213.html
8.数据挖掘的过程张杰整理数据挖掘是指一个完整的过程,该过程从大型数据库中挖掘先前未知的、有效的,可实用的信息,并使用这些信息做出决策或丰富知识。下图描述了数据挖掘的主要步骤和过程。 数据挖掘过程中各步骤的大体内容如下: 第一步:确定挖掘目的。认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结果是不可预测的,但要探索的问题应https://maimai.cn/article/detail?fid=1405334297&efid=7lwV824VMzvaUfEhWMvd3A
9.什么是数据挖掘?——数据挖掘的过程,方法和实例数据挖掘是指从大量的数据中发现有价值的模式、规律和知识,以支持决策和预测分析的过程。通过数据挖掘,我们可以从海量数据中发现隐藏的关联性和趋势,为企业和组织提供宝贵的商业洞察力。下面将介绍数据挖掘的过程、方法和实例。 1. 数据挖掘的过程 数据挖掘的过程通常包括以下步骤:问题定义、数据采集、数据处理与清洗、https://www.jiandaoyun.com/fe/sjwjsjwjdg/
10.一种基于数据挖掘的混合生产过程质量控制方法的英文翻译海词词典,最权威的学习词典,专业出版一种基于数据挖掘的混合生产过程质量控制方法的英文,一种基于数据挖掘的混合生产过程质量控制方法翻译,一种基于数据挖掘的混合生产过程质量控制方法英语怎么说等详细讲解。海词词典:学习变容易,记忆很深刻。http://dict.cn/%E4%B8%80%E7%A7%8D%E5%9F%BA%E4%BA%8E%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E7%9A%84%E6%B7%B7%E5%90%88%E7%94%9F%E4%BA%A7%E8%BF%87%E7%A8%8B%E8%B4%A8%E9%87%8F%E6%8E%A7%E5%88%B6%E6%96%B9%E6%B3%95
11.数据挖掘研究(精选十篇)数据挖掘是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程, 这些信息的表现形式为:规则、概念、规律及模式等。它可帮助决策者分析历史数据及当前数据, 并从中发现隐藏的关系和模式, 进而预测未来可能发生的行为。数据挖掘的过程也叫知识发现的过程。 https://www.360wenmi.com/f/cnkey7ouwjk5.html
12.终于有人把数据挖掘讲明白了图1 数据挖掘过程 2数据挖掘的内容 2.1 关联规则挖掘 从大规模数据中挖掘对象之间的隐含关系称为关联分析(Associate Analysis)或者关联规则挖掘(Associate Rule Mining),它可以揭示数据中隐藏的关联模式,帮助人们进行市场运作、决策支持等。 考察一些涉及许多物品的事务。事务1中出现了物品甲,事务2中出现了物品乙,事务3https://www.51cto.com/article/698009.html
13.数据分析的过程主要包含这7个方面数据分析的过程是循序渐进的过程,主要包括如下7个方面。 一个完整的数据分析的过程,应该包括数据采集、数据存储、数据提取、数据挖掘、数据分析、数据展现、数据应用七个方面。今天我们就来从这几个角度着手,简要介绍一下数据分析的过程。 1. 数据采集 数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条https://www.jiushuyun.com/hywz/2061.html
14.大数据挖掘技术和流程数据理解指的是对用于挖掘数据的预处理和统计分析过程,有时也称为ETL过程。主要包括数据的抽取、清洗、转换和加载,是整个数据挖掘过程最耗时的过程,也是最为关键的一环。数据处理方法是否得当,对数据中所体现出来的业务特点理解是否到位,将直接影响到后面模型的选择及模型的效果,甚至决定整个数据挖掘工作能否完成预定目标https://gxq.guiyang.gov.cn/zjgxq/zjgxqxyzs/zjgxqxyzsdsjqy/201412/t20141225_17120452.html
15.数字人大建设何以促进全过程人民民主发展:创新路径与前景展望人民代表大会作为实现全过程人民民主的重要载体,需要继续发挥先行示范作用,依托数字化建设,积极推进全过程人民民主的实践模式。数字人大建设应该通过主动对标全过程人民民主要求,从横纵联通的数字基础底座建设、闭环式工作流程重塑、精准处理与协同共享为导向的数据应用能力建设、技术应用的安全和标准探索四个方面入手,推动全https://theory.southcn.com/node_203ed94b00/955f4694a7.shtml
16.天津大学首批10门研究生课程登陆“学堂在线”平台课程介绍:主要介绍数据分析与数据挖掘的基本概念和方法。使学习者熟悉数据挖掘的过程,掌握数据分析与数据挖掘过程中常用的算法模型及数据处理方式,为相关研究打下数据处理基础。 课程链接:https://next.xuetangx.com/course/tjnu08091002372/1497582 光电检测技术 http://www.tju.edu.cn/info/1026/2531.htm