数据治理体系之二

“很多刚进入数据行业的从业者对于元数据经常会存在理解不了,或者不知道是什么的现象,本文简单从什么是元数据,元数据的定义,元数据的作用,元数据管理的功能,以及元数据在数据治理中的意义进行介绍元数据”

元数据是指描述数据的数据,它包含有关数据的各种属性和特征的信息。在DAMA(数据管理协会)中,元数据的定义是指一组结构化信息,用于描述和管理数据资源。它描述了数据本身(如数据库、数据元素、数据模型),数据表示的概念(如业务流程、应用系统、软件代码、技术基础设施),数据与概念之间的联系(关系)。元数据可以帮助组织理解其自身的数据、系统和流程,同时帮助用户评估数据质量,对数据库与其他应用程序的管理来说是不可或缺的。它有助于处理、维护、集成、保护和治理其他数据。

通过准确、一致和完整的元数据管理,组织可以更好地管理和控制数据资产,提高数据的可信度和可用性,从而支持业务决策和创新。

看这个定义,元数据是什么还是相对比较抽象,下面进行详细的说明。

01什么是元数据

前面已经结束了元数据的定义,下面我们以一个详细的示例来说明什么是元数据。

例如:一张人员信息PersonnelInformation,里面包含字段:ID、Name、EnglishName、Gender、Contact、Post.那么我们在数据库中看到的数据是这样的。

对于这样一张表,我们需要了解这张表的数据就一定需要了解这个表的元数据,那么元数据是什么了

元数据包含业务元数据、技术元数据(包含操作元数据)、管理元数据三种类型。下面详细介绍元数据的三类元数据信息:

一、业务元数据

1)数据集、表和字段的定义和描述,例如表的描述、字段描述属性。

2)业务规则、转换规则、计算公式和推导公式,例如指标字段的计算公式,转换规则等。

3)数据模型(概念模型、逻辑模型),在模型设计阶段中的逻辑模型等。

4)数据质量规则和检核结果,例如对某个字段的质量检查规则。

5)数据标准,例如对某个字段的数据标准。

6)数据的安全/隐私级别。

二、技术元数据

技术元数据(TechnicalMetadata)提供有关数据的技术细节、存储数据的系统以及在系统内和系统之间数据流转过程的信息。技术元数据示例包括:

1)物理数据库表名和字段名。

2)字段属性。

3)数据库对象的属性。

4)访问权限。

5)数据CRUD(增、删、改、查)规则。

6)物理数据模型,包括数据表名、键和索引。

7)ETL作业详细信息。

8)文件格式模式定义。

9)数据溯源和数据血缘,包括上游和下游变更影响的信息。

10)周期作业(内容更新)的调度计划和依赖。

11)恢复和备份规则。

12)数据访问的权限、组、角色。

操作元数据

操作元数据(OperationalMetadata)描述了处理和访问数据的细节,例如:

1)批处理程序的作业执行日志。

2)抽取历史和结果。

3)调度异常处理。

4)审计、平衡、控制度量的结果。

5)错误日志。

8)备份、保留、创建日期、灾备恢复预案。

10)容量和使用模式。

12)清洗标准。

13)数据共享规则和协议。

14)技术人员的角色、职责和联系信息。

三、管理元数据

管理元数据是指元数据属性中的管理属性,例如数据所属权,数据所有者,数据拥有部门等属性。表明数据管理权限等。

2)数据所有权属性(如数据所有权部门、数据所有者)。

那么针对上面那个例子,我们详细列一下该表的业务元数据、技术元数据、管理元数据信息。

元数据管理的元数据模型信息具体根据实际使用需要参照以上的列出来的类别进行添加。以上就是元数据的模型,根据这个模型,建立元数据采集任务,将这些信息采集进入表中进行管理,即完成元数据采集的任务。

02非结构化数据的元数据

非结构化数据的元数据包括以下内容:

这些元数据的存在对于非结构化数据的有效管理至关重要。

非结构化数据的元数据主要应用对象是数据湖的数据,数据挖掘和数据科学家需要对数据探索的时候,需要通过元数据找到需要的数据,以及其他元数据定位到自己需要找到的数据,主要能通过元数据进行搜索和定位的能力。

03、元数据的作用

元数据的作用在数据管理中的重要性毋庸置疑,主要体现在三个方面。

一、数据的解读和理解

完善的元数据让数据可以被解读、被理解,进而才能被管理、被使用。

二、元数据目录是提供数据管理的依据

通过收集和维护元数据,我们可以构建一个元数据目录。在这个元数据目录中,记录了企业的数据及其详细描述信息。元数据目录是数据资产管理和数据共享的基石,也是校验数据质量、制定数据安全策略和建立资产目录的依据。同时,元数据的补充还包括数据安全等级和安全策略等重要信息。

例如我们建立数据资产目录是依据元数据建立的。

例如我们建立服务市场和数据资产市场是依据元数据建立的。

三、数据开发过程中排查问题的依据

综上所述,元数据是大数据管理和治理以及开发的基础,没有这个基础,其他上层的工作都无法开展。

04元数据的管理功能

元数据管理的功能主要包含:元模型管理功能、元数据采集,元数据维护、元数据列表、任务监控五个功能。

元模型管理功能,可以自定义选择元数据采集的元数据项,不同公司可以根据当前使用需求,对元数据采集的任务项进行增删修改,自定义可视化修改元模型。

元数据采集,根据定义的元数据模型,添加采集任务,需要采集哪些库,哪些表的元数据信息呢,新建采集任务之后,由调度系统进行调度执行,更新元数据。

元数据维护,采集元数据有时候存在漏采,错采等情形,提供维护页面对采集的元数据进行修改。

元数据列表,采集元数据以业务维度、技术维度、管理维度、安全维度展示,同时管理采集的元数据版本,可以对比不同版本发生的变更。

任务监控,则是对创建的元数据采集任务进行监控,可以重新启动,或者立即执行,了解采集任务的采集成功或者失败情况。

THE END
1.结构化数据半结构化数据和非结构化数据通过这样的数据格式,可以自由地表达很多有用的信息,包括自我描述信息(元数据)。所以,半结构化数据的扩展性是很好的。 非结构化数据 顾名思义,就是没有固定结构的数据。各种文档、图片、视频/音频等都属于非结构化数据。对于这类数据,我们一般直接整体进行存储,而且一般存储为二进制的数据格式。https://blog.csdn.net/liangyihuai/article/details/54864952
2.什么是结构化半结构化和非结构化数据?①结构化数据:指关系模型数据,即以关系数据库表形式管理的数据,结合到典型场景中更容易理解,比如企业ERP、OA、HR里的数据。 ②非结构化数据:指数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。如word、pdf、ppt及各种格式的图片、视频等。 https://it.ynnu.edu.cn/info/1054/2898.htm
3.非结构化数据包括哪些内容在信息技术快速发展的今天,数据已经成为我们生活和工作中不可或缺的一部分。数据大致可以分为结构化数据和非结构化数据两大类。结构化数据主要指的是具有固定格式和结构的数据,如数据库中的表格数据。而非结构化数据,由于其形式多样、结构不固定,一直是数据处理和分析的难点和热点。 https://www.zhuflow.cn/news/information/1358.html
4.什么是非结构化数据?在当今数字化的世界中,数据的多样性和海量性已经成为了一个普遍的现象。除了传统的结构化数据,我们还面临着大量的非结构化数据。非结构化数据指的是缺乏明确的数据模式和格式,数据来源多样的数据类型。在本文中,我们将探索非结构化数据的定义、特点以及其在不同领域的应用。 https://www.filez.com/news/detail/974a6ef096d0b214bf7e13a2218d4e30.html
5.非结构化数据是什么9CaKrnJVtI1china.huanqiu.comzh-Hansarticle非结构化数据是什么非结构化数据主要是指那些无法用固定结构来逻辑表达实现的数据,简单来说就是用户散落在论坛、微博、微信或其他渠道发表的关于产品的各种评价或吐槽。国内的企业级客户在进行大数据分析时,仍以分析结构化数据为主。从形态上,非结构化数据主要包含三大块:第https://m.huanqiu.com/r/MV8wXzg5MzI2MTNfOTBfMTQ2MzMzODI2MA==
6.什么是非结构化数据?在当今的数字化时代,数据被认为是新的“石油”。企业、组织和个人每天都在产生大量的数据,而这些数据可以大致分为三类:结构化数据、半结构化数据和非结构化数据。其中,非结构化数据(Unstructured Data)占据了大部分,它的存在形式非常广泛和灵活,因此给数据管理和分析带来了巨大的挑战和机遇。本文将带你深入了解什么是https://zhuanlan.zhihu.com/p/721431172
7.非结构化数据是什么意思在大数据的浩瀚海洋中,数据被分为两大类:结构化数据和非结构化数据。结构化数据因其规整性和易处理性而广受欢迎,但非结构化数据同样蕴含着巨大的价值和潜力。那么,究竟什么是非结构化数据呢? 一、非结构化数据的定义 非结构化数据,顾名思义,是指那些不符合传统数据库结构(即行和列)的数据。这类数据通常以文本https://www.gokuai.com/press/a574
8.什么是非结构化数据?非结构化数据完整指南Elastic定义非结构化数据并探索数据示例以理解它与结构化数据有哪些不同。了解如何分析非结构化数据,非结构化数据的优点和带来的挑战。https://www.elastic.co/cn/what-is/unstructured-data
9.什么是结构化数据和非结构化数据?零代码知识中心二、什么是非结构化数据? 顾名思义,其他所有不能按照行列格式整齐排列的数据都是结构化数据,如录音、视频片段、图像、社交媒体帖子、电子邮件内容、客户服务聊天记录、机器传感器数据等等。据 Gartner 估计,非结构化数据约占企业所有数据的 80%,来自其他机构的估计甚至更高。 https://www.jiandaoyun.com/fe/gdyqhj/
10.什么是非结构化数据?Teradata非结构化数据是指没有固定组织原则的未经过滤的信息。它通常被称为原始数据。了解更多信息。https://prod1.teradata.com/Glossary/What-is-Unstructured-Data
11.什么是非结构化数据?OpenText非结构化数据是指没有按照预定义方式组织的数据集。了解非结构化数据的类型以及如何管理它们至关重要。https://www.opentext.com/zh-cn/what-is/unstructured-data
12.什么是非结构化数据(unstructureddata)?机器之心随着AI和5G时代的到来,我们对信息的渴望被极大的唤起,常规的结构化数据交互已经不能满足人们的需求,而伴随着数字化的快速发展,非结构化数据扮演起越来越重要的角色,图片、视频、语音蕴含的丰富信息将被广泛利用。然而真正能够使用并且管理非结构化数据是现在人工智能领域的一大问题。 https://www.jiqizhixin.com/articles/2020-05-20-10
13.请简述什么是结构化数据和非结构化数据。上述错账分别采用什么错账更正方法,并说明更正方式。8分钟前 u*** 购买了资源 云南开放大学电工电子技术第二次作业17分钟前 a*** 下载了资源 江苏开放大学纳税实务第三次形考作业25分钟前 a*** 购买了资源 江苏开放大学纳税实务第三次形考作业25分钟前 a*** 下载了资源 2024春江苏开放大学外国留学生汉语偏误https://www.ddwk123.cn/archives/652785
14.爱数非结构化数据中台解决方案针对文档、图片、视频等非结构化数据,打造统一数据管理、统一分析洞察、统一安全体系、统一内容服务的融合式中台。 非结构化数据中台围绕非结构化数据以DIKW模型为指引,消除数据孤岛,深度融合人工智能技术,实现汇集、治理、分析洞察和知识服务,全方位赋能业务与人。 https://www.aishu.cn/cn/unstructured-data-solution
15.为什么我们称文本为“非结构化”?文本背后确实存在结构,但是这不允许在计算机的角度将文本视为结构化的,这种结构是如此巨大,如此复杂,如此神秘以至于计算机无法理解,计算机仅能理解简单的结构,而语言简直就是苍白无力,因此在计算机看来,文本是非结构化的,更复杂的是,非结构化数据(从计算机的角度来看)包含的内容远远超过文本,非结构化数据包括各种其他数据https://www.chinacpda.com/data/detail/?id=1951
16.浅谈非结构化数据的特点都有哪些之前小编有谈论过什么是结构化数据,有结构化数据,也有非结构化数据。本文,就简单谈论一下什么是非结构化数据,以及非结构化数据的特点都有哪些。 非结构化数据是数据结构不规则或不完整,不方便用数据库二维逻辑表来表现的数据,没有预定义的数据模型,包括所有格式的办公文档、HTML、文本、图片、XML,各类报表、图像和https://www.yun88.com/news/1165.html
17.数据架构:大数据数据仓库以及DataVault值得注意的是,企业中的大数据包括重复型非结构化数据和非重复型非结构化数据,如图1.1.6所示。 1.1.5 分界线 一开始,对于非结构化数据的两种类型(重复型非结构化数据和非重复型非结构化数据),我们可能认为它们之间的差别是难以预料、微不足道的。实际上,这两种非结构化数据类型之间的差异并非微不足道。因为这两种https://www.ituring.com.cn/book/tupubarticle/11854
18.下列数据不属于非结构化数据的是()。下列数据不属于非结构化数据的是()。 A.文本文档 B.视频 C.事务性数据 D.图片 点击查看答案进入题库练习 查答案就用赞题库小程序 还有拍照搜题 语音搜题 快来试试吧 无需下载 立即使用 你可能喜欢 单项选择题 软件需求类型有功能需求()。 A.非功能需求 B.质量属性 C.约束 D.用户需求 点击查看答案进https://m.ppkao.com/mip/tiku/shiti/5149439.html
19.结构化与非结构化的区别多源异构数据源半结构化数据①结构化数据:指关系模型数据,即以关系数据库表形式管理的数据,结合到典型场景中更容易理解,比如企业ERP、OA、HR里的数据。 ②非结构化数据:指数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。如word、pdf、ppt及各种格式的图片、视频等。 https://www.fanruan.com/bw/doc/154297
20.非结构化的数据库51CTO博客已为您找到关于非结构化的数据库的相关内容,包含IT学习相关文档代码介绍、相关教程视频课程,以及非结构化的数据库问答内容。更多非结构化的数据库相关解答可以来51CTO博客参与分享和学习,帮助广大IT技术人实现成长和进步。https://blog.51cto.com/topic/feijiegouhuadeshujuku.html