打造精细化标签体系,DATRIX驾驭非结构化数据管理

早在1700年,欧洲印制出了用在药品和布匹上作为商品识别的第一批标签。所以,现在的标签是用来标志您的产品目标和分类或内容,像是给目标确定的关键字词,便于自己和他人查找和定位自己目标的工具。

为什么要给内容打标签?

因为,我们要找一切我们认为有用的东西。

1)快速识别

2)便捷检索

分类和标签的联系与区别

1)建立联系的方式不同

分类是自上而下的,也就是先有分类,而后才有内容。标签是自下而上的,一定是先有内容,才有标签。分类自上而下的特性,有助于“重聚”关键词相同的内容。这就决定了它们的维度不同「分类是抽象化,大纲级别;标签是实例化,关键词级别」。

2)描述的类型不同

分类描述的是属性,故名“分门别类”。花是花,树是树。标签描述的是内容特征,所以叫做“打标签”,有点像“扣帽子”。

数据管理为什么需要标签体系?

传统企业的信息化使用更多的是分类体系,而标签体系是互联网企业的“致胜法宝”。

随着数字化时代的到来,大数据&人工智能等技术掀起了传统企业数字化转型的浪潮。从技术侧来看,转型就是拥抱互联网,战略性地使用数据和IT。

如果将数据管理平台定位成一个存储和管理数据的技术平台,那或许有“分类体系”就可以了。但如果数据管理平台的定位是企业数字化转型的运营中枢系统,要实现对前端业务的支持和赋能,那“标签体系”就是数据管理平台的标配。

分类是自上而下的规划,侧重标准化,标签是自下而上的倒推,注重业务场景。

“数字转型,场景为王”,在“技术+业务”双驱模式的数据管理平台中,标签体系、数据萃取将助力企业运营转型升级。

德拓信息自研的DATRIX智能数据管理平台作为一站式数据平台,提供从数据汇聚、数据存储、管理、搜索、转码、AI处理、发布应用、到归档备份的数据全流程生命周期管理,实现组织数据资源的统一管理与共享交换。

DATRIX目前已在多行业有大量的项目案例,今天,小拓将以以苏州广播电视台为例,来谈谈标签体系在非结构化数据管理中的重要性。

项目需求

随着信息化时代的发展,数据量越来越大,数据的时效越来越急迫。在面对各类业务生产的需求时,作为领先的媒体平台,苏州台对于各类视频、音频、图片文档等非结构化数据管理具有更高的要求。

目前国内大多数电视现有的传统媒体库,在进行素材编辑时,无法对部分素材进行统一的存储,台内素材编辑人员与部门缺少数据共享、归档的意识,导致各类数据利用率低,共享困难。

基于这些需求和痛点,德拓信息为苏州台在DATRIX的基础上定制化打造了影像素材智能管理平台,通过AI智能技术、知识图谱、标签体系等技术对生产资源实现更多层次更细节化的管理,以满足各类业务的生产需求,拓展更多智能化的生产方式。

在管理层面,用从内容信息维度的管理原始级精品素材的方式将取代现在分类式的素材管理模式;

在协同共享层面,通过部门空间应用,加强素材在部门内容有效协同共享;

在服务层面,采用标签检索和图谱等技术,提高素材检索精度,为内容生产系统服务。

标签体系的具体应用

/应用一/

文件标记

通过标签树,分类标签管理功能,实现即时&上传完成后打标签,且提供标签层级关系,极大方便用户后期的文件管理。

1)利用标签树,实现有层级的标签管理,增强t标签的关联性:

(标签树管理)

2)后台设定不同类型文件对应的必填标签,支持即时&上传完成后打标签,极大方便后期的文件管理。

(分类标签管理)

(即时上传完成后打标签)

/应用二/

数据推荐

(基于标签的文件推荐)

/应用三/

智能检索

利用标签树,实现标签推荐:即用户在搜索关键词时,如果该关键词存在于标签树中,那么在搜索页面可为用户推荐搜索词的上级、平级、下级标签,提升搜索的逻辑深度,为用户尽可能找到所需文件。

(搜索标签推荐)

如上图所示,当用户搜索‘姑苏区’时,搜索结果为元数据信息中包含‘姑苏区’的所有文件。同时‘姑苏区’存在于标签树中,故此处推荐标签为‘苏州市’(上级标签)、‘吴中区/吴江区/相城区’(平级标签)。当用户点击推荐标签后,即视为以该标签继续搜索对应文件。

标签检索:DATRIX支持多维度的文件信息检索,其中标签是重要的维度之一。

(文件搜索)

如上图所示,在搜索‘吴中区’时,出现四个搜索结果,此外,标签推荐继续推出关联标签。第一个文件的标签与搜索关键词直接匹配,列为第一,可见标签在文件检索中有着至关重要的地位。

/应用四/

基于德拓AI引擎,给文件自动打标签

在后续版本升级中,DATRIX将支持基于Ai引擎,给不同类型文件自动打标签,例如:针对新闻视频中出现的多人会议/主持人/飞机/汽车等文件,通过转码和Ai引擎处理,自动给该文件打上‘会议’、‘主持’、‘飞机’、‘汽车’等标签,极大提升文件管理及使用效率,帮助用户深入挖掘数据价值。

DATRIX作为德拓信息十年的拳头产品,在媒体、教育、金融、医疗等多个行业沉淀了大量经典案例,目前已服务于CCTV、SMG、复旦大学、中国医科大学、四川大学华西医院、联想之星等单位。

用户场景虽不尽相同,但在各个案例中,标签体系均扮演着极其重要的角色。德拓信息DATRIX产品也将坚定不移的持续优化标签体系在各行业领域的具体落地场景,帮助用户最大程度发掘数据价值,更高效的管理和使用数据。

THE END
1.结构化数据半结构化数据和非结构化数据结构化数据 结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。举一个例子: id name age gender 1 lyh 12 male 2 liangyh 13 female 3 liang 18 male https://blog.csdn.net/liangyihuai/article/details/54864952
2.结构化数据和非结构化数据的区别–PingCode数据是当今数字化世界的基础,各种组织和企业都依赖数据来进行决策、分析和创新。在数据处理和存储方面,有两种主要类型的数据:结构化数据和非结构化数据。这两种数据类型之间存在显著的区别,了解它们之间的差异对于有效地利用数据至关重要。 结构化数据 结构化数据是以表格、数据库或类似的结构组织和存储的数据。它通常遵https://docs.pingcode.com/ask/65799.html
3.结构化数据和非结构化数据的区别阿里云为您提供结构化数据和非结构化数据的区别相关的70498条产品文档内容及常见问题解答内容,还有等云计算产品文档及常见问题解答。如果您想了解更多云计算产品,就来阿里云帮助文档查看吧,阿里云帮助文档地址https://help.aliyun.com/。https://help.aliyun.com/wordpower/447655-1.html
4.结构化和非结构化有什么区别?结构化和非结构化数据的区别,可以说是现代数据管理中非常关键的一个概念。下面,我就根据最新的参考资料和自己的理解,详细为大家讲解一下这两者的区别。 首先,结构化数据是指那些以固定格式或模式存储的信息。这类数据最典型的例子就是数据库表格中的信息,例如客户x名单、销售记录等。它的特点包括: - 格式固定:https://localsite.baidu.com/article-detail.html?articleId=30765201&ucid=PHfzrjnLPWf&categoryLv1=%E6%95%99%E8%82%B2%E5%9F%B9%E8%AE%AD&ch=54&srcid=10004
5.解析非结构化数据与结构化数据的区别与联系非结构化数据和结构化数据是两种不同的数据形式,它们在数据的结构、处理方式、获取方式等方面存在差异。非结构化数据是指没有固定格式和明确结构的数据,它包括文本、图像、视频等类型,其组织形式相对自由灵活。而结构化数据是以表格和数据库形式组织的数据,具有明确的数据结构和规范的格式。本文将通过对非结构化数据和https://www.filez.com/news/detail/8334ba6c5eb4f79c51096083f5cb75ca.html
6.结构化数据与非结构化数据的差异在本文中,我们将讨论结构化数据和非结构化数据以及它们之间的区别。 结构化和非结构化数据是数据的两大类。由于我们生活在一个信息时代,数据是我们日常生活中必不可少的东西,我们做的每一个决定都是基于这样或那样的数据。 在本文中,我们将讨论结构化数据和非结构化数据以及它们之间的区别。 https://www.51cto.com/article/694851.html
7.什么是结构化半结构化和非结构化数据?什么是结构化、半结构化和非结构化数据? ①结构化数据:指关系模型数据,即以关系数据库表形式管理的数据,结合到典型场景中更容易理解,比如企业ERP、OA、HR里的数据。 ②非结构化数据:指数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。如word、pdf、ppt及各种格式的图片、视https://it.ynnu.edu.cn/info/1054/2898.htm
8.结构化数据vs非结构化数据最具包容性的大数据分析同时使用结构化和非结构化数据。 结构化数据与非结构化数据的区别是什么? 除了在关系数据库中存储与在数据库外部存储之间存在明显的区别外,最大的区别是分析结构化数据与非结构化数据的简便性。存在用于结构化数据的成熟分析工具,但是用于挖掘非结构化数据的分析工具是新生和发展中的。 https://www.jianshu.com/p/1ae5d687092e
9.信息公开专栏? (2)特点:由于非结构化数据过于复杂且经常变动,信息表现灵活,无法限定结构对其进行预定义模型,基本在数据仓库中以文件的形式存放在文件系统里或存储在传统数据库的大对象字段中。 ? 与结构化数据相比,有了很大区别,其特点如下: ? a.数据在先,模式在后; https://www.changzhi.gov.cn/xxgkml/zfxxgkml/szfgzbm/czstjj/czsrmzf/tjxx_1188/sjfxhjd/202207/t20220704_2588893.shtml
10.结构化数据与非结构化数据的差异结构化和非结构化数据是数据的两大类。由于我们生活在一个信息时代,数据是我们日常生活中必不可少的东西,我们做的每一个决定都是基于这样或那样的数据。 下面我们将讨论结构化数据和非结构化数据以及它们之间的区别。 什么是结构化数据? 结构化数据是指按照预定义的模型结构化或以预定义的方式组织的数据。根据谷歌https://www.modb.pro/db/407619
11.什么是非结构化数据(unstructureddata)?机器之心随着AI和5G时代的到来,我们对信息的渴望被极大的唤起,常规的结构化数据交互已经不能满足人们的需求,而伴随着数字化的快速发展,非结构化数据扮演起越来越重要的角色,图片、视频、语音蕴含的丰富信息将被广泛利用。然而真正能够使用并且管理非结构化数据是现在人工智能领域的一大问题。 https://www.jiqizhixin.com/articles/2020-05-20-10
12.银行专岗计算机考试大纲4.数据处理速度快(Velocity) 这是大数据区别于传统数据挖掘的显著特征,需要对数据进行实时的分析。 5.数据真实性(Veracity) 大数据中的内容与真实世界中的发生的事件息息相关,研究大数据就是从庞大的网络数据中提取出能够解释和预测现实事件的过程。 (三)大数据的结构类型 大数据包括结构化、半结构化和非结构化数据,http://www.yinhangzhaopin.com/yhks/yhbs/1/96117.html
13.非结构化数据怎么治理?最近遇到几个项目,都跟非结构化数据脱不开关系。老彭刚毕业的时候,做的是数据库的活儿,那都是结构化数据。后来有了hadoop技术,可以用来处理物联网、互联网的半结构化数据。真正做非结构化的场景还是比较少的,大多是在项目中选取一两个点给意思意思一下。https://www.niaogebiji.com/article-139650-1.html
14.什么是结构化数据和非结构化数据?零代码知识中心结构化数据易于搜索和组织,机器设备可以轻松地处理。用户可以输入数据、搜索数据库、修改和使用数据,通常使用关系数据库管理系统或结构化查询语言 (SQL)。SQL 是专门为管理结构化数据而设计的编程语言。 二、什么是非结构化数据? 顾名思义,其他所有不能按照行列格式整齐排列的数据都是结构化数据,如录音、视频片段、图https://www.jiandaoyun.com/fe/gdyqhj/
15.结构化数据和非结构化数据不同在哪里,这里有答案结构化数据和非结构化数据不同在哪里,今天跟大家说说:https://www.fanruan.com/bw/jjiehidal
16.文本挖掘与非结构化数据分析通过OpenText Intelligent Classification 获取洞察力!由人工智能驱动的文本挖掘和非结构化数据分析,帮助您做出更明智的决策,发现隐藏的价值。https://www.opentext.com/zh-cn/products/magellan-text-mining
17.什么是结构化数据?结构化数据完整指南Elastic定义结构化数据,通过探索示例理解它与非结构化数据和半结构化数据有哪些不同,并了解如何使用结构化数据。https://www.elastic.co/cn/what-is/structured-data
18.非结构化数据与大数据的关系及影响合理地利用非结构化数据,并运用先进的技术和算法对其进行处理和分析https://www.gokuai.com/press/a184
19.为什么我们称文本为“非结构化”?为什么计算机对结构化和非结构化的定义会有所不同? 该计算机可以处理结构化数据,而非非结构化数据,计算机希望数据整齐,整齐地堆在一起,称为记录,每个记录都有一个键和其他属性,一旦将数据组织成结构化格式,计算机就会加快速度,就像子弹穿过机枪一样,如果没有子弹则机枪卡住。 https://www.chinacpda.com/data/detail/?id=1951