档案信息长久保存策略研究学术研究

2017年5月14日,习近平在“一带一路”国际合作高峰论坛开幕式上的演讲中提到:要坚持创新驱动发展,加强在数字经济、人工智能、量子计算机等多方面前沿领域合作,推动大数据、云计算、智慧城市建设。其中智慧城市建设离不开智慧档案的支持与服务。智慧档案是对原有的数字档案馆的提升与发展,是档案信息化发展的最高级形态。

一、档案信息化发展现状

目前,信息化被提升到国家战略的高度,这为档案信息化的发展提供了良好的社会环境。档案信息化已经从个别单位的实验性探索变为所有单位档案管理的必由之路。无论是信息化的规模和质量,还是信息化意识和方法都有了大幅提升。现时期,档案信息化三大发展主线是电子文件管理、馆藏数字化和档案信息网络服务。同时,地方档案部门的发展焦点是建设数字档案馆(室),数字档案馆(室)既是开放或利用数字档案资源的网上展览、地方特色档案资源的展示阵地,又是档案馆(室)采集数字资源等各类网络资源的渠道,是档案信息资源的社会共享的主要平台。福建省的档案信息化发展还是处于初步阶段,总体发展水平不匀衡。全省目前地市级档案馆只有漳州市档案馆建设完成数字档案馆工作,成为全国第九家、地市级档案馆第五家、全省第一家“全国示范数字档案馆”。因此,福建省的档案信息化发展道路还将是任重道远。

二、档案信息存在的主要形式

档案信息存在的主要形式,也就是说档案信息内容记录与表达的主要手段与方式,与信息记录时所处的技术水平有着直接关联。不同的档案载体所反应的信息与不同的记录技术相对应。档案信息记录形式以及技术水平可分为三种:

(一)机械记录

所谓机械记录方式就是借助外力使载体材料发生形变、或在载体材料上留下色彩痕迹的信息记录形式。这种记录形式存在着比较久远的历史,给人类文明留下了无比辉煌和珍贵的记忆。对应的档案形式有:甲骨档案、金石档案、简牍档案、绢帛档案、泥版档案、纸草档案、羊皮档案、纸质档案等传统档案形式。此外,还包括现代的实物档案(奖杯、奖章、勋章、匾额、印章等)。

(二)模拟记录

模拟记录是用模拟技术的手段,用一种事物的变化规律模拟另一种事物的变化规律,并可以将这种规律予以保存的记录形式。这种的记录形式,能够保存事物的真实面貌,给人以回到过去时光的感觉。如普通摄影、机械录音、磁录音与录像等都属于模拟记录。对应的档案形式:普通照片档案(含底、照片)、特种照片档案(如航测片、各类医疗片)、电影胶片档案、缩微胶片档案、(胶质)幻灯片档案、激光全息照片档案、机械录音唱盘、录音带、录像带等。

(三)数字记录

数字记录是运用数字技术,将原始离散或连续信息转化为二进制数字编码后以记录在磁、光或半导体存储载体的过程。数字记录所对应的档案形式有:电子文件、多媒体文件、电子档案、数字档案等。数字档案信息具有自己相对的独特性,它可以与载体实现分离,因此它没有相对固定的物质形式,可以由多种载体来承载,大家所看到的电子文件、多媒体文件、电子档案或者数字档案其实都是它的输出形态。

三、档案信息化对档案信息长久保存提出挑战

如今,档案信息化发展水平仍然还是处于极不平衡的状态。全国各地的档案信息化发展水平良莠不齐,很难形成一种高度发展的统一态势。档案信息化是一项系统性、长期性的工程,需要单位强有力的支持才能顺利进行。只有少数单位实施了档案信息化的工作。许多单位都对档案信息化感兴趣,但是受制于经费、人才、制度等因素而不能开展。档案信息化的发展对档案信息长久保存提出了挑战。在档案信息化发展过程中,就是要把现存的机械记录和模拟记录的相应档案形式转化为数字记录的形式,从而生成大量数字档案。这些大量的数字档案安全存储问题就成为了各单位要考虑和解决的重要问题。

现在,针对大量的数字档案存储问题,档案部门选择使用的存储载体一般是硬盘、磁带和光盘,这三种存储载体各自有其鲜明的技术优势。在实际的操作过程中,硬盘是作为主要存储载体之一,在档案信息存储备份工作中得到了人们的普遍认可与应用。硬盘载体的特点是:1.单位存储成本低,2.数据读取速度快,3.技术发展迅速,4.单盘介质存储容量大。同时硬盘在数字信息在线存储中也有着众多和长期的应用。许多的档案馆已将硬盘作为离线存储载体用于存储大量档案信息。

四、档案信息长久保存策略

在数字档案管理系统中要特别注重对档案信息保存功能要求,做到系统能够实现对数字档案信息的长久保存和安全使用。要做到和实现数字档案信息长久安全保存,包括了以下两个方面的要求,一是档案信息长久保存策略的确定,二是档案信息存储架构选择。本文主要研究和探讨档案信息长久保存策略的选定问题。档案信息长久保存策略有以下几方面构成:档案信息存储格式的选择,大量档案信息的检测、重要数据备份和迁移等技术方法的采用,以及容灾系统或突发事件应急机制等。

(一)存储格式要标准化,绝不能随意

存储格式的标准化,是档案信息被可读取的前提。在海量数字档案的存储格式要求上,要做到统一与标准,决不能出现“百花齐放”的现象,存储格式要依据不同的数据类型,制定出统一的标准格式,不可“任性”而为之。在存储格式的选择上,要为海量数字档案的长久可读性考虑,以确保其能够永久保存下来,首先要选择符合国家制定的标准格式,如果暂时还没有制定出国家标准的,可以灵活或机动选择主流格式或开放式。并对后续的存储要求做出适当的安排。

(二)定期进行必要的检测,发现问题,立即处理

(三)对重要的信息进行备份以及迁移

安全是档案工作永远的话题和重中之中的第一要务。数据备份是对现存的大量数字信息达到长久保存的一项最为有效的办法之一。在网络高度发达的今天,网络安全问题一直是大家最为担忧的事情。近日发生的勒索病毒爆发事件。国内不少知名高校、加油站、火车站、自助终端、医院、政府办事终端、公司等被此病毒感染,而且造成不同程度的经济损失。

综合考虑数字档案信息资源的重要度和日常管理和大众利用的需要度,可以选择在线、近线、离线、异地、异质和迁移存储等技术和方式。提高长久保存大量数字档案信息的水平和能力。

1.在线备份

目前许多档案部门主要都是采用在线备份的策略进行存储。此种的存储方式.的技术特点是信息查询速度快、数据更新及时等,在线存储方式.深受大众的好评,但是,在线存储方式也有其自身的局限性,如:日常运行需要较大的维护费,所需的硬件设备购买的费用较高,大量档案信息资源全部进行在线存储需要投入大量的经费。一般单位恐怕很难承受得了这么昂贵的设备。

2.在线存储和离线存储相结合

在众多档案馆内,数据的存储一般都采用两结合的方案,即综合、全面、充分考虑大量档案信息数据的属性,若它们是安全要求高、重要程度高、使用频率相对较低等特点,大多数档案馆就会采用在线存储和离线存储相结合的存储策略。这样作法有两个方面的好处,一是利用频率高的数据进行在线存储,方便了快速查询利用,二是利用频率低的数据进行近线或离线存储,同时实现了长期安全保存全部数据的目标。也有效地解决了资源配置问题,降低档案馆对档案信息资源存储问题的成本投入,产生了积极的效果。

3.异地、异质备份

福建省档案馆与广东省档案馆达成数字档案异地保存协定,两省的数字档案可以多一套留存在对方的档案馆内,确保永久保存和安全。对于一些相当重要的电子档案,应当将它们打印出纸质档案保存,做到异质备份,以防出现电子档案丢失或受损的情况出现。异地、异质备份是保全档案信息的真实、安全、长久的有效手段方式,将极大地促进档案信息资源的安全、可靠和真实,对于档案信息资源的利用多了一份保障。

4.迁移

当计算机硬件、软件、技术、标准规范等在发生重大变故、调整、变化或发生突发事件时,为了能够做到数字档案信息安全地实现可读、可用、可存,就要对所存储的数据进行迁移技术处理。迁移技术能够最有效的保护存储数据的安全与真实转移。不会使数据在不确定的环境中缺失或失真。

(四)容灾系统或突发事件应急机制

相对于突发事件应急机制,在建设数字档案馆的过程中,很少有部门能够给予高度重视,并加于认真应对。防患于未然,是对档案信息的高度责任,也是对历史记忆的保护。当计算机系统或网络系统在遭受不可抗拒的自然灾难如水灾、火灾、地震、海啸、战争等以及人为灾难时如计算机攻击、黑客、网络病毒、网络中断、硬软件错误、停电和人为操作失误等,容灾系统将确保用户数据的安全性和真实性。也就是说,容灾系统是数据存储备份的最高层次。

未来的档案信息化发展将更加的“智慧”化。档案管理方面的新理念和新技术将不断地得到实践和运用,推动各地档案信息化跨上新台阶。数字档案信息存储技术也更加的完全和先进,档案信息也将会得到长久地保存。通过“智慧档案”建设,使数字档案资源共建共享平台投入运行,实现开放类档案信息的“一站式”服务,充分发挥档案数据资源的内在价值。

参考文献

[1]郭鑫杰.基于“互联网+”思维的智慧档案建设策略研究.浙江档案,2015(11).

[2]杜琳琳.海量数据离线存储系统研究.中国档案,2016(2).

[3]方雪.智慧城市背景下的档案信息化.管理观察,2014(5).

THE END
1.上传模式与实时模式详解,操作与应用指南(适用于初学者与进阶用户2、实时模式:指的是数据在产生后,能够立即进行传输和共享的模式,在直播、在线会议、实时通讯等领域应用广泛。 如何操作上传模式 要开始使用上传模式,您需要遵循以下步骤: 步骤一:选择文件 在您的计算机或移动设备中选择您想要上传的文件,这可以是图片、视频、音频或文档。 https://www.shuguo168.com/post/11417.html
2.离线编程操作,优势应用与未来离线编程技术,离线编程操作,优势离线编程操作,顾名思义,是指在没有网络连接的情况下进行的编程操作,传统的在线编程需要在互联网环境下进行,而离线编程则可以在没有网络的环境中完成编程任务,这种编程方式主要依赖于本地计算机的硬件和软件资源,通过编写、调试和执行程序来达到预期的功能。 http://www.skypure.com.cn/post/35344.html
3.三重时空变化模式的视频协调视频协调是一项重要而具有挑战性的任务,旨在通过自动调整前景的外观以与背景协调,从而获得视觉上逼真的合成视频。受手动协调的短期和长期逐步调整过程的启发,提出了一个视频三重变换器框架,用于模拟视频中的三种时空变化模式,即短期空间以及长期全局和动态,用于视频协调等视频到视频任务。 https://zhuanlan.zhihu.com/p/13827922254
4.数据的存储有在线近线和离线等方式。系统数据的存储有在线、近线和离线等方式。系统当前需要用的数据通常采用在线存储方式;近期备份数据通常采用近线存储方式;历史数据通常采用离线存储方式。目前,常用的在线式、近线式、离线式存储介质分别是( )。 问题1选项 A.U盘、光盘、磁盘 B.移动磁盘、固定磁盘、光盘 https://www.educity.cn/tiku/74195.html
5.存储知识:数据一致性分级存储分层存储与信息生命周期管理从性能上来说,磁盘当然是最好的,光盘次之,最差的是磁带。而从价格上来说,单位容量成本磁盘最贵、光盘次之,磁带最低。这就为我们不同的应用追求最佳性价比提供了条件,因为这些不同的存储媒介可应用于不同的存储方式中。这不同的存储形式包括在线存储、近线存储和离线存储。https://cloud.tencent.com/developer/article/1529091
6.百度搜索深度学习模型业务及优化实践02 搜索超大规模在线推理系统 2.1 在线系统与近线/离线系统 搜索在线推理系统,是根据用户query进行实时计算并返回结果,模型主要分为三部分:需求分析/query改写、相关性/排序、分类。 (1)需求分析/query改写,是通过深度学习模型返回一个语义相近的query 当用户问:“熔断是什么意思啊?” 其中含有口语化表达,通过调用深度https://blog.itpub.net/28285180/viewspace-2995181/
7.词汇表包括在线、近线、异地和离线存储在内的存储空间,用户可通过 Oracle HSM 文件系统进行引用。admin set ID(管理集 ID) 由存储管理员定义、拥有共同特征的用户和/或组的集合。创建管理集的目的通常在于,对涉及到来自多个组的用户以及跨多个文件和目录的项目存储进行管理。archival media(归档介质) 写入归档文件的目标介质https://docs.oracle.com/cd/E75712_01/SAMMA/samqfs_glossary.htm
8.国有资产管理模式构建12篇(全文)数据存储管理和迁移服务器是媒体资产管理系统的重要组成部分。软件采用标准的模块化设计, 主要功能是监测素材的使用频率和在线Raid剩余空间, 有选择性地将高码率素材迁移到近线存储中。同时, 迁移服务器还启动带机械手的光盘自动刻录机, 备份素材到离线存储光盘中。 https://www.99xueshu.com/w/ikey6pke632g.html
9.近线存储结构:医疗PACS系统离线存储和在线存储资源近线存储正是为了解决这种需求而设计的,它结合了在线存储的快速访问和离线存储的低成本优势。 近线存储的核心技术是分层存储管理(Hierarchical Storage Management,HSM)。HSM服务通过自动化流程将不常访问的数据从高成本的硬盘迁移到成本更低的存储介质,如光盘库或磁带库。这不仅降低了存储成本,还确保了数据的长期保存。https://download.csdn.net/download/weixin_38686557/12208327
10.LinkedIn数据架构剖析mysql教程因此,LinkedIn 工程师团队提出了三段式(three-phase)数据架构,由在线、离线以及近线数据系统组成。总体上讲,LinkedIn数据被存储在如下几种不同形式的数据系统中(看下面的图): RDBMS Oracle MySQL(作为Espresso的底层数据存储) RDBMS Espresso(LinkedIn自己开发的文档型NoSQL数据存储系统) Voldemart (分布式Key-valuehttps://m.php.cn/faq/133904.html
11.推荐引擎产品RecEng介绍学习笔记主要处理用户行为发生变化、推荐物品发生更新时,对离线推荐结果进行更新。 近线计算不像离线计算那样专门以 max compute 作为输入输出,近线程序的输入数据可以来自多个数据源,比如说在线的表格存储以及用户的api请求或者是程序中的变量,输出可以是程序变量或者写回在线存储,或者返回给用户,出于安全性的考虑,推荐引擎提供一https://developer.aliyun.com/article/1088196
12.近线硬盘是什么,近线离线存储有什么好处所谓的近线存储,外延相对较广泛,主要定位于客户在线存储和离线存储之间的应用。就是指将那些并不是经常用到,或者说数据的访问量并不大的数据存放在性能较低的存储设备上。但同时对这些的设备要求是寻址迅速、传输率高。(例如客户一些长期保存的不长用的文件的归档)。因此,近线存储对性能要求相对来说并不高,但又要https://www.dt-stor.com/yingpanbaike/161.html
13.上海烁谱科技有限公司上海烁谱科技有限公司 非浸入式荧光氧/溶解氧传感器、荧光pH传感器、温度传感器等核心技术https://www.spsens.cn/
14.档案馆电子档案与数据离线备份管理规范2.1近线备份 指存储设备与计算机系统物理连接,操作系统或应用系统不可随时读取和修改备份于其中的电子档案和数据,备份策略、恢复方式等通过独立于操作系统、应用系统的存储管理系统实施。 2.2离线备份 指将电子档案和数据存储于可脱离计算机、存储系统保存的存储介质上,如光盘、磁带等。 2.3在线备份 指存储设备与计算机系统https://wenku.baidu.com/view/8621e4d607a1b0717fd5360cba1aa81144318fa7.html
15.某银行对企业级对象存储7方面性能14个案例的测试实录总行影像数据通过存储分层架构实现在线、近线和离线数据的存储和隔离。在线存储存放于闪存(FS900)当中,约 5T,保存了近 7 天的影像数据,并通过 IBM 的 ECM 客户端定期迁移至 ECM 系统所在的近线存储(DS8870)当中,约 20T,保存了近 30 天的影像数据,最后再通过 TSM备份软件每日将近线存储中的影像数据备份至华为(https://blog.51cto.com/u_15127582/2756934
16.腾讯广告基于混元大模型的生成式召回落地实践图10:近线推理、离线训练工程架构图 不同于广告现有召粗精排模型的 ms 级耗时,LLM 推理的在线耗时通常在 50-500ms 量级、不适合作为在线的实时推理,因此工程上我们建设近线推理的方式,近线预估用户感兴趣的营销对象,在用户下次请求广告系统时做对应推荐。另一方面,即使是近线推理,由于 GPU 推理资源相对珍贵和受限https://53ai.com/news/LargeLanguageModel/2024101726784.html
17.StorageTek近线归档存储方案助CCTV新闻共享系统存储在线近线存储技术是指相对于速度更快、价格昂贵的在线磁盘存储产品和通过手工方式将数据归档到磁带上的离线磁带技术而言的高性能磁带库技术。StorageTek的近线磁带库以离线产品的价格提供接近在线的性能,为客户提供所需的大容量数据的快速备份和随机实时查询的必需能力。 https://www.dostor.com/p/1188.html