论档案存量数字化增量电子化战略学术研究

一、存量数字化、增量电子化战略的提出

(一)存量数字化、增量电子化战略何时提出

“2013年,全国数字档案馆(室)建设推进会上,我们提出实施‘存量数字化、增量电子化’战略”。2016年在全国档案馆工作会议上国家档案局局长李明华如是说。但查前任局长杨冬权2013年10月此次会议的讲话稿,仅见“要求”一词:在提出为了实现我国数字档案馆(室)建设目标,必须重点抓好的工作时,杨局长提出“(一)按照‘存量数字化’的要求,大力推进传统载体档案数字化”……“(二)按照‘增量电子化’的要求,全面开展原生电子文件的归档、接收工作”。两个月后,在同年12月召开的全国档案局长馆长会议上,杨局长换用“思路”一词。一年后,在2014年12月召开的全国档案局长馆长会议上,在要求2015年加快档案信息化建设时杨局长提出“要继续实施‘存量数字化、增量电子化’战略”。也就是说,到2014年底才正式使用“战略”这个词。

此后,继任局长李明华在2015年全国档案工作暨表彰先进会议、2016年全国档案馆工作会议的讲话中都提出“要坚定不移地实施‘存量数字化、增量电子化’战略”。2016年李明华在第十八届国际档案大会介绍中国的数字档案资源建设时把实施这个战略列为我国数字档案资源建设的一个方面。另两个方面,一是把数字档案资源建设纳入国家档案事业发展规划,二是制定有关数字档案资源建设的管理规范和建设标准。2017年,李局长在全国档案局长馆长会议总结上一年度档案信息化工作时,单列两段总结“战略”实施情况:“‘存量数字化’有新成绩”、“‘增量电子化’有新成果”。同时李局长提出2017年要“继续大力实施‘存量数字化、增量电子化’战略”。

由此可见,这个战略的形成和实施是一个逐步明确、渐进深入的过程:2013年初步形成思路,2014年确定思路,到2015年战略思路已经非常明晰。在不断明确的同时,不断加大实施力度。到2016年已取得一定成果,并可向世界同行介绍。

这个过程是与我国档案信息化发展同步的。我们同样可以在国家档案局领导讲话的用词中看出档案化建设发展的过程:2013年“不断深化”、2014年“明显加快”、2015年“快速发展”、2016年“全面提速”。或许讲者无意,听者有心,我们从中看出了一年一个台阶的发展过程。在这个过程中逐步摸索档案信息化的发展规律,形成并明确了科学的实事求是的“存量数字化、增量电子化”的档案信息化发展战略。

(二)存量数字化、增量电子化战略由谁提出

2006年印发的《福建省档案信息化建设“十一五”规划》“总体目标”提出“突出把握存量档案数字化和增量档案电子化这两个工作重点”;在“主要任务与具体工作要求”中分别提出“(二)加快存量档案数字化步伐”“(三)努力实现增量档案电子化”。在这里我们看到福建省早在2006年就已经清晰地把存量档案数字化和增量档案电子化作为档案信息化的两个重要方面。又如,2011年印发的《云南省档案事业发展“十二五”规划》把档案资源的存量数字化和增量电子化作为推进档案信息化的基础。原福建省档案局局长陈永成在2006年就已经预见到如何确保增量档案的电子化、规范化,如何通过先进的技术手段规范整合和有效链接存量数字化档案和增量电子档案的数据信息,完全实现信息化条件下的各类档案信息资源的社会共享和安全保管,以适应国家信息化和档案信息化发展的需要,将成为今后档案信息化的重要课题和任务。(1)由此可见,存量档案数字化和增量档案电子化是一些地方的档案工作者在档案信息化建设的实践中总结认识工作规律而提出的工作思路,由国家档案局归纳肯定上升为全国的档案信息化战略,用以指导全国档案信息化工作。

战略形成的基础在于对主客观条件及其发展变化的规律性的认识。战略既是对全局、方向的谋划和指导,也是对达到目标的途径的选择。比较其他的关于档案信息化战略的意见,“存量数字化、增量电子化”这个战略更切合我国档案信息化当前发展阶段的实际。存量、增量反映并涵盖了档案信息化建设的对象。要进入数据库的全部档案信息无非是两个方面,一是对纸质等类原有存在的档案(存量档案)进行数字化加工形成数字化产品。目前主要采用扫描的形式。二是由办公自动化等系统归档的电子文件(增量档案)。对存量和增量分别采取数字化和电子化的手段,把原始档案转换为计算机能够识别、保存,网络能够传输、利用的数据。认真地实事求是地想一下,档案信息化建设在本质上不就是靠这两条腿走路而取得发展吗。因此,笔者认为,“存量数字化、增量电子化”是科学的方向和道路的选择。它没有“高大上”的宏伟规划,是“接地气”的具体谋划,因而是能够指导全国档案信息化建设扎实推进、稳步发展的有效战略。

二、存量数字化、增量电子化的战略目标

存量数字化和增量电子化这个战略的目标是“推动各级档案馆(室)实现由传统管理向现代管理转型升级”(2)。

中央办公厅、国务院办公厅2014年印发的《关于加强和改进新形势下档案工作的意见》提出,各级党政机关、企事业单位要把档案信息化纳入本单位信息化建设整体规划,统一部署、同步实施,确保档案部门实现对电子文件形成、积累和归档的全程监督指导。也提出要加快推进传统载体档案数字化。

随后印发的中共福建省委办公厅、福建省人民政府办公厅《关于加强和改进新形势下档案工作的实施意见》(以下简称“意见”)具体细化了中央、国务院的要求,提出了我省档案信息化的五年发展目标。

在存量档案数字化方面提出了具体的量化指标:“争取到2020年,县级以上国家综合档案馆馆藏传统载体档案数字化达到80%以上,县级以上各部门各单位档案室传统载体档案数字化达到l00%,建立全省性、分布式、规范化、可共享的档案目录数据库、档案全文数据库和多媒体档案数据库。”

在增量档案电子化方面提出了主要的工作要求:“规范电子文件管理工作,确保归档电子文件、电子档案与纸质档案具有同等效力;加强档案部门的档案管理信息化平台与部门业务系统及公文系统间的业务协同,支持电子文件在线归档,确保电子文件及时归档和电子档案定期移交同级国家综合档案馆”。

我们可以把上述两个方面理解为我省实施存量数字化、增量电子化战略的五年发展目标或曰五年规划。

三、我省实施存量数字化、增量电子化战略的困难

我们先从顶级的省档案馆开始分析。福建省档案馆至2013年仅有23.47%存量档案数字化,在全国排名第20位。截至2014年仍有约4600万页待数字化。从2015年开始每年可完成450万页数字化工作。(3)依此推算,大约要到2023年才能完成80%的目标。

此外,有漳州市龙文区档案馆馆藏档案数字化达87%,惠安县超过80%,福州市各县(市)区基本达70%以上。(7)

形势并不乐观,“同志尚需努力”。困难主要在档案数字化的量大,档案馆人员编制少,需要外包才能较快完成任务,但经费不足,导致推进缓慢。当然,有些地方还是可以的。福州市2016-2020年市财政每年将下达馆藏数字化经费200万,三明市计划“十三五”期间下达350万元。

县级以上部门、单位档案室实现传统载体档案数字化l00%的目标似乎更难。难在数字化数量要求的比例比较高(当然相对的量少)。虽然数字化的量少,但档案室人员少,且专业水平相对较低,缺乏数字化工作知识和经验。目前档案馆方面已经有财政设立的馆藏数字化专项资金,而档案室的数字化经费投入要看单位领导是否重视档案信息化工作。

从存量数字化的内容目标看,建设档案目录数据库比较容易,建设档案全文数据库比较困难,建设多媒体档案数据库难上加难。后面两个难的原因除了量大,还有技术和设备问题。

增量电子化难在档案管理系统的建立和实现前端控制。具体地说就是要实现档案管理系统与办公自动化,或者还有其他专门数据处理系统的对接,并使这些系统的数据符合电子档案管理的要求。

福建省档案局局长丁志隆在2017年全省档案局长馆长会议总结工作时也指出我省存在“数字档案馆(室)建设进展缓慢”的问题。(8)面对困难和问题,我们需要分析原因,寻求对策。

四、存量数字化和增量电子化的关系

先比较二者的差异:

第一,档案存储形式不同。存量主要是对纸质文件进行数字化加工形成的扫描件;增量是计算机系统直接形成的电子文件。

第三,存量档案全文检索的前处理比增量复杂。增量的电子文件只要直接设定或转换为可供全文检索的格式,而纸质档案数字化的扫描件则要通过全文识别转换为全文数据才能提供全文检索。需要安装专门的OCR识别系统。如果OCR识别系统的识别率低,就会影响到定位到字的全文检索的准确率,就难以实现更有深度的存量文件信息资源的增值服务。

总的来说,增量的技术性强,存量的工作量大。

笔者认为,在存量与增量二者中,先抓增量比较“合算”。

首先,电子文件每天都在海量产生。冯惠玲课题组指出的我国基层单位电子文件管理存在“有人办,无人管;有保存,无管理;有管理,无规范”的三个不同层次的情况(9),依然没有大的改观。如果不管电子文件,它有可能流失,至少将造成电子文件积压,造成电子文件归档工作的积累。

其次,存量和增量的归档范围和保管期限是一样的。它们象天平两头的物体,此消彼长,总量不变。解决增量就意味着等着扫描的存量的减少。反过来说,增量不“消灭”,我们将永远跟在后面扫描。一个地方、一个单位领导重视,提出要求、增加投入,建立档案管理系统,及时处理增量,就可以建立一个档案信息化跨越式发展的跳板。因为增量的量毕竟比存量少。反之,如果长期拖延增量的处理,增量电子化就会成为档案信息化的短板,就会拖档案信息化发展的后腿。

“规定”还提出“统筹传统载体档案数字化、电子文件归档与电子档案管理工作”。如何统筹是我们在工作对象数量庞大,而力量有限的时候需要做的战略考虑。

笔者以为,当前应当采取“消灭增量、消化存量”的战略方针,以时不我待的精神,先管好增量,再由近及远回溯开展存量档案的数字化工作。“消灭”要坚决,“消化”可以慢一点。

基于此,下文把论述的战线缩小到增量档案电子化上来。

五、增量电子化的几个阶段

第一阶段:一般化管理阶段。只是简单地对应纸质文件对电子文件进行收集、整理。

第三阶段:智能化管理阶段。采用现代化手段的最终目的是为了提高效率。进入第二阶段后,发现电子档案管理比想象的要复杂的多。于是,就要考虑更为高效的方法。如,2015年国家档案局就已组织验收通过“机关文书档案保管期限智能识别系统”。又如,个别单位开始考虑设计或部分实现了自动著录、编目、加盖档号章,跨库、分类、全文信息等检索,多种电子文件整合,多媒体和综合信息处理等功能。国内档案界也开始研究开发数据挖掘、知识管理等更为高级的功能。

“人工智能其实是让世界恢复了原本的复杂性。”(10)只是计算机将复杂的工作变得容易并以简单的智能形式呈现给我们。到这个阶段,再难的事情都将“易如反掌”。只有使计算机环境下的归档整理工作变得简单容易,计算机管理档案才会被广大档案工作者完全接受。

六、增量电子化要解决的问题

(一)数据。所谓“增量”的增,就是通过物理或逻辑归档的方法增加数据。目前需要解决的主要是文件格式自动转换、元数据等信息自动捕获等技术问题。总的目标是尽可能多地采取自动化的手段收集数据,并使数据符合标准要求。

(二)数据格式与元数据标准。如果说没有数据,计算机系统只是“空中楼阁”;那么没有标准的数据,其计算机系统就是“危楼险阁”。因为没有标准的数据是无法管理的数据。

2002年发布的国家标准《电子文件归档与管理规范》第一次提出“三性”要求:对电子文件的内容、结构和背景信息进行鉴定,确认其与形成时的原始状况一致,即确认文件的真实性;电子文件的内容、结构、背景信息和元数据等无缺损,即达到完整性的要求;电子文件应具备的可理解性和可被利用性,包括信息的可识别性、存储系统的可靠性、载体的完好性和兼容性等,即保持文件的有效性。

七年后“三性”要求落地。2009年国家档案局发布三个档案行业标准《版式电子文件长期保存格式需求》《文书电子文件元数据方案》《基于XML的电子文件封装规范》,形成了数据标准的基本框架。

现在面临的问题是每一个实施增量电子化的单位要从文件形成阶段开始落实数据标准,实现前端控制和全程管理。

(三)档案管理系统(或称“档案管理软件”)。这是电子档案管理的核心。如果仅仅是管理目录,使用Excel或word表格等通用处理工具也是可以的。但要实现真正意义上的电子档案管理,没有专用的软件是万万不可的。也可以说,具有“四性”的文件是生长在专用软件的怀抱里的。

从宏观看我省增量电子化已经进入在保证“四性”前提下的规范化管理阶段。但目前省内销售的档案管理软件低水平或现水平重复的比较多。笔者以为档案管理软件也应当进行“供给侧改革”,推进结构调整,减少低端供给。特别是要增强对需求变化的适应性和灵活性,使软件的研发与档案信息化建设的发展同步,并略有超前。

软件供应商要跟踪了解档案业务和档案信息建设的发展,特别档案信息化标准制定情况,进行充分的需求调研,按照工业化模式,发展标准化、系列化、商品化的通用性软件和根据客户需求定制的优质软件。随着软件供应市场的培育,竞争会逐步展开,性价比高的软件一定会占有更多的市场份额。不关心档案事业和档案信息化发展的档案管理软件供应商一定不会有大发展。

软件需求方要了解发展方向,提出需求,检测功能实现情况。目前大多数单位还是采取购买通用软件再根据本单位档案管理实际加以修改的形式。购买前,要充分学习了解电子档案管理的标准要求,广泛调查、比较现有档案管理软件的性价比;签订购买合同时,要详细提出需求,约定要达到的具体目标;软件安装后,要反复测试,全面完成功能和界面设计与程序修改。修改到位再付钱。争取做到价廉物美。

档案行政管理部门需要做的工作是统一制定并宣传贯彻数据标准,规范软件基本功能要求,建立软件第三方检测、认证制度,引导软件升级,评价和推介优质产品,促进档案信息化产品产业化、市场化,并保障市场的健康发展。当前应当把元数据、格式、封装、备份等保证文件真实性、完整性和保持文件长期可读性的知识列入档案业务指导、培训内容。教师和业务指导人员应该把这些知识讲细、讲清楚,并尽量能用软件进行形象讲解,使档案人员知道这些东西“长”得怎样、是如何实现技术要求的。

(五)档案信息化建设业务的监督指导。这一点虽然不是技术问题,但却是一个关键的问题。

从全球电子文件管理的发展规律看,初期一般采取自下而上的探索形式,“到了科学方法逐渐成型的阶段,则需以自上而下为主,以便在总体成本较低的情况下迅速提升整体水平。”(11)我国电子档案管理已经有二十多年的历史,无论是计算机管理设施、技术,还是电子档案管理标准、规范都已经比较成熟。应当回过头来在较高起点上进行顶层设计、统一规划和全面指导。

欣闻“十三五”期间我省要“实现全省各级立档单位档案工作监督指导覆盖率达100%”。(12)真是善莫大焉!档案信息化建设方面的监督指导当在其中。只有这样2020年县级以上各部门各单位档案室传统载体档案数字化达到l00%的目标才能实现;只有这样才能打通增量档案电子化这个全省档案信息化发展的瓶颈。

当然,关键是落实。要努力实现有效的全覆盖。不积跬步无以至千里。负责督导的同志要提高自己的档案信息化知识水平。管理督导的部门要通过行政效能督导等手段推动督导工作扎实地较快开展。

我省通过两期“分布式档案基础数据库建设”,综合档案馆的档案数字化工作已在正常轨道进行。建议在适当的时期把档案信息化业务监督指导的重点转移到数字档案室建设上来,采取“试点先行、分步实施”的办法,扎实推进增量电子化和档案室存量档案数字化。目前,福州、漳州已实现实体档案与电子档案同步接收,龙岩市已将电子文件在线归档移交纳入市直单位绩效考评内容。可以在这些地方选择增量电子化的省级试点单位。

七、结论

——建设档案强国是我国档案事业发展的战略目标。大力提高档案信息化水平是建设档案强国的重要方面。只有加快档案信息化建设步伐才能较快地实现建设档案强国的目标。

——存量档案数字化、增量档案电子化是档案信息化建设的现实反映、实践总结。把它作为档案信息化建设的战略符合档案信息化发展的客观规律。因此,存量档案数字化、增量档案电子化是切合我国当前档案信息化发展需要的战略选择。

——在存量与增量之间,增量是牛鼻子,是关键。它是档案信息化的源头活水,但需要修渠导引使水流畅。因此,必须下大力气解决增量电子化的标准制定和宣贯,档案信息管理系统研发和采购,以及档案业务监督指导等问题。

——增量电子化技术性强,存量数字化工作量大,两项工作都有难度。2020年要达到“意见”提出的档案信息化建设的目标,需要以马上就办、真抓实干的精神,撸起袖子加油干。

参考文献:

[1]陈永成.大力推进档案信息化共同构筑档案信息资源社会共享平台——档案信息化的几点战略思考.福建档案,2006(1)

[2]李明华2015年在全国档案工作暨表彰先进会议上的讲话

[3]叶建强.福建设立档案数字化专项资金.中国档案报,2015-11-29

[4]福建省档案局副局长马俊凡.档案信息化是最大挑战福建将实施档案数字化工程.就“全省档案事业发展‘十三五’规划”接受新华网专访.新华网福建频道,2016-6-7;2017年全省档案局长馆长会议交流材料;黄国风.“海丝”泉州新起航兰台先锋勇担当——福建省泉州市档案局馆创新发展侧记.中国档案报,2017-5-11

[5]漳州市档案馆.信息化时代我们大步向前走——漳州市档案馆馆藏档案数字化介绍.福建档案,2016(4)

[6]福建档案工作信息,2017(4)

[7]2017年全省档案局长馆长会议交流材料;福建档案工作信息.2017(2)

[8]丁志隆.在全省档案局长馆长会议上的讲话.2017-3-24

[9]冯惠玲、刘越男等.电子文件管理国家战略.中国人民大学出版社,2011:29

[10]罗振宇.2017年的五只黑天鹅.读者,2017.7:60

[11]冯惠玲、刘越男等.电子文件管理国家战略.中国人民大学出版社,2011:35

[12]福建省档案局副局长马俊凡.档案信息化是最大挑战福建将实施档案数字化工程.就“全省档案事业发展‘十三五’规划”接受新华网专访.新华网福建频道,2016-6-7

THE END
1.数据挖掘概念(AnalysisServices尽管关系图中所示的过程是一个循环过程,但是每个步骤并不需要直接执行到下一个步骤。创建数据挖掘模型是一个动态、交互的过程。浏览完数据之后,您可能会发现数据不足,无法创建适当的挖掘模型,因此必须查找更多的数据。或者,您可以生成数个模型,但随后发现这些模型无法充分地回答定义的问题,因此必须重新定义问题。您可能https://technet.microsoft.com/zh-cn/library/ms174949(en-us,sql.105).aspx
2.数据挖掘的分析方法可以划分为关联分析序列模式分析分类分析和数据挖掘流程 首先,我们需要明确数据挖掘的基本流程,如下表所示: 流程图 数据收集数据预处理数据分析结果评估结果展示 各步骤详解 1. 数据收集 这一阶段收集待分析的数据,可能来自数据库、CSV文件、API接口等多种来源。示例代码如下: importpandasaspd# 从CSV文件读取数据data=pd.read_csv('data.csv')# 读取名为dahttps://blog.51cto.com/u_16213297/12863680
3.人工智能三大算法数据挖掘机器学习与深度学习的核心之争在人工智能的发展历程中,三大算法——数据挖掘、机器学习与深度学习,被广泛认为是推动AI技术进步的关键驱动力。这些算法不仅为各行各业带来了革命性的变化,也使得我们能够更好地理解和利用大量数据。 首先,我们来看一下数据挖掘。它是一种从大量数据中发现模式或关联的过程。这项技术被广泛应用于商业领域,如推荐系统https://www.9e80wtu09.cn/shu-ma/384090.html
4.2019届毕业设计(论文)阶段性汇报第一阶段我主要完成了论文调研、基线训练及基础生成模型的搭建工作。首先,我从童声识别,数据增强和生成对抗网络三个方面调研了论文并进行了总结整理。然后我用成人语音及少量儿童语音训练了基线模型,并用少量儿童语音训练了基础生成模型,测试了生成数据的效果。 https://zhiyuan.sjtu.edu.cn/html/zhiyuan/announcement_view.php?id=3366
5.人工智能心得体会9篇数据、算法、程序设计、机器人课程、开源硬件类课程等,利用项目式教学或其他活动如科技创新、创客、跨学科活动等助力课程落地,逐步建立课程——空间——活动的人工智能教育活动实践,在论坛中也介绍了人工智能教育需要遵循学生各年龄层的学情特点,分为三个阶段,第一阶段大班STEM基础教学,第二轮实践教学建立社团校队,第三https://www.unjs.com/fanwenwang/xdth/20221130181133_6041555.html
6.公司员工职业规划(精选10篇)(一)数据与员工招聘 对于职业发展规划来说,从员工招聘阶段就要全面介入。数据分析模型会帮助人力资源管理人员做出更加理性的决策。首先,数据挖掘模型会抓取数据库里应聘者职业技能、薪酬要求以及培训教育等方面的信息,然后对比岗位需求,通过数学运算找到最佳的资源配置方式。招聘过程的最根本诉求就是解决企业职位与候选人之间https://www.ruiwen.com/yuangongzhiyeguihua/6087991.html
7.江苏省发展和改革委员会经验交流规范权力运行强化监督制约(三)建设过程。系统建设经历三个阶段:一是前期准备阶段(2011年5月—2012年1月)。委内成立领导小组和具体项目组,并先后赴国家预防腐败局、国家信息中心、海关总署、北京市发改委以及省内有关地区和部门进行调研,多次到国家发改委和省纪委汇报总体思路、听取指导意见。在此基础上,完成了系统顶层设计,编制了权力运行流http://fzggw.jiangsu.gov.cn/art/2015/5/6/art_3968_6645997.html
8.人工智能学习心得(通用28篇)数据、算法、程序设计、机器人课程、开源硬件类课程等,利用项目式教学或其他活动如科技创新、创客、跨学科活动等助力课程落地,逐步建立课程——空间——活动的人工智能教育活动实践,在论坛中也介绍了人工智能教育需要遵循学生各年龄层的学情特点,分为三个阶段,第一阶段大班STEM基础教学,第二轮实践教学建立社团校队,第三https://www.yjbys.com/xindetihui/fanwen/3342600.html
9.数据挖掘的三个要素是什么帆软数字化转型知识库数据挖掘的三个要素是数据、算法、应用。数据是数据挖掘的基础,数据质量的高低直接影响挖掘结果的准确性和实用性;算法是数据挖掘的核心,通过各种算法可以发现数据中的规律和模式;应用是数据挖掘的最终目标,挖掘出的信息需要在实际应用中得以验证和利用。数据质量的高低直接影响挖掘结果的准确性和实用性。如果数据存在大量https://www.fanruan.com/blog/article/593841/
10.2020年第七期全国高校大数据与人工智能师资研修班本次培训采用“云课堂线上精讲+专家技术在线答疑指导+学员群内实操答疑+助教指导”结合的方式,包含前置基础课程学习阶段和核心课程学习阶段。全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅。讲解数据分析与挖掘项目实训的模型理论和项目代码实战,梳理技术框架,从根本上解决如何使用模型、优化模型的http://www.tipdm.com/pxdt/2015.jhtml
11.刘献君—决策支持:院校管理中一个被忽视的重要领域新中国成立以来,我国高校决策支持发展变化大体经历了新中国成立后前三十年、1978-1998年、1998年至今三个阶段,每个阶段都有各自的特点。但总体来说,决策支持仍是高校管理中一个被忽视的领域,存在的问题包括决策支持没有受到应有的重视,职能部门成为决策支持的主体,数据分析系统不健全,没有建立科学的决策支持平台等。https://xww.hustwenhua.net/info/1002/32633.htm