(一)应特别注意对档案实体的保护,尽量采用对档案实体破坏性小的扫描设备进行数字化。纸张老旧、薄脆、破损的,不得使用高速扫描仪进行扫描。
(二)超出所使用扫描仪扫描尺寸的档案可采用更大幅面扫描仪进行扫描,也可以采用小幅面扫描仪分幅扫描后进行图像拼接的方式处理。分幅扫描时,相邻图像之间应留有足够的重叠,并且采用标版等方式明确说明分幅方法;若后期采用软件自动拼接的方式,重叠尺寸建议不小于单幅图像对应原件尺寸的1/3。
三、扫描色彩模式
(一)宜全部采用彩色模式进行扫描。
(二)扫描的电子图像色泽、亮度、饱和度需要和档案实体原件基本保持一致。
(三)扫描图像不得出现档案实体原件没有的异常颜色。
四、扫描分辨率
一般,纸质档案的扫描分辨率采用300DPI。照片档案、文字密集的档案、珍贵档案可以使用600DPI或更高的分辨率。
五、存储格式
(一)纸质档案数字图像长期保存格式为TIFF、JPEG等通用格式,同一批档案应采用相同的存储格式。
(二)图像压缩率的选择可根据实际应用的需求而定。一般,A4幅面档案图像文件容量大小控制在500KB至1.5MB之间,A3幅面档案图像文件控制在500KB至2MB之间。
(三)纸质档案数字图像利用时,也可从网络浏览速度、易操作性、存储空间占用等方面进行综合考虑,将图像转换为PDF等其他格式。
六、图像命名
(一)应以档号为基础对数字图像命名,确保图像命名的唯一性。
(二)建议将数字图像存储为单页文件,并按档号与图像流水号的组合对图像命名。
以“卷”为保管单位的档案
以“档号”+“.”+“扫描页顺序号”+“图像后缀名”的形式命名,扫描页顺序号一般采用三位阿拉伯数字。
如:
J001-WS·1999-Y-0001-001.001.tif
J001-WS·1999-Y-0001-001.002.tif
以“件”为保管单位的档案
J001-WS·2012-Y-0001.001.tif
J001-WS·2012-Y-0001.002.tif
(三)数字图像确需存储为多页文件时,可采用该档案的档号对图像命名。
J001-WS·1999-Y-0001-001.pdf
J001-WS·2020-Y-0001.pdf
(四)用“档号”的组成项来分类存储数字资源,确保数据挂接的准确性。
《归档文件整理规则》规定归档文件档号的结构宜为:
全宗号-档案门类代码·年度-保管期限-机构(问题)代码-件号
如:J011-WS·2020-Y-BGS-0001
那么,存储路径就可以是:
\全宗号\档案门类代码\年度\保管期限\机构(问题)代码\档号
即\J011\WS\2020\Y\BGS\J011-WS·2020-Y-BGS-0001
《档号编制规则》提供的按卷整理档案(税务稽查档案)档号编制示例
全宗号-档案门类代码·二级类别号·三级类别号·年度·保管期限
示例:J019-ZYJCCC2019D30-001-001
说明:J019为全宗号,ZY为档案门类代码(专业档案),JC为二级类别号(税务稽查),CC为三级类别号(查处类),2019为年度,D30为保管期限代码,001为案卷号,001为件号。
\全宗号\档案门类代码\二级类别号\三级类别号\年度\保管期限\案卷级档号\文件级档号
即\J019\ZY\JC\CC\2019\D30\J019-ZYJCCC2019D30-001\J019-ZYJCCC2019D30-001-001
在使用档号的组成项来分类存储数字资源时,可以按照档号的组成项先后顺序来分类存储,也可以根据实际工作情况进行调整,但是作为一个档案门类,一定要能够统一标准。