古籍数字化的保真问题分为两方面,一方面要客观地反映古籍原貌,另一方面要真实地传递其中蕴涵的知识信息。关于保真问题,业内专家进行了多方面的探索和实践,但目前古籍数字化的保真工作仍未完全摆脱机械性的束缚和技术依赖的误区。本文在众多专家研究成果的基础上,尝试提出新的解决思路,希望能为古籍数字化的保真工作提供有益的启示。
古籍数字化保真问题的由来
历史的变迁、地域的差异、传抄刊刻过程中的讹误,以及人为地增删篡改,都给后人阅读古籍造成了障碍,因此书非校不能读也。通过校勘训诂修正错讹,还原古籍中所要传达的真实信息,同时忠实地记录下古籍原来的面貌,以供后人进一步研究甄别,这种校勘训诂的严谨态度,尤以清代学者著称。而且这一传统一直影响到当代的古籍整理工作,古籍数字化载体的优势为古籍的保真提供了更好的解决方案,同时也带来了新的问题,这就是今天古籍数字化保真问题的由来。
古籍数字化保真的现状
古籍数字化的保真问题,突出体现在古籍载体转换和数字化古籍两个环节。
1.古籍载体转换环节的保真问题
古籍数字化工作的第一步是完成传统载体向数字化载体的转换,这一工作的中心环节就是实现汉字的数字图形向数字字符的映射。然而古籍中异体、避讳、通假、俗字、繁体等文字现象,以及传抄刊刻过程中的错讹,造成大量非标准汉字的存在,给这一过程造成了极大的困难。目前对于这一问题的处理出现了以下两种倾向。
转换过程过于机械。比如古籍中的异写字:“半”上的两点或作八,“疽”字下的且或作旦,再如古籍中的缺笔避讳字:“通”缺中间一竖,“丘”缺中间一竖等。对于这种字形上稍有变化的字都要求反映在数字字符上。陈力先生在国家图书馆的古籍数字化工作中就发现,如果按照这种“依样画葫芦”的做法,即使Unicode字符集扩展到十万字以上也不能完全满足这种机械性的古籍数字化的需求。更重要的是,这种机械性的保真将影响到检索的可信度和精度,并造成数据库在开放、共享方面的困难。因为使用者在检索时并不清楚某部书中某字的具体写法,甚至一部书中同样的字也可能有许多种变体[1]。
还有古籍本身的错误,比如:乾隆集思堂本《尚论后篇》“在太阳则寒伤管之症”,“管”字实为“营”字的讹误。“大不后,六、七日不大便”,“不”显为“下”字之讹。像这种错误如果不加甄别地转换到数字文本中,反而会使原书失真,从而造成不必要的学术困惑,甚至产生新的错误。这样的保真名为负责,实际上是一种失职,是不负责任的表现。
无论古籍中的字写成什么样,甚至不管对错,都要求找到一个与之字形一致的数字字符相对应。技术人员的出发点是好的,但这种机械性的方式显然不是最佳的解决方案,在目前的技术条件下也是不太可能实现的。
与之相对应的是转换过程过于随意。古籍数字化工作中的技术人员往往不太懂古籍,他们生怕改动古籍的一点一画,只好千方百计发挥自己的技术潜能,希望能将古籍原原本本地转换为数字文本,而不太考虑读者的实际需要。一旦技术水平达不到完全保真的程度,他们就会做一些“大胆”的变通处理,结果就难免错乱。
技术人员的变通方案无非“形近替换”,但形体近似者未必功能相同,形体差别很大的有时反而功能相同。比如:敦煌医药卷子《灸图法》中有一字,形近“念”(第四笔的横折为横,第五笔的点为横),但此字跟“念”没有任何关系,而是“俞”字写作“愈”后再草写讹变而成[2]。再如:《四库全书》中“惠”字有三种写法,除通行体外,一种写法没有“心”上的挑和点,中间的竖画下面不出头,另一种写法也没有挑和点,但中间竖画出头。字符集中只有通行体和竖画不出头的编码,遇到竖画出头的那种写法时,根据“形近替换”的原则,要用竖画不出头的写法替换,而不是选用通行的“惠”来替换。这种做法实际上并未达到保真目的,反而忽视了规范原则。
其他变通的方案,一是将这些没有编码的字不做处理,在数字文本中暂时空缺。但这样的话,我们就人为地为古籍制造了一个“数字残本”,古籍数字化的意义就会大打折扣。或是保留图像添补到数字文本中的空缺中,这样表面上是保证了古籍的完整性,但计算机是“读不懂”这些图像的,因此也就无法进行检索、统计等处理,这样将来就无法精确实现数字化古籍的“研究支持功能”[3]。
2.数字化古籍环节的保真问题
首先说明一点,数字化古籍的形式有多种,比如各种类型的检索系统。但本文所讨论的专指以提供古籍阅览为目的的形式。
目前数字化古籍比较理想的形式是“图文对照”,即读者在阅读过程中可随时实现古籍图像与电子文本之间的切换。数字版文渊阁《四库全书》以及“中国基本古籍库光盘”等就采用此种形式,并取得比较好的效果。笔者认为,目前这种形式并非尽善尽美,还存在问题需要进一步改进。
首先是对古籍外形的刻意模仿。一些制作精美的数字化古籍产品,其电子文本采用繁体竖排的形式,有些甚至做出了翻转书页的动画效果。笔者认为将主要精力集中于此似乎没有太大必要。若从逼真再现古籍的角度考虑,古籍图像是理所当然的首选,然而这种“仿制品”显然不能满足古籍专业研究的需要,也不能作为一次文献来引用。而对于习惯于简体横排的普通读者,又多少显得艰涩。品评数字化古籍优劣的标准,并不在于它与古籍有几分形似,而是要看它是否真正体现了古籍的文化意蕴。
其次,笔者注意到,目前数字化图像采集的范围大都只限于古籍的书页,而古籍的书脑、书根、书脊、版心上也很可能存在版本信息,而这部分内容尚未引起技术人员的重视。再有,古籍的保存环境,比如存放古籍的书函,包裹古籍的锦缎等,它们是古籍的有机组成部分,其中蕴涵了关于古籍的重要信息。但据笔者了解,这部分内容似乎也没有纳入古籍数字化研究的视野,而缺乏了这部分内容的数字化古籍还不能算做是真正完整的。
古籍数字化难以实现保真的根结
1.古籍整理环节的缺失
虽然我们一直在强调古籍数字化的本质就是古籍整理,但在当前的实际工作中,对于古籍数字化,我们并没有以古籍整理的态度来对待,也没有将古籍整理的理论和方法引入到数字化工作中。困扰数字化古籍实现保真的根结就在于古籍整理环节的缺失。
转贴于
文渊阁《四库全书》数字化工程最初尝试利用扩展字符集的办法解决保真问题,但工作很快陷入困境。无奈之下,制定了字形“认同-代换及异体字、外字处理规则”,即凡是字库中已有编码的字符都让它保真,而没有编码的外字就不保真而用已编码的异体字或形近字替换。此时才开展整理工作,未免有些被动。“如果不对数字对象进行文本校勘正形,将会更加大不同版本、数字化与非数字化古籍内容的差异,对古籍的使用甚至中华文化的传承产生严重的不良后果”。如果我们不能够认识到这一点,单纯从技术角度寻求解决的方案,那么我们的工作就陷入了误区。
2.古籍数字化工作缺乏文献学专家的主导
技术只是形式,内容才是核心,内容决定采取何种形式,形式只能服务于内容,而不是相反。因此,“只有熟悉对象(古籍)内涵的主体,即内容专家,才有能力决定实现古籍数字化的基本路向和基本框架,技术专家的作用是在既定的框架内如何最便捷、最优化地实现目标。……IT技术永远是工具,没有内容专家的构建和引领,再好的IT技术也难以带来真正的利益”[6]。然而当前的数字化工作中,技术专家占据了主导和优势的地位,参与其中的文献学专家凤毛麟角,发挥的作用也非常有限。据参与文渊阁《四库全书》数字化工作的李运富先生介绍,文献学专家是在工程的中途才介入的,虽然在他们的努力下许多错误得以修正,但有些问题已积重难返,加之古籍专业人员太少,无法对整部《四库全书》的用字作全面整理,因而该电子版本的用字仍然难免存在混乱和错误。这不能不说是一件憾事,同时也为我们今后的工作提供了借鉴。
解决古籍数字化保真问题的新思路
1.加强古籍整理工作
为了解决古籍数字化工程中的保真问题,我们必须以学术研究的态度,扎实做好古籍的校勘训诂等整理工作。通过整理的古籍,从形式上看没有保真,但从内容上看,却保留了原作的“语言事实”,消除的只是“文字障碍”[3]。实践工作表明,经过整理的古籍,数字化实现的难度将大大降低。
2.载体转换过程中采取更为合理的映射策略
有了古籍整理的基础,我们可以在载体转换过程中采取更为合理的映射策略。笔者设想的映射包括以下三种方式。
一对一的映射。对于古籍中绝大多数的汉字,我们都可以实现古今一对一的映射。
多对一的映射。改造错别字、恢复避讳字、整理异体字,将同一汉字的多种非标准形态统一映射为标准汉字的数字字符。比如:“為、爲、沩、溈、儰、蒍……”均为“为”字的异体写法,我们统一映射为通用的标准汉字“为”的数字字符。
一对多的映射。对于难以识别的、存在争论的汉字,以及不同版本间存在差异的汉字,、进行一对多的转化。即一个汉字图形可以映射为多个汉字的数字字符,将取舍的权利留给读者。比如:《素问·调经论》“虚者聂辟,气不足,“聂”字《黄帝内经太素》作“慑”,《黄帝针灸甲乙经》作“摄”。将图像“聂”映射为等效的“慑”、“摄”两个数字字符。
需要指出的是,以上两种特殊的映射方式,是在“改而留迹”的原则下进行的。对繁体、通假、避讳、异体、俗字等文字现象,以及各版本间的差异,均做标记,这样不仅解除了人们对于古籍保真的担忧,同时将字里行间的“言外之意”也表达了出来。这样,古籍数字化产生的将是一个不失原貌的标准电子版本。在此标准版本的基础上开发的古籍数字化产品才能具有更高的可信度和更好的开放性。
3.针对不同用户提供最佳的保真方案
针对专业学者,我们提供包括古籍保存环境在内的高品质数字化图像,力求不遗漏关于古籍的任何信息,使读者有身临其境,摩挲古籍的感觉。针对普通读者,我们提供内容可靠、符合现代阅读习惯的古籍数字化文本,最大程度地消除现代人阅读古籍的障碍,便利使用。同时通过技术手段实现两种阅览方式的切换。
结语
古籍的保真问题应当分为内容保真和形式保真两个方面辨证地看待,整理的目的是为了保内容之真,形式保真为的是今后进一步的研究整理。整理与保真实为同一问题的不同表现形式。古籍整理为古籍数字化保真问题的解决提供了新思路,将保真问题带出了技术的误区,为古籍数字化的深入开展奠定了坚实的基础。
参考文献
1陈力.中文古籍数字化方法之检讨[J].国家图书馆学刊,2005,(03):11~16.
2沈澍农.中医古籍用字研究[M].北京:学苑出版社,2007.
3李国新.中国古籍资源数字化的进展与任务[J].大学图书馆学报,2002,(1):21~26,41.
4李运富.谈古籍电子版的保真原则和整理原则[J].古籍整理研究学刊,2000,(01):1~7.
〔关键词〕古籍;数字化资源;调查分析
1古籍数字化的调查
2古籍数字化的特点
2.1古籍数字化的地区发展不同
东部比西部发展快,经济发达的地区更快,比如北京大学图书馆、清华大学图书馆、北京师范大学图书馆、南开大学图书馆、华东师范大学图书馆、山东大学图书馆[19]、武汉大学图书馆不仅对馆藏纸本古籍资源进行了很好的揭示,还拥有丰富的古籍电子资源。而西部,除了云南大学图书馆[20]等少数几个建有馆藏古籍书目数据库,陕西师范大学图书馆购买了4个古籍电子资源,绝大部分大学在馆藏古籍的揭示和古籍电子资源的购买方面都不如东部经济发达地区。
2.2综合性大学和专业性大学发展不同
综合性大学比专业性大学发展快。清华大学图书馆、北京师范大学图书馆、南开大学图书馆,不仅建有馆藏古籍书目数据库以及和古籍有关的特色数据库,还拥有丰富的古籍电子资源。中央财经大学[21]、中国农业大学[22]、北京林业大学[23]、中国政法大学[24]、天津医科大学[25]等专科大学都没有建立专门的古籍数据库,古籍电子资源也极少。
2.3古籍数字化程度不同
2.4建设的专题数据库不同
2.5拥有古籍数据库的数量不同
3古籍数字化存在的问题和对策
3.1搞好古籍普查,避免重复建设
由于一些大学还没有建设馆藏古籍数据库,一些虽建有数据库,但只提供简单的卡片信息,即使有一些大学正在进行数据详编,但是缺乏版本比对所必须的书影,造成古籍版本难以确定,古籍普查任重道远。
3.2编码标准化问题
编码标准化问题是古籍数据加工的一个重要问题。古籍文献中的文字相当繁杂,不仅有写法不同的甲、金、篆、隶、楷、行、草等,更有书体差别的繁、简、古、今、异、俗、讹、新、旧等,即使同一种书体,其汉字的数量也很难有一个标准字库可以解决。我国大陆多用GB2312码,台湾地区多用BIG5码,而微软所用的GBK是GB与BIG5等的超集。复旦大学图书馆、浙江大学图书馆[29]使用GBK码的繁体字检索,有些字如抄和钞、考和禕、和录等,尚不能通检。古籍数字化应遵循国际化的准则,目前,国际标准150/IEC10646(GB13000,unicode)把迄今为止尚存的语言按照其文字统一编码,制定出全球通用的编码字符集标准,它的码位所容纳的汉字囊括《康熙字典》、《汉语大字典》,它包含少数民族文字和外国文字,使得数字化的古籍可在中文简体、中文繁体、德文、日文、韩文、英文等视窗平台上运行,这种跨语境关联的检索系统,极大的方便了使用不同语种用户的检索,是未来古籍数字化的方向。
3.3古籍数字化中知识发现功能的实现
关键词:中医古籍;数字化;共享平台
自上世纪90年代我馆开展古籍数字化研究工作以来,在各级课题的资助下先后建立"珍善本中医古籍档案管理系统"、"中医药珍善本古籍多媒体数据库"、"馆藏中医古籍书目数据库"、"中国中医科学院古籍管理系统"、"中医养生数据库"和"中医药古籍资源数据库"等多个数据库。这些数据库在不同的时期都发挥了各自不同的作用,不断地推进我馆中医古籍数字化保护和利用工作。然而随着数据库数量的增加,在利用这些数据库的过程中也出现了一些新的问题。
1目前存在的主要问题
1.1用户查询不便利不同的数据库资源是相对独立的,相互之间缺乏必要的联系,在对古籍信息进行全面查询时,需要将每本古籍在每个数据库里都查询一遍。这样查询起来十分的繁琐,工作量也很大。
1.2内容和功能存在重复由于都是中医古籍数据库,除了各自特有的功能外,都会对古籍的基本内容进行描述或查询,甚至是用户管理等方面都存在很多相似之处。这样就会造成重复建设,而且增加了存储空间。
1.3更新不同步不同的数据库由不同的管理员来管理,一个数据库的信息被更新后,其它的数据库管理员很难及时得到这些信息并对所负责的数据库进行及时有效地更新。这种不同步很容易造成查询结果的遗漏。
此外,如果把各个数据库的管理与自身发展看做是纵向的,那么,组建一个横向的共享平台将是十分必要的。它可以将各个数据库的资源串联在一起,从而形成一种类似矩阵管理的结构模式。而且随着数据库技术和网络技术的飞速发展,馆藏中医古籍数字化共享平台的组建在技术上也是切实可行的。
2总体设想目标
为了实现馆藏中医古籍的资源共享和方便、快捷的信息检索服务,通过对现有的馆藏中医古籍数据库(主要包括"馆藏中医古籍书目数据库"、"中国中医科学院古籍管理系统"和"中医药古籍资源数据库"三个数据库)的整合,组建一个面向用户需求的集数据加工管理和应用服务为一体的古籍资源网络共享平台。
该平台以交互性强、简捷方便为特点,具有良好的信息导航、数据管理和在线服务等功能,可以满足用户个性化的服务要求,实现用户和管理员各自内部以及相互之间的信息交流和数据传递。
3具体组建结构
该平台可由数据管理系统和对外服务系统两部分组成。每部分之间是相互联系的,而且可根据实际需要分设不同的子系统。
3.1数据管理系统
3.1.1内容管理系统内容管理系统是指对有关中医古籍的各种数字资源,包括文本、图片,甚至是视频、3D模型等,进行存储和管理。这部分是整个共享平台的基础。
内容管理系统可分为存储模块和管理模块。存储模块是指对各种数字资源进行存储和备份,也对数字资源的各种元数据进行存储。这样既可以保护各种资源,也可以保存各个媒体类型之间的关系以及其他诸如用户对某个资源拥有的权限等关系。管理模块是指对各种数字资源进行描述、分类、核查、加工、整合以及统计分析等方面的管理。
3.1.2用户管理系统用户管理系统是指对各种用户进行信息描述和需求分析的管理。各种用户包括不同数据库的数据库管理员和不同层次的外部用户,主要是指外部用户。
用户管理系统可分为用户信息模块和用户需求分析模块。
用户信息模块主要包括用户元信息和个性化特征的信息。如用户姓名、性别、年龄、单位、联系地址、专业、职业、职称等;用户的收藏书目;用户的请求历史;用户每次的检索记录等等。
用户需求分析模块主要是针对直接或间接获得的用户需求信息进行分析。包括:通过用户描述,获取用户请求;对用户注册资料、使用习惯等个性化信息进行分析,主动跟踪用户平时感兴趣的信息,调整系统个的角度和内容,建立用户个性化需求模式;维护用户的数据信息等。
3.1.3数据库管理系统数据库管理系统是指对整个共享平台的硬件和软件进行管理和维护。包括数据库定义、数据装入、数据库操纵、数据库控制、数据库维护、数据通信等等。这是整个共享平台正常运行的重要保障。
3.2对外服务系统
3.2.1检索服务系统检索服务系统是通过友好的用户检索口直接面向用户需求提供不同层次的检索服务,包括简单检索、组合检索、智能检索等等。这部分是共享平台的主要服务窗口。检索服务系统要简便、易操作,对于登陆平台的任何用户都可以提供服务。
3.2.2个性化服务系统个性化指根据用户的信息使用行为、习惯、偏好和特定需求,向用户提供满足其个性需求的信息内容和功能的一种服务。个性化服务系统是根据用户的定制需求,提供个性化的界面设置、个性化的信息环境以及个性化的信息快报。特别是用户可以定制个人馆藏,提高用户的检索效率,从而使用户的个性化需求能得到最大限度的满足。这是与用户管理系统相连接的。
3.2.3用户交流系统用户交流系统是指利用群组软件等协同工具给不同类型或不同兴趣的用户提供一个共享和交流空间。通过用户彼此之间的讨论与交流,整合组织所有资源,加强成员之间的沟通,提升组织信息产品服务的质量和效率。其目的在于实现不同子系统的信息同步,提供知识共享,利用开放的环境,促进不同用户之间的群体合作。
4组建方法
4.1数据库比较对"馆藏中医古籍书目数据库"、"中国中医科学院古籍管理系统"和"中医药古籍资源数据库"三个数据库的结构、内容和功能进行全面的比较,分析三者之间的相同点和不同点,尤其是各自的特色功能。
4.2资源整合
4.2.1结构整合对于结构相同的数据,进行数据合并。对于结构不同的数据,可以兼容的,进行字段合并,并对每条数据进行补充;不可以兼容的,进行结构重建,并对每条数据进行修改和完善。
4.2.2内容整合对于内容相同的数据,进行完善、去重;对于内容不同的数据,进行修改和补充。
4.2.3功能整合对于相同的功能,进行去重;对于不同的功能,尤其是各自的特色功能,进行改进和优化。对于以前没有的功能,尤其是用户个性化服务功能,进行补充。
结合我馆的实际情况,馆藏中医古籍数字化共享平台的具体服务方式可采用B/S多层架构体系,即整个的应用服务由基于Web的应用服务器、中间件服务器和后台数据仓库组成。系统对外服务的主服务器、镜像服务器选用LINUX;应用服务器上的数据库系统采用ORACLE数据库;编程语言采用PHP和JavaScript语言,Web服务器采用ApacheWeb服务器。这几种技术都有免费开源的特点,而目功能强大、互相集成,易于建设、维护、提高使用效率和保护后台数据。
4.4系统该平台可在中国中医科学院图书馆网上进行。这样可以为用户提供更多的中医古籍信息,也方便用户查询自己所需要的信息和资源。
5总结
馆藏中医古籍数字化共享平台的组建和运行是一个长期复杂的工程。在建设的过程中,必须遵循服务用户、统筹规划、共建共享的原则,通过各方面的人力、物力和资金的配合与支持,才能形成一个简捷方便的网络共享平台,从而更好地为用户服务,为中医古籍的保护和利用服务,为中医事业的发展创新服务。
参考文献:
[1]范文安.徽省科技文献资源共建共享平台及其建设方案[J].科技情报开发与经济,2007,17(22):113-114.
[2]干冬力.高校图书馆信息资源共享平台构建分析[J].科技情报开发与经济,2007,17(13):22-23.
[3]朱义华,郭昭辉,武港山.数字资源共享平台框架的设计和实现[J].计算机应用研究,2007,24(5):214-217.
关键词:古籍数字化古籍保护“明别集丛刊”项目
“明别集丛刊”是北京大学图书馆和黄山书社合作的大型古籍影印项目,是迄今为止规模最大的明人别集丛书,选取明代近2000位作者的诗文集,占现存全部明代作者及其别集的三分之二强,基本囊括了明代重要作者的重要别集。该项目选取了1500多种原书,200多种胶卷,共扫描50多万筒子页(包括胶卷还原),其选目与扫描工作已经完成。笔者在北京大学图书馆古籍部就职,参与了选目工作,并承担该项目的复核和后期处理工作,对于数字化过程中的古籍保护问题,有一些粗浅体会,今整理如下。
1数字化前的底本甄选工作
选择好的底本,这是古籍数字化的重要前提。据笔者参与此项工作的体会,在选择底本时,需注意以下几个问题:
1.1底本应有较大版本价值
底本应选取刻印年代较早、流传稀少、具有代表性、是此后诸本的祖本,等等。这个问题主要属于版本目录学和文献学的范畴,这里不展开讨论了。
1.2版本鉴定应保证准确性
1.3同一版本有不同复本者
在选目过程中,如遇到同一版本有不同复本者,应综合考虑古籍内容、印刷状况、装订情况、纸张条件,等等,尽量选择内容完整、无缺页或者缺页较少、刷印清晰、断版、补版较少的书。不能选中缝较紧的书,如果中缝太紧,扫描时,靠近装订线的文字容易变形,甚至有可能根本扫描不上,需要拆书,才能达到理想的扫描效果。但如果两种书都中缝紧,而其中的一种有包角的话,则尽量选择没有包角的书,因为包角还原起来较困难。总之,想尽办法避免拆书,尤其是尽量不拆有包角的书,以保持古籍的原貌。
纸张方面,尽量选用白棉纸或皮纸等较厚而坚韧的纸张,尽量不选薄竹纸,特别是薄而脆的黄色竹纸古籍。从保护古籍来看,在扫描过程中,要翻页,要按压,竹纸的书更容易受损。从扫描效果看,同样的内容,在黑白扫描的情况下,白棉纸或皮纸等的扫描效果更清晰;另外,古籍纸张太薄的话,容易透出反面的字,在黑白扫描的情况下,这些透字会变成图像上的底灰,处理起来较困难。至于透字问题,有用下列方法处理的:即扫描时加衬纸,夹在筒子页内,把两个半页隔开,从而避免透字。不过,古籍纸张多较松脆,衬入的纸张易把书口划破。所以,这次“明别集丛刊”扫描时,我们没有采用衬纸。透字问题则希望扫描公司来处理。
选书时,如果仅选用该书的部分内容、需要插入纸签标明起止的话,尽量用软而薄的手工竹纸,千万不能用厚而硬的机械制纸,以免损坏古籍原本。另外,有些宣纸虽然是手工制造,但比较厚而硬,也尽量不要选用。纸签上的说明文字尽量用铅笔,以免污染古籍原本。
1.4卷页单一定要做好
2图像化过程中需注意的问题
2.1尽量保证不损伤古籍
为了保护古籍,和扫描公司交流好非常重要。因扫描公司人员流动大,操作员的素质与水平参差不齐,需要在扫描前提醒他们一些扫描原则。古籍扫描与普通书扫描有很大不同:古籍一定要轻拿,轻放,轻翻;而且,一定不能像扫描普通书那样,用带有螺旋纹的指套,因指套上的螺旋纹易刮伤古籍纸张。在进行大型数字化项目的时候,扫描公司一般会派一个组长。这位组长一定得认真负责,如果事事处处只顾及扫描速度,而不管古籍是否受损、扫描效果是否良好,这样的组长不能用。如对扫描组长不满意,我们可以督促扫描公司换人。如果操作员不爱护古籍,我们也要请他离开。最好和扫描公司就古籍保护问题,签订一份合同,详细规定古籍扫描有哪些规矩,违反了的话,或者损伤古籍的话,需要承担什么责任。另外,要告知扫描公司,没有取得我们同意,不能私自拆书。又,某些古籍的封面最初印刷时,覆有薄的透明纸保护,须告知扫描公司,尽量不要撕开覆纸,可用彩色扫描,如果彩色扫描也不清楚的,宁可不扫描封面,也要保持古籍原貌。
2.2确保扫描效果良好
这也是立足于保护古籍的需要。如果扫描效果不好,又无法进行后期处理的话,很可能需要重新扫描,而多次扫描原书,对古籍损害很大。古籍扫描效果是否良好,与扫描仪器、扫描参数设置、扫描的颜色模式等等,都有关系。
“明别集丛刊”项目采用了3种图像化设备:柯美(MINOLTA)PS7000扫描仪、数码相机、虹光(Avision)FB6080E扫描仪。FB6080E是平板式扫描仪,其图像效果在3种设备中最好,但因为与古籍直接接触,可能对纸张松脆的古籍有损,而且扫描速度较慢。其他两种复制设备速度较快,扫描时只需页面朝上,平放于托书台,但也需要操作员手动翻阅古籍,并按压,对古籍还是可能有微损。而且,有的古籍较厚,用后两种复制设备时,扫描图像可能会变形。最好采用既能与古籍零接触,又能保证图像效果的扫描仪器。
笔者认为,彩色扫描是最保真的方式。但彩色扫描速度慢,而且比黑白扫描总额贵。因此,采用哪种扫描模式,要和出版社多沟通,问询出版社需要达到什么扫描效果,并灵活掌握。最好先试扫描一部分,找出最好的扫描方式后,再进行大规模扫描。
3图像化之后的处理问题
扫描完成后,需要做图像后处理,在以下两个环节容易出问题:
3.1拼版环节
扫描完成后,需要对两个半页进行拼接,形成一个筒子页。如果操作员不认真,容易出现以下错误:左右拼版颠倒,以致版心到了边上;缺半版;左右两个半版有部分叠加,从而挡住版心;左右拼版歪了,以致两版之间出现夹角。需要对扫描公司特别说明的是:有的筒子页半页有字,另半页是空白,这半个空白页也必须拼上,不能删除。否则,容易把这半页和下一个筒子页的前半页拼在一起,从而导致整本书的拼版错误。
3.2裁切环节
以上是笔者参与“明别集丛刊”项目中,关于古籍数字化与古籍保护的一些初步想法。挂一漏万,抛砖引玉,希望得到大家的指点。
论文摘要:数控机床电气系统故障的调查、分析与诊断的过程也就是故障的排除过程,一旦查明了原因,故障也就几乎等于排除了。因此故障分析诊断的方法十分重要。
一、故障的调查与分析
这是排故的第一阶段,是非常关键的阶段,主要应作好下列工作:
1、询问调查在接到机床现场出现故障要求排除的信息时,首先应要求操作者尽量保持现场故障状态,不做任何处理,这样有利于迅速精确地分析故障原因。
2、现场检查到达现场后,首先要验证操作者提供的各种情况的准确性、完整性,从而核实初步判断的准确度。由于操作者的水平,对故障状况描述不清甚至完全不准确的情况不乏其例,因此到现场后仍然不要急于动手处理,重新仔细调查各种情况,以免破坏了现场,使排故增加难度。
3、故障分析根据已知的故障状况按上节所述故障分类办法分析故障类型,从而确定排故原则。由于大多数故障是有指示的,所以一般情况下,对照机床配套的数控系统诊断手册和使用说明书,可以列出产生该故障的多种可能的原因。
4、确定原因对多种可能的原因进行排查从中找出本次故障的真正原因,这时对维修人员是一种对该机床熟悉程度、知识水平、实践经验和分析判断能力的综合考验。
5、排故准备有的故障的排除方法可能很简单,有些故障则往往较复杂,需要做一系列的准备工作,例如工具仪表的准备、局部的拆卸、零部件的修理,元器件的采购甚至排故计划步骤的制定等等。
下面把电气故障的常用诊断方法综列于下。
(1)直观检查法这是故障分析之初必用的方法,就是利用感官的检查。
①询问向故障现场人员仔细询问故障产生的过程、故障表象及故障后果,并且在整个分析判断过程中可能要多次询问。
②目视总体查看机床各部分工作状态是否处于正常状态(例如各坐标轴位置、主轴状态、刀库、机械手位置等),各电控装置(如数控系统、温控装置、装置等)有无报警指示,局部查看有无保险烧煅,元器件烧焦、开裂、电线电缆脱落,各操作元件位置正确与否等等。
(3)信号与报警指示分析法
①硬件报警指示这是指包括数控系统、伺服系统在内的各电子、电器装置上的各种状态和故障指示灯,结合指示灯状态和相应的功能说明便可获知指示内容及故障原因与排除方法。
②软件报警指示如前所述的系统软件、PLC程序与加工程序中的故障通常都设有报警显示,依据显示的报警号对照相应的诊断说明手册便可获知可能的故障原因及故障排除方法。
(7)交叉换位法当发现故障板或者不能确定是否故障板而又没有备件的情况下,可以将系统中相同或相兼容的两个板互换检查,例如两个坐标的指令板或伺服板的交换从中判断故障板或故障部位。这种交叉换位法应特别注意,不仅硬件接线的正确交换,还要将一系列相应的参数交换,否则不仅达不到目的,反而会产生新的故障造成思维的混乱,一定要事先考虑周全,设计好软、硬件交换方案,准确无误再行交换检查。
(8)特殊处理法当今的数控系统已进入PC基、开放化的发展阶段,其中软件含量越来越丰富,有系统软件、机床制造者软件、甚至还有使用者自己的软件,由于软件逻辑的设计中不可避免的一些问题,会使得有些故障状态无从分析,例如死机现象。对于这种故障现象则可以采取特殊手段来处理,比如整机断电,稍作停顿后再开机,有时则可能将故障消除。维修人员可以在自己的长期实践中摸索其规律或者其他有效的方法。
二、电气维修与故障的排除
电气故障的分析过程也就是故障的排除过程,因此电气故障的一些常用排除方法在上一节的分析方法中已综合介绍过了,本节则列举几个常见电气故障做一简要介绍,供维修者参考。
2、数控系统位置环故障
①位置环报警。可能是位置测量回路开路;测量元件损坏;位置控制建立的接口信号不存在等。
②坐标轴在没有指令的情况下产生运动。可能是漂移过大;位置环或速度环接成正反馈;反馈接线开路;测量元件损坏。
3、机床坐标找不到零点。可能是零方向在远离零点;编码器损坏或接线开路;光栅零点标记移位;回零减速开关失灵。
【关键词】配电线路;故障分析;自动化技术;应用问题
0.引言
1.配电线路的应用现状分析和应用
1.1国内配电线路的应用现状
在城市的主城区,配电网的线路以电缆线路居多,它们常用地下电缆;在一般偏远城区,城市远郊区和农村常以架空线路居多,在主城区与一般城区的交界处则是架空和地下电缆混合线路,架空线路多数是开关本体,基本不具备自动化接口和改造条件。
1.2国内配电线路的故障类型分析
配电线路要实现配网的自动化,就要对各输电线路故障进行正确的分析、隔离和复电,通过理论及实践总结,对配电线路的故障类型进行分析。
1.2.1架空线路故障类型特点的介绍
架空线路如果出现故障,常常具有如下特点。第一,是馈线故障频繁,容易造成大面积停电;第二,是瞬时性故障和单相接地故障多,容易造成停电,甚至破坏绝缘,损坏设备;第三,是用户故障不断增加,容易使用户出现故障造成大面积停电。
1.2.2电缆线路故障类型特点的介绍
架空线路如果出现故障,它的故障类型常常具有如下特点。第一,是馈线故障概率小,停电次数少;第二,是永久性故障至大面积停电居多;第三,是多分布在配电站点内和电缆接头处,属发展性故障,破坏绝缘甚至损伤设备;第四,是用户故障不断增加用户故障会造成大面积停电。
1.2.3混合线路故障介绍
架空线路和架空电缆混合线路的故障停电问题则是配网自动化就地智能处理重点解决的问题。
2.馈线自动化实现方式
结合配电网的故障类型和特点,为提高配电网发现、隔离、恢复故障的能力,实现配电网自动化,现阶段主要的配网自动化实现方式如下:
2.1主站集中型FA技术的实现
2.1.1FA技术的工作原理
主站系统根据配电终端检测的故障告警信息,结合变电站保护动作信号综合判断,确定故障类型和故障区段,自动或手动隔离故障点,恢复非故障区段供电。
2.1.2FA技术的特点
FA技术的特点如下,第一,线路类型无限制,架空、电缆、混合都适合;第二,不要求变电站重合闸配合;第三,无须保护配合,便实施,管理简;第四分段不受限,扩展灵活;第五,主干线路开关采用蓄电池为后备电源,分界开关配置超级电容为后备电源;第六,依赖通信及主站,投资较大,每次故障,整条线路存在短时停电。
2.2分布智能型FA技术的实现
2.2.1分布智能型工作原理
2.2.2分布智能型的特点
2.4电压电流型FA技术的实现
2.4.1电压电流型FA技术工作原理
2.4.2电压电流型FA技术特点
3.结语
采用FA就地智能故障处理,可实现对线路运行状态的管、监、控、优的管理,随着电力系统的不断发展,配电网结构越来越复杂,配网中某条线路的小故障若不及时切除将会影响到其他线路,甚至演变成为三相短路,扩大故障的影响范围,实现配网自动控制能够有效解决上述问题,保障小康社会的用电安全。