您当前所在位置:

探析档案目录与政务信息资源目录体系的关系

2013-01-15

 

由于目前这两个目录之间并未建立起关联,那么,处于政务信息资源目录体系之下的应归档或已归档的信息资源,在进入档案馆保管阶段并经馆编目录加以管理和控制之后,不易再通过原利用体系独立对其进行查找利用;档案馆也不易通过目录控制的方式对应归档及尚未进馆档案进行前端控制和全程管理。

二、档案目录与政务信息资源目录体系编目的比较

正因为档案目录和政务信息资源目录体系之间内在的联系,且无论是档案目录还是政务信息资源目录体系,目录编制均为核心,由此对二者进行比较。

(一)档案目录的著录项目与政务信息资源目录体系中核心元数据的比较

著录项目是档案目录的基本构成单元,是编制档案目录的基础和条件。元数据是描述政务信息资源特征的数据③,在政务信息资源目录的编目、建库、发布和查询中发挥着重要的作用。因此我们将《档案著录规则》(DA/T18—1999)规定的著录项目、《政务信息资源目录体系》核心元数据及《北京市综合档案馆目录数据库结构与数据交换格式》中部分数据库的著录项目进行比较。

1、《北京市综合档案馆目录数据库结构与数据交换格式》中的文书文件、案卷目录库的著录项目基本使用了《档案著录规则》中的著录项目,但省去了稿本与文种项、载体形态项、附注与编号项等著录项目中的内容,增加了开放状态、档案复制类型及编号等著录内容。案卷目录数据库和文书档案文件目录数据库同属管理型目录,但著录项目也因级次的不同而有差异。所以在编制档案目录时,著录项目的选定并非一成不变,而是要根据目录类型、级次、专题、分类方法等的不同加以选择。此外,无论是《档案著录规则》规定的著录项目,还是《北京市综合档案馆目录数据库结构与数据交换格式》中列出的字段名称,都是反映文件或案卷的内容和形式特征,而不包括相应的结构和背景信息。

2、档案著录项目与《政务信息资源目录体系》中核心元数据的关系:(1)交叉关系。如信息资源名称、信息资源摘要、信息资源提供方、信息资源发布日期、关键字等核心元数据与档案著录信息中的题名、责任者、提要、时间项、关键词等,可以通过技术等手段进行转化。(2)不是所有核心元数据都是档案著录信息源,如全宗号、目录号、案卷号、页(件)号、缩微号、载体类型、密级、保管期限、开放状态等明显体现档案专业特性的著录项目,无法从元数据中提取,需要人工进行编制。(3)有些核心元数据,如信息资源标识符、元数据标识符等可以在文件形成与管理过程中自动形成的元数据实体及元素,目前在档案目录中尚未体现;对信息资源分类的有关信息、在线资源链接地址、服务信息、元数据维护方等核心元数据的著录内容,也尚未列入档案目录的著录信息之中。

(二)档案著录条目和政务信息资源核心元数据编排组织的比较

档案目录和政务信息资源目录体系共有的条目编排方法是按主题类别分类编目。我们就以此对二者进行分析比较。

档案分类标引时,应首先对档案文件进行周密地主题分析,确定文件、案卷所论述的事物中,哪些主题应予以标引,能为利用者提供检索途径,然后根据主题性质,到《中国档案分类法》中查找其所属的类目④,并准确地给予分类标识。政务信息资源的主题分类也是通过对主题分析的结果进行分类,再确定类目名称和类目编码。不同的是:

1、分类依据。档案主题分类主要依照《中国档案分类法》,政务信息资源分类主要依据《主题分类类目表》。

2、类目设置。《中国档案分类法》设置了19个基本大类,每一基本大类下再根据需要设置若干属类。而《主题分类类目表》则规定了21个一级类及133个二级类。

3、标识符号。档案分类采用汉语拼音字母与阿拉伯数字相结合的混合号码制,用一个字母表示一个大类,以字母的顺序反映大类的序列。在字母之后,采用数字编号制,用数字表示大类下类目的划分,数字的位数一般代表类目的级位,遵循层累制原则。⑤政务信息资源目录体系中类目代码编制规则是:分类类别用1位大写罗马字符表示,“Z”代表主题分类;一级类用1位大写罗马字符表示;二级类用1位大写罗马字符及2位阿拉伯数字表示。即在主题分类中,分别用“A”至“W”标识21个一级类,用大写罗马字符“A”至“Z”加两位阿拉伯数字“00”标识二级类。

4、著录要求。在《档案著录规则》和《北京市综合档案馆目录数据库结构与数据交换格式》中,分类号分别为必选项、可选项,且均无著录类目名称的规定;在《政务信息资源目录体系》中,“信息资源分类”是必选核心元数据,其中包括分类方式、类目名称、类目编码等元数据元素。这在一定程度上体现了档案分类标识和政务信息资源类目编码在检索利用频次和各自目录系统中地位的不同。

(三)档案目录与政务信息资源目录体系编目技术的比较

随着计算机技术的发展和普及应用,纸质档案目录逐渐淡出,档案目录数据库形成规模。由于我国尚未出台全国统一的档案目录数据库结构标准,因此本文参照《北京市综合档案馆目录数据库结构与数据交换格式》及《政务信息资源目录体系》编目系统技术要求,对二者主要的编目技术进行比较。

1、档案编目要根据目录作用和编目对象特征、级次、序列等,有针对性地具体设定符合实际利用需要的各种档案目录数据库结构表、使用说明与数据交换格式。政务信息资源的编目要根据编目对象的具体粒度采用不同的单位编目。

2、档案目录数据库普遍为Xbase关系型数据库。在编制档案目录时,首先根据规定,在数据库管理系统中设定目录字段名称、字段名、字段类型、字段长度等,再由人工将著录信息插入到该数据库相应的表格中。而插入过程只能针对事先定义好的字段结构。这一过程对未被事先定义字段结构的著录内容无能为力,除非更改数据库结构,如增加表的字段或者新的数据库表。跨平台、跨系统的数据交换是通过扩展名为.DBF的Xbase关系型数据库文件格式实现。⑥经过压缩、分割处理的数据交换文件,应将其解压缩、合并后再进行交换。⑦

3、政务信息资源目录体系基于XML技术。XML应用面主要分为文档型和数据型两种类型。前一类型中,XML存放整个文档的XML数据,然后XSLT将XML转换、解析,结合XSLT中的HTML标签,最终成为HTML显示在浏览器上。而后者则是利用相关的XML API(MSXML DOM、JAVA DOM等)对XML进行存取和查询。XML还可以作为信息传递的载体,主要是为分布式应用程序服务。XML文本本身不仅可包含信息内容,还涵盖了信息结构。只要是格式正确的XML文本,都可以随时添加到数据库里,并可以与分布式的应用进行数据交互。比较而言,XML和数据库的联合兼有关系数据库和面向对象数据库的优势,因此基于XML技术的政务信息资源目录比目前的档案目录数据库更具扩展功能。此外,对编目对象、分类技术等的比较前文已有表述。

三、档案目录体系

与政务信息资源目录体系的交互融和

基于档案目录与政务信息资源目录体系的内在联系及上述异同点的比较,我们可以考虑在现有的档案目录与政务信息资源目录体系之间建立交互渠道。具体做法是建立档案著录项目和政务信息资源目录体系核心元数据的映射关系,利用已有技术,采用现阶段比较流行的WEB数据库方式进行处理,使系统可以根据用户的检索请求,检索相应的目录数据库,并将查询记录,以WEB的形式反馈给用户,同时实现多种模式检索服务,满足不同权限用户异地查询需求。在实际操作中应考虑的问题主要有: