数字科技档案馆建设关键技术研究

VIP免费
3.0 高德中 2024-11-19 5 4 6.51MB 94 页 15积分
侵权投诉
摘 要
随着国家信息化的不断深入,电子资源在政府日常办公中占据着越来越重要
的地位,档案馆作为电子政务资源的最终接收和保存机构,其建设情况显得益发
重要。数字档案馆可以为全方位、多角度、无时滞地利用综合性信息资源提供数
据基础,为政府高效率、高质量决策提供保障,有利于政府信息的社会共享,实
现政府信息资源的全面增值。数字档案馆在西方发达国家得到了高度重视并已经
取得了一定成果,如美国的电子文件馆 ERA 工程,澳大利亚的 NAA 计划,英国
E-Government 建设。
数字档案馆建设核心技术主要包括电子文件长期保存、电子文件资源共享、
电子文件综合利用和电子文件信息安全和容灾备份技术。目前国内数字档案馆建
设主要集中于电子文件资源共享和电子文件综合利用上,对于电子文件长期保存
着力不多。北京市科学技术委员会提出建设数字科技档案馆示范工程,因此对电
子文件长期保存技术展开研究显得尤为急迫和重要,在此背景下,本文主要研究
内容是数字科技档案馆建设关键技术-电子文件长期保存技术。
作为数字科技档案馆建设关键技术,电子文件长期保存技术是一项系统工程,
包括数字科技档案馆总体框架研究、信息打包研究和数据后台存储研究。本文主
要工作如下:
一、通过采纳国际上主流的开放档案信息系统 OAIS( Open Archival
Information System)框架,结合数字档案馆建设实际情况,对数字科技档案馆进行
基于 OAIS 的总体框架研究,包括:数字科技档案馆总体框架设计和数字科技档
案馆元数据规范设计。
二、通过采用符合 OAIS 要求的 XFDU 信息打包标准,对 OAIS 总体框架研
究中产生的提交信息包 SIP、档案信息包 AIP 和分发信息包 DIP 进行研究。
三、结合 Oracle XML DB 数据库技术对元数据规范 SchemaXFDU Schema
和提交信息包 SIP档案信息包 AIP分发信息包 DIP XML 文件的存储进行研
究。
通过对上述内容的研究,为数字科技档案馆建设提供了有力的保障,对于今
后特色数字档案馆建设具有一定的借鉴意义。
关键词:数字档案馆 OAIS XFDU XMLDB Repository XMLType
ABSTRACT
With the development of information society of our country, electronic resources
in the day-to-day office of government occupies an increasingly important position.
archives of e-government resources as the ultimate institutions of receiver and
preservation, its construction appears to have become more important. Digital archives
may provide basic data for the omni-directional, multi-angle, delay-free use of
integrated information resources , provide safeguard for efficient, high-quality
decisions-making of government, and is in favor of the information-sharing between
government and society to achieve a comprehensive value-added of government
information resources. Digital archives in the western developed countries has been
attached great importance to and has achieved certain results, such as the United
States’s ERA (electronic resources archival) project, Australia's NAA plan, the United
Kingdom's E-Government building.
Digital archives building’s core technologies include long-term preservation of
electronic documents, resource sharing of electronic documents, comprehensive
utilization of electronic documents, information security and disaster recovery and
backup of electronic documents. At present, the construction of Digital archives mainly
focus on resource sharing and comprehensive utilization of electronic documents, the
long-term preservation of electronic documents doesn’t have been pay enough
attention. Beijing Municipal Commission of Science and Technology attempting to
build demonstration project for Digital archives, and therefore the study of long-term
preservation technology of electronic documents is particularly urgent and important.
In this context, the main content of this article is the key technology of building Digital
archives - long-term preservation technology of electronic documents.
As the key technology of construction of Digital archives, long-term preservation
technology of electronic documents is a systematic project, including overall
framework research, information package research and data background storage
research of Digital archives. In this paper, the main work are as follows:
Part one, by adopting the international leading OAIS (Open Archival Information
System) framework, combining with the actual situation in the construction of Digital
archives, we make the OAIS-based overall framework research, including: design for
Digital archives overall framework and design for Digital archives metadata criterion.
Part two, through the use of information package standards - XFDU(xml
formatted data unit) which is in line with the requirements of OAIS, we make the
research of submission information package(SIP), archival information package(AIP)
and dissemination information package(DIP), which emerge in part one- Digital
archives OAIS-based overall framework research.
Part three, combining with Oracle XML DB database technology, we make
database background storage research, which is useful for storing the xml files
produced in Part one and Part two, including metadata criterion Schema, XFDU
Schema and SIP, AIP, DIP etc.
By applying research production, we provide an effective guarantee for the
construction of Digital archives. At the same time, it has some referential significance
for the future of the country to carry out large-scale construction of digital archives.
Key WordDigital ArchivesOAISXFDUXML DBRepository
XMLType
目 录
摘 要
ABSTRACT
第一章 绪 .........................................................................................................1
§1.1 研究背景...................................................................................................1
§1.2 课题来源...................................................................................................2
§1.3 核心技术...................................................................................................2
§1.4 主要研究内容...........................................................................................2
第二章 开放档案信息系统 OAIS .......................................................................... 4
§2.1OAIS 简介 ................................................................................................. 4
§2.2OAIS 环境模型 ......................................................................................... 5
§2.3OAIS 功能模型 ......................................................................................... 6
§2.3.1 摄入(Ingest) ................................................................................... 7
§2.3.2 档案存储 Archival Storage(Archival Storage) ............................. 9
§2.3.3 数据管理(Data Management................................................ 10
§2.3.4 系统管理(Administration......................................................11
§2.3.5 保存规划(Preservation Planning.......................................... 13
§2.3.6 存取功能(Access.................................................................. 15
§2.4OAIS 框架下的元数据标准 ................................................................... 17
§2.4.1 元数据标准简介..........................................................................17
§2.4.2 元数据标准定义..........................................................................18
§2.4.3 元数据标准理论..........................................................................18
第三章 XFDU 信息打包标准...............................................................................21
§3.1XFDU 描述..............................................................................................21
§3.2XFDU 实现提交信息包 SIP ...................................................................23
§3.3XFDU 实现档案信息包 AIP .................................................................. 25
§3.4XFDU 实现分发信息包 DIP .................................................................. 26
第四章 Oracle XML DB 数据库技术 ....................................................................27
§4.1XML 数据库............................................................................................27
§4.1.1XML 数据库分类.........................................................................27
§4.1.2XML 数据库优点.........................................................................28
§4.2Oracle XML DB 概述 ..............................................................................29
§4.2.1Oracle XML DB 简介 ...................................................................29
§4.2.2Oracle XML DB 体系架构 ...........................................................30
§4.3Oracle XML DB-XMLType .....................................................................32
§4.3.1XMLType 简介............................................................................. 32
§4.3.2XMLType 存储方式..................................................................... 32
§4.3.3XML DB 中的 XML Schema .......................................................34
第五章 数字科技档案馆建设整体介绍...............................................................36
§5.1 建设背景.................................................................................................36
§5.2 建设总目标............................................................................................38
§5.3 关键技术研究.........................................................................................39
第六章 基于 OAIS 的总体框架研究 ................................................................... 40
§6.1 数字科技档案馆总体框架设计.............................................................40
§6.1.1 数字科技档案馆组织地位..........................................................40
§6.1.2 数字科技档案馆总体框架..........................................................41
§6.2 数字科技档案馆元数据规范设计.........................................................43
§6.2.1 元数据规范框架..........................................................................43
§6.2.2 元数据表的设计..........................................................................45
§6.2.3 元数据规范 Schema .................................................................... 50
第七章 基于 XFDU 的信息打包研究 ..................................................................65
§7.1XFDU Schema ......................................................................................... 65
§7.2 提交信息包 SIP ......................................................................................68
§7.3 档案信息包 AIP ..................................................................................... 73
§7.4 分发信息包 DIP ..................................................................................... 74
第八章 基于 Oracle XML DB 的存储研究 ..........................................................75
§8.1 批注 XML Schema ................................................................................. 75
§8.2 存储前准备工作.....................................................................................77
§8.3 注册和删除 XML Schema ..................................................................... 78
§8.4 存储和查找 XML 文档..........................................................................79
第九章 结束语.......................................................................................................81
附录 MetadataSpec.xsd ......................................................................................... 82
参考文献.................................................................................................................88
在读期间公开发表的论文和承担科研项目及取得成果.....................................90
第一章 绪论
1
第一章 绪
§1.1 研究背景
我国的电子政务建设,正在由网络硬件环境建设,逐步向政府信息化法规、
标准、电子工作模式等软环境建设方向发展,由网络信息发布式、内部电子流程
化方式,向利用网络资源、信息资源实现信息的整合、共享、深度利用等方式发
展。建设基于网络的、政府和社会迫切需要的、以跨政府职能的信息整合为特征
的、可供政府和社会充分共享的数字档案馆,已经成为电子政务深化发展的重要
内容[1]
数字档案馆可以为全方位、多角度、无时滞地利用综合性信息资源提供数据
基础,为政府高效率、高质量决策提供保障;建设和利用数字档案馆,是知识管
理理念和方法在政府管理中的有效应用,有助于提高政府管理的整体水平[2];建
设和利用数字档案馆,不但有利于政府自身的利用,而且有利于政府信息的社会
共享,实现政府信息资源的全面增值;建设和利用数字档案馆,是一项在国内、
国际领先的政府信息管理工程。
与此同时,特色资源是信息资源中最具生命力的组成部分,具有互补性、共
享性和较高的再利用价值。政府信息资源中的地方经济、部门经济信息和地方服
务信息是最具有个性化的信息,以市场需求为导向,突出地方特色,是各级政府信
息资源建设的重点和方,把能够反应这种特殊性的信息资源和最具有优势的
息资源加以收集、加工、整理和筛选,让社会其他成员各取所需地再利用[3]同时,
构建特色数字档案馆能够避免重复建设造成的浪费,使政府信息资源在全社会得
到优化配置和有效利用,发挥它的最佳的社会效益和经济效益,满足社会公众的需
要。
虽然政务资源具有如此巨大的利用价值,而且国内档案馆在纸质档案数字化
方面下了很大功夫,但就实际成果来看,只是初步解决了政务资源的收集问题,
而资源的整合依然存在很多障碍和壁垒[4],资源的利用尚没有一套十分有效的体
系,电子文件的持久保存问题也没有得到真正解决。
数字科技档案馆建设关键技术研究
2
§1.2 课题来源
本课题是受北京市科技委员会委托,市级科管系统信息化建设-科技政务专项
下的子课题:北京市数字科技档案馆建设。
北京市科学技术委员会拥有 OA 系统,MIS 系统以及十几个行政审批系统,
其中政务资源由于主要以高新科技为主,具有相当大的特殊性和利用价值,但各
系统互相隔离,无法实现资源的充分共享、有效利用和长期保存。数字档案馆建
设涉及的关键技术包括电子政务资源的整合、利用和长期保存,最终实现为政府
内部决策提供强有力的依据和辅助手段,满足社会公众的利用需求,降低行政和
社会成本。
§1.3 核心技术
数字科技档案馆建设核心技术包括电子文件长期保存、电子文件资源共享、
电子文件综合利用和电子文件信息安全和容灾备份技术等。
电子文件长期保存技术包括:保存框架设计、数据打包技术和后台数
存储技术。
电子文件综合利用包括:检索技术、知识管理、决策支持、数据挖掘
技术。
电子文件资源共享包括资源共享交换体系建设、资源共享目录体系建
等。
电子文件信息安全和容灾备份技术分为信息安全和容灾备份。信息安
包括病毒防护系统、入侵检测系统、防主页篡改系统、VPN 网关、基于
PKI 的身份认证与加密体系、基PMI 的授权管理体系、打印可检测数
字水印系统等;容灾备份包括 SAN 存储结构、双机热备、数据库更新与
维护等。
§1.4 主要研究内
鉴于数字科技档案馆建设规模庞大,涉及技术众多,不可能在一篇文章中逐
一介绍。数字档案馆建设可以借鉴很多成熟技术,如信息安全和容灾备份技术、
电子文件综合利用技术,以及国家正在进行的电子政务目录体系和交换体系建设。
同时电子文件长期保存技术作为数字科技档案馆建设关键技术,却没有引起国内
第一章 绪论
3
有关机构的重视,相关研究仍然偏少,因此本文着眼于选择在数字科技档案馆建
设中扮演着基础地位的电子文件长期保存技术进行研究。
作为数字科技档案馆建设关键技术,电子文件长期保存技术是一项系统工程,
主要包括数字科技档案馆总体框架研究、信息打包研究和数据后台存储研究。本
文主要工作如下:
一、通过采纳国际上主流的开放档案信息系统 OAIS( Open Archival
Information System)框架,结合数字档案馆建设实际情况,对数字科技档案馆进行
基于 OAIS 的总体框架研究,包括:数字科技档案馆总体框架设计和数字科技档
案馆元数据规范设计。
二、通过采用符合 OAIS 要求的 XFDU 信息打包标准,对 OAIS 总体框架研
究中产生的提交信息包 SIP、档案信息包 AIP 和分发信息包 DIP 进行研究。
三、结合 Oracle XML DB 数据库技术对元数据规范 SchemaXFDU Schema
和提交信息包 SIP档案信息包 AIP分发信息包 DIP XML 文件的存储进行研
究。
本文结构如下:
第一章绪论,介绍本文研究背景、课题来源与主要研究内容。
第二章开放档案信息系统 OAIS,阐明了 OAIS 框架及其功能模型。
第三章 XFDU 打包标准,介绍了基于 OAIS XFDU 打包标准。
第四章 Oracle XML DB 技术,说明了 XML 数据库的优势,并详细描述了
Oracle XML DB 数据库技术以及其两大组成部分,即 XMLType Repository
第五章数字科技档案馆建设整体介绍,对该专项课题进行系统说明。
第六章基于 OAIS 的总体框架研究,包括数字科技档案馆总体框架设计和数
字科技档案馆元数据规范设计。
第七章基于 XFDU 的信息打包研究,包括 XFDU Schema、提交信息包 SIP
档案信息包 AIP 和分发信息包 DIP 的实现。
第八章基于 Oracle XML DB 的存储研究,包括批注 XML Schema注册 XML
Schema、存储和查找 XML 文件等。
第九章结束语,总结本文工作并展望未来应用前景。
数字科技档案馆建设关键技术研究
4
第二章 开放档案信息系统 OAIS
随着电子政务信息化的不断发展,数字信息总量迅速增长,并成为日益重要
的资源。因此,如何保证电子文件的长期保存和获取就成为亟需解决的问题。经
验表明,电子文件的长期保存是一项庞大的系统工程,不仅需要技术层面的支持,
更加需要一种全面、系统的框架模型加以规划。
OAIS 系统发布以来,在国际信息领域得到了广泛认同和参考应用,同时也
引起国内有关领域的关注和研究[5]。国际上,从图书情报、文件档案管理到计算
机与信息系统领域都OAIS 参考模型进行了研究,包括模型的解析、运用和系
统功能的具体实现等。CCSDS ISO 的推动下,OAIS 参考模型成为了数字档
案系统普遍遵从的标准规范,来自图书馆、档案馆、科学数据、文化传承等领域
的相关项目和系统都纷纷以其为准,进行系统的规划和设[6]。因此出现了很多
在其领域具有一定示范作用的基于 OAIS 参考的长期保存项目,如美国的电子文
件档案馆(ERA)等。
§2.1OAIS 简介
OAIS 是由美国国家航空和航天局的空间数据系统咨询委员会(Consultative
Committee for Space Data System,CCSDS开发,目的在于提供对数字资源长期保
存和存取规定的概念和参考模型。OAIS 是一个存档机构,由工作人员和系统组
成的,负责为目标团体提供信息的长期保存和利用。OAIS Oopen意味着该
标准是经过公开讨论决定的,而非对资源的访问不受限制[7]
OAIS 参考模型中,提供了一个完整的档案信息保存功能,它包括信息摄
入、档案存储 Archival Storage、数据管理(Data Management、访问和分发。它
同时论述了数字信息从一种媒体或格式到另一媒体或格式的移植、信息表示的数
据模型、信息保存中软件的作用、档案系统之间数字信息的交换等。它还确立了
各个存档功能内部和外部的接口,以及一系列在这些接口之上的高层服务。该模
型提供了多种演示例子以及推荐做法,并为 OAIS 存档组织提供了一组最小责任
集合。
需要注意的是,OAIS 参考模型是对与数字档案系统相关的环境、功能模
以及信息对象的概念化。但是这个参考模型并不能用来建立实际系统,主要是因
第二章 开放档案信息系统 OAIS
5
为,参考模型中并没有提及系统的体系结构、存储或处理过程、数据库设计、处
理平台、以及任何与建立一个档案系统机能相关的技术细节。但是,这个参考模
型是实际系统建立的一个起点,也就是说,不同形式结合起来刻画了实际系统所
必须的高层任务、服务以及信息需求[7],[8],
§2.2OAIS 环境模型
OAIS 认为,一个 OAIS 是一个置身于生产者、消费者和系统管理
(Administration)之间的一个存档体系[8],如图 2-1 所示。
2-1 OAIS 环境模型
围绕 OAIS 进行档案存储 Archival Storage管理和利用的角色分别有生产者、
系统管理(Administration)和消费者。其中:
(1)生产者(Producer)是提供需要保存信息的人或者是客户系统。生产者通过
OAIS 的摄取过程(Ingest)向 OAIS 提交要保存的信息,包括元数据。这个过
接受提交的数据并准备到档案系统中存储。生产者与 OAIS 的相互作用通常被描
述为提交协议,具体包括:提交的信息类型、期望生产者能提供的元数据以及从
生产者到存档的实际传送管理[7],[8],[9]
(2)系统(Administration)由设置 OAIS 整体政策的人组成。这一角色确立
档案收集的范围,明确档案条目的保存许可,指明资金来源以及监管使用的情况,
定期评论 OAIS 的政策和运作。
(3)OAIS 的消费者(Consumer)指的是与 OAIS 服务交互以获取特定保存信息的
人或系统。在 OAIS 消费者中,包括了被称为特定群体的特殊消费者。
系统管(Administration)生产(Producer)、消(Consumer)以及特定群
体在 OAIS 中更多的代表了功能性,而不是单纯的组织角色[7],[10]。所有这些角色
可以被包含在单一的组织架构内,也可以分布在多个不同的组织中。
摘要:

摘要随着国家信息化的不断深入,电子资源在政府日常办公中占据着越来越重要的地位,档案馆作为电子政务资源的最终接收和保存机构,其建设情况显得益发重要。数字档案馆可以为全方位、多角度、无时滞地利用综合性信息资源提供数据基础,为政府高效率、高质量决策提供保障,有利于政府信息的社会共享,实现政府信息资源的全面增值。数字档案馆在西方发达国家得到了高度重视并已经取得了一定成果,如美国的电子文件馆ERA工程,澳大利亚的NAA计划,英国的E-Government建设。数字档案馆建设核心技术主要包括电子文件长期保存、电子文件资源共享、电子文件综合利用和电子文件信息安全和容灾备份技术。目前国内数字档案馆建设主要集中...

展开>> 收起<<
数字科技档案馆建设关键技术研究.pdf

共94页,预览10页

还剩页未读, 继续阅读

作者:高德中 分类:高等教育资料 价格:15积分 属性:94 页 大小:6.51MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 94
客服
关注