论文部分内容阅读
【摘要】文章在回顾目前档案管理实践中存在问题的基础上,基于内容管理技术提出了一种能对档案目录、全文和图、文、声、像等多媒体档案进行统一管理的数字化档案管理系统,并对这种系统的架构及主要功能模块进行了介绍。
【关键词】内容管理 档案管理 管理系统
当二十世纪的尼葛洛庞帝(Nicholas Negroponte)在《数字化生存》一书中,向人们描述着数字时代对我们的生活方式、工作方式甚至思维方式带来的各种冲击时,人类文明已经真实地迈进了二十一世纪,数字化信息时代的大潮朝着我们扑面而来。随着企业信息化进程的不断加速,档案管理如何应对及适应数字化信息时代的需求,如何利用新的IT技术来提升企业档案管理的效率与水平是我们档案工作者需要思考的问题。
一、档案管理与数字化全息档案管理系统
企业档案管理是企业管理基础工作之一。所谓企业档案管理就是以丰富的档案资源为基础,以最大限度地开发和利用档案信息资源为目的,面向企业各部门,强化档案信息的各项服务功能和环境,建立规范化、制度化的档案管理体系,为企业节约成本、提高生产能力、为增强企业科技创新能力和现代化管理水平提供优质服务。
纵观档案管理的发展,其大致经历了三个发展阶段:第一阶段是卡片式手工档案管理方式;第二阶段是计算机辅助档案目录管理方式;第三阶段是档案目录计算机管理与部分档案实体的扫描件相结合管理方式。随着数字技术处理和内容管理技术的飞速发展,新一代的档案管理将是数字化全息档案管理的方式。目前的档案管理软件大多处于第二或第三阶段管理水平,即档案管理部门虽实现计算机辅助管理,但仍停留在目录级管理或目录加档案扫描件管理。这样的缺点是无法实现直接从网络上查询、调阅档案、查询效率低;同时,对档案信息的深加工和专题编研困难,利用水平较低。
所谓是数字化全息档案管理主要是以全文数据库、多媒体数据库和关系数据库为管理工具,以扫描的纸质档案图像、全文内容、采编与转换的音视频等多媒体资料和档案目录为管理对象,利用海量全文数据库技术、数据加密和压缩存储等技术,实现从档案数字化、档案接收、整理编目到档案利用及档案移交全过程的计算机管理,达到对档案目录、全文和图、文、声、像等多媒体档案统一管理。同时,档案可以发布到局域网、广域网、企业内部网、国际互联网,并可通过各种方便的查询手段迅速地检索出所需要的档案资料,最终实现“数字化档案馆”。
采用数字化全息档案管理系统进行档案管理同以往的管理方式相比具有以下优点:
第一,查询速度快:一次查询只需几秒钟。
第二,保存期限长:100年以上,保真性高,而一般纸介质只能保存10年左右。
第三,内容全面完整:不仅包含档案目录信息,也完整包含了具体的信息内容。
第四,真正实时在线:授权使用者可以有时从全球任何角落访问自己所需的档案资料。
二、内容管理的含义及其相关概念
随着社会的进步、经济的发展、信息技术的普及和提高,各行业的信息内容正在以迅猛地势头增加。这些信息并不仅限于存储在数据库或后台系统中的结构化数据,还有很多非结构数据。据统计,目前大约85%的企业信息是非结构化数据,包括纸张文件、报告、传真、视频、音频、图片等,称为内容。这些非结构化内容蕴涵了丰富的信息,是企业的“知识”的重要组成部分,在对这些内容的获取、组织、存储、安全、提取和再利用的技术手段等方面面临着挑战。近几年来,由此就出现了内容管理概念和相应的内容管理技术。
内容管理(Content Management,CM)是电子商务时代的新宠,是一个新兴的市场。对于内容管理,业界还没有一个统一的定义,不同的机构有不同的理解。例如Gartner Group认为内容管理从内涵上应该包括企业内部内容管理、Web内容管理、电子商务交易内容管理和企业外部网(Extranet)信息共享内容管理(如CRM和SCM等),其中电子商务和XML是推动内容管理发展的源动力。
非结构化大对象数据的存储和管理技术以及元数据与索引数据的同步是内容管理中数据整合所需要的关键技术。非结构化的内容管理包括对元数据的管理、数字对象的管理以及如何通过一个统一的库访问协议对元数据和数字对象进行一致性、完整性操作。例如在多媒体内容的范畴内,可以通过以下公式来更好地理解:
一个媒体对象=不可区分的媒体对象
媒体对象+元数据=内容
内容+权限=媒体资产
一个媒体对象(经过数字化处理后就成为数字对象)是一个不可区分的对象,例如一篇文章,需要给它加上自己独特的属性信息,如文章的标题、关键词、时间以及作者等等,这些独特的属性信息称为元数据。结合了元数据的媒体对象就叫做内容,而对于内容,如果可以被再利用、再增值,就需要将内容成为媒体资产。如果要将内容变为媒体资产,需要加入权限管理,加入了权限管理后,对内容的利用就可以因人而易,使得内容信息可以被再利用,生成资产价值。
内容管理涵盖了内容的创建、存储、发布、交付等过程,突出内容与形式分离,对应工作人员的分工。负责形式的人员如:设计师通过内容管理系统提供的设计界面对内容的最终表现形式进行设计,通常体现为内容管理系统中的模板制作。而内容的创建人员则专注于内容本身,无需关心内容的形式。在内容管理系统内部,系统通过模板与数据的结合,从而自动完成了内容与形式的结合,将结合的结果发布出来,并交付给内容的消费者。典型的内容管理系统一般提供以下一些功能:
第一,内容创建功能。一般提供友好的界面或工具允许非专业的人员能很轻易地将内容输入到系统中。针对具体的需求,如Web内容管理,则一般能实现图片、视频、动画等与文字的结合。
第二,内容存储功能。使用文件系统或数据库将内容格式化成可以处理的格式。高端的产品甚至支持数据模式的设计,可以根据需求自行定义内容的属性。内容存储一般提供归档功能。
第三,审核支持。或简单或复杂地实现内容审核的工作流,高端产品支持自定义工作流程。
第四,模板制作功能。部分产品提供模板制作工具,有些产品定义了一些自己的脚本或标记,对HTML进行了扩展。
第五,内容部署功能。一般提供一些工具或服务,可以将制作好的内容部署到最终的应用环境如Web服务器上。
内容管理不是某种单独的创新技术,而是许多先进技术的综合应用,它涵盖企业内联网(Intranets)、因特网(Internet)和企业外联网(Extranets)应用,大大突破了传统信息流管理软件、办公自动化软件以及文档管理软件的应用范围、使用效果和商业价值。内容管理重点解决各种非结构化或半结构化的数字资源的采集、管理、利用、传递和增值,并能有机集成到结构化数据的商业智能(BI)环境中,如ERP、CRM等。内容管理的终极目标是实现内容价值链的最优化。
三、基于内容管理的企业数字化档案系统设计
基于内容管理技术,我们根据当前档案管理实践中新的需求提出了一种基于内容管理的企业数字化档案管理系统架构,如图1所示。该系统以建立档案全息数据库为核心,通过运用各种内容管理技术,在功能上涵盖档案管理的全过程:档案数字化及生产管理、档案整理编目(立卷和归档)、档案内容管理、档案辅助实体管理(征集、接收、移交)、档案利用(借阅与查询)、档案交换、系统管理、档案安全管理等所有环节。
1、档案数字化管理

档案数字化系统模块采用高速扫描、OCR识别和辅助标引三项技术,可以将数以万计的纸介质的发文、批示等快速、自动地转换成数字化文本、影像,并实现海量信息高速检索、查询。档案数字化加工工作应具备对档案数字化工作过程中的扫描、模数转换、修改、文字识别、正文录入、校对、著录、审核等处理环节的管理功能。档案数字化及生产管理系统包括纸质档案数字化、多媒体(照片、录音、录像)档案数字化和数字化生产管理功能,如图2所示。

2、档案整理编目
档案整理编目系统作为档案文献资源的整理、编辑与标引的有效工具,应具备数据采集、类目设置、分类排序、数据校检、目录生成、数据统计、打印输出等基本功能,并能根据主题词(或关键词)及分类号自动标引的功能。档案整理编目系统将数字化部门生产出来或外部接收来的档案件进行必要的编辑、关联、位置调整后,组卷归档、审核并转存到档案数据库中。
3、档案内容管理
档案内容管理系统是整个系统的关键。作为海量档案信息资源的管理平台,内容管理系统主要实现对经过整理编目的各类档案信息内容进行统一的管理与维护;对档案内容的密级进行控制,对档案内容及索引进行加密处理;实现对系统操作用户与档案借阅查询用户进行权限控制,并提供统一的身份验证机制。在进行档案库建设时,依照内容管理的观点,针对大对象数据的访问、修改和管理等不同特点,将把生产过程中的元数据和文字稿件存储在Oracle数据库中,将图片等二进制大对象存储在内容管理平台中,通过元数据与对象数据同步机制自动建立元数据和内容管理对象的对应关系。通过内容管理机制保证对大对象数据操作的完整性和一致性,应用内容管理体系结构的优势实现大对象数据的高效访问。关系型数据库管理系统擅长结构化数据的处理,由RDBMS服务器管理业务数据,可以保证数据的完整性和一致性。全文检索系统擅长于非结构化全文数据的处理——全文检索,由全文搜索引擎管理非结构化全文数据的全文索引,并提供全文检索服务。通过将全文检索系统和关系数据库的集成,使用户在完全保持已有业务应用和业务数据的前提下,可以对海量的结构化和非结构化数据进行高效、安全、可靠的发布和增值利用。
4、档案利用
档案利用系统主要包含档案信息内容的检索查询、档案的借阅管理、档案的辅助实体管理功能等。检索查询应具备对档案信息数据进行多种途径、全方位的检索查询功能;档案借阅管理包括对档案利用者及利用的目的、时间、内容、效果等信息的记录、分析、统计以及档案催退、续借、退还等功能;辅助实体管理包括对档案征集、接收、移交以及档案鉴定、密级变更等进行相应的管理。同时还为用户提供网上档案快速借阅、查询和专项打印等服务与专题编研等档案利用。
5、档案交换
档案信息交换与接口系统充分考虑数字化档案综合应用平台的实际需要,主要考虑从以下三个方面满足档案信息交换的需要:(1)通过与原有系统的接口,系统支持将原来档案管理系统中的数据迁移并整合到新系统中来;(2)通过与公文管理系统的接口,系统为公文管理系统提供在线或脱机归档的接口,实现办公厅公文管理系统归档的信息;(3)系统通过XML数据交换标准,方便与其他相关系统进行数据交换,以满足系统扩充和将来发展的需要。
四、结束语
本文提出的基于内容管理技术的企业档案关系系统,主要以全文数据库、多媒体数据库和关系数据库等为管理工具,以扫描的纸质档案图像、全文内容、采编与转换的音视频等多媒体资料和档案目录为管理对象,利用内容管理领域的全文数据库技术、数据加密和压缩存储等技术,实现从档案数字化、档案接收、整理编目到档案利用及档案移交全过程的计算机管理。达到对档案目录、全文和图、文、声、像等多媒体档案统一管理,从而有效地提升了企业档案管理的水平。
【参考文献】
[1]庞涉芝:浅谈现代企业管理与企业档案管理[J],黑龙江科技信息,2002(1).
[2]孙广芝:企业内容管理理论与应用评述[J],情报杂志,2005(12).
[3]韩啸、曹辉:内容管理的关键技术[J],中国传媒科技,2004(1).
【关键词】内容管理 档案管理 管理系统
当二十世纪的尼葛洛庞帝(Nicholas Negroponte)在《数字化生存》一书中,向人们描述着数字时代对我们的生活方式、工作方式甚至思维方式带来的各种冲击时,人类文明已经真实地迈进了二十一世纪,数字化信息时代的大潮朝着我们扑面而来。随着企业信息化进程的不断加速,档案管理如何应对及适应数字化信息时代的需求,如何利用新的IT技术来提升企业档案管理的效率与水平是我们档案工作者需要思考的问题。
一、档案管理与数字化全息档案管理系统
企业档案管理是企业管理基础工作之一。所谓企业档案管理就是以丰富的档案资源为基础,以最大限度地开发和利用档案信息资源为目的,面向企业各部门,强化档案信息的各项服务功能和环境,建立规范化、制度化的档案管理体系,为企业节约成本、提高生产能力、为增强企业科技创新能力和现代化管理水平提供优质服务。
纵观档案管理的发展,其大致经历了三个发展阶段:第一阶段是卡片式手工档案管理方式;第二阶段是计算机辅助档案目录管理方式;第三阶段是档案目录计算机管理与部分档案实体的扫描件相结合管理方式。随着数字技术处理和内容管理技术的飞速发展,新一代的档案管理将是数字化全息档案管理的方式。目前的档案管理软件大多处于第二或第三阶段管理水平,即档案管理部门虽实现计算机辅助管理,但仍停留在目录级管理或目录加档案扫描件管理。这样的缺点是无法实现直接从网络上查询、调阅档案、查询效率低;同时,对档案信息的深加工和专题编研困难,利用水平较低。
所谓是数字化全息档案管理主要是以全文数据库、多媒体数据库和关系数据库为管理工具,以扫描的纸质档案图像、全文内容、采编与转换的音视频等多媒体资料和档案目录为管理对象,利用海量全文数据库技术、数据加密和压缩存储等技术,实现从档案数字化、档案接收、整理编目到档案利用及档案移交全过程的计算机管理,达到对档案目录、全文和图、文、声、像等多媒体档案统一管理。同时,档案可以发布到局域网、广域网、企业内部网、国际互联网,并可通过各种方便的查询手段迅速地检索出所需要的档案资料,最终实现“数字化档案馆”。
采用数字化全息档案管理系统进行档案管理同以往的管理方式相比具有以下优点:
第一,查询速度快:一次查询只需几秒钟。
第二,保存期限长:100年以上,保真性高,而一般纸介质只能保存10年左右。
第三,内容全面完整:不仅包含档案目录信息,也完整包含了具体的信息内容。
第四,真正实时在线:授权使用者可以有时从全球任何角落访问自己所需的档案资料。
二、内容管理的含义及其相关概念
随着社会的进步、经济的发展、信息技术的普及和提高,各行业的信息内容正在以迅猛地势头增加。这些信息并不仅限于存储在数据库或后台系统中的结构化数据,还有很多非结构数据。据统计,目前大约85%的企业信息是非结构化数据,包括纸张文件、报告、传真、视频、音频、图片等,称为内容。这些非结构化内容蕴涵了丰富的信息,是企业的“知识”的重要组成部分,在对这些内容的获取、组织、存储、安全、提取和再利用的技术手段等方面面临着挑战。近几年来,由此就出现了内容管理概念和相应的内容管理技术。
内容管理(Content Management,CM)是电子商务时代的新宠,是一个新兴的市场。对于内容管理,业界还没有一个统一的定义,不同的机构有不同的理解。例如Gartner Group认为内容管理从内涵上应该包括企业内部内容管理、Web内容管理、电子商务交易内容管理和企业外部网(Extranet)信息共享内容管理(如CRM和SCM等),其中电子商务和XML是推动内容管理发展的源动力。
非结构化大对象数据的存储和管理技术以及元数据与索引数据的同步是内容管理中数据整合所需要的关键技术。非结构化的内容管理包括对元数据的管理、数字对象的管理以及如何通过一个统一的库访问协议对元数据和数字对象进行一致性、完整性操作。例如在多媒体内容的范畴内,可以通过以下公式来更好地理解:
一个媒体对象=不可区分的媒体对象
媒体对象+元数据=内容
内容+权限=媒体资产
一个媒体对象(经过数字化处理后就成为数字对象)是一个不可区分的对象,例如一篇文章,需要给它加上自己独特的属性信息,如文章的标题、关键词、时间以及作者等等,这些独特的属性信息称为元数据。结合了元数据的媒体对象就叫做内容,而对于内容,如果可以被再利用、再增值,就需要将内容成为媒体资产。如果要将内容变为媒体资产,需要加入权限管理,加入了权限管理后,对内容的利用就可以因人而易,使得内容信息可以被再利用,生成资产价值。
内容管理涵盖了内容的创建、存储、发布、交付等过程,突出内容与形式分离,对应工作人员的分工。负责形式的人员如:设计师通过内容管理系统提供的设计界面对内容的最终表现形式进行设计,通常体现为内容管理系统中的模板制作。而内容的创建人员则专注于内容本身,无需关心内容的形式。在内容管理系统内部,系统通过模板与数据的结合,从而自动完成了内容与形式的结合,将结合的结果发布出来,并交付给内容的消费者。典型的内容管理系统一般提供以下一些功能:
第一,内容创建功能。一般提供友好的界面或工具允许非专业的人员能很轻易地将内容输入到系统中。针对具体的需求,如Web内容管理,则一般能实现图片、视频、动画等与文字的结合。
第二,内容存储功能。使用文件系统或数据库将内容格式化成可以处理的格式。高端的产品甚至支持数据模式的设计,可以根据需求自行定义内容的属性。内容存储一般提供归档功能。
第三,审核支持。或简单或复杂地实现内容审核的工作流,高端产品支持自定义工作流程。
第四,模板制作功能。部分产品提供模板制作工具,有些产品定义了一些自己的脚本或标记,对HTML进行了扩展。
第五,内容部署功能。一般提供一些工具或服务,可以将制作好的内容部署到最终的应用环境如Web服务器上。
内容管理不是某种单独的创新技术,而是许多先进技术的综合应用,它涵盖企业内联网(Intranets)、因特网(Internet)和企业外联网(Extranets)应用,大大突破了传统信息流管理软件、办公自动化软件以及文档管理软件的应用范围、使用效果和商业价值。内容管理重点解决各种非结构化或半结构化的数字资源的采集、管理、利用、传递和增值,并能有机集成到结构化数据的商业智能(BI)环境中,如ERP、CRM等。内容管理的终极目标是实现内容价值链的最优化。
三、基于内容管理的企业数字化档案系统设计
基于内容管理技术,我们根据当前档案管理实践中新的需求提出了一种基于内容管理的企业数字化档案管理系统架构,如图1所示。该系统以建立档案全息数据库为核心,通过运用各种内容管理技术,在功能上涵盖档案管理的全过程:档案数字化及生产管理、档案整理编目(立卷和归档)、档案内容管理、档案辅助实体管理(征集、接收、移交)、档案利用(借阅与查询)、档案交换、系统管理、档案安全管理等所有环节。
1、档案数字化管理

档案数字化系统模块采用高速扫描、OCR识别和辅助标引三项技术,可以将数以万计的纸介质的发文、批示等快速、自动地转换成数字化文本、影像,并实现海量信息高速检索、查询。档案数字化加工工作应具备对档案数字化工作过程中的扫描、模数转换、修改、文字识别、正文录入、校对、著录、审核等处理环节的管理功能。档案数字化及生产管理系统包括纸质档案数字化、多媒体(照片、录音、录像)档案数字化和数字化生产管理功能,如图2所示。

2、档案整理编目
档案整理编目系统作为档案文献资源的整理、编辑与标引的有效工具,应具备数据采集、类目设置、分类排序、数据校检、目录生成、数据统计、打印输出等基本功能,并能根据主题词(或关键词)及分类号自动标引的功能。档案整理编目系统将数字化部门生产出来或外部接收来的档案件进行必要的编辑、关联、位置调整后,组卷归档、审核并转存到档案数据库中。
3、档案内容管理
档案内容管理系统是整个系统的关键。作为海量档案信息资源的管理平台,内容管理系统主要实现对经过整理编目的各类档案信息内容进行统一的管理与维护;对档案内容的密级进行控制,对档案内容及索引进行加密处理;实现对系统操作用户与档案借阅查询用户进行权限控制,并提供统一的身份验证机制。在进行档案库建设时,依照内容管理的观点,针对大对象数据的访问、修改和管理等不同特点,将把生产过程中的元数据和文字稿件存储在Oracle数据库中,将图片等二进制大对象存储在内容管理平台中,通过元数据与对象数据同步机制自动建立元数据和内容管理对象的对应关系。通过内容管理机制保证对大对象数据操作的完整性和一致性,应用内容管理体系结构的优势实现大对象数据的高效访问。关系型数据库管理系统擅长结构化数据的处理,由RDBMS服务器管理业务数据,可以保证数据的完整性和一致性。全文检索系统擅长于非结构化全文数据的处理——全文检索,由全文搜索引擎管理非结构化全文数据的全文索引,并提供全文检索服务。通过将全文检索系统和关系数据库的集成,使用户在完全保持已有业务应用和业务数据的前提下,可以对海量的结构化和非结构化数据进行高效、安全、可靠的发布和增值利用。
4、档案利用
档案利用系统主要包含档案信息内容的检索查询、档案的借阅管理、档案的辅助实体管理功能等。检索查询应具备对档案信息数据进行多种途径、全方位的检索查询功能;档案借阅管理包括对档案利用者及利用的目的、时间、内容、效果等信息的记录、分析、统计以及档案催退、续借、退还等功能;辅助实体管理包括对档案征集、接收、移交以及档案鉴定、密级变更等进行相应的管理。同时还为用户提供网上档案快速借阅、查询和专项打印等服务与专题编研等档案利用。
5、档案交换
档案信息交换与接口系统充分考虑数字化档案综合应用平台的实际需要,主要考虑从以下三个方面满足档案信息交换的需要:(1)通过与原有系统的接口,系统支持将原来档案管理系统中的数据迁移并整合到新系统中来;(2)通过与公文管理系统的接口,系统为公文管理系统提供在线或脱机归档的接口,实现办公厅公文管理系统归档的信息;(3)系统通过XML数据交换标准,方便与其他相关系统进行数据交换,以满足系统扩充和将来发展的需要。
四、结束语
本文提出的基于内容管理技术的企业档案关系系统,主要以全文数据库、多媒体数据库和关系数据库等为管理工具,以扫描的纸质档案图像、全文内容、采编与转换的音视频等多媒体资料和档案目录为管理对象,利用内容管理领域的全文数据库技术、数据加密和压缩存储等技术,实现从档案数字化、档案接收、整理编目到档案利用及档案移交全过程的计算机管理。达到对档案目录、全文和图、文、声、像等多媒体档案统一管理,从而有效地提升了企业档案管理的水平。
【参考文献】
[1]庞涉芝:浅谈现代企业管理与企业档案管理[J],黑龙江科技信息,2002(1).
[2]孙广芝:企业内容管理理论与应用评述[J],情报杂志,2005(12).
[3]韩啸、曹辉:内容管理的关键技术[J],中国传媒科技,2004(1).