浅谈图书馆数字资源的采集与整合

来源 :源流·教育版 | 被引量 : 0次 | 上传用户:fdgerg454h4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】数字出版和网络出版方兴未艾,在数字图书馆建设已开始走向服务得今天,无论是商业型数字资源还是开放存取型数字资源都呈现了海量增长的趋势。本文就图书馆如何能够在海量的数字资源中进行采集与整合浅谈了一些看法。
  【关键词】采集原则
  采集模式采集系统整合模式
  数字资源是海量的,理论上一个图书馆可以收集所有的数字资源,但图书馆应该根据自己的任务和服务对象等因素,制定适合自身的数字资源发展政策,确立采集原则、采集模式、采集系统。
  一、采集
  1、资源的采集原则
  (1)对性原则。根据图书馆的性质、任务和特点,针对不同的专题,确定信息的采集方针、明确采集的类型、范围和采集的深度。
  (2)统性原则。在网络环境下,应注意掌握和发挥印刷型文献、电子文献和网络信息资源的特点和优势互补、协调发展,从而形成连续系统、完整的数字资源系统,为学术研究人员提供系统、便捷的服务。
  (3)靠性与权威性原则。网络信息资源杂乱无序,资源的来源渠道也很复杂,为了避免不可靠的和重复的信息,应从提供者的信誉、机构的性质与规模等方面来考虑,选择权威性和可信度高的网站。
  (4)准化原则。在网络环境下,各用户或机构已不再是独立体,而是整个信息网络中的一个节点,各个节点间的信息资源共享实现建立在信息资源建设的统一的标准和规范的基础上。
  (5)术性原则。数字资源种类繁多,实现途径多样化,其主要目的是为了进行学术方面的信息传播与交流,实现学术信息资源共享,因此,在数字资源的选取和利用上,应确定数字资源所属的学科范围,通过质量控制选取有学术价值、有深度、反映学科前沿发展水平的科学学术资源,同时应通过同行评审机制确保信息资源质量和学术价值。
  (6)益原则。资源的保存最后是为了开发利用,使信息资源建设发挥出最大的使用效益,数字资源模式应根据用户的不同需求对资源进行分类和补充,通过开发相关的技术,最大限度的提高资源的使用效益。
  2、數字资源的采集模式
  数字资源机构库的资源既包括一次文献的(对象数据)也包括与之对应的二次文献(元数据),图书馆对数字资源的收集将更多的集中在元数据的收集。由于数字资源信息单元多元化的特征,图书馆对信息进行评估和选择将成为图书馆员的工作。图书馆代理用户选择行为将在“库”的层级上展开,采集数字资源信息时应重视收集行的效率和收集范围的全面。采集模式至少包括3种。
  (1)在国家层面进行集中的元数据采集,构建国家级数字资源的元数据总库,然后主题型或其他类型的服务提供者从国家元数据总库采集元数据或进行联机跨库检索。这种模式比较符合我国国情和数字资源的具体要求。技术上也比较容易实现。建立一个国家级数字资源元数据总库,将保障元数据最大限度的一致性,减少重复性工作。
  (2)主题型服务提供者执行基于学科的元数据采集任务,然后作为内容提供者为国家数字资源元数据总库进行采集。
  (3)按照资源类型(比如期刊论文,预印本,学位论文和技术报告等)由专门的代理机构进行元数据采集,然后作为内容提供者为国家元数据总库采集数据。目前我国主题型服务提供者和专门资源类型的机构还不存在,因此我国有必要建立一套开放存取资源元数据的国家级的集中的自动化采集机制和系统。并在元数据集成的基础上实现元数据的二次采集。
  3、采集系统
  目前信息资源的采集系统有手工和自动两种方法,手工采集即手工选择几百个网址和选定一个存储得频率;自动采集是使用机械手爬虫程序来管理网络文献,它定期运行一种爬行程序,把“爬”过的信息资源的每一页都抓到服务器上,并且自动管理。数字资源的采集最好采用自动爬行和手工采集相结合的方式。采用自动内容爬行的方法能尽可能迅速收集到网络上巨大规模的信息资源,对于那些不能用自动方法得到的深层次网络并且具有极高价值的开放存取信息资源内容,应采取手工采集管理方式作为补充。
  二、整合
  1、图书馆数字资源整合势在必行
  (1)从数字资源内容上看,存在以下问题:一是内容交叉、重复。不同数字资源系统之间存在内容交叉、重复的信息,影响用户对信息的选择与获取。二是存在冗余信息、多数数据库资源收录原则是“全”使得大量使用价值不高的信息进入资源系统,干扰用户对信息的获取。三是知识关联程度低。人类知识是一个紧密联系的有机整体,而现有数据库资源系统内的的数据对象大都是孤立存在的,无法体现学科知识的内在联系。四是不宜获取全文。目前数字资源系统大多为题录型数据库,二次数字资源和一次数字资源间缺少链接关系。用户难以获取全文。
  (2)从技术角度看,不同的数字资源系统有着不同的编码结构和表达方式,格式的不同导致描述和组织标准的差异,导致检索途径和方法的不同,不同数据库使用不同的检索软件,使得数据库网检索界面也风格各异,迥然不同,具有差异性和复杂性。
  综上,从某种意义上讲,数字资源数量越大,给用户造成的负担也就越重,在这种情况下,如果不对数字资源进行合理有效的整合,必然会使用户陷于不得门径而入的困惑境地,影响着数字资源的有效利用。
  2、图书馆数字资源的整合模式
  数字资源的整合应包括数字资源系统建设、数字资源关联、跨库跨平台检索、保障技术提升四个层面的内容。其中建设是基础,关联、跨库检索是整合的主体内容,保障技术提升是完善。下面谈一下关于数字资源的整合模式。
  (1)以书目管理系统OPAC为平台,以书目数据库为基础整合其他数字资源。这种模式是将各类数字资源的元数据信息导入OPAC书目库,对象数据(如文献的正文、图像、音频、视频等)合理规划,或是用其它数字资源建设系统平台生成各种类型的对象数据库。OPAC在图书馆数据库中发展时间长,MARK格式相当成熟,规范性好,数据库质量高,因此这种模式在理论上有一定的优势。但这种模式基于书目信息管理系统。对其它信息特别是多媒体信息描述还不尽如意,对大量信息的管理困难,发布不灵活,原有系统的内部结构体系及实现技术又局限了它升级……这些因素决定它并不合适用来对多媒体等大容量信息进行建库。(2)以先进的数字资源建设系统为平台实现多库无缝检索及库间数据关联。目前,许多图书馆引进了数字资源加工系统进行特色数字资源建设,这类系统平台最好的是国家图书馆(中数图)数字资源采集、加工、管理、检索、整合系列系统。这类系统是面向对象数据。在处理信息的种类及容量方面较OPAC有很大的优越性,另外这类系统的检索功能更强大,更灵活,能实现全文检索、二次检索、关联检索等,建库灵活多样,能个性发布。它功能齐全、处理信息种类多,能很好的实现无缝跨库检索和库间数据关系。
  (3)以联合检索技术实现跨库跨平台检索。这种模式对图书馆整合工作人员要求低,购置的数字资源与自建的数字资源相对独立,互不联系。联合检索在技术上目前并不存在问题。但实际需要各系统商共同参与,密切配合,这是较难操作之处。
  (4)建立统一数据库以整合检索技术实现跨库跨平台检索。由于网络数字资源逐渐成为信息资源的主流,与传统文献相比,网络数字信息资源呈现出动态性,分布性,多元性,无序性的特点。充分利用网络数字资源并依赖对这些信息资源的准确、规范化的描述和组织,可以保证开放环境下对这些资源的准确识辨和选择,提高资源被利用程度。这种用来帮助标识。描述和定位网络电子资源的数据就是元数据。目前并没有执行统一的标准,元数据形式多样,一些描述很简单,一些则很复杂,很丰富。标准不一,数据兼容性差,整合困难,因此很有必要建立统一标准的元数据库实现整合检索,最大限度提高检索效率。笔者认为这种模式更适合图书馆数字资源整合的发展方向。
其他文献
2013年11月5日,由华硕电脑主办的“骑行天下 视不可挡——华硕AMD R9和R7系列显卡新品发布会”在北京举行。本次发布会上,华硕携手AMD公司共同发布并展示了旗下全新的R9和R7系列显卡。同时,华硕游戏显卡正式对旗下的产品系列进行更名,华硕显卡“骑士军团”将在此后登上显卡市场的舞台一展英姿。  在此之前,AMD刚刚发布了全新的显示核心架构,全新的架构配合TureAudio、Mantle两项强
期刊
【摘要】保持党的纯洁性,必须加强党风建设和反腐倡廉工作。强化党风建设和反腐倡廉工作,要紧紧围绕发展这个第一要务开展,  教育要常抓不懈,制度要不断完善,监督要形式多样,为企业做大、做强、做优提供保证。  【关键词】保持党的纯洁性党风建设反腐倡廉  历史的经验充分证明。党风建设和反腐倡廉工作是企业生存和发展的重要保证。只有加强党风建设和反腐倡廉工作,各级领导人员才能从党的利益、企业利益、员工的利益出
期刊
【摘要】德治是我国古代治国方略重要方面,也是儒家思想重要组成部分。可以说它是一种信仰,也可以说是一种约定的制度。本文简单的理顺了德治思想发展脉络以及存在的限度。   【关键词】德治仁政弱强制性  德治是人类社会用道德进行控制和评价社会成员行为的一种手段。它主要是通过榜样示范、道德礼仪、教化活动、制定乡规民约和宗族家法、社会舆论褒贬等等一些形式出现。“德”在西周的时候是一个将道德、政治、信仰、策略融
期刊
【摘要】本文为西方教育心理学中流行的教学理论——建构主义理论的综述及评价,在分析建构主义教学观的基础上,结合我国外语教学的特点,探讨了建构主义在高职英语教学中的应用,旨在更加有效地提高高职院校的英语教学质量。  【关键词】建构主义高职英语教学  当前,社会对外语人才的需求越来越广泛,对外语水平的要求越来越高,这就要求高职院校必须培养全方位、高素质的应用型外语人才。而随着时代的发展,当今高职教育也发
期刊
摘 要:本文探讨了组合预测方法对提高风险值预测表现的意义,给出了执行风险值组合预测的具体方法,同时对预测表现进行了实证分析。用历史模拟法和风险矩阵法作为两种单个预测方法,风险值组合预测的权重由分位数回归来估计。针对我国上证综合指数的实证分析表明合适的风险值组合预测能够显著地提高单个预测方法的预测表现。  关键词:风险管理;风险值;组合预测;分位数回归  中图分类号:F830.9 文献标识码:A 文
期刊
【摘要】学术研究就其纵向结构来看,包括确定研究的价值取向、研究过程和撰写研究成果三个步骤。对于一个从事学术研究的研究生来说,他从事研究的个人价值取向不外乎完成学位论文和投稿两方面;而就其研究过程来看,主要有书斋式研究过程和实证式研究过程两种;形式的相近、语言表达的模仿倾向、对同一研究的文献综述的大同小异,都是撰写研究成果时表现出来的共性。但在共性之外我们也窥见到了某些问题,即偏重国外理论的直接移植
期刊
【摘要】技工学校现有的教学模式面对社会需求存在诸多不适应和困惑,改革与探索新的教学方法是势在必行,一体化模块式教学无疑是技工学校教育教学改革的有效选择。  【关键词】教学管理一体化教学模式  一、引言  技校工艺与实习课教学一直由教务、实习分头安排,考核管理。随着学校教学改革的深入,特别是实习课由分散实习改为集中实习后,这种管理模式逐渐暴露出部门独立、多头指挥、工艺课教学和技能训练无法交叉使用的弊
期刊
【摘要】加强党内监督,保持党的纯洁性,要确定适合于现阶段要求的党内监督工作思路,监督方法必须要坚持创新和发展,重点要加大对“一把手”的监督力度,对权力运行行为实施全过程监督。  【关键词】加强党内监督保持党的纯洁性腐败监督管理  加强党内监督,是党组织对党员干部的严格要求和关心爱护,目的是使我们的干部不犯或少犯错误。这对于党要管党,从严治党,进一步发展党内民主,维护党的团结和统一,提高党的领导水平
期刊
山水园林式的梅县富力城拔地而起,规模宏大的锦绣国际家居博览中心即将开业,客家全围龙式的文体中心承载着客家文化,方正大气的外国语学校书声琅琅,梅县新城、槐岗新城、葵岗新城、雁洋新城和畲江新城“五城联动”拉开城市发展架构……近年来,梅县区突出产城联动,做好新区开发与旧城改造,大力建设公共服务设施,推进城区扩容提质,提升城市品位,取得了良好的效果。  梅县新城加速崛起  梅县新城是嘉应新区起步区的重要组
期刊
【摘要】高校作为培养高素质人才的摇篮,人力资源管理水平和开发能力作为高校发展水平的重要指标,在一定程度上影响高校的发展。本文重点从高校人力资源开发能力方面探讨影响高校改革发展的原因。  【关键词】高校人力资源  开发  高等教育人力资源管理是指运用科学的原理、原则和方法。根据人才成长规律和学校的任务,对学校各类各级人员进行规划与组织,对人际与人事关系进行指导、协调和控制教职工的聘任录用、调配交流、
期刊