我国数据库资源重复建设的现状及其治理措施

来源 :教育前沿·理论版 | 被引量 : 0次 | 上传用户:vforvivid
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:我国文献数据库发展迅速,但重复建设情况较为严重。笔者在对几个代表性期刊和图书全文数据库进行调查的基础上,分析了我国数据库重复建设的情况和造成的不良后果,并提出了解决数据库资源重复建设的对策。
  关键词:文献数据库 重复建设
  中图分类号:G250文献标识码:A 文章编号: 1673-1875(2008)11-053-03
  
  一、前言
  
  自20世纪70年代以来,我国数据库建设已有了30多年的历史,并取得了显著的成绩。据2001年2月中国互联网信息中心的调查,我国在线数据库已达45598个。经过几年的发展,据最新的《2005年中国互联网络信息资源数量调查报告》显示,我国在线数据库已达29.54万个。很显然,与建设之初相比,我国的数据库建设已有了长足的进步,但与发达国家数据库建设相比,我国数据库建设还存在着许多问题,比如数据库资源的重复建设问题。这一问题在经过数据库建设的高速发展后,在应用领域里逐渐显现出来,成为一个较为突出的问题。它的存在很大程度上了阻碍了数据库资源的健康发展。因此对数据库资源重复建设问题加以研究显得非常必要,并具有较大的现实意义。
  据有关专家学者研究显示和笔者使用体验发现,在我国最具代表性的几家数据库开发商的数据库中大量存在资源重复建设现象。以下仅以国内几家代表性期刊全文数据库和电子书全文数据库为例对数据库资源重复建设现状加以探讨。
  数据库,简单地说就是数据的集合,它是通过一定的信息组织方式组织起来的有序化的数字化信息资源系统,它是计算机信息检索系统的信息源和核心。
  根据不用的角度,人们可以将数据库分为多种类型。其中根据数据库所含信息内容作为基本的分类标准,可以将数据库分为源数据库和文献数据库两大类。而文献数据库又可以分为书目数据库和全文数据库。全文数据库是存储文献全文或其中主要部分的数据库,简称全文库。它能使用户获得最终的一次文献,因此在当前数据库产业发展中,全文数据库的建设占有非常重要的比重。
  数据库资源建设有两层涵义,一是指数据库用户布局和配置适合本单位需要的数据库资源体系,主要是从数据库用户合理布局角度而言;二是指数据库开发商开发数据库资源,主要是从开发角度来看。笔者所要探讨的是国内数据库开发商在开发数据库资源过程中存在的重复问题。
  
  二、我国数据库资源重复建设现状
  
  目前,我国数据库资源数量众多,无法将全部数据库资源重复建设情况做一一统计。而三大期刊全文数据库和三大图书全文数据库是当前国内使用最为广泛,影响最大的数据库资源,它们具有较高的成熟度,是我国数据库资源建设的典型,在一定程度上能够反映我国数据库资源建设的总体情况。因此下面仅以它们的重复收录情况为例对我国数据库资源重复建设情况加以反映。
  《中国期刊全文数据库(CJFD)》是中国知识基础设施(China National Knowledge Infra-structure,简称CNKI)工程的重要组成部分。它由清华大学、清华同方光盘股份有限公司、中国学术期刊(光盘版)电子杂志社、光盘国家工程研究中心、清华同方股份有限公司和清华同方教育技术研究院共同主办,是我国第一个综合性中文期刊全文数据库,也是目前世界上最大的连续动态更新的中国期刊全文数据库。
  《中文科技期刊数据库(全文版)(VIP)》是我国又一个大型综合性中文期刊全文数据库,由科学技术部西南信息中心下属的大型专业化数据公司重庆维普资讯公司开发研制。它源于重庆维普资讯有限公司1989年创建的《中文科技期刊篇名数据库》,目前已成为我国最大的综合性文献数据库之一。
  《数字化期刊全文数据库(QIKAN)》是由北京万方数据股份有限公司自主研制开发的期刊全文数据库,是万方数据资源系统的重要组成部分。它基本包括了我国文献计量单位中自然科学类统计源期刊和社会科学类核心源期刊的全文资源,是了解Internet上中文期刊的重要窗口。
  


  (注:以上数据均来自三大数据库网站,截止日期为2006年10月12日)
  根据新闻出版署2006年最新公布的数字,我国现在公开出版的期刊共9000余种,其中学术性、知识性较强、编辑出版质量较好的期刊大体上在6000种左右。对照上表可以看出,三大期刊数据库显然在收录时间,收录范围,收录期刊,收录学科上不可避免的存在着明显的重复。
  为了说明三大期刊数据库资源的重复程度,笔者根据三大数据库收录期刊名录,就其中收录的图书情报和档案期刊做了进一步调查。
  


  (以上数据均来自三大数据库网站,数据经过笔者核实和简单筛选,数据截止日期为2006年10月12日)
  从表二可以看出万方数据库的收录期刊数量较少,但是它与CJFD和VIP数据库的重复率均达到了百分之八十以上,是三个数据库中重复现象最为严重的数据库。其次为CJFD,但它与VIP数据库的重复率仍高达约84.3%,重复率最低的是VIP。
  书生之家数字图书馆是北京书生公司开发的综合性数字图书馆,2000年5月正式开通。它以领先的书生全息数字化技术为核心信息资源平台,为图书情报机构和普通消费者提供数字图书馆服务。按中图法分为31个大类,目前约收录20万种图书,它以新书为主,但也做原有藏书的回溯。
  超星数字图书馆是北京超星信息技术发展有限责任公司于1998年研究开发的数字图书馆系统。它成功地开发了纸张图文资料数字化技术(PDG),是国内专业的数字图书馆技术和资源提供商。2000年,被列为国家863计划中国数字图书馆示范工程。它按中图法分为22个大类,累计收录图书40多万种,它以原有藏书的回溯为主,但也收录新书。
  Apabi数字图书馆是北大方正电子有限公司于2000年12月创建的数字图书馆系统,它以成熟的方正Apabi网络出版整体解决方案为基础,将数百家出版社的高质量的最新电子书提供给图书馆。它按中图法分为23个大类,累计收录图书3万余种,主要收录最新出版的图书。
  


   (以上数据均来自三大数据库网站,截止日期为2006年10月16日)
  从表三可以看出方正电子图书数据库由于起步晚,主要收录新近出版的图书,收录图书数量较少。超星数字图书馆收录全面,收录图书数量最多。三个数据库之间的重复率相差比较悬殊,最少的为2.32%,但最严重的达到了80%以上。总体来说,电子图书全文数据库重复收录情况比期刊数据库有所减少,但局部重复情况仍较为严重。
  
  三、数据库资源重复建设带来的问题
  
  数据库建设是一项复杂的系统工程,它不仅是单个数据库开发商的事情,还牵涉到数据库用户的使用,我国数据库产业发展等方方面面。数据库资源重复建设为用户使用带来了不便,影响了整个中文数据库产业的发展,为我国的经济发展,社会进步带来许多的问题。
  首先,它给数据库购买者和用户造成不便。
  数据库资源的低水平重复建设的直接表现就是数据库内容相当部分重复,但同时任何一个数据库都不能够全面覆盖所有信息资源。相同种类数据库产品,既重复,又不全面,使用户特别是集团用户如图书馆很难做出购买决策。如够买其中一种数据库,担心有些期刊和论文遗漏,造成科学研究,经济发展和决策等的失误。如同时购买,虽然能够使得数据库资源更加全面和丰富,但用户实际上却为相同的数据库资源花费了大量财力,使得原本紧张的资源购置经费更加捉襟见肘。而且,因为各种数据库各自使用不同的数据库软件,使用不同的格式标准,使得数据库检索平台很难统一,无法实现高效的跨库检索和利用,因此针对同一检索要求,用户需要学会多个数据库系统的使用,并做出多次检索和筛选工作,这大大加重了用户的负担,降低了资源利用效率,打击了用户使用数据库的积极性,从根本上削弱了数据库产业发展的动力。
  其次,数据库开发商浪费本企业资源,分散精力,影响拳头产品开发和数据库产品的全面发展。
  一个企业的发展资源是有限的。如果资源浪费,就会影响企业的发展速度和竞争力,严重的就会影响到生存。我国的数据库企业更是如此。数据库产品的开发,是一项长期的工作,它需要大量的人力,物力和财力。数据库资源的重复建设,对于各个数据库企业来说都是一种极大的浪费。如果能避免这种重复浪费,就能够把这些人力,物力和财力投入到现有数据库产品优化和更多新数据库产品建设上去。
  再次,从数据库产业来看,浪费国家资源,影响我国和全球中文数据库发展。
  个人,单位和企业资源都是国家资源的组成部分。这些资源的浪费就是国家资源的浪费。数据库资源的重复建设造成的浪费限制了数据库质量的提高和数据库产品的全面发展,影响我国数据库产业的发展,使我国在全球数据库产业发展中处于劣势。
  
  四、数据库资源重复建设对策
  
  1.政府要统一协调,合理布局,制订数据库产业长远发展策略
  政府应该建立统一的国家数据库管理机构,认真吸取国外数据库资源建设的先进经验与教训,在对现有的数据库资源进行摸底,整理和分析的基础上,对数据库产业发展做统一发展部署。对数据库产业的生产和服务进行统一合理的布局,打破不同系统,不同行业或部门之间各自为政,条块分割的局面,加强协调和配合,以避免重复浪费。在此基础上,制定数据库产业发展政策,引导数据库资源建设,认真做好数据库资源建设结构布局和质量的审批,验收和监督等工作,从而提高数据库资源建设水平,引导数据库资源建设的良性健康发展。
  2.数据库生产企业要加强行业自律,强化企业管理,走特色发展的道路
  数据库开发商要自觉服从数据库产业发展政策和国家数据库管理机构的管理,合理听取相关部门的意见。同时,可以建立数据库生产企业发展协会,加强行业之间的沟通和自律,做好数据库生产企业资源建设的协调和合作。此外,还应加强数据库资源建设的选题立项工作,避免重复选题,拓宽发展思路,不断开发出新的数据库资源,注重提高数据库资源质量,打造本企业的拳头产品,培养核心竞争力,避免利用重复的数据库资源来进行竞争。
  3.用户要加强资源共享,有针对性地选择数据库资源
  用户特别是集团用户,如图书馆及信息服务部门等同时购买几个重复率很高的数据库,这在一定程度上推动了数据库资源的重复建设。用户,特别是图书馆及信息服务部门要加强资源共建共享,避免重复购买,加强数据库资源购买试用和调研工作,挑选最适合自己的数据库资源,逐渐据弃那些耗资大,服务效益低的数据库资源,从而通过市场价值规律的作用来合理配置数据库发展资源,引导数据库资源建设的优化发展。
  4.尽快建立和完善数据库知识产权保护机构和相应法律法规,促进中文数据产业健康发展
  从中国大百科全书状告超星数字图书馆,到2001年著名刑法专家陈兴良教授状告中国数字图书馆、2004年中国社科院郑成思等七专家状告书生数字公司、2006年著名作家杜昌维又将方正数字图书馆告上了法庭,这一系列事件仅仅是少数的典型代表,它表明我国数据库产业发展中存在着严重的版权问题,这为我国数据库产业的发展壮大埋下巨大隐患,将严重阻碍数据库产业的健康发展。目前,我国数字出版业数字出版业主要提出了四种授权模式:版权集体管理机构模式、超星模式、授权要约模式和法定许可模式。根据国外的经验,目前各界较为认同的是集体管理出版模式和超星模式。虽然现有的模式并不能解决所有的问题,但尽快建立和完善相应数据库知识产权保护机构和法律法规以规范产业发展显得相当迫切。我国数据库产业发展中,一方面是数据库商没有取得版权授权,同时又存在着重复授权问题。没有取得版权授权,任何一个个数据库商都可以收录任何文献,这种混乱行为必然会造成重复建设问题。同时,作者或者版权方为了个体利益,将版权同时授予多家数据库商,这也势必引起重复收录问题。数据库重复建设就是这两大问题造成的直接后果。合理取得授权并限制重复授权是数据库产业健康发展的保证。
  
  参考文献:
  [1]李惠军.数据库建设和购置应注意重复问题[J].大学图书馆学报,1999(1):38-39.
  [2]陈小敦.我国图书馆数据库建设的现状、存在问题及其对策[J].图书馆论坛,2003(4):57-59.
  [3]史伟奇,何平.我国数据库建设存在的误区及对策[J].图书馆学刊,2001(5):44-45.
  [4]张列军.数据库建设和购置应注意重复问题[J].大学图书馆学报,1997(15):21.
  [5]张银犬.基于资源整合的网络中文数据库建设[J].现代情报, 2003(11):95-96.
  [6]郭文玲,马凤仙.从因特网的利用状况看我国的数据库建设[J].图书情报知识,1998(4):31-33.
  [7]韩宪荣,王晓玉.网络环境下数据库信息资源建设[J].情报学报,1999(6):631-636.
  [8]崔希友.发展我国中文数据库产业的战略对策[J].情报学报.1997(5):383-387.
  [9]陆华娟,刘玥辉.国内三大期刊全文数据库之比较[J].现代情报,2004(1):74-76.
  [10]周志峰.国内三大全文电子期刊数据库的比较与分析温州师范学院学报(自然科学版)[J].2004(5):107-111.
  [11]中国期刊全文数据库河海大学图书馆镜像站. [2006-10-12]http://e26.cnki.net/kns50/classical/singledbindex.aspx?ID=1
  [12]维普信息资源系统河海大学图书馆镜像站.[2006-10-12]http://202.119.47.6/
  [13]万方数据资源系统.http://www.wanfangdata.com.cn
  [14]超星数字图书馆南京大学图书馆镜像站点.[2006-10-16]. http://202.119.47.40:8080/
  [15]书生之家数字图书馆河海大学图书馆镜像站.[2006-10-16]. http://202.119.112.133:81/fwtj/fwtj.jsp?106_1&http://222.193.96.10:81/default.jsp
  [16]方正电子图书河海大学图书馆镜像站.[2006-10-16]. http://222.193.96.10/List.asp?DocGroupID=5
  [17]中国互联网络信息中心.中国在线数据库发展状况(2001年中国互联网络信息资源数量调查报告).[2006-10-10]ttp://www.cnnic.net.cn/resource/tj/2.shtml#2.1.4中国在线数据库发展状况
  [18]中国互联网络信息中心.2005年中国互联网络信息资源数量调查报告.[2006-10-10].http://www.cnnic.net.
  cn/download/2006/20060516.pdf
  [19]中华人民共和国新闻出版总署.2005年全国新闻出版业基本情况.[2006-10-10] http://www.gapp.gov.
  cn/GalaxyPortal/inner/zsww/zongsu3.jsp?articleid=6375&boardpid=145&boardid1=1150101011150f
  [20]宋保强.无力更改现行版权法电子图书遭遇发展瓶颈.[2006-10-10]. http://www.zydg.
  net/magazine/article/1672-5247/2006/07/339377.html
  [21]新浪网.授权要约模式研讨:共建版权授权高速公路.[2006-10-10].http://tech.sina.com.cn/it/2004-09-26/1011431895.shtml
  [22]郭太敏.信息资源检索与利用[M].徐州:中国矿业大学出版业,2002
  [23]赵兵等.信息检索与利用[M].沈阳:东北大学出版业,2002
其他文献
摘 要:在世界性基础教育改革浪潮中,改造传统的技术教育,设置富有时代特征的技术类课程,成为众多国家基础教育改革中的主流取向。本文仅就中小学技术教育改革课程背景、设置与趋向等做一下简述,以期对我国的技术教育有一定的启示。  关键词:技术教育 中小学技术教育 课程改革  中图分类号:G423.07 文献标识码:A文章编号: 1673-1875(2008)11-037-02    教育的第一要义是课程。
建筑工程中深基坑支护技术的应用水平对整个工程质量和施工进度有着非常大的影响作用,若技术应用出现问题,就会引发一系列施工安全问题,阻碍施工进度,影响建筑企业的经济效益
摘 要:高校辅导员的思想素质、道德水平,对学生的思想政治教育效果有着重要影响。本文从增强高校辅导员六个方面的意识进行了探讨,以提高思政工作效果。即增强政治意识、服务意识、创新意识、责任意识、师德意识和学习意识。  关键词:高校辅导员 增强 意识  中图分类号:G451.8 文献标识码:A文章编号: 1673-1875(2008)11-039-01    《普通高等学校辅导员队伍建设规定》明确指出:
摘 要:文章从英语学习能力教学培养的角度出发,着重阐述学生学习能力在英语教学中的培养,认为教师在教学中应注重学习能力的培养,充分发挥学生学习的主观能动性,让他们讲究学习方法,有效地学习英语,提供学习质量。  关键词:阅读能力 口语能力 网络自主学习策略  中图分类号:G642.3文献标识码:A 文章编号: 1673-1875(2008)11-040-02    中等职业教育是我国高中阶段教育的重要
中图分类号:G822文献标识码:A 文章编号: 1673-1875(2008)11-046-01    塑胶跑道问世后,短跑技术有很大发展,随着科学训练方法广泛应用,世界纪录多次刷新,放松跑技术是现代短跑技术一个重要环节。掌握短跑放松跑的技术,提高放松跑的能力,是攀登短跑技术高峰的重要内容。然而,这项技术至今没有引起一些短跑运动员,教练员的足够重视,其原因的放松跑的理论理解不深,以及对它在全程跑中
农业是宁夏的传统产业,农村经济在宁夏国民经济中有着举足轻重的作用;硒砂瓜产业是宁夏的四大特色战略性主导产业之一,已经成为宁夏农村经济的一个重要支撑和农民增收的重要来源
摘 要:近年来我国教育硕士的培养已初具规模。教育硕士专业开启了高校为基础教育服务的新途径,有助于提高基础教育教师的教育理论和研究水平,提升其专业知识结构和解决教育实践中问题的能力。文章试图回顾教育硕士发展的整个历程,从中得出我国教育硕士发展的特点。在此基础上,借鉴国外教育硕士培养优秀经验,从培养目标、质量评估、政策法规、课程体系、学科门类等方面对教育硕士的优质培养提出建议和展望。  关键词:教育硕
中图分类号:G632 文献标识码:A 文章编号: 1673-1875(2008)11-045-01     新课程改革的具体目标中其中一点是“创设有利于建立新型学习方式的课程实施环境,提高学生自主学习、合作交流以及分析和解决问题的能力”。课程目标中注重由学科本位向学生本位转变,改变过于注重知识传授的倾向,使获得双基的过程同时成为学会学习和形成正确价值观的过程。过去课程改革的重点在学科内容本身,而现
摘 要:评价目的是教师评价的方向,它指导和规范着教师评价的行为。因此,明确教师评价的目的,可以更好的促进教师评价的实施。本文通过分析当前国内外学者对教师评价目的的看法,发现他们所提出的教师评价目的或多或少都包括了“形成性”与“总结性”两类,只是关注的焦点不同。在教师评价的“形成性目的”中以专业发展和教学改进最多,其次为增进工作士气、促进学校改革发展和在职进修。相对而言,在教师评价的“总结性目的”中