论文部分内容阅读
据岛内“中央社” 等新闻媒体报道台湾﹃中研院﹄的数位数据库已开放并以申请会员制方式开放岛内免费授权使用
这套系统是由台湾“中研院”历史语言研究所︵简称史语所︶组织建立的史语所是著名的史学研究资料的重地以严谨扎实丰厚而著称现有专任研究人员五十多人分四个学术组九个专题研究室六个工作室其︽中央研究院历史语言研究所集刊︾傅斯年图书馆数位数据库在史学界是非常有影响力的
傅斯年图书馆最早建立于一九二八年一九四九年迁到台湾一九六〇年在美国的援助下兴建了现在依旧使用的四层建筑并为纪念史语所的已故所长傅斯年先生(曾任)由胡适之先生将其命名为傅斯年图书馆此馆收藏范围以历史学语言学文字学人类学以及古籍考订学为主有关中国古科技史文献生命医学文献亦甚丰富当下馆藏总计约七十多万册档案二万余件(人物档案包括手稿照片信件)期刊报纸三千多种现刊一千多种对俗文学资料的收藏是其馆藏极具特色的一部分有一万二千件二万余目时间上溯至清乾隆年间地域遍及全中国至二〇〇四年八月已被数据库收录完毕
已经建立并开放的数位数据库则是﹃中研院史语所珍藏历史文物数位化典藏计划﹄的具体实施上世纪八十年代中期由史语所和傅斯年图书馆着手进行他们运用数位化方式重新整理珍贵的典藏文物“期望透过崭新的研究平台跨越时空与地域提供汉学界更丰富优质的研究素材”到去年底史语所将多年来典藏的考古资料 (包括殷墟两周考古及台湾考古)拓片与古文书 (含甲骨文拓片青铜器拓片佛教造像拓片辽金元拓片汉墓画像拓片居延汉简)善本图书中国西南少数民族文物明清两朝档案等整理成包括“汉籍电子文献”“内阁大库档案﹄等十六个典藏数据库暨系统仅“汉籍电子文献”就包含整部二十五史整部阮刻十三经超过两千万字的台湾史料一千万字的大正藏以及其他典籍合计字数一亿三千万字并以每年至少上千万字的速率增长
这十六个数据库总计提供近四亿字史料电子全文一百多万面数位影像五十六万多笔收藏文物的数据等信息目前它是“迄今最具规模的中文古籍数据库也是目前网络中资料整理最为严谨的中文全文数据库”比如“二十五史”所选用的录入底本是台湾鼎文公司翻印的大陆中华书局点校本(台湾称为“新校本”)多名台湾学者参与了校订工作每部史籍都经过至少四次校阅
在正式开放之前此数位数据库已做了四年多的测试性开放使用人次总共累计达十九万人次点阅次数超过六百八十万次平均每天都有超过四千六百次的点阅记录据豆瓣网“爱读书的熊”特别推崇在“汉籍电子文献”的一级栏目最后有一个不太引人注目的“人文资料库师生版”是为普及文史教育而向台湾大中小学师生免费开放的其中包括了许多文史研究的重要典籍占整个汉籍资料库文献的一半
另外史语所创所以来的文书档案包含了人事采购公务信件工作计划工作报告会议记录等一九九六年开始整理现已进入“档案数位化典藏计划”
特别值得重视的是陈国栋(史语所研究员兼傅斯年图书馆主任)林妙桦(史语所傅斯年图书馆馆员)于二〇〇四年在中科院牵头主办的“两岸三院信息技术应用与交流研讨会”上提请注意数位典藏系统一是建制多元平台以提供多元服务比如整合串连各种检索系统之数据再以跨平台之电子出版型态进行出版二是数位典藏系统的各项经验传承强调随着数据量扩增更需经验的传承否则系统的后续维护及运作效能也将大受影响他们提出在数位典藏工作的规划中一要考虑多元媒体的储存机制比如无论用何种媒体都必须考虑其保存年限及储存环境等问题数字媒体更需考虑其改版或升级等相关问题二要依其保存及使用年限予以定期重制以避免因档案毁损或规格变更等情况而影响数位影像的储存及读取三要异地储存可预防一旦发生灾难则仍难逃无典藏备份的后果四是对原件数位化也不得减少其维护和修复费用因为数位化复制品对于研究者而言仍无法取代原始典藏
这套系统是由台湾“中研院”历史语言研究所︵简称史语所︶组织建立的史语所是著名的史学研究资料的重地以严谨扎实丰厚而著称现有专任研究人员五十多人分四个学术组九个专题研究室六个工作室其︽中央研究院历史语言研究所集刊︾傅斯年图书馆数位数据库在史学界是非常有影响力的
傅斯年图书馆最早建立于一九二八年一九四九年迁到台湾一九六〇年在美国的援助下兴建了现在依旧使用的四层建筑并为纪念史语所的已故所长傅斯年先生(曾任)由胡适之先生将其命名为傅斯年图书馆此馆收藏范围以历史学语言学文字学人类学以及古籍考订学为主有关中国古科技史文献生命医学文献亦甚丰富当下馆藏总计约七十多万册档案二万余件(人物档案包括手稿照片信件)期刊报纸三千多种现刊一千多种对俗文学资料的收藏是其馆藏极具特色的一部分有一万二千件二万余目时间上溯至清乾隆年间地域遍及全中国至二〇〇四年八月已被数据库收录完毕
已经建立并开放的数位数据库则是﹃中研院史语所珍藏历史文物数位化典藏计划﹄的具体实施上世纪八十年代中期由史语所和傅斯年图书馆着手进行他们运用数位化方式重新整理珍贵的典藏文物“期望透过崭新的研究平台跨越时空与地域提供汉学界更丰富优质的研究素材”到去年底史语所将多年来典藏的考古资料 (包括殷墟两周考古及台湾考古)拓片与古文书 (含甲骨文拓片青铜器拓片佛教造像拓片辽金元拓片汉墓画像拓片居延汉简)善本图书中国西南少数民族文物明清两朝档案等整理成包括“汉籍电子文献”“内阁大库档案﹄等十六个典藏数据库暨系统仅“汉籍电子文献”就包含整部二十五史整部阮刻十三经超过两千万字的台湾史料一千万字的大正藏以及其他典籍合计字数一亿三千万字并以每年至少上千万字的速率增长
这十六个数据库总计提供近四亿字史料电子全文一百多万面数位影像五十六万多笔收藏文物的数据等信息目前它是“迄今最具规模的中文古籍数据库也是目前网络中资料整理最为严谨的中文全文数据库”比如“二十五史”所选用的录入底本是台湾鼎文公司翻印的大陆中华书局点校本(台湾称为“新校本”)多名台湾学者参与了校订工作每部史籍都经过至少四次校阅
在正式开放之前此数位数据库已做了四年多的测试性开放使用人次总共累计达十九万人次点阅次数超过六百八十万次平均每天都有超过四千六百次的点阅记录据豆瓣网“爱读书的熊”特别推崇在“汉籍电子文献”的一级栏目最后有一个不太引人注目的“人文资料库师生版”是为普及文史教育而向台湾大中小学师生免费开放的其中包括了许多文史研究的重要典籍占整个汉籍资料库文献的一半
另外史语所创所以来的文书档案包含了人事采购公务信件工作计划工作报告会议记录等一九九六年开始整理现已进入“档案数位化典藏计划”
特别值得重视的是陈国栋(史语所研究员兼傅斯年图书馆主任)林妙桦(史语所傅斯年图书馆馆员)于二〇〇四年在中科院牵头主办的“两岸三院信息技术应用与交流研讨会”上提请注意数位典藏系统一是建制多元平台以提供多元服务比如整合串连各种检索系统之数据再以跨平台之电子出版型态进行出版二是数位典藏系统的各项经验传承强调随着数据量扩增更需经验的传承否则系统的后续维护及运作效能也将大受影响他们提出在数位典藏工作的规划中一要考虑多元媒体的储存机制比如无论用何种媒体都必须考虑其保存年限及储存环境等问题数字媒体更需考虑其改版或升级等相关问题二要依其保存及使用年限予以定期重制以避免因档案毁损或规格变更等情况而影响数位影像的储存及读取三要异地储存可预防一旦发生灾难则仍难逃无典藏备份的后果四是对原件数位化也不得减少其维护和修复费用因为数位化复制品对于研究者而言仍无法取代原始典藏