数字图书馆及其分类技术的研究

来源 :福州大学 | 被引量 : 4次 | 上传用户:godmouse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和因特网的快速发展,网上信息的类型越来越丰富,可利用的资源也越来越丰富。因此迫切需要一种系统技术来管理数字信息资源,数字图书馆就是顺应这种需要而产生的。数字图书馆是一个新兴的,涉及到因特网、多媒体、数据仓库、数据挖掘和知识产权权保护等诸多技术的计算机应用领域,应用和商业前景非常广阔。 本文研究的就是数字图书馆的技术。本文对数字图书馆的概念、特点和技术体系结构进行了研究和讨论,对构建数字图书馆的数字资源所用到的元数据—XML和都柏林集也进行了深入的讨论。目前国内一些系统如万方、清华CNKI都采用专用的资源表示格式,万方采用的是pdf,而清华CNKI采用的caj。本系统提出了一种基于XML的元数据格式嵌入在资源中的资源表示方式,用户可以用浏览器直接阅读本系统中的数字资源,不需要专门的阅读器进行阅读了。 文档分类是数字图书馆技术中很重要的组成部分。国内外已有很多的分类算法,在本文中,重点介绍了SVM的分类技术以及它在文档分类中的优异表现,同时也指出它的缺点,SVM是基于大规模的语料库基础上的,如果文档较短,那么它的优点就体现不出来。在这种情况下,作者结合关联规则的算法,提出了词集算法,这个算法能对短文档的分类产生比较好的分类结果。
其他文献
近年来,Internet得到了飞速发展,特别是IPv6、下一代网络NGN(Next Generation Network)和第三代移动通信3G(3rd Generation)等相关技术起到了强大的推动作用,这使得目前的网络呈现出
网络答疑系统是远程教育中的重要组成部分之一.它在加强教师和学生的交流,帮助学生明确问题的所在和获得自己真正需要的答案信息方面具有不可缺少的作用.目前存在的基于自然
目前,基于内容的图像数据库检索已成为图像数据库研究的主流,其核心是基于内容的图像相似性检索.基于内容的图像检索遇到的主要问题是检索的准确性需要进一步提高,这主要是由
互联网业务的种类和数量在近几年迅速膨胀,与此同时,人们对网络服务质量的要求也越来越高,如何在现有设施的基础上使网络的性能达到最优是网络管理者和网络服务提供者都非常
随着信息技术的发展,计算机已经成为人们生活中不可或缺的一部分。个人用户可以使用计算机浏览网页、视频聊天、网络购物,企业单位可以使用计算机保存业务数据、进行自动化管理
近几年来,各级建设行政主管部门高度重视建筑市场的建设和管理,不断加大监管力度,取得了明显成效。但是,当前建筑市场秩序混乱的问题并没有得到根本解决,一个重要原因就是目前建筑
高可靠性的容错计算机系统在许多重要部门广泛应用.容错计算机系统设计中一个重要问题是如何对所采用的容错机制进行测试和评估.故障注入技术是测评容错机制的有效方法,可被
工作流技术作为一项流程集成技术,已经在许多领域得到了广泛的应用,并且受到了人们越来越多的关注.目前,由于企业所处的环境复杂多变,企业的业务流程也变得更加动态和灵活,如
近年来,随着嵌入式应用的发展,涌现出许多适合资源有限的8、16或32位小系统的小型TCP/IP实现.该文首先讨论了小型TCP/IP实现采用的简化TCP/IP实现的方法和技术,并分析了这些
近年,中国电力行业改革不断,逐步引入竞争机制,发电企业开始与电网分离,成为独立企业参与市场竞争.在由计划经济运行模式向市场导向的转变背景下,电厂的管理重点逐步过渡到基