【摘 要】
:
随着互联网的高速发展,越来越多的信息以电子形态存储和交换,于是信息检索技术应运而生,并且仍在不断的发展和完善。文献检索作为科研人员获取资源信息的重要途径,已经成为信
论文部分内容阅读
随着互联网的高速发展,越来越多的信息以电子形态存储和交换,于是信息检索技术应运而生,并且仍在不断的发展和完善。文献检索作为科研人员获取资源信息的重要途径,已经成为信息检索中一块重要的领域。科学的文献检索可以帮助科研人员借鉴和总结前人的研究成果,不仅能够促进文献资源的迅速开发和利用,还可以避免重复研究等现象的出现。传统文献检索大多按照被引次数、发表时间、搜索词出现频次等条件之一对结果进行排序,角度单一且忽略了文献相互引用带来的价值流动,往往会出现部分文献排名过高或过低的现象。为此,很多国内外学者提出将PageRank算法应用到文献检索中,并取得了一定程度的改进,但是仍忽略了一些特殊情况,如文献使用价值可能会随时间的推移而产生衰退,还有一些发表时间较短的文献被引次数为零,如何去评估他的价值等。本文针对这些问题,提出了一种多维检索排序法,在对文献间互引所构成的引文网络的结构进行分析的基础上,综合考虑各种因素带来的影响,并引入文献活跃度的概念,以加权的方式将文献价值量化。最后,本文选择开源网络爬虫Heritrix作为样本采集工具,采用Struts2开发框架,Html+JavaScript脚本语言以及Oracle11g数据库等开发工具设计并实现了一个简易的在线文献检索系统。该系统从中国知网上爬取对文献进行描述的Html和Aspx文件并进行解析,通过解析结果创建实验数据集。实验证明,多维检索排序法比传统文献检索排序法效果更好,而且由权值迭代所带来的额外的计算量大部分为离线完成,在提高准确率的同时也很好的保持了检索的效率。
其他文献
近年来,随着传感器技术、嵌入式计算技术、微电子技术、现代网络技术和无线通信技术的不断发展,无线传感器网络(Wireless Sensor Network简称WSN)作为一种全新的信息获取、处
基于结构光投影的主动三维测量方法由于其高分辨率、非接触、无破损、数据获取速度快等优点而被公认为最有前途的三维测量方法。傅立叶变换轮廓术通过摄像机采集一幅因物体表
在虚拟化环境中,虚拟机镜像文件在物理节点上完整地保存了虚拟机运行环境和用户数据。但是,虚拟化带来的语义隔离性使得虚拟机镜像文件保存了虚拟机中所有已删除的数据,这极
人脸检测作为人脸信息处理中的一项关键技术,近年来在模式识别与计算机视觉领域中已成为一个热门的研究方向,具有极高的学术研究价值和商业应用价值。随着智能化信息处理技术
随着Internet技术的不断发展,各种新技术的不断诞生,正在逐渐改变人们的生活与工作的方式。诞生于上世纪九十年代的RSS技术是近几年在互联网上最热门的技术之一,各种类别的信
动态插桩系统在程序的执行过程中动态地插入代码以获取程序的执行信息或扩展程序的功能,它被广泛的应用于程序的性能分析、体系结构模拟和错误检查等。然而,动态插桩系统普遍
近几年开始,CPU主频提高的速度已经越来越慢,硬件厂商开始将CPU的发展方向转变为多核化,Intel、AMD等公司多核处理器的市场占有率也开始不断上升,并且这些处理器中集成的核也
无结构化P2P(Peer-to-Peer)网络在覆盖网上采用了完全分布式的组织方式,无中心管理节点,节点之间的地位完全平等,可以自组织、自管理、能较好的处理节点的动态加入和退出,以及节
随着影像技术和图像应用技术的蓬勃发展,对图像处理的各种要求越来越高,而图像分割作为图像处理和图像分析的重要基础,在近年来得到了广泛地研究与推广。由于细节较多,图像灰
网络虚拟化(Network Virtualization)旨在公共的底层物理网络上建立彼此相互隔离的逻辑网络,每个逻辑网络可以有各自独有的地址格式、寻址策略与控制方式。在传统网络体系结