面向情报学研究生教育领域的垂直搜索引擎研究

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:hubeijj111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前网络上存在很多各种类型的情报学研究生教育资源:各高校研究生网站、高校图书馆网站、科研院所网站、研究生论坛、情报学专家和学者的个人网页或博客等等。面对大量的情报学研究生教育资源,用户很难定位自己所需要的信息。情报学研究生教育垂直搜索引擎能整合这些繁杂、散乱无序的网络资源。垂直搜索引擎专注具体深入的纵向服务,致力于某一特定领域内信息的全面和内容的深入,对于领域外的信息不收录,情报学研究生教育垂直搜索是针对通用搜索引擎信息量大、查询不准确等问题提出来的,其特点就是“专”“精”“深”且具有行业色彩,它是与通用搜索引擎截然不同的引擎类型。传统搜索引擎的检索返回结果太多,不知道从哪开始浏览,查准率低,垂直搜索虽面向主题排除了很多闲杂信息,但为了更好的使用户定位自己所需要的信息,对搜索结果进行聚类是非常重要的。情报学研究生教育涉及范围广资源种类多,例如培养机构包括高校教学院系、科研院所、高校图书馆等,情报学又是图书馆和文献学、计算机和通讯科学、管理和系统科学等领域的交叉产物,导致培养内容和方式丰富,所以用户面对搜索结果将无从下手,在搜索引擎中应用聚类技术,能使经过处理后的搜索结果以一种超链接的层次类目方式提交给用户,内容相似的搜索结果被划分为一个类目,这样,搜索结果就被有效地组织起来,用户就可以快速地了解搜索结果的整体分布情况,并快速定位自已需要的结果。本文就面向情报学研究生教育领域的垂直搜索引擎提出了构建策略,实现了此系统的五大模块:爬虫模块、网页信息分析处理模块、建立索引模块、用户检索接口模块、聚类模块。并对垂直索引的主题过滤、面向情报学研究生教育领域的专业分词、聚类模块的实现等作了大量实验。本文分为七章,文第一章介绍,垂直搜索引擎的研究意义和背景,提出了面向此领域的垂直搜索引擎的技术结构;第二章详细论述了垂直搜索引擎与通用搜索引擎的不同;第三章采用文献计量学的关键词分析法,对情报学研究生教育相关学术论文进行关键词分析,统计出情报学研究培养领域的高频词和热点词,更新分词词典,为情报学研究生教育领域的分词词典提供了专业分词;第四章研究了我国情报学核心网站基于关键词的搜索引擎优化的统计,分析了我国情报学核心网站的结构特点,有利于选取和合适的网站进行垂直搜索引擎的构建;第五章提出了构建此领域垂直搜索引擎的五大模块;第六章具体实现了垂直搜索引擎的构建,并实现了聚类显示;第七章作出了总结和展望。
其他文献
非物质文化遗产保护是近年来学术界的热门话题,人们从不同的角度探讨非物质文化遗产对人类文化生存和发展的重要意义以及各种保护非物质文化遗产的措施。湖北省恩施土家族苗
电力企业的发展面临着经营管理模式的转变要求,要适应市场需求的变化,电力企业要不断地实现自身行政管理体制的优化升级,转变不合理的管理结构与管理理念,积极主动的推动电力
<正>美国当地时间4月16日,高盛被美国证券交易委员会以涉嫌欺诈而起诉。消息一出,全球哗然。4月19日,英国前首相布朗率先批评高盛——华尔街最大的投资银行"道德破产";4月30
本文以张爱玲小说《倾城之恋》为细读文本,从叙事中的明暗线索、男女主人公形象分析、主题中的浪漫与苍凉三方面细致地解读了该小说。
房地产投资信托凭借其运作特点能够很好的解决房地产融资问题,但是,要想使这种融资方式在我国得到很好的发展,必须认真分析我国的发展环境,以发挥优势、转变劣势、紧抓机遇、
<正>文章选取的花卉词除有观赏价值的草本植物外,还包括草本或木本的地被植物、花灌木、开花乔木以及盆景等,选取标准从宽不从严。为了保证考察对象及结果的权威性和可靠性,
了解一体化车载设备的原理,做出系统故障的初步判定,并对一体化设备的故障处理进行了系统式、板块式的阐述。
2012年11月21日,由中国社会科学院经济学部企业社会责任研究中心编著的《中国企业社会责任研究报告(2012)》在京发布。这是中国社科院连续第4年发布《企业社会责任蓝皮书》。
随着我国建设事业的发展,我国的建筑企业犹如雨后春笋般不断出现,如何在众多企业中脱颖而出,是一个很大的问题。文章根据建筑施工工程管理及施工质量方面存在的诸多问题,对提
汽车在人们的生活中扮演着非常重要的角色,给人们带来了诸多的方便,但汽车的排放污染物给大气环境造成了严重的污染。因此汽车尾气的净化处理自然也成了社会关注的焦点,寻找