数字图书馆中个性化服务技术的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:Michael_Wong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以数字图书馆中的文本数据为基础,研究用户个性化偏好模型,个性化信息获取、存储与管理以及相关的资源特征的提取、组织、维护等问题,研究个性化信息推荐技术和个性化检索技术.本文的主要研究成果包括如下六方面.首先,提出一种能够表达数字图书馆中复杂用户偏好的偏好模型.该模型把用户偏好与语义概念层次相结合,比原有的基于偏序关系的偏好模型具有更强的表达能力,能够表达数字图书馆中文本数据上的复杂用户偏好,具有很好的扩展性和自适应性.第二,提出基于新的偏好模型的用户偏好获取方法以及偏好信息的存储和索引技术.利用统计分析的方法获取用户对文本属性的偏好和文本内容的偏好,实验结果表明偏好挖掘算法是十分有效的.提出的混合存储策略在单机上的空间代价和操作代价都远远小于传统的关系存储模式.第三,提出了文本特征的提取方法以及特征信息的存储和索引技术.新的提取方法对PDF格式的文本进行特征提取,把基于规则和自动机的提取方法相结合,较好地解决了数字图书馆的数据预处理问题.针对数字图书馆中查询的特点,采用层次索引来组织文本的结构和内容信息,具有很好的并行性和压缩比,采用并行和压缩技术提高了查询效率.第四,提出两种个性化推荐算法.在基于兴趣度的个性化推荐算法中,把文本之间的相似性、文本的新颖性和信息量结合起来,提出用户对文本兴趣度的概念,理论分析和实验结果均证明算法能够真正返回用户感兴趣的文本,提高了推荐完全性和推荐准确性.在基于文献拓扑的个性化推荐算法中,提出文献拓扑图和相关子图的概念,把文献之间的拓扑结构应用于文献的推荐,不仅提高了算法的效率,而且能够全面、准确、清晰地给出与用户感兴趣的研究问题相关的文献.第五,在个性化检索方面,把语义概念层次与用户个性化关键字组相结合,形成带表达能力的概念层次,用来表达用户的内容偏好.实验结果表明,算法的查全率和查准率都高于传统的关键字检索和基于概念层次的个性化检索算法.提出检索结果的自动分类方法,为用户提供检索结果的分类信息,再根据用户对类别的选择传输文本,大大减少了网络传输量,提高了系统的效率.最后,基于上述基础研究成果,以基于机群并行计算环境的数字图书馆管理系统为平台,设计实现了一个支持个性化服务的数字图书馆系统原型.
其他文献
随着Internet技术与多媒体技术的飞速发展,多媒体通信逐渐成为人们进行信息交流的重要手段,人们可以通过网络交流各种信息,进行网上贸易等。由于图像信息相比其他信息具有直
随着计算机网络技术的迅猛发展和广泛应用,特别是Internet的快速普及,促进了计算机与互联网科技的不断创新与升级。网络设施和资源对于国家企业和个人的重要性在日益增强,它在不
随着计算机技术,特别是Internet技术的发展,在许多行业、单位或机构部门内部都逐步实现了业务、信息的计算机化管理。但是各个机构、单位或部门内部由于业务和功能归属不同,因此
随着计算机网络在我国的日益普及,基于网络的应用日益丰富,网络管理工作也显得越来越重要。网络管理的内容十分丰富,有故障管理、计费管理、配置管理、性能管理、安全管理5
随着科技的不断发展,互联网中的视频数据呈指数增长,视频数据已经成为人们获取信息的重要来源之一。在需要大量人机交互的领域中获取的人脸信息更为人们所关注,如何通过这些人脸
随着Internet的发展和网络服务商业化进程的加快,Internet的规模和复杂程度都在迅速增长。从管理的角度讲,Internet是由成千上万的自治系统(Autonomous System简称AS)组成,这
实施管理信息系统是企业信息化建设的一个重要措施,然而,传统管理信息系统已经不能满足目前企业的需求。企业的模式在逐渐的由层次职能型转变为流程管理型,企业业务流程经常
集数据采集、处理及通信于一体的无线集成传感器网络以其低廉的价格、便利的展开方式正得到越来越广泛的使用,对传感器网络各个方面的研究也成为目前学术界非常活跃的课题。而
随着Web上信息的迅速扩展,各项基于Web的服务也逐渐繁荣起来。作为这些信息服务的基础和重要组成部分,Web信息采集正应用于搜索引擎、站点结构分析、页面有效性分析、Web图进
随着Internet及大容量存贮技术的迅速发展,Web上的信息日益丰富。从海量、异构的Web信息源中获取用户所需要的知识是一项很难的事情,同时也是一项亟需解决的问题。Google,Altavi