基于命名实体的网页推荐算法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:liyang0ly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术和计算机技术的飞速发展,网上的信息呈带宽的指数级增长。在这样一个信息量爆炸的社会中,人们希望通过网络获得大量信息,而搜索引擎就是在这样的背景下诞生与发展起来的。一般来讲,用户通过搜索引擎查询信息,虽然搜索引擎可以按照某种算法给出相关网页排序,但是有时并不能满足用户的查询请求。为了给用户提供满意的服务,从查询日志入手,分析用户的查询行为,提出了基于命名实体的网页推荐算法,给用户提供智能推荐,从而给出较好的推荐网页。本文从网络查询日志研究中发现,大量的查询中都或多或少的含有实体,这些实体分为传统命名实体和特殊命名实体。传统命名实体研究人名、地名和机构名;特殊命名实体研究与人类生活联系紧密的领域如TV、环境、经济、电影、医学、交通、IT和教育中具有特殊含义的实体。针对查询中和文档中的实体识别和类型识别,采用不同的方法,且对于查询中实体类型的识别采用三元组的概率形式。根据实体类型,相应地,对网页也进行了处理,将实体类型映射到网页类型,可以更好地提供网页推荐。本文提出了基于混合马尔科夫模型用于目录网页的导航链接和基于LDA特征选择的网页推荐算法用于主题网页推荐。根据当前用户的点击行为向其推荐8个以内的导航链接,这些推荐是根据含有同一实体的查询需求,在关键字匹配的情况下向用户推荐的,从而为用户减少了时间消耗和带宽消耗。因为一篇文档中存在很多主题,本文提出了基于LDA特征提取的网页推荐算法,通过采用LDA对文本建模,获得各个类别的子LDA模型,进而将文本分类,最后结合实体类型及查询词的匹配程度,向用户推荐网页链接。实验结果显示,基于混合马尔科夫模型的推荐算法,达到了比较满意的效果。基于LDA特征提取的网页推荐算法优于传统的推荐算法,很好地满足了用户的需求。
其他文献
要成功设计、控制和管理网络,为用户提供应有的服务质量,就需要了解和掌握网络的内部特性。流量矩阵作为网络流量工程的重要参数,可以为网络规划、拥塞控制、流量异常检测、
随着计算机和通信技术的不断发展,Internet已经成为当今社会生存与发展必不可少的重要资源。随着网络的演进,在以IP电话、在线购物、视频会议等为代表的实时应用日益繁荣的同
近年来,伴随着互联网技术的不断发展,基于Web的各种应用也越来越得到了人们的重视。将Web技术与数据库技术相融合,使数据库成为Web的重要组成部分的Web数据库已经成为目前数
论文以目前计算机科学与技术领域广泛讨论和应用的分布式存储、分布式计算和内容仓库标准接口为背景,结合内容管理系统项目,研究如何用Java内容仓库封装分布式文件系统,实现
随着通信技术的发展,融合性和异构性成为未来网络的主要特征。如何在异构网络中为用户提供端到端的QoS保障成为了关键性问题。相关标准组织和研究机构为解决上述难点进行了很
无线传感器网络是由部署在监测区域内大量的廉价微型传感器节点组成,通过无线通信方式形成的一个多跳自组织网络。传感器网络中的节点通常采用电池作为电源,能量十分有限,且
本文介绍了对GSM和TD-SCDMA共位置区方案所做的研究。GSM和TD-SCDMA分别是2G和3G的技术标准,由于投资保护和网络演进的需求,实际运营的网络架构中将出现两张网络长期共存的局
Distributed Service Network (DSN)是针对电信业务和移动互联网业务所提出的新一代可运营、可管理的分布式核心网体系架构。DSN核心网基于P2P架构,没有中心节点,由大量的对
随着社交网络服务的快速发展,SNS已经成为网络用户重要的基础应用之一。本文首先本文首先总结了SNS的基本概念和发展现状,然后对集中式SNS和分布式SNS的特点进行分析,提出了