【摘 要】
:
Web信息的快速增长,使得搜索引擎成为用户信息检索的主要工具。现有的搜索引擎基本上采用“一个搜索适用所有用户”的模型,体现不出用户真正的兴趣所在。因此,搜索引擎的个性
论文部分内容阅读
Web信息的快速增长,使得搜索引擎成为用户信息检索的主要工具。现有的搜索引擎基本上采用“一个搜索适用所有用户”的模型,体现不出用户真正的兴趣所在。因此,搜索引擎的个性化研究成为当今Internet信息检索方面的一个重要课题。在对个性化搜索引擎和Web挖掘等相关技术研究的基础上,深入分析了基于词频的TFIDF算法,该算法将用户浏览的页面置以平等的地位,忽略了文档与用户兴趣的相关性。针对这一缺点,分析了用户浏览页面与用户兴趣的相关因素,结合Web挖掘技术与相关反馈思想,提出了页面相关性权重的概念。将页面相关性权重与TFIDF算法相结合,提出了一种加权TFIDF算法。通过分析文档结构、用户浏览行为信息及用户对文档的评价信息,设计了一种基于加权TFIDF算法的三层用户兴趣挖掘策略,来创建和实时更新用户兴趣模型。分析了常用的基于向量夹角余弦的相关度排序算法存在的缺陷,在用户兴趣模型基础上,提出了一种改进的基于VSM的个性化文档相关性排序算法,根据用户的兴趣爱好对文档进行过滤、排序,提高系统的查准率。设计并实现了一个个性化信息检索系统,通过兴趣模型对用户输入的查询关键词进行查询扩展,将检索结果与用户兴趣相匹配,并按文档相关性大小进行排序,过滤其中低于指定阈值的文档。该系统在保证查全率的前提下,提高了系统查准率,实现了个性化信息检索的目的,同时也证明了算法的有效性。
其他文献
汽车产业被视为国民经济的支柱型产业,在经济发展的过程中具有举足轻重的作用。近年来,我国汽车零部件行业伴随整车市场高速发展的步伐而快速增长,行业规模不断扩张。随着信
从工程实际应用的角度出发,对模糊神经网络控制器的整个设计环节及应用过程进行了研究。重点研究了智能算法在现代控制中的实际应用,包括人工神经网络、遗传算法及模糊逻辑在
基于频监控技术的车辆检测方式近年来发展很快,由于它具有检测区域大、系统设置灵活等突出的优点,已成为智能交通系统领域的一个研究热点。视频监控技术为交通系统提供了直观、
随着人口的增长,越来越多的国家在面临人口老龄化的问题,同时空巢老人和独居老人所占人口比例也逐渐增多,导致家中无人监护的跌倒行为越来越多。一个鲁棒的自动化跌倒检测系统可
随着网络信息的爆炸性增长,用户在网上查询所需信息的难度越来越大。要想得到更为全面、准确的搜索结果,必须同时调用多个搜索引擎,元搜索引擎就是在这样的背景下产生的。元
数据挖掘又称为数据库中的知识发现,是指从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘出有趣知识的过程。数据挖掘是一个系统过程,一个挖掘任务可由不同的功能模
随着Internet覆盖范围的不断扩大、计算机与网络技术研究的不断深入,网络安全作为一个无法回避的问题呈现在人们面前。如何保障信息安全、防范网络入侵已经成为人们最为关心
Freescale公司的8位MCU应用广泛,其HCS08系列(下称S08系列)是2004年前后推出的增强型8位MCU,到目前为止已推出217种不同的产品。软件仿真器为用户程序提供一个完全脱离实际硬
计算机技术、多媒体技术及Internet的迅速发展,使得基于内容的图像检索成为多媒体领域最活跃的研究热点之一。本文首先介绍了基于内容的图像检索(CBIR)的背景及意义、国内外研
农业信息化是农业现代化的重要组成部分,将信息技术尤其是人工智能技术应用于农业是实现农业信息化的关键。农业智能系统的创建和应用改变了过去农业生产基层领导者决策的盲