论文部分内容阅读
随着互联网的迅速发展,网络上的信息成爆炸式增长。自从Tim Berners-Lee提出Web2.0的概念之后,用户从被动的接受信息逐渐转变成信息发布的参与者。社会标签是Web2.0的众多应用之一,社会标签是由大众用户参与并且共享的元数据,大众用户不但是标签的发布者,而且是这种信息的接受者。随着Web2.0不断的发展,社会标签服务系统不断的推出新的服务,在其提供的众多服务中,用户对搜集的信息用标签加以描述并且和其他用户共享标签是其核心服务。社会标签是大众用户根据自己的兴趣对网络资源进行的分类,而且用户使用的标签不受任何分类标准的约束。虽然社会标签的出现给用户带来了种种好处,但是用户添加标签时的随意性也给社会标签带来了种种缺陷。本文研究的搜索方法是基于社会标签的,主要针对社会标签的不足提出的一种新的搜索方法,并借助于信息检索中的向量模型以及模糊数学的思想对网络资源对应的标签建立模糊对象模型。由于考虑到网络上资源规模非常庞大,因此本文的搜索方法利用模糊聚类的手段来提高用户查询的效率,并基于模糊聚类对网络资源建立索引树。对于用户的查询本文采用KNN查询,只把最符合用户查询意图的前K个结果返回给用户。本文的搜索方法也从用户个人兴趣出发对用户查询进行查询扩展。实验结果充分证明了本文提出的搜索方法更加满足用户对搜索结果准确和效率的要求。