基于标签模糊对象聚类的搜索方法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:happywz521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,网络上的信息成爆炸式增长。自从Tim Berners-Lee提出Web2.0的概念之后,用户从被动的接受信息逐渐转变成信息发布的参与者。社会标签是Web2.0的众多应用之一,社会标签是由大众用户参与并且共享的元数据,大众用户不但是标签的发布者,而且是这种信息的接受者。随着Web2.0不断的发展,社会标签服务系统不断的推出新的服务,在其提供的众多服务中,用户对搜集的信息用标签加以描述并且和其他用户共享标签是其核心服务。社会标签是大众用户根据自己的兴趣对网络资源进行的分类,而且用户使用的标签不受任何分类标准的约束。虽然社会标签的出现给用户带来了种种好处,但是用户添加标签时的随意性也给社会标签带来了种种缺陷。本文研究的搜索方法是基于社会标签的,主要针对社会标签的不足提出的一种新的搜索方法,并借助于信息检索中的向量模型以及模糊数学的思想对网络资源对应的标签建立模糊对象模型。由于考虑到网络上资源规模非常庞大,因此本文的搜索方法利用模糊聚类的手段来提高用户查询的效率,并基于模糊聚类对网络资源建立索引树。对于用户的查询本文采用KNN查询,只把最符合用户查询意图的前K个结果返回给用户。本文的搜索方法也从用户个人兴趣出发对用户查询进行查询扩展。实验结果充分证明了本文提出的搜索方法更加满足用户对搜索结果准确和效率的要求。
其他文献
基于共享地址空间的多线程是有效利用多核资源的重要方式。并发线程对一些共享数据的竞争,成为影响应用性能瓶颈之一。严重的共享地址空间竞争,限制了大量的多线程程序的性能
量子信息科学是信息科学与量子力学结合的一门新兴交叉科学。量子信息科学采用量子比特来表示量子态。遗传算法是模仿生物自然选择和遗传机理,构造一种随机化搜索的人工智能算
软件系统在长期不间断的运行过程中,会产生一系列能够导致软件性能下降的现象,例如系统内存泄露、舍入误差的积累、未释放的文件锁以及大量的存储空间碎片等,这种现象被称为软件
随着全球信息化的不断发展,对地理信息系统(GIS)的应用也越来越广泛,例如电力GIS系统等。如今的GIS系统,不仅需要处理二维空间的数据,还要对三维或者更高维空间的数据进行处
伴随着科技的发展,大量的手持可摄像电子设备已经走进到广大群众的日常生活中,人们虽然在享受方便,快捷,丰富的各种多媒体信息,但是同时也感受到了对多媒体信息处理的各种困
随着信息技术的迅猛发展,人们可以通过互联网从世界各地接收和发送信息,而信息交换过程中的一个突出问题就是数据格式的异构性,这将极大地阻碍对信息进行有效地使用。XML的出现
社会网络是指社会个体成员之间因为互动而形成的相对稳定的关系体系,其中联系较为紧密的团体称为社区,处在同一社区中的个体更易于受到社区内其他人的影响,而社区挖掘技术就是挖
肺癌是严重威胁人们生存的疾病,目前,已经跃居成为世界恶性肿瘤病例的第一位。而计算机辅助诊断系统(CAD)对早期肺癌的发现和诊断有十分重要的价值。肺区域分割作为基于医学影
网络游戏现在已经进入三维网络游戏的时代,它以逼真的画面,巨大的游戏场景赢得了玩家的认可。由于游戏规模越来越大,在线人数增多,使得网络延时、丢包和集群的负载均衡等问题越来
支持向量机是由Vapnik等人基于统计学习理论提出的一种新型的机器学习方法。支持向量机基于结构风险最小化原理,综合考虑了经验风险和置信风险,具有良好的泛化能力和较高的分