基于社区标签图与维基百科的Web对象分类研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:yuxjmail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着互联网的发展,网络社区化产生了许多具有研究价值的社区数据,社区数据的相关研究已经成为Web挖掘领域的一个热点。基于社区标签图的Web对象分类的方法是近年来Web挖掘领域的一个研究方向,它将社区标签作为Web对象的特征,通过社区标签图来构建Web对象之间的联系,利用源领域数据来指导目标领域数据的分类,解决了缺乏Web对象特征和缺乏类标记数据的问题。但是,由于基于社区标签图的Web对象分类方法只通过社区标签匹配的方式来构建对象之间联系,所以并不能更深层次地挖掘对象之间的潜在语义联系。   本文研究在缺乏类标记数据环境下如何利用社区标签数据和维基百科知识库来对Web对象进行分类,提出了一种基于维基百科概念图的Web对象分类算法,从语义层面上挖掘Web对象之间的潜在联系。首先,本文研究了如何从维基百科中提取语义联系,包括同义概念、多义概念、类概念以及关联概念等,并将这些语义联系引入到社区标签图中,构造维基百科概念图。接着,本文将维基百科概念和Web对象间的相邻性引入到分类算法中,提出了一种基于维基百科概念图的Web对象分类算法。实验表明,本文提出的基于维基百科概念图的Web对象分类方法能够有效挖掘Web对象之间的潜在联系,并且取得更好的分类效果。
其他文献
近年来,无线传感器网络获得了快速发展,广泛应用于环境监控、医疗卫生、军事以及工业等领域,同时也引起了众多研究者的关注。WSN的覆盖问题是网络构建初期和应用过程中的必要
随着在创新2.0下“互联网+”这种新业态的出现,社会生活的各个领域都与互联网变得密不可分。这也导致了互联网上的各类非结构化数据,结构化数据,半结构化数据的大数据爆炸式
无线传感器网络融合了传感器技术、信息技术和网络通信技术,它是由大量传感器节点通过无线通信技术自组织构成的网络。无线传感器网络是信息技术中的一个新的领域,在军事和民用
随着P2P网络应用和用户数量的不断增加,网络所面临的问题比如网络拥塞和Qos保障等问题变得越来越棘手。因此,对P2P进行识别并加以控制就成了关键问题。早期的P2P应用通常采用
随着科学技术的发展,许多生产和科学研究领域对计算机的计算能力要求越来越高,传统的单处理器系统受散热问题和制造工艺等因素的影响已达到性能瓶颈,处理器体系结构开始向多核心
信息技术的急速发展在不断地改变人们生活方式的同时,也使得信息传播的形式在不断地丰富和翻新。短文本(通常文本长度小于160字符)作为手机简讯、在线即时聊天、论坛用户评论
为了适应业务带宽、服务质量以及网络覆盖等多方面需求,以及应对各种新的宽带无线接入技术对3G系统形成的挑战,3GPP组织于2004年12月启动了无线接入网LTE(Long Term Evolution,
空间数据库技术是当前数据库领域中的研究热点,在国内外的许多不同领域都得到了应用。由于空间数据库中的数据无序、庞大,以及空间对象与空间查询的高度复杂性,使得查询效率成为
智能交通系统已成为当前交通管理发展的重要方向,而车牌识别系统作为智能交通系统的一部分,起着举足轻重的作用,它的广泛应用将有助于我国交通管理自动化的进程。   国内外已
由于网络技术的迅猛发展,Internet已经成为人们日常工作和生活中必不可少的一部分,上网的工具也越来越多,从刚开始笨重的PC机到轻便的笔记本电脑,再到现在更为小巧方便的掌上电脑