基于多源特征的微博图文相关关系识别方法研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:spiderwolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会和经济的快速发展,人们进入读图时代,以图作为研究对象的应用陆续出现。然而,这些研究均存在着图像底层特征与高层语义特征间“语义鸿沟”问题,并且该问题一直是图像研究的难点。随着社会媒体的兴起,微博备受关注,且它的数据不再简单的以文字形式展现在用户面前,文字附近往往配有图片信息和社会信息等多源信息,本文旨在利用微博中的多源信息研究微博中图片与文本间的相关关系。针对微博数据,本文首先提取多源信息的特征,即图像特征、文本特征和社会特征;然后根据提取的特征,提出了三种方法来识别图文相关关系,分别是基于BP神经网络的微博图文相关关系识别方法、基于SVM的微博图文相关关系识别方法以及基于特征映射的微博图文相关关系识别方法,它们分别利用机器学习中的BP神经网络和SVM训练模型,其中,基于特征映射的方法利用了遗传算法消除图像特征、文本特征和社会特征间的异构性。实验结果采用各类正确率和总正确率进行评估,实验结果表明,在总识别率上,基于特征映射的微博图文相关关系识别方法优于其余两种方法,在相关图文的预测方面,基于特征映射的微博图文相关关系识别方法比其余两种方法更有效,在不相关图文的预测方面,基于SVM的微博图文相关关系识别方法比其余两种方法更有效。
其他文献
企业应用软件系统是企业在激烈的市场竞争中生存下来的关键因素,业务构件是企业应用系统的软件实现,其开发过程存在着大量重复劳动,庞大的代码量影响着自身的快速重构能力。
家庭影院电脑的无线遥控器是当前嵌入式多媒体系统中的研究热点之一,本文在了解当前国内家庭影院电脑遥控器的基础上,设计了一种2.4GHz频率的USB接口遥控器。通过开发的驱动
在电子商务快速发展的今天,要求电子商务交易的双方有智能性、分布性、安全保护措施、自主性等等特性。利用多Agent系统框架来搭建自动电子商务平台是一个很好的解决方案。分
我国汽车产业和交通事业的迅速发展和车辆的普及化以及无线传感器网络的快速发展,对车辆性能检测提出了更高的要求。目前,有些地方无法实现车辆检测设备的安装和检测网络的建设
随着互联网的快速发展和人们对信息需求的迅速增加,语义网(Semantic Web,又称语义Web)作为研究和处理海量信息的先进技术成为Web信息研究领域的主要目标之一。语义Web改进了
随着面向银行等典型行业的支持事务处理、信息服务、金融计算应用的深入发展,对计算机系统的计算性能要求不断提高的同时,还要求其能够高速地、不间断地、实时处理各类事务处
VoIP是当前最流行的通讯词汇,它的应用正变得越来越广泛,且几乎涉及到每一个行业。而企业集团IP分布式呼叫中心系统则是最近出现的朝阳产业,它给企业带来了新的机遇和运行模
网络模拟由于其成本低廉、模拟精确度高等特点,越来越受网络研究人员的青睐,成为研究网络行为的必不可少的手段。然而,由于硬件资源的限制,现有网络模拟工具无法完成对大规模
视频广告为商业繁荣发挥了积极作用。电视广告中也存在着虚假违法、内容庸俗、夸大宣传等现象,造成了恶劣的社会影响,损害了媒体的社会公信力。同时,违规网络视频广告也呈泛
随着网络规模不断扩大,网络复杂性不断增加,网络故障问题越来越突出。本文针对传统故障诊断中存在的问题,深入地研究了关联规则挖掘与分类挖掘两种数据挖掘方法,并应用于故障