基于压缩域的社会图像标签排序与个性化推荐技术的初步研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:markoliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体和互联网技术的飞速发展,社会化媒体(social media)已成为人们传播和分享信息的重要媒介,每个用户都可以在社会化媒体中上传并分享自己的媒体信息。社会化媒体的日益流行与广泛传播也促使社会图像分享网站成为活跃于互联网上的一支新秀。  社会图像分享网站允许用户使用标签(tag)对图像进行标注,然而,由于知识背景的不同,用户标注的标签往往是杂乱且无序的。为此,对已有图像标签进行合理有效的排序,以使标签更好地诠释图像内容信息是十分必要的,社会图像标签排序(tag ranking)技术应运而生。然而,社会图像标签排序的准确率受制于图像内容特征的表征能力。近年来,视觉单词(visual words)作为描述图像特征的有效方法,表现出较好的特征表征能力。但是,现有的视觉单词往往是在无监督情况下生成的,通常会引入量化误差,从而产生很多带噪的视觉单词,降低了视觉单词的描述能力;同时,视觉单词提取过程往往比较耗时,如果面对的是普遍存在的压缩格式图像,需要先解码再进行后续处理,会进一步增加计算量。  现实生活中,人们出于文化背景以及审美观的不同,对同一幅图像会有不同的理解。在社会图像分享网站中,面对大规模的海量社会图像信息,如何快速有效地帮助用户找到感兴趣的图像信息,向用户提供个性化推荐(personalizedrecommendation)服务成为社会媒体技术进一步发展的趋势。  为此,论文对基于压缩域的社会图像标签排序与个性化推荐技术进行了初步研究,具体研究内容包括以下几个部分:  (1)构建了一种压缩域社会图像的描述性视觉单词。首先,针对压缩格式的图像,利用图像压缩码流重建低分辨率图像,并提取SIFT(Scale-Invariant FeatureTransform)特征;然后通过分层K均值方法对SIFT特征聚类,构建视觉单词词汇树;最后利用PageRank原理找到各个图像类别中具有描述性的视觉单词,生成描述性视觉单词。实验结果表明所提的压缩域描述性视觉单词相比传统视觉单词具有更高的描述能力,同时较完全解码的描述性视觉单词相比,在性能相当的情况下,能显著减少处理时间。  (2)提出了一种基于近邻投票模型的社会图像标签排序方法。首先提取压缩图像的可伸缩颜色描述子(Scalable Color Descriptor,SCD),并构建颜色特征词汇树;然后联合压缩域描述性视觉单词和颜色特征建立词汇树倒排索引,进行相似性匹配来获取近邻图像;最后进行K近邻投票,根据投票结果获得各个标签与图像内容的相关性大小,从而完成对标签的排序。实验结果表明所提方法能够有效改善社会图像标签的性能,在保证标签排序性能的同时能显著减少处理时间。  (3)初步研究了一种基于标签的个性化社会图像推荐方法。首先,结合图像标签建立用户-图像-标签的三部图,构建用户兴趣模型;然后执行用户兴趣模型中的用户-图像方向以及图像-标签方向的三部图扩散;最后整合图像资源值,获取用户个性化兴趣信息,进而做出社会图像推荐。实验表明,与基于二部图的个性化推荐相比,该方法能有效提高个性化推荐的准确率。
其他文献
本文设计和实现了一个基于微机的脑电的检测与生物反馈训练系统。检测系统由三个测量电极、脑电信号放大器和数据采集卡构成。检测系统由单片机控制,能够采集数据和对采集到的
在现代微小卫星中测控通信系统是实现星地通信的桥梁,卫星通信中多普勒频移将会造成信号频差,严重影响通信质量.为了结合信息电子系统的新机理新概念的测控通信模块部分的研
红外线,简称IR,是一种无线通讯方式,常常可以使用红外线进行无线数据的传输,能够取代复杂的连接线。自1974年发明红外线以来,它已经过风风雨雨二十多年的发展,如今,已经是一种很成熟
本试验采用单一因素试验和正交试验,结合SPSS数据分析,研究了沈农一号马齿苋中黄酮类化合物的提取方法:①在有机溶剂法提取沈农一号马齿苋中黄酮类化合物的试验中,当乙醇浓度70%,提
无线多跳网络在现代通信技术研究领域中日益受到研究者的重视。但要想取得进一步发展,仍有许多技术难题需要攻克,特别是由于其独特的网络架构而带来的数据传输相关问题。  本
羊草(Leymus chinensis (Trin.) Tzvel.)又称碱草,隶属禾本科,赖草属,因其营养价值高,富含蛋白质,适口性好,抗旱,耐盐碱,耐贫瘠,抗逆性强,适应广等优点,对我国发展草原畜牧业和退化草地、荒漠化治理方面具有举足轻重的作用。近年来,由于自然环境变劣,荒漠化加剧,以及过渡放牧等不利影响,已对我国草地构成了严重威胁,严重制约了我国人工草地建设和天然草地的改良和沙化治理的步伐。
本文系统地研究了自然语言处理的方法和目前该领域的理论、技术,深入研究了汉语自动分词方法,对常用的各种分词方法做了比较研究,改进了MM方法,提高了切词效率,详细阐述了分词所用
该文分析和研究扩展卡尔曼滤波和高频信号注入在永磁同步电动机无速度传感器调速系统中的应用,分别给出基于扩展卡尔曼滤波和高频信号注入的永磁同步电动机无速度传感器调速
本研究利用16SrDNA克隆和序列分析的分子生物学方法重点分析了酒精厂污水处理系统好氧池和厌氧池污泥中Planctomycetales的分子多态性,并通过厌氧氨氧化活性的测定讨论了其中
在国家重点科技项目(攻关)计划(96-1302-05-02)的支持下,为有效开展陆地车辆定位系统与智能化导航系统的研究工作,该文对智能车辆定位与导航系统的设计理论与开发研制的关系技术