论文部分内容阅读
随着多媒体和互联网技术的飞速发展,社会化媒体(social media)已成为人们传播和分享信息的重要媒介,每个用户都可以在社会化媒体中上传并分享自己的媒体信息。社会化媒体的日益流行与广泛传播也促使社会图像分享网站成为活跃于互联网上的一支新秀。 社会图像分享网站允许用户使用标签(tag)对图像进行标注,然而,由于知识背景的不同,用户标注的标签往往是杂乱且无序的。为此,对已有图像标签进行合理有效的排序,以使标签更好地诠释图像内容信息是十分必要的,社会图像标签排序(tag ranking)技术应运而生。然而,社会图像标签排序的准确率受制于图像内容特征的表征能力。近年来,视觉单词(visual words)作为描述图像特征的有效方法,表现出较好的特征表征能力。但是,现有的视觉单词往往是在无监督情况下生成的,通常会引入量化误差,从而产生很多带噪的视觉单词,降低了视觉单词的描述能力;同时,视觉单词提取过程往往比较耗时,如果面对的是普遍存在的压缩格式图像,需要先解码再进行后续处理,会进一步增加计算量。 现实生活中,人们出于文化背景以及审美观的不同,对同一幅图像会有不同的理解。在社会图像分享网站中,面对大规模的海量社会图像信息,如何快速有效地帮助用户找到感兴趣的图像信息,向用户提供个性化推荐(personalizedrecommendation)服务成为社会媒体技术进一步发展的趋势。 为此,论文对基于压缩域的社会图像标签排序与个性化推荐技术进行了初步研究,具体研究内容包括以下几个部分: (1)构建了一种压缩域社会图像的描述性视觉单词。首先,针对压缩格式的图像,利用图像压缩码流重建低分辨率图像,并提取SIFT(Scale-Invariant FeatureTransform)特征;然后通过分层K均值方法对SIFT特征聚类,构建视觉单词词汇树;最后利用PageRank原理找到各个图像类别中具有描述性的视觉单词,生成描述性视觉单词。实验结果表明所提的压缩域描述性视觉单词相比传统视觉单词具有更高的描述能力,同时较完全解码的描述性视觉单词相比,在性能相当的情况下,能显著减少处理时间。 (2)提出了一种基于近邻投票模型的社会图像标签排序方法。首先提取压缩图像的可伸缩颜色描述子(Scalable Color Descriptor,SCD),并构建颜色特征词汇树;然后联合压缩域描述性视觉单词和颜色特征建立词汇树倒排索引,进行相似性匹配来获取近邻图像;最后进行K近邻投票,根据投票结果获得各个标签与图像内容的相关性大小,从而完成对标签的排序。实验结果表明所提方法能够有效改善社会图像标签的性能,在保证标签排序性能的同时能显著减少处理时间。 (3)初步研究了一种基于标签的个性化社会图像推荐方法。首先,结合图像标签建立用户-图像-标签的三部图,构建用户兴趣模型;然后执行用户兴趣模型中的用户-图像方向以及图像-标签方向的三部图扩散;最后整合图像资源值,获取用户个性化兴趣信息,进而做出社会图像推荐。实验表明,与基于二部图的个性化推荐相比,该方法能有效提高个性化推荐的准确率。