论文部分内容阅读
互联网的迅猛发展给人们带来了巨大的方便,已成为人们交流沟通的重要渠道,同时,也给我们带来了巨大的挑战。在网络上,充斥着大量有关色情、暴力、反动和邪教等的有害信息。不仅危害未成年人的身心健康,而且严重威胁国家安全和社会稳定,有必要建立和完善面向互联网的舆情监控和预警机制。针对近年来日益突出的群体性事件,互联网上的信息传播已成为推助事态扩大化的重要原因。面向互联网上敏感信息的搜索和监控是群体性事件的早期预警以及防止其负面影响蔓延的有效手段。本文设计并实现了一种面向互联网的群体性事件敏感内容的图像检索系统。利用该系统可以发现互联网上类似的群体性事件图片及其相关网页。由于互联网图片数量巨大、图像特征维数过高,影响了系统的响应速度。本系统改进了现有的图像特征提取算法,利用维数约简技术,降低并优化图像特征维数,提高了系统的查询速度。论文系统地论述了面向互联网敏感内容图像检索系统的设计与实现。具体地说,主要进行了以下几方面的工作:首先,论文介绍了面向互联网敏感内容图像检索系统的需求分析和总体设计,对系统的软硬件环境和开发平台进行说明。在系统性能和系统功能分析的基础上,提出了本系统开发的总体原则,总结了系统预计实现的主要基本功能。论述了主题网络爬虫的工作流程和实现思路,以及系统数据库的设计。其次,论文对图像特征提取算法进行了研究,提出了基于图嵌入框架的图像维数约简的图像特征提取方法。通过维数约简,图像的原始特征维度得以降低,并得到优化的特征子集,能够更好地检索出相似性图像。与现有主要方法比较,本文方法的有效性在国际测试图像集中得以验证。同时,本系统引入用户相关反馈技术,通过用户对检索结果的评分,根据用户反馈信息对图像相似性重新排序,得到二次优化结果,此过程可反复进行,有利于捕捉用户的真实意图。再次,论文阐述了系统的详细设计与实现。根据面向对象程序设计方法,介绍了系统各主要模块涉及到的具有代表性的类的结构设计及其实现的核心代码。结合群体性事件的相关实际图片,展示了系统的用户界面和使用流程,说明了系统的检索结果。然后,论文研究了基于GPU硬件加速的系统优化设计。简要介绍了CUDA系统架构,并详细说明了CUDA+VS2008环境的搭建。根据系统并行性的分析,对HSV特征值的计算模块移植到CUDA中。通过实验测试,验证了该方法的可行性。最后,论文总结了全文的主要工作以及不足,提出了进一步扩展研究的可能方向。