论文部分内容阅读
由于数码相机和拍照手机等图像采集设备的日益普及,加上互联网向人们日常生活的迅速延伸,互联网上数字图片的数量呈几何级数递增。为了使人们可以方便快捷的从浩如烟海的网络图片资源中找到所需要的图片,研究开发界面友好、功能丰富、精确高效的图像搜索系统尤为重要。一个完整的图像搜索系统包含三个层面的内容:搜索输入层面、搜索算法层面和搜索结果展示层面,分别对应于图像搜索流程中的输入搜索查询、执行图像搜索和呈现搜索结果三个环节。本论文研究提出了基于跨媒体信息和高效图像编码算法的图像搜索若干关键技术,通过使用跨媒体信息和高效图像编码算法,分别从这三个层面对传统的图像搜索系统进行扩展和改进。首先,论文研究利用跨媒体信息,分别从搜索输入层面入手拓展了图像搜索系统的能力,从搜索算法层面入手增强了图像搜索系统的性能,从搜索结果展示层面入手探索了一种新的图像搜索结果呈现方式――图文摘要。另外,论文还为搜索结果展示层面设计了一种高效的图像压缩编码算法,可以有效提高图像搜索结果呈现的实时性,改善用户的图像搜索体验。具体来说,在搜索输入层面,论文提出了一种基于实体概念分布图的图像搜索技术,引入了一种全新的图像查询――实体概念分布图,并设计了对应的基于跨媒体信息的图像相关度评估方法,可以解决传统图像搜索系统难以应付的一类图像搜索问题――用户的搜索需求同时包含语义约束和视觉内容约束。在搜索算法层面,论文提出了一种基于文档相互约束的图模型,利用跨媒体信息提高对图文相关度评估的准确率,减轻噪声文字对图像搜索的干扰,最终达到增强图像搜索性能的效果。在搜索结果呈现层面,论文尝试了一种新的图像搜索结果呈现形式,提出了一种跨媒体代表性选举方法,利用跨媒体信息为图像搜索结果同时生成图片摘要和文本摘要,以方便用户直观的掌握搜索结果的概貌。论文还提出了一种基于方向余弦变换的图像压缩编码算法,有效减小了图像数据大小,加速了图像搜索结果的呈现。经过精心的实验设计和验证,论文提出的基于跨媒体信息和高效图像编码算法的图像搜索若干关键技术,在图像搜索的各个层面都展示出令人满意的性能,能够有效改善用户的图像搜索体验。