图像语义自动标注方法的研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:wori123ri123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数码相机、拍照手机等有成像功能的数码产品的普及导致图像的获取越来越容易,同时,计算机网络的普及、微博的流行以及Flickr等图像共享社区的成熟,使图像数据的传播越来越容易,这两点最终导致了图像数据的爆炸式增长,这就要求与之适应的图像数据的管理和理解能力。图像语义自动标注技术就是图像数据管理和理解的有效手段。本文在介绍了图像语义自动标注的一些基础知识和相关工作之后,主要围绕图像标注如何缩减语义鸿沟、提升标注效果和提高标注效率开展研究。主要研究工作及创新如下:(1)深入研究了图像自动标注方法中的跨媒体相关模型(Cross Media Relevance Model, CMRM),在它的基础上作了一定的改进:1)CMRM算法中,图像仅使用一种基于图像分割技术的blob表达,为了避开在自动标注过程中使用图像分割技术,以及表达图像不同方面的信息,我们使用了其他两种图像表达方式(基于图像的栅格化划分和图像的显著点检测)来共同表达图像;2)考虑标注词与标注词之间的共现关系,称这种共现关系为文本主题,使用标注词的多项式分布来描述文本主题,在图像标注过程中,联合不同文本主题下标注词的概率来标注测试图像,通过实验证明了这种改进提高了标注准确度。(2)提出了一种融合支持向量机和多伯努利模型的分层图像语义自动标注方法,该分层的图像语义自动标注方法首先利用聚类算法对所有训练图像进行聚类,将视觉上相似的图像聚为一类,每个聚类用SVM构建一个分类器,然后对一幅待标注图像,用分类器给待标注图像加上类别标签,类别标签对应的训练图像集合作为待标注图像的相似图像,作为MBRM模型的训练图像,来给图像作标注。在研究该方法的过程中,为了使得后续的标注结果更准确,我们在聚类过程中,改进了k均值聚类算法,考虑在聚类的每个类别中每维特征对该类别影响的不同,赋予不同的权值,最终提高聚类的准确度。
其他文献
芭蕾舞以其"开、绷、直、立"四个动作原则,对高校体育舞蹈教学在艺术感、审美能力、艺术表现力等方面存在耦合点,笔者在探究了芭蕾训练的内涵及动作要素后,解析了高校体育舞
一、细菌性烂鳃病与寄生虫性烂鳃病 1.病鱼相同症状。烂鳃病为鱼种至成鱼养殖阶段的主要病害,流行于夏、秋季,对草鱼、青鱼危害最大。引起烂鳃病的病原体有细菌和寄生虫两种,
国际化是全球经济一体化对高职教育提出的新任务。通过研究高职教育国际化的内涵和面临的挑战,探索高职教育国际化的实现途径,提出高职院校应通过融入国际社会、建立质量体系
在备春耕季节,市场上肥料品种较平时多,价格适中,这时选购化肥,可以适当降低生产成本,但选购时需要注意几个问题。首先让我们了解一下肥料的基本知识,根据肥料含有氮、磷、钾这3种
动物最初是生物学概念,但在人类社会的发展中慢慢演变出在不同的学科领域,其含义所指有不同的范围。本文旨在探究动物的法律保护问题,而这又离不开动物的本质含义。什么是动