基于机器学习的图像内容分析与存储方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:Fish_FF1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的普及以及各种应用平台的高速发展,数据的爆炸式增长对数据分析与存储形成了巨大挑战。针对大规模图像分析应用,存储读取数据时的时间延迟成为制约此项应用的重要问题。图像应用与存储间的语义信息不对称是造成这一问题的根本原因。针对内容语义分析问题,近年来,智能化计算成为主要的研究方向。其中,机器学习因为具有线下学习,线上生成的特点而成为研究热点。针对图像内容语义问题,机器学习能够完成内容语义关联、分类、标注和Hash映射等任务,为大规模环境下应用图像语义并提升语义分析能力提供算法支持。面向图像的机器学习算法从学习过程上分为浅层学习与深度学习两种。前者需要先通过传统图像分析方法提取特征,然后利用浅层学习的方法完成任务。后者通过卷积神经网络与任务网络进行端到端的学习完成任务。浅层学习由于割裂了特征提取与任务间的关系,从而降低了任务的准确率,进而被深度学习所取代。深度学习能够串联学习特征提取与任务间的逻辑关系,但是由于参数难以设计,其应用广泛性受到制约。针对以上的特点,研究分别以浅层学习与深度学习为基础对图像标注,图像Hash和图像存储展开具体实践。图像标注是图像内容语义分析中的重要议题。标注能够建立起图像内容与语义间的分类关系。为解决标注应用中,单视图特征效果不稳定的问题,算法引入浅层学习机制下的集成学习方式融合多种特征,提出多视图多标签的标注方法MVML。算法使用BOF,VLAD和PHOG三种方法提取特征,以SVM为基础学习器进行集成融合。算法针对平衡样本和非平衡样本的训练数据集提出Bagging和Boosting两种学习方式,并创新性地使用验证集进行基础学习器的权重学习。在Label Me和VOC2012数据集上的结果显示,MVML的效果在不同任务下都保持稳定并优于最好的单视图下效果。在与多标签标注算法MKL-SVM的对比中MVML的标注精确率在大部分时候平均高出3.5%。图像标注技术生成的内容语义信息,在大规模环境中的表达能力与比对能力具有局限性。通过0和1构建的相似性Hash因为轻便的表达方式,并且能够通过异或实现快速比对而成为替代方案。利用深度学习实现相似性Hash映射,能够提升映射前的特征相关性,但是需要解决没有Hash标签,无法进行有监督学习的问题。因此,在深度学习机制下提出一套自学习图像相似性Hash生成算法DSTH。DSTH分为标签获得与函数学习两个阶段。第一阶段中,利用国际优秀模型迁移学习得到深度特征,构建K近邻图结构,通过拉普拉斯特征值降维与二值化获取Hash标签。第二阶段中,以切片网络构建函数学习网络,使用Batch Norm作为激活函数,在欧式距离损失函数下,映射每个维度上的Hash值。实验对比了不同深度特征、函数学习网络和激活函数配置下的效果,发现通过Goog Le Net得到深度特征配合切片网络和Batch Norm激活函数能够得到更好的效果。在此方案下,实验以CIFAR-10数据集下48位和STL-10数据集下32位的Hash码,在使用分类标签和不使用分类标签情况下分别对比了其他有监督Hash算法和无监督Hash算法。结果显示DSTH在召回率精确率和按数量返回图像精确率的对比中全面占优,在按汉明距离返回精确率和按最近类别返回的码长分析中部分占优,证明DSTH生成的Hash码具有较强的近似表达能力。最后,实验利用CIFAR-100数据集相同数据不同类别的特性进行DSTH泛化表达能力测试,通过无标签学习结果验证不同分类标准下的性能。结果发现在最近3类查找精确率上差异微小,证明DSTH具有较强的泛化表达能力。为解决大规模图像分析时需要提取大量数据的问题,设计提出面向图像内容的图谱化存储系统方案。结合DSTH工作,方案引入深度学习,相似性Hash和图谱化元数据。通过深度学习得到Hash语义元数据增补元数据,并以图谱化结构构建和管理语义元数据。另外,根据图结构特点,通过改进Page Rank算法,提出以汉明距离为度量的Sem Rank节点排名算法。实验结果证明了算法的有效性与可靠性。在图检索应用实验中,证明算法能够得到时事热点,并以语义渐变方式引导用户关注热点。最后,实验通过节点在图数据库中的插入时间趋势,证明设计方案能够适用于大规模环境,为存储与应用分析搭建内容语义桥梁。
其他文献
随着信息技术和数字媒体的快速发展,以微博、个人主页、QQ为代表的自媒体的出现,标志着传统传播活动中的受众已不再是信息的接受者,同时也是信息的创造者和传播者。因此,在新
【目的】明确持续干旱胁迫对棉花叶片光谱、光合和荧光特征的影响,为筛选水分敏感指标提供理论依据。【方法】以转基因抗虫棉银瑞361为试材,采用盆栽控水方式,测定持续干旱与
2017年,联合国教科文组织提出"增强教师权能,促进教学自由"的教师发展理念,以期待更高水准的教师课程领导力服务未来世界教育的发展。现代服务业作为当前和未来经济社会发展
本文测定4类7种粘结剂与处理牛牙牙釉质、牙本质抗剪粘结强度。结果表明与树脂类粘结剂相比,含4—META、磷酸酯类,其粘结力稍有提高;而含 HEMA·GA 类,则粘结力相近似。扫描
中国是历史悠久的礼仪之邦, 汉语中有许多敬辞和谦辞。 敬辞, 即表示对别人敬重的词语; 谦辞,则是用于自我表示谦恭的词语。千百年来,中国人在人际交往中使用了许多敬辭和谦辞,这充分体现了我们中华礼仪之邦的特点,使用敬辞和谦辞还可体现一个人的文化修养。  初次见面说“久仰” ,好久不见说“久违” ;  请人批评说“指教” , 求人原谅说“包涵” ;  求人帮忙说“劳驾” , 麻烦别人说“打扰” ;  
目的:探讨用氯吡格雷联合阿司匹林治疗冠心病心绞痛的可行性。方法:选取2015年5月至2017年5月期间大悟县第一人民医院收治的100例冠心病心绞痛患者作为研究对象。根据治疗方
十九大提出实施乡村振兴战略,以从根本上解决农村农业农民问题。乡村振兴的核心是人才培养,尤其是农村实用人才的培养。作为农村实用人才培养的重要力量,农村中职教育的完善
<正>1994年7月,我从河南省劳改警察学校毕业,被分配到河南省五一农场三分场。那个时候《监狱法》还未出台,当时叫河南省劳改一支队三大队。8月1日到分场报到后,又被分到六中
期刊