【摘 要】
:
随着大数据时代的到来,特别是智能数据的兴起,图像数据不仅仅成为海量的深数据,还进一步成为了高维的宽数据。面对如此海量、高维的大规模图像数据,如何快速且有效地对其进行
论文部分内容阅读
随着大数据时代的到来,特别是智能数据的兴起,图像数据不仅仅成为海量的深数据,还进一步成为了高维的宽数据。面对如此海量、高维的大规模图像数据,如何快速且有效地对其进行检索、分类并且能够从中提取有利用价值的内容,已经成为了现代科技社会研究的热点。而图像特征表示与分类技术作为机器学习和数据挖掘等领域的重要组成部分也已经被广泛地应用于诸多领域。在现有的矩阵分解技术中,非负矩阵分解(NMF)作为数据表示的一种有效方法已经获得了广泛地关注和深入地研究。因此,对NMF进行探索具有一定的实际意义。本文在NMF算法的基础上,主要研究如何将多种约束施加于NMF框架中、如何有效地融合NMF分解的特征以及如何更好地将NMF算法与图像分类相结合。针对以上的研究内容,本文提出了3种改进的NMF方法:(1)基于图正则化和稀疏约束的增量型非负矩阵分解算法。该算法既保留了几何的部分结构,又充分利用上一步的结果增量地学习,同时对系数矩阵施加稀疏性限制,最后将其整合于同一个目标函数中,在降低运算时间的同时,还具有较好的分类准确率;(2)基于特征融合的多约束非负矩阵分解算法。该算法在各种约束的基础上不仅考虑了少量已知样本的类别信息和稀疏约束,还对其进行了图正则化处理,而且将分解后的具有不同稀疏度的图像特征进行了融合,从而增强了算法的聚类性能和有效性;(3)基于双图正则的半监督非负矩阵分解算法。该算法同时考虑了数据流形和特征流形的几何结构,并且将已知的标签信息约束到NMF中,在改善学习质量的同时极大地提高了算法的识别性能。本文分别对提出的三种改进的算法进行了收敛性、稀疏性和识别性的验证,并在常用的人脸及物体数据集上证明了三种方法的可行性,根据实验结果可以进一步分析出三种新方法的有效性。最后,对三种算法的聚类效果进行了比较,结果显示基于双图正则的半监督非负矩阵分解算法最优。
其他文献
当两种不同密度流体的分界面受到一个外力或加速度(加速度方向从轻流体指向重流体)作用,界面上的初始扰动不断增长,并最终导致湍流混合,这种界面不稳定性通常被称为Rayleigh-
在先进的电化学储能装置中,锂硫电池(Lithium-sulfur battery,LSB)由于高理论比容量(1675 m Ah g-1)和能量密度(2600 Wh kg-1),硫正极的极低成本和无毒性等优势使其成为极具潜
现有的哈耶克思想研究主要围绕其自由理论、社会理论及法律理论三个面向进行,但哈耶克思想的诸多细致内容很难通过上述宏观的理论阐释得到详尽的说明,研究有待于细致和深入。
随着测量技术的发展,人们可以获得大量的观测数据,通过获得的数据推断系统的动力学,称为动力学重构问题。目前,人们已从不同角度提出了一些重构方法,然而,当测量环境带来的测量误差较强时,大多数重构方法就不再有效了。Chen.Y等人提出了高阶关联矩阵重构方法(High-order correlation computation,简称HOCC),可以有效地对强系统噪声下的非线性动力学系统进行重构。但在测量噪
目前国际上正在大力发展第四代同步辐射光源——衍射极限储存环,其束流发射度设计值达到了百皮米甚至十皮米级水平。为了降低束流发射度,衍射极限储存环设计都采用MBA(multi-
1型糖尿病(Type 1 diabetes mellitus,T1DM)是自身免疫性疾病的一种,受T细胞的调节。干细胞治疗是一种非常有前景的治疗T1DM的新型疗法。目的:探究应用人脐带间充质干细胞(Hu
近20多年来我国经济快速发展,钢筋混凝土结构在建筑市场中占很大的比例,当结构出现性能退化或服役条件变更而不能继续以当前状态工作时,为了节约成本、便于施工,首要考虑的就
20世纪80年代以来,不断提高的市场化水平,使得处于弱势地位的农民为了降低交易成本、发展规模化经济、提高自身的市场竞争力,开始自主组织合作社。《中华人民共和国农民专业
随着三维成像、计算机图形、图像学及通信技术等的发展,人造的或现实的三维物体以数字产品的的形式进入到了生活、军事、科技、工业等各个领域。三维数字模型的应用为人们的
氨气是肉鸡养殖环境中对肉鸡健康危害最大的气体污染物,对肉鸡生长和健康造成不可忽视的影响。本试验利用呼吸控制舱研究了不同氨气浓度对肉鸡行为、生产性能、肺组织形态、