论文部分内容阅读
近年来,社交媒体、监控摄像头、生物识别传感器和社交媒体产生的数据迅速增长。大量的可视化数据对机器学习方法提出了更高的要求。同时,数据来源多样、标签信息弱等问题使得传统的机器学习模型和特征提取方法面临着更为严峻的挑战。如何挖掘和利用多源信息、建立机器学习模型来有效地处理多媒体大数据是本文研究的目标。结合多源异构数据融合学习和弱监督学习两个研究点,本文提出了一系列的方法,主要研究内容和贡献如下: 1.提出多源的图像特征融合学习模型。本文聚焦于路面裂纹自动检测,研究如何有效融合多源图像特征,并提出了一个高效的路面裂纹检测方法Crack-Forest。通过有效地融合来自多源的特征,即传统裂纹检测特征以及积分通道特征,重新定义了构成裂纹的局部结构,从而得到更好的裂纹表示。接着,随机结构森林对得到的特征集合进行了特征选择,并将裂纹的局部结构聚类。利用局部结构的出现和共现信息,本文提出了一个新颖的裂纹描述符。它能够准确的区分裂纹和噪声,并在裂纹检测中有效地消除噪声的影响。实验结果证明了CrackForest的有效性。此外,本文作者收集整理了一个手工标注的中国城市路面裂纹图像数据集,并提出了两个裂纹检测评价指标,为后续相关研究提供了基准数据集。 2.提出基于多视角学习的多模态数据检索模型。数据往往具有异构性,即含有多个模态(图像和文本)、多个视角(不同的特征)以及不同的数据类别。不同的特征描述对象的不同方面,并且提供了互补的信息。本文提出了一个跨模态检索框架MCTD。通过建立张量模型,MCTD有效地融合了来自多模态多视角的特征,探索了特征之间的关联性,并避免了稠密视角在特征空间的主导问题。MCTD率先性地将张量分解技术应用到多模态多视角特征融合中,找到不同模态间共同的潜在语义空间,为理解信息实体提供了更全面的信息,从而获得了更好的检索结果。大量的实验验证了MCTD的性能,并证明了特征关联性的作用。 3.提出噪声数据的弱监督学习模型。作为一种弱监督学习问题,比例标签学习是近年来备受关注的一种新的学习问题。不同于监督学习,在该问题中,实例是以包的形式给出的,并且每个包的标签比例已知,每个实例的标签未知。比例标签学习方法被广泛地应用于预测投票和垃圾邮件过滤等场景。本文分析了比例学习问题中噪声的来源,并通过引入pinball损失,提出了一个新颖的比例标签学习方法,称为“pSVM-pin”。该方法可以将经验损失和比例损失整合进同一个模型中,并通过最大化类间分位数距离,有效地消除了噪声的影响。本文通过交替地预测未知的示例标签和求解分类超平面,来求解该问题。本文通过一个人工数据集展示了pSVM-pin的稳定性,并在UCI数据集上证明了算法的性能,最后通过一个真实案例说明了pSVM-pin的可行性。