论文部分内容阅读
MIML (Multi-Instance Multi-Label learning,多示例多标记学习)是一种新型机器学习框架,在对复杂数据对象、尤其是多义性对象的学习方面有显著优越性,受到很多研究者关注。近年来MIML学习理论与方法方面都有很多进展,并已被广泛应用于图像分类、视频标注、网页分类、基因表达模式分析、蛋白质功能结构分析等。以往研究都假设每个训练样本都包含完整的多标记,然而在现实应用中,数据样本的标记往往不完整,这样的情况被称为“弱标记”。如何在弱标记条件下进行有效的MIML学习,是一个有待解决的问题。本文对弱标记MIML学习方法进行研究,主要做了以下工作:(1)提出一种能有效进行弱标记MIML学习的MIMLwel方法。该方法假设高度相关的标记会共同拥有一些示例,而每个标记所对应的正、反例中心符合大间隔划分,从而通过块坐标下降法有效地利用示例与标记间的关系进行弱标记学习。实验验证了MIMLwel的有效性。(2)提出一种能通过删减冗余示例来提高弱标记MIML学习效率的MIMLwel-ins方法。该方法假设冗余示例被删减后,每个标记所对应的正、反例划分间隔会有效增大,从而在寻找冗余示例的同时补全缺失标记。实验显示出该方法值得进一步探索。