论文部分内容阅读
近年来,数码相机和拍照手机产品的广泛应用催生了海量照片,个人电子照片库越来越庞大。与此同时,社交网络的流行带动着个人照片的大量分享,例如Facebook、Fliekr、人人网、微博和开心网。海量照片带来一个问题:如何管理这些照片。一般来说,对照片的管理主要通过三个维度:时间、地点和人物。在这三个维度中,人们往往更愿意通过照片中的人物来进行管理,比如依据照片中包含的朋友和家人来进行分类。若没有协助分类的工具只是手动标注,工作量将非常巨大。因此,用户对实用的照片管理工具的需求非常旺盛。本文对基于人物的照片库组织和管理进行研究,所完成的主要工作如下:
(1)设计了照片人物自动标注系统的框架,并基于此框架实现了一个标注系统。由于照片中情况千变万化,人脸识别技术尚不足以完全应对,只依靠无监督(半监督)的聚类算法进行自动标注无法达到理想性能,为了使标注结果准确无误,需要得到人工交互的支持。而对用户来说,人工交互如果过于复杂,交互频率过高,则容易失去使用的耐心。因此,本文解决方案的主要思路是:使用半监督聚类算法和一些机制协助用户交互,以达到减小交互代价(用户交互数和难度)最终实现照片中人物准确标注的目的。
(2)提出了一种聚类评价方法,该方法能够有效判定聚类结果对于后续人工交互操作的影响,通过实验证明,通过该方法能够筛选出具有最小交互代价的聚类结果。
(3)设计并实现了一种用于人物聚类的多特征提取与融合方法,包括人脸、头发和衣服三种信息的特征提取方法,并通过实验对比了各种融合方法的不同效果,以此为基础选择了最佳的方案。
(4)设计了获取监督信息的机制,分别从聚类前和聚类后两个角度加以考虑,设计了直接获取和协助获取两种模块。实验表明,通过该机制能够更高效地获取监督信息,有助于聚类算法收敛到准确的标注结果。
本文基于上述技术实现了照片标注系统,将该系统的功能与Google公司的图片管理软件Picasa3.9中“按人物管理照片”功能进行了对比,本文系统的交互次数较Picasa3.9减少30%以上。