融合多线索特征的照片人物聚类

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:sdwfzhd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数码相机和拍照手机产品的广泛应用催生了海量照片,个人电子照片库越来越庞大。与此同时,社交网络的流行带动着个人照片的大量分享,例如Facebook、Fliekr、人人网、微博和开心网。海量照片带来一个问题:如何管理这些照片。一般来说,对照片的管理主要通过三个维度:时间、地点和人物。在这三个维度中,人们往往更愿意通过照片中的人物来进行管理,比如依据照片中包含的朋友和家人来进行分类。若没有协助分类的工具只是手动标注,工作量将非常巨大。因此,用户对实用的照片管理工具的需求非常旺盛。本文对基于人物的照片库组织和管理进行研究,所完成的主要工作如下:   (1)设计了照片人物自动标注系统的框架,并基于此框架实现了一个标注系统。由于照片中情况千变万化,人脸识别技术尚不足以完全应对,只依靠无监督(半监督)的聚类算法进行自动标注无法达到理想性能,为了使标注结果准确无误,需要得到人工交互的支持。而对用户来说,人工交互如果过于复杂,交互频率过高,则容易失去使用的耐心。因此,本文解决方案的主要思路是:使用半监督聚类算法和一些机制协助用户交互,以达到减小交互代价(用户交互数和难度)最终实现照片中人物准确标注的目的。   (2)提出了一种聚类评价方法,该方法能够有效判定聚类结果对于后续人工交互操作的影响,通过实验证明,通过该方法能够筛选出具有最小交互代价的聚类结果。   (3)设计并实现了一种用于人物聚类的多特征提取与融合方法,包括人脸、头发和衣服三种信息的特征提取方法,并通过实验对比了各种融合方法的不同效果,以此为基础选择了最佳的方案。   (4)设计了获取监督信息的机制,分别从聚类前和聚类后两个角度加以考虑,设计了直接获取和协助获取两种模块。实验表明,通过该机制能够更高效地获取监督信息,有助于聚类算法收敛到准确的标注结果。   本文基于上述技术实现了照片标注系统,将该系统的功能与Google公司的图片管理软件Picasa3.9中“按人物管理照片”功能进行了对比,本文系统的交互次数较Picasa3.9减少30%以上。
其他文献
医学图像作为重要的可视化手段,在临床诊断和治疗、医学教育和培训以及医学研究和交流上都有不可替代的作用。随着计算机软硬件技术的发展,医学图像中的目标识别、分类、分割和
由于混沌系统具有对初始条件和系统参数的极端敏感性、连续宽带谱、遍历性、有界性、内在随机性、分维性、普适性和统计特征等,使得混沌系统的研究得到了飞速的发展,特别是其
随着物联网的迅猛发展,射频识别技术(Radio Frequency Identification,简称RFID)作为物联网发展的排头兵,已经成了市场最关注的技术。简单的RFID系统,加上中间件、网络技术、
测定生物大分子空间结构是揭示蛋白质分子功能、阐明其相互作用规律的重要基础。近年来,在更易描述分子形态的球坐标系下,使用抑制噪声功能更强的ISAF基函数进行单颗粒三维重
基于Modelica语言的多领域统一建模与仿真是处理复杂物理系统的有效手段,因而在智能制造业中得到广泛应用。由于多领域统一建模具有非因果的特性,使得基于Modelica的复杂仿真模
传感器节点在监测区域内监测信息,比如温度、湿度、光照、压强等,并将监测到的消息发送给汇聚节点,汇聚节点通过互联网将信息传给观察者。  与传统无线网络相比无线传感器网络
移动对象的轨迹预测是一种积极的管理策略,也是一种智能的管理策略。各种便携式移动通信设备被逐步安装到车辆等移动对象上,交通管理系统从而积累了各种移动对象的大量轨迹。在
物流链中企业之间存在着大量的电子表单交换需求,如订货单、发货单、入库确认单等。由于交互的企业之间使用的操作系统不一致、应用系统不一致、数据格式不一致,这些异构表单的
网络集中存储系统是数据处理集群存储和共享数据的一种重要方式,它有着高密度,易共享,高可靠,易管理等优点。随着数据存储和处理需求的爆炸性增长,以及计算能力的快速发展,传
无线多跳网络已经逐步成为向无线终端提供接入服务的主要网络形式,是移动互联网接入网的重要组成部分。无线多跳网络的开放、自组织和多跳特性使得保障接入安全面临很大挑战,