针对零售货柜图像的对象分割与生成方法

来源 :清华大学 | 被引量 : 0次 | 上传用户:play5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从输入图像中分割得到不同物体的语义块信息,是图像分割、语义识别领域的重要研究问题。而该问题的逆问题,基于语义信息生成逼真的指定物体图像,同样是图像合成领域的重要问题。本论文针对货柜零售商品的图像分割和生成这一实际应用问题,对上述这对互逆的问题展开研究,提出了一套行之有效的方法,能够满足多样化场景下商品对象分割的需求,同时能生成单商品和多商品的图像数据。首先,对于商品对象的分割问题,设计并实现了一种基于逐步放宽固定背景假设的商品对象分割方法,以实现在不同场景下商品对象的准确分割。该方法以固定背景为基础假设,借助采集设备及计算得到的先验图来实现对商品对象的自动分割。对于倒影等破坏固定背景假设的场景,借助多相机生成可视外壳并进一步将其投影到图像,形成可视外壳约束来进行倒影去除的分割优化。在多个运动物体同时出现在固定场景的情况,利用面向图像序列分割的深度学习方法,从粗到细逐步学习特定目标物体的特征信息,从而实现有筛选的商品对象分割。在定性定量实验中,超60%的用户倾向和平均90%以上的倒影去除率表明本文方法能针对不同场景图像中的商品对象进行有效分割。其次,对于逆向的商品对象的图像生成问题,提出了一种基于生成对抗网络的商品图像生成方法,以期望在提供少量指导信息的情况下,实现高质量逼真图像的生成。无需对商品对象的类别进行约束时,使用随机噪声进行单个商品图像的生成;在需指定生成图像的单个商品对象类别时,借助语义信息来辅助指导。在进行多商品对象图像生成时,使用基于包围矩形表示的语义标注图简化数据标注工作,并减少所需提供的指导信息;此外,转换器-增强器这一框架结构使得转换器专注于从粗粒度上将语义信息转换为图像,而增强器专注于在细粒度上提升图像的细节。定量实验表明,在结构相似性和峰值信噪比这两个图像生成质量指标上,本文方法相对基线方法分别有3.04%和1.04%以上的提升。在定性实验中,超50%的用户倾向也表明了本文商品对象图像生成算法的有效性。
其他文献
由于偶氮苯高效的光异构化且顺反异构体间的结构差异大,被广泛用作光致开关;另一方面,偶氮苯衍生物和碱基大小相近,极性分布类似,可通过巧妙的分子设计,调控核酸结构、RNA沉
随着直流输电技术的快速发展,对电网设备智能化的要求也逐步提高,交流滤波器作为换流站内最主要的组成设备之一,具有滤除谐波和无功补偿的功能。在直流系统启停和稳定运行的
在社会文明高度发展的今天,收视群体的收视品味逐渐提升,影视作品中“戏中戏”结构受到了广大观众群体的追捧和喜爱。所谓“戏中戏”结构指的是一部剧中套演该戏剧本身之外的
激光跟踪仪已成为工业机器人、数控机床等高端装备运动精度检测的主要方式。然而目前激光跟踪仪价格昂贵,不能适应中国工业的发展。因此,研制一种测量原理相对简单、测量精度
曲面压电结构因其具有三维构形,能够实现空间信息的全向感知、响应和转换,在航空航海、工业控制、生物医学等领域得到了广泛的应用。目前,小尺寸的曲面压电结构的制备工艺复
卵巢癌是一种常见的女性生殖器官肿瘤,在我国,卵巢癌新增患者人数和死亡人数都在逐年增加,其发病率高,且致死率占女性恶性肿瘤第一位,严重威胁了女性的身体健康。目前,卵巢癌
现代的人们越来越重视自身的健康,因此,大多数人在工作之余,会投入越来越多的时间在运动健身上。人在运动过程中可能会发生运动损伤,然而在做康复性训练的过程中,有可能因为
近些年来国内兴起了研究国学的热潮,受此影响,全国各地的中小学也纷纷在各自学校教育体系中新增加了国学教育的内容,然而目前尚在起步阶段,对于如何在教学中渗透国学内容成为
无线传感器网络(Wireless Sensor Network,WSN)随着微电子技术、计算技术以及无线通信技术的不断发展而日趋成熟,在国防军事、环境监测、交通管理、医疗卫生和生产制造等众多领域得到了广泛的应用。大量具有数据感知、信息处理和无线通信能力的传感器节点以多跳、自组织的方式构成无线传感器网络。然而,由于传感器节点的能量及计算能力受限,在实际应用过程中极容易受环境因素影响而发生链路或节点故
随着智能手机的出现与GPS技术的快速发展,越来越多的位置社交网络逐渐产生并被用户所应用,它能为用户提供多种功能,包括分享位置、发表评论以及与好友建立连接等,极大的丰富了人们的生活。而用户量的递增也直接导致了数据量的指数性增长,例如Foursquare,其作为最流行的位置社交网络包含了至少五千万个用户以及一千万个兴趣点,在这海量数据的背景下用户无法精准高效地获取自己想要的信息,对此个性化兴趣点推荐系