【摘 要】
:
近年来,以人工智能为代表的计算机技术在实际应用中逐步推广,使得零售行业发生巨大变化。尤其是人脸识别、移动支付、云计算等技术的普及,催生了无人便利店、无人自动售货机以及无人售货架等三种主要的新型消费形态,亦即人们常说的“无人零售”。当前,在新冠疫情的冲击下,无人零售的智能化、便捷性和无接触等特点使其逐渐得到大众的认可。但是,当前公开的无人零售数据集较少,因此需要实现图像的快速采集。同时,一些无人零售
论文部分内容阅读
近年来,以人工智能为代表的计算机技术在实际应用中逐步推广,使得零售行业发生巨大变化。尤其是人脸识别、移动支付、云计算等技术的普及,催生了无人便利店、无人自动售货机以及无人售货架等三种主要的新型消费形态,亦即人们常说的“无人零售”。当前,在新冠疫情的冲击下,无人零售的智能化、便捷性和无接触等特点使其逐渐得到大众的认可。但是,当前公开的无人零售数据集较少,因此需要实现图像的快速采集。同时,一些无人零售柜对饮料的种类和摆放都有较大限制,除了拍摄识别外还需传感器的辅助,这也增加了饮料识别中的不确定性。因此,只用单一摄像头进行无人零售中的饮料识别既需要较高的准确率,又要保持实时性,该方向也成为了相关研究的重点。针对人工采集数据成本高和标注效率低的问题,本文设计了一种可以对饮料拍摄图像的数据采集装置。该装置能够自动连续拍摄,高效地采集到足够数量的不同种饮料组合图像,并提供快速标注。基于上述数据采集装置构建的数据集,本文采用主流目标检测算法训练,以得到相应的饮料识别模型。其中,针对原始模型实时性欠佳的问题,本文在传统目标检测算法的基础上提出Multilocal Net,其采用类激活方式提取局部特征传导至骨干网络部分和全局信息共同训练,并分别设置全局流和局部流的交叉熵损失函数。经过与传统算法的对比,在保证准确率的情况下提高了实时性。针对真实场景中对目标域图像识别精度较低的问题,在数据层面上进行不同场景的融合,提高模型跨场景的泛化识别能力。使用装置采集的图像和少量的无人零售柜图像这两种场景组成的数据集时需要降低场景对饮料识别的影响,因此从数据增强和注意力机制两个方面进行改进。经过实验验证,数据增强方法Mosaic和Mixup可以模拟部分遮挡或者模糊的真实场景,一定程度上提高模型的泛化能力。在网络结构方面,为使模型对真实无人零售场景更敏感,设计了带有域注意权重的SE适配器组模块,在主干网络中使用该模块比基础网络的准确率提高1.6个百分点,在跨场景的识别效果的提升上最为显著。
其他文献
哈尔滨独特的地理位置,特殊的气候条件,别具一格的饮食习惯造就了独树一帜的冰雪文化。哈尔滨冰雪主题公园作为哈尔滨冰雪文化的物质载体,是展现哈尔滨城市形象的个性化名片。本研究以情感化理念为视角,构建了情感化理念与冰雪主题公园景观设计的关联性,通过了解游客对哈尔滨冰雪主题公园景观设计需求和评价,发现了哈尔滨冰雪主题公园景观设计的现存问题,制定了设计策略。本研究分为四个部分。首先,在阅读大量文献基础上确立
目的:基于单细胞转录组测序(sc RNA-seq)研究参与红外激光致小鼠角膜损伤修复的细胞及其在修复中变化,探讨激光角膜损伤修复机制。方法:采用连续输出的3.74μm远红外激光照射C57BL/6J小鼠角膜,光斑直径2mm,照射时间0.8s,辐照量为23.2J/cm~2。于损伤前和损伤后3h、6h、12h、1d、3d、7d、14d和21d,采用组织病理技术,观察角膜损伤特点和损伤修复过程;使用10X
知识蒸馏是知识迁移的一种实现方式,它使用训练好的复杂的教师模型来训练简单的学生模型,其中学生基于教师模型各类别上的预测概率,学习其中蕴含的暗知识,使得简单模型的分类性能可接近复杂模型的分类性能。知识蒸馏实际上是学生模型学习教师模型决策边界的过程,样本越靠近决策边界,学生模型学习的效果越好。因此,如何得到并更好的利用位于教师模型的决策边界附近的边界样本是知识蒸馏的核心问题之一。针对以上问题,本文利用
后基因组时代进一步研究的关键在于全面理解生物蛋白编码的表达、调控以及功能。对蛋白质进行功能注释是当前遗传学领域的重要研究课题之一,有助于科学家从分子层面理解生物体复杂的细胞机制,在揭示遗传密码和理解生命活动等问题中起着关键作用。蛋白质功能预测旨在利用计算方法自动注释蛋白质功能,近期的工作主要集中在利用深度学习避免复杂的特征工程,但这些模型普遍存在数据利用率不高的问题:一方面,通过监督学习提取序列特
自2000年以来,全球研究机构和国际卫生组织深入调查了环境噪声对人类健康的不良影响,并发现过度暴露于噪声环境会增加心脏病风险、睡眠障碍、儿童认知障碍以及与压力相关的心理健康风险。全球七成人口依水而居,宽阔的水面空间给人们带来了强烈的归属感。但现阶段,滨水空间的实证研究和视听环境恢复作用研究相对较少,尚未形成系统的研究体系。因此,如何指导设计师有效地优化滨水步道空间视听环境,提升滨水步道空间对人的压
目的:肝癌是世界上最常见的恶性肿瘤之一,影响着全世界。肝细胞癌(hepatocellular carcinoma,HCC)是原发性肝癌的主要组织学类型。而蛋白质翻译后修饰(post-translational modification,PTM)广泛发生在许多肿瘤转化过程的关键信号通路。磷酸化是肝细胞癌中广泛研究的蛋白质翻译后修饰。有文献报道,p65磷酸化修饰与癌症相关,促进癌症的进展。课题组前期研
对于肿瘤成像引导的光动力治疗过程,在可见光激发条件下同时实现高荧光效率和高单线态氧产率已成为诊断与治疗一体化的主要障碍。由于缺乏有效的方法来解决这一问题,因此构建高量子产率、高效单线态氧产率、稳定的红光发射、优良的光稳定性和低暗毒性的单一光敏剂具有挑战性。在本研究中,通过将一种新型聚合物(J71)巧妙地结合到疏水共轭聚合物中,设计出一种具有优良成像和强大光动力治疗能力的有效供体-受体系统,从而突破
随着多媒体技术的发展,频繁的信息交互加剧了网络图像的隐私暴露问题。特别是在医疗、军事和金融领域内,图像经常包含大量的敏感信息。秘密图像共享是一个有效保证图像隐私性和安全性的方法,具有重要的研究意义和实用价值。目前,基于共享矩阵的秘密图像共享方法在该领域得到了广泛应用。但是,该方法在构建共享矩阵的过程中会产生大量重复列,进而导致生成的矩阵存在数据冗余的问题,并且在运用共享矩阵进行逻辑与操作时会导致信
糖尿病肾病(Diabetic kidney disease,DKD)是糖尿病(Diabetes mellitus,DM)最常见的微血管并发症之一。如果不加以治疗,患者最终发展成终末期肾病(End-stage renal disease,ESRD)。肾小球的纤维化是DKD主要的病理特征,在纤维化的过程中人肾小球系膜细胞(human mesangial cells,HMCs)外基质堆积被认为是纤维化的
背景:RhoA-ROCK通路介导了神经细胞的许多生理和病理过程,如细胞的伸展、收缩和损伤后再生长相关过程均受到此通路的调节。有研究表明Rho A-ROCK通路的抑制,可促进神经细胞的生长,并且ROCK2起到了主导的作用。最新研究表明,H2S通过促进Rho A的磷酸化,对缺血性脑损伤起到了保护作用,但未明确H2S和ROCK2蛋白之间的具体机制。H2S能否对ROCK2的磷酸化修饰产生影响,以及此修饰对