【摘 要】
:
群组行为识别是计算机视觉领域中一项具有挑战性的任务。与传统的个体行为识别相比,群组行为识别不仅需要理解场景中个体的行为,还需要推断个体之间的潜在交互关系。准确捕捉场景中的时空信息,并对个体间的交互关系进行推理是理解群组行为的关键。本文在总结现有群组行为识别方法的基础上,考虑个体行为理解对群组行为识别的重要性,致力于构建灵活有效的交互关系推理网络,主要解决群组行为识别任务中以下几个问题:第一,考虑个
论文部分内容阅读
群组行为识别是计算机视觉领域中一项具有挑战性的任务。与传统的个体行为识别相比,群组行为识别不仅需要理解场景中个体的行为,还需要推断个体之间的潜在交互关系。准确捕捉场景中的时空信息,并对个体间的交互关系进行推理是理解群组行为的关键。本文在总结现有群组行为识别方法的基础上,考虑个体行为理解对群组行为识别的重要性,致力于构建灵活有效的交互关系推理网络,主要解决群组行为识别任务中以下几个问题:第一,考虑个体行为理解对群组行为识别的影响,并在统一的框架下实现个体和群组行为的识别;第二,如何有效利用时序和空间信息提升群组行为识别准确率;第三,如何获取群组行为中个体间复杂的交互关系信息也是群组行为识别中的一个关键问题。针对这些问题,本文做出以下工作:(1)针对群组行为识别任务中时序和空间信息有效利用问题,提出了时空自注意力转换网络。空间自注意力转换模块利用注意力图模拟场景中空间瞬时注意力,自适应地为个体融合周围交互信息,并增加全局空间注意图模拟场景中长时间跨度的空间注意力;时序自注意力转换模块为场景特征进行时序建模,并增加时序掩膜提高时序建模效率,减少时序信息冗余;将个体和群组行为识别在统一的框架上实现。(2)针对群组行为识别任务中复杂的交互关系信息获取问题,提出了多社交尺度关系图网络。首先,以欧式距离衡量社交尺度,综合利用时序信息以及个体外观和位置信息,在多个社交尺度下构建个体关系图。然后,利用图卷积网络对个体关系图进行推理,获取个体间的交互关系信息,并利用层次关系信息融合网络融合多尺度交互关系信息。最后,利用长短期记忆网络捕获场景的时序信息。(3)本文提出了两个新的模型用于群组行为识别,在Volleyball和Collective activity数据集上的实验结果表明本文模型达到先进识别准确率。
其他文献
随着图数据的日益普及,图挖掘已成为图分析的一项基本任务,其中频繁子图及模式挖掘作为重要一环已经被广泛应用在各个领域,如社交网络分许、蛋白质检测、金融诈骗检测等,它们的目标是在数据图中找到出现次数频繁的子图或者模式。在社交领域中,频繁模式挖掘具有广泛的应用前景,例如在合作图中寻找频繁的合作模式,以此来知道团队的科学构成。但是在关系密集的社交图中,寻找频繁模式是一件极其耗费时间的任务,这使得现有方法难
远程光电容积描记术(remote photoplethysmography,r PPG)是一种从面部视频非接触式测量血容量脉冲(blood volume pulse,BVP)信号的技术,在压力检测、情绪分类和健康监测等领域具有广泛的应用。通过r PPG获取高质量的BVP信号,可计算多种心脏相关的生理指标。然而,现有的多数r PPG方法受所提取BVP信号质量的限制,只能计算平均心率值。本文提出了一种
呼吸率是一种重要的人体生理指标,在评估人体呼吸状况和诊断呼吸障碍疾病上具有不可替代的作用。目前呼吸率检测方法多需专业人员操作,在家庭日常检测方面尚有不足,而近些年出现的基于视频的非接触式呼吸率检测方法具有操作简便、适用性强等优点,在智慧医疗领域极具发展潜力。现有基于视频的呼吸率检测方法在实时性上仍有不足,并且对人体姿态有所限制,最终影响检测性能。针对此问题,本文进一步研究了基于运动特征的视频呼吸率
目标检测是通过摄像设备对自然场景中的物体进行捕获并分析的一种技术,广泛应用于机器导航、自动驾驶、智能监控和工业检测等诸多领域。近年来,随着无人机航拍设备的不断发展,针对其捕获的航拍图像进行目标检测备受研究人员关注,尽管通用的目标检测模型的检测能力取得了显著进展,但是由于航拍图像受拍摄角度等外界因素影响较大,且随着拍摄高度的变化,图像中物体的尺寸跨度变化较大,检测准确性较差;另外,无人机的灵活性导致
条纹投影三维形貌测量方法由于其本身的优势,已成为近年来流行的三维形貌测量技术之一。但是在测量过程中,噪声、背景区域和阴影区域等因素导致获取的点云中不可避免地存在无效点云,影响最终三维测量的精度和三维显示的效果,因此必须将其识别并剔除。在现有的方法中,很难确定一个合适的阈值来剔除这两类无效点云。针对这一问题,本文主要研究工作及创新点如下:(1)提出了一种基于提高背景区域调制度的无效点云剔除方法。首先
搜救行动在任何受灾地区都起着至关重要的作用。通常采用救援人员搜救和机器人搜救。但无人机可以作为替代方案,因为无人机比人类和地面机器人具有机动性和高度的双重优势。研究发现,无人机不仅可以搜寻受灾人员位置,还可以使用无人机采集图像进行人体呼吸的检测,以此判断人的生存状态。然而,无人机自身的晃动对于检测结果具有较大影响,且因为无人机晃动的不确定性和复杂性,传统的滤波器难以准确自适应的去除晃动干扰。因此,
带钢作为一类重要的钢铁产品,其广泛应用于汽车制造、桥梁建筑、航空航天等支柱行业,保证其最终产品质量对于社会的发展和生活的改善具有重要意义。带钢表面损坏区域的数量、程度和分布是决定带钢质量的重要因素,基于计算机视觉的表面缺陷检测和分类方法能够很好地实现带钢表面缺陷的定位和识别,发现造成缺陷的起因,从而有效的保证带钢产品质量。带钢表面缺陷检测和分类的准确率及高速率主要依赖于其表面图像的高效表示,该文将
成像式心冲击描记术(imaging ballistocardiography,iBCG)是一种基于视频的非接触式心率测量技术,其通过视频提取受试者头部因心脏跳动导致的微弱机械运动信号,进而计算心率。由于该技术具有操作简便,成本低等特点,获得了研究人员的广泛关注。然而,由头部自主运动引起的刚性运动和由面部表情引起的非刚性运动很容易对iBCG的测量造成干扰。本文提出一种运动鲁棒的iBCG新方法(rob
随着现代社会的高速发展和城市化的加快,居民持有汽车的数量在急速的增长,在给人们带来便利的同时,由于道路车辆过多、道路和安全意识匮乏等诸多原因,车辆行驶安全问题日益突出,交通安全形势严峻,正逐渐成为人们关注的焦点。所以,人们寄希望于将现代高科技技术应用在车辆上,从而降低事故的发生率,智能交通系统由此诞生。汽车生产商将此系统与车联网技术的使用,具有解决交通安全问题的可能,并且拥有广大的市场和美好的发展
在人们快节奏的生活模式下,心血管类疾病发生的概率大大增加,已成为威胁人们身体健康的主要因素之一。心率,作为一种身体机能反馈指标,在心血管疾病的预防和诊断中都发挥着极为重要的作用。对于心率的测量,人们在很长一段时间内依赖于传统的接触式方法。但是,在连续监测过程中,接触式会带来活动受限和皮肤压迫等弊端,因此在动态心率监测和特殊人员护理等方面实用性不足。近年来,成像式光体积描记术(Imaging Pho