【摘 要】
:
深度学习在语言翻译,图片识别等领域大力发展,已经在生活中获得大量应用,如机器翻译、人脸识别等。随着5G时代的到来,网速对人的限制越来越小,以及人们产生和发布视频资源的便捷性,都促使视频资源在网络中海量增长。如何利用深度学习算法学习视频信息表达方式和进行网络短视频多模态搜索一直是业界关注的研究领域。与手工制作的动作特征不同,深度学习方法在主动学习图像特征方面表现良好,这为人类动作识别技术提供了一个新
【基金项目】
:
广东省的额特色创新项目《智能养老监护视频对象识别与检索关键技术的研究》;
论文部分内容阅读
深度学习在语言翻译,图片识别等领域大力发展,已经在生活中获得大量应用,如机器翻译、人脸识别等。随着5G时代的到来,网速对人的限制越来越小,以及人们产生和发布视频资源的便捷性,都促使视频资源在网络中海量增长。如何利用深度学习算法学习视频信息表达方式和进行网络短视频多模态搜索一直是业界关注的研究领域。与手工制作的动作特征不同,深度学习方法在主动学习图像特征方面表现良好,这为人类动作识别技术提供了一个新的视角和处理方法。本文使用RGB序列和光流序列作为网络模型的输入,RGB序列和光流序列常作为深度学习处理运动识别问题的输入信息。使用3D网络学习视频的帧间信息,从输入进入网络开始分别对图片和光流信息进行融合,用于更好的表述动作这个连续时空的概念。在本文模型分析与训练过程中主要工作如下:首先本文使用13320个视频的UCF-101数据集进行训练,在训练前需要进行视频预处理工作,提前进行拆帧和光流计算,得到44GB共370万张RGB和光流图片,方便后面模型训练;按照UCF-101数据集的split-1方法进行训练集拆分,通过参数调整训练模型达到93.47%准确率。本文通过训练双流膨胀3D卷积网络(I3D)模型来完成视频动作识别的任务。在得到表现良好的视频动作识别模型后,本文使用python语言的Django模块制作了网页的系统界面。使用测试集数据模拟用户的视频数据,使用动作识别网络和目标检测网络对数据进行自动标注,最后添加进My SQL数据库。本系统实现了多模态的端到端的短视频检索。主要包含实现:1)通过一段短视频实现对同类短视频的检索功能;2)通过一段文字或关键字描述实现短视频的检索功能,视频的文字标注由目标检测结果和运动识别结果组合构成;3)在系统中可以收集识别错误视频,用于未来优化模型结构和提高模型精度。
其他文献
猪作为一种可以大规模养殖的动物,在动物养殖领域占有极其重要的地位。当今社会的飞速发展使得日常生活水平显著改善,猪肉供给量的增加导致猪只养殖基地不断扩充,然而如何有效安全的对养殖基地进行集约化管理成为当前所面临的首要问题。猪肉在我国肉制品消费的种类中占有很重要的地位,但是猪瘟疫情时有发生,为了保证食品安全,防止问题猪肉流入市场,对猪肉源头进行有效监管的需求日益迫切。除此之外,随着人们防范意识的不断增
随着移动互联网的快速发展,伴随着的是用户需求的快速增长,为解决用户海量的需求,开发者需要开发出大量的应用。理解已有程序代码是许多软件开发任务的基本步骤,如何才能快速地分析出代码所实现的功能,并尽可能地压缩程序开发和维护流程,已经成为软件工程领域的热点问题,具有十分重要的现实意义和经济意义。传统的程序分类任务只能依赖大量的人力进行人工标注,效率低下。有学者从自然语言处理领域借鉴经验,将深度学习引入到
随着汽车产业和经济的发展,机动车保有数逐年增长,交通安全更是成为制约汽车产业进一步发展的桎梏。主动避撞系统作为一种能提升行驶安全性的主动安全技术越发受到人们的关注。主动避撞系统包含了纵向主动避撞和横向主动避撞,虽然前者的技术更为成熟且在市场得到广泛推广,但当主车车速较高或前车与主车的相对距离难以满足纵向主动避撞的需求时,横向主动避撞却能实现更有效的避撞。故针对汽车纵横向主动避撞控制策略的研究对车辆
认知障碍是指人体认知功能的损害,根据功能损害的程度不同,可诊断为轻度认知障碍(Mild Cognitive Impairment,MCI)或重度痴呆(Dementia)。由于身体机能及大脑神经的衰退,认知障碍普遍存在于老年人。据科学统计,认知障碍难以治愈,每年影响约1000万人,因此有效、准确的诊断引起了广泛关注。近年来,结合先进设备的3D影像结果和临床认知障碍测试量表结果,医生可以分析得到准确的
随着神经网络的广泛应用,其缺点愈发被发现。由于会产生“灾难性遗忘问题”而无法进行增量学习。近些年来,迁移学习的相关领域发展迅速。迁移学习方法大都注重模型在新任务上的效果,而在过去任务上的效果往往不注重。作为一种特殊的迁移学习方法,增量学习主要任务就是解决“灾难性遗忘问题”。本文将从另一个角度对灾难性遗忘进行解释:神经网络的训练对其数据的分布有很高的要求,如果训练数据不符合目标结果的分布情况,网络将
粒子群算法是由J.Kenned和R.C.Eberhart于1995年提出的一种优化算法,它通过模拟动物种群的行为而设计,其目的是获得最优解。这些群体内部各成员之间通过互相协作的方式去寻找食物,并且群体中的每个成员在搜索过程中都积累一定的经验,粒子群算法就是根据这些个体自身的经验和学习其他成员的经验,来不断的改进搜索方向和搜索进度。粒子群算法具有良好的优化性能,使用简单且应用广泛。美中不足的是,粒子
随着互联网技术的不断发展以及人们生活需求的不断增长,智能网联汽车的概念应运而生。与传统汽车相比,智能网联车的功能更加丰富,需要处理的网络数据量的规模也更加庞大。而传统的车载网络的带宽有限,无法处理大量的网络数据。与传统的车载网络相比,车载以太网具备高带宽、高吞吐量、低成本等优势。目前,许多汽车制造商已逐步应用车载以太网来满足高级驾驶辅助系统应用的运行需求。因此,车载以太网在汽车上的应用前景十分广阔
随着改革开放的脚步不断向前大步迈进深化发展,我国经济发展势头日新月异、迅猛提升,经济的发展紧密了世界各国间的联系,中国逐渐从一个发展中国家向发达国家迈进,物质的供给与物质的储备得到了极大提升,与此同时精神需求日益上涨,文化领域得到了空前的发展,其中电影领域的发展尤为瞩目。中国电影从以往为艺术类电影创作模式转向市场经济化运作模式,发展势头强劲,电影市场的蓬勃发展一方面得益于国家相关部门大力扶持,另一
由于二十一世纪网络的发展与信息量的剧增,各类数据间的关系变得越来越复杂,人们也不得不与大量的数据打交道。因此,当前的世界已经进入了大数据时代。为了能够在杂乱无章的数据海洋中高效的检索和整理出人们所需要的信息,就要对大量的数据进行批量分析和聚类,然后实现对这些不同类型数据的量化处理,并使用某种固定规格的数组或者向量来表示它们,这种表示将会满足后期应用中对数据的统计,检索,推荐以及分类等需求。对这些数
近年来,人们越发看重节能环保,而且随着我国居民汽车保有量的不断提升,国家也出台了一系列政策来对汽车能耗与排放提出了更高的要求。轻量化设计能够有效地实现满足汽车性能要求的同时减少能耗与排放,在实现汽车轻量化的途径中,材料替换是十分有效的方式。钢板弹簧的重量占商用汽车非簧载质量的10%-20%,使用复合材料来将其全部或部分进行替换,一般能够实现至少50%的减重,同时可以进一步改善汽车的行驶性能、减少燃