改进的CNN特征及其时序建模在视频分类中的应用

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:wcf333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,随着互联网的飞速发展和影像设备的技术进步,人们在日常生活中能够接触到的视频越来越多,无论是视频的种类还是视频的总量都呈爆炸式的增长。而且人们对视频应用的需求也不仅仅局限于听和看,更重要的是解析视频的内容,并从中发现视频内部或者视频与视频之间的关系,实际上就是需要智能的方法能够实现对视频自动地分析。视频分类是计算机视觉领域当下热门的研究,在人机交互、视频安全监控、医疗诊断、虚拟现实和视频检索等方面具有广泛的应用前景和潜在的经济价值。视频可以看作是一组具有时序关系的序列,而深度学习的方法在图像分析领域已经取得了巨大的成功,所以对于视频的分析可以转化为对视频的图像序列分析。卷积神经网络是深度学习中最具代表性的模型,尤其是VGG-Net模型,是由规模庞大的图像数据训练得到的,使得VGG-Net模型具有良好的特征提取效果。而且针对特定的任务也可以对经典的卷积神经网络模型进行改进,提高模型的特征提取能力。视频是具有时序信息的信号,在对视频进行分析时时序信息也十分重要。HMM是具有良好的时序建模能力的模型,可以通过对视频的图像特征序列建模,得到包含视频空间信息与时序信息的特征表示。本文的主要工作如下:第一,设计了一个视频分类方案:应用深度学习模型做视频的特征提取,结合时序模型对视频进行建模实现特征表示,最后使用分类器得到分类识别结果的方案。第二,选择CNN模型VGG16做特征提取,并针对特定的数据库,在VGG16模型上做改进,增加一个全连接层,优化提取特征的表达能力。第三,选择HMM时序模型对视频的图像特征序列进行时序建模。创新性的应用HMM的参数作为视频的特征表示加分类器的组合,代替HMM传统的训练识别方法。YouTube、UCF50和HMDB51都是关于人体行为的公共视频数据库,本文提出的方案将会在以上三个数据库上进行实验,验证方案的有效性,同时也会与其它的不同方法进行对比分析。
其他文献
“今天不做饭了,我们出去吃。”“晚上有时间吗?出去吃顿饭。”这些话语在如今的年代可谓是司空见惯。生活水平提高了吗。但是随着生活的变化,仅仅为了“吃”是不够的。吃出新意
随着计算机技术及互联网的发展,图像的存储与传输变得更加容易,医院每天产生大量数字图像,近几年基于内容的医学图像检索的研究一直在进行,取得了不错的研究成果,但医学图像
《山东医药》(下称杂志)创刊于1957年。50年来,杂志栉风沐雨,不断发展壮大,连续多年被评为全国综合性医药卫生类核心期刊和中国科技论文统计源期刊,经济效益从白手起家到现在
无线传感器网络(Wireless Sensor Networks,简称WSNs),由大量随机部署于目标监测区域的传感器节点组成,具有信息感知、处理、传输的功能,是人类与自然、社会交互的科技手段之
目的探讨上链非编码RNA(long non-coding RNA,lnc RNA)XIST在乳腺癌病程中的生物学功能及作用机制。方法通过qRT-PCR检测乳癌组织及癌旁组织中lncRNA XIST(以下简称XIST)的表达;CCK-8检测低表达XIST后乳腺癌细胞的活性变化,AO/EB检测乳腺癌细胞凋亡情况。Wound healing和Trans well检测XIST在卵巢癌细胞中侵袭以及迁移的能
自第二批保持共产党员先进性教育活动在我校启动以来,通过学习动员、分析评议阶段,有效推动了先进性教育活动的深入开展,使大家的思想认识有了很大的提高,党性观念明显增强,
加强执政能力建设,是党在新时期面临的一项重任,作为普通高中党组织,应如何加强执行能力建设呢,笔者根据多年的工作实践谈一点粗浅的认识。明确高中党组织执政能力建设的指
多年的编辑工作实践,让我体会到,不同类型的图书,有着不同的编辑加工程序,只有善于总结、归纳,才能逐步建立与之相配套的质量保证体系,确保图书的编辑加工质量。标准汇编类图
在医学图书市场竞争日趋激烈、同质化现象普遍存在的情况下,各出版社都在接受优胜劣汰竞争规律的考验。专业出版社的产品若做不到专精、专特,就难逃市场淘汰的厄运,更谈不上
目前,“出版管理以财务为中心,财务管理以成本为中心”的观念已被大多数出版社所接受并贯彻实施于日常的内部管理之中。但随着市场的发展变化,也随着出版社自身为适应市场的