UGC视频增强超分辨与分类

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:mengyangshizamao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和通信技术的发展,大量的视频数据快速涌现。越来越多的人选择拍摄视频并上传到网络上分享生活。我们称这样的视频为UGC视频,而这些视频的质量往往偏低。视频增强超分辨技术在工业界和学术界都有重要的应用价值。但是,在目前的视频增强超分辨数据集中,低质量视频往往由高分辨率视频下采样得到,这种低质量视频不包含真实场景中的失真,例如白噪声,压缩失真和传输失真,因此,根据这些数据集训练出来的模型往往在真实的UGC视频中表现较差。为了解决这个问题,我们构建一个真实且数据量巨大的视频增强超分辨数据集,称为VESR-Wild。该数据集从工业界的视频应用中构建而来,并且包含真实失真,并且该数据集包含10,000段视频,总共1百万帧视频帧。据我们所知,这是目前最大的视频增强超分辨数据集。我们在该数据集上比较了流行的视频增强超分辨算法,并进一步讨论了未来视频增强超分辨的研究方向。我们希望该数据集可以让研究者对目前视频增强超分辨算法有更深入的认识,并促进该领域在真实UGC视频场景下的探究。另外,在本论文中,我们提出一个新的视频增强超分辨网络结构,称为VESR-Net。我们设计了一个分离非局部模块来捕捉帧间关系,提高视频帧融合的效率,并引入基于通道注意力机制的残差模块来提升视频帧重建的性能。我们设计了实验来分析VESR-Net的有效性,并说明VESR-Net优于目前的视频增强超分辨算法。值得一提的是,该方案在优酷视频增强超分辨挑战赛中取得第一名。在真实场景的应用中,视频超分辨通常与视频分类共同使用。考虑到视频分类的性能可能会受到低质量UGC视频的影响,我们进行了充分的实验来探究视频增强超分辨对视频分类的影响。另外,UGC视频中因为存在运动模糊,物体遮挡和低光照环境等情况,所以这仍然是一个很有挑战的课题。我们提出了多支路的投票网络,并构建了一个UGC视频分类数据集,希望能够促进视频分类在真实场景的探索。
其他文献
标题配合物[Sm(L)3(Phen)H2O]2(HL=1H-苯并三唑-1-乙酸;Phen=1,10-邻菲啰啉)是由SmCl3.6H2O、1H-苯并三唑-1-乙酸和1,10-邻菲啰啉经水热反应得到。采用元素分析、摩尔电导、
目的:观察旋覆代赭汤加减对痰阻气逆型功能性消化不良(FD)患者的临床治疗效果和胃肠激素的影响。方法:将90例门诊或住院的痰阻气逆型FD患者随机分为对照组45例和治疗组45例,
在我眼中,“问题生”的智力不比别人差,他们对善恶美丑的辨别能力也不比别人差。那么,他们究竟差在哪儿呢?通过这几年的教学实践,我发现,“问题生”主要差在心理状态上,换句
本文以法国精神分析学者雅克·拉康的主体理论、性别理论以及美国拉康派精神分析批评者Ed·普吕斯对自由的界定为理论依据,对易卜生后期戏剧中三部作品的自由问题进行探讨。这三部作品以女性为主要人物,分别是《罗斯莫庄》中的吕贝克·维斯特、《海上夫人》中的艾莉达·房格尔和《海达·高布乐》中的海达·高布乐,她们试图突破父法秩序,在不可能的欲望中追求自由的可能;她们欲望的表达方式、对自由的追求方式各不相同。吕贝克
随着经济发展水平的提高,人民追求幸福美好生活的档次不断上升,同时对所生存的环境也有了新的要求,在倡导“绿色”生活的今天,化学也在推崇“绿色”,“绿色化学”应运而生。绿色化学又称“环境友好化学”、“清洁化学”,其目的就是从根本上消灭污染,它的特点是在始端就采用预防污染的科学手段,因此在化学反应的始终都能够做到无污染零排放。绿色化学不仅仅是一门学科,更是一种环境友好的生活理念。中学是形成个人初级价值观
科技在国民经济中的地位越来越重要,世界各国都在不断地增加科技投入,以保障科技的可持续发展。科技投入是科技创新的前提和基础,而财政投入是科技投入的主要力量,由此,政府财政科技投入的绩效管理已成为学术界和政府部门关注的热点问题。在上述背景下,本文以天津为研究对象,考察天津市2007-2016年间的财政科技投入绩效,从直接产出效益、经济效益和社会效益三方面评价天津市的效率水平。研究数据表明,从2007年