【摘 要】
:
近年来,作为一种能展现360度全方位视角的媒介,全景视频在监控、场景展示、赛事直播等领域展现了独特的魅力,逐步走进大众视野。全景视频具有视角广阔、高分辨率、高帧率、数据量大的特点,为存储和传输带来困难,因此亟需有效的全景视频编码方案。在全景视频编码过程中,投影方法与编码算法是最关键的两个要素。本文围绕全景视频的特性,提出了如下几种投影方法,以适配随后的全景视频编码:(1)提出近似均匀采样的少畸变双
论文部分内容阅读
近年来,作为一种能展现360度全方位视角的媒介,全景视频在监控、场景展示、赛事直播等领域展现了独特的魅力,逐步走进大众视野。全景视频具有视角广阔、高分辨率、高帧率、数据量大的特点,为存储和传输带来困难,因此亟需有效的全景视频编码方案。在全景视频编码过程中,投影方法与编码算法是最关键的两个要素。本文围绕全景视频的特性,提出了如下几种投影方法,以适配随后的全景视频编码:(1)提出近似均匀采样的少畸变双八边形投影。克拉斯特抛物线投影实现了球体上的均匀采样,但在平面两侧畸变严重。针对该问题,提出将全景视频投影到两个八边形中,在畸变与均匀采样间取得平衡,以提升编码性能。为消除双八边形投影的倾斜边界,进一步节省码率,还提出一种紧凑的投影方法。实验结果表明,与等距柱状投影相比,双八边形投影能节省24.70%的码率,而紧凑的双八边形投影可以节省24.95%的码率。(2)提出基于球面划分的等面积均匀立方体投影。针对立方体投影采样不均匀的问题,利用提出的曲面像素建模办法,结合等面积比原则,通过直接在球面上进行采样,为每一像素分配相等的球面面积,实现均匀采样。由于所提投影方法具有方向性,因此具有水平和竖直两种采样模式。对比实验结果表明,在高分辨率全景视频编码中,所提投影可获得最佳编码性能。相比等角立方体投影方法,两种模式分别可以节省平均0.5509%和0.6681%的码率。另外,根据所提投影的特性,对球形Lanczos插值算法进行适应性调整,可为重建视频提供约0.1d B的质量增益。(3)提出基于环形分割的均匀对称立方体投影。等面积均匀立方体投影虽实现了球面上的均匀采样,但具有严重的方向性和采样不对称性。而且难以提前判断某测试序列的最佳采样模式。针对上述问题,提出对曲面进行环形分割,并使平面对角线上的像素投影到曲面对角线上,实现对称采样。同时,利用曲面像素建模和等面积比原则,确定环间分界线和曲面像素的位置,确保均匀采样。实验结果表明,在高分辨全景视频编码中,所提投影与等角立方体投影相比,可以节省0.8277%的码率。
其他文献
支持矩阵机作为支持向量机的推广,是人工智能中的重要技术,被广泛的应用在分类和预测的问题中,如文本分类、图像识别、医疗诊断等等.这些实际问题中的数据天然是矩阵形式,其结构特征提供了数据的重要信息,因而以矩阵为变量的支持矩阵机问题的研究至关重要.支持矩阵机模型很好的考虑到了矩阵数据内部具有的相关性,其研究的主要困难在于目标函数中秩函数、0/1损失函数的非凸非连续性.目前已有的研究集中在矩阵数据的向量化
随着短视频、直播、云会议等对实时性要求较高的应用不断涌现,最小化延迟成为网络研究的方向和目标。主动队列管理对于改善网络拥塞、控制数据流延迟有着重要作用。然而传统网络的转发设备受硬件限制不支持用户自定义队列管理算法,但随着可编程网络等新型网络架构的出现,在数据平面通过编程接口管理网络节点上的资源(存储器、处理器和分组队列等)得以实现,主动队列管理技术得到进一步的发展,研究数据平面的队列管理对于改善网
目前,医药流通行业受到国家医药改革相关政策的影响,面临着在医药终端下单至送货到位的有限时间内,医药物流中心如何完成大量拆零订单的拣选作业,即如何提高拣选效率的困境。通过在实际中的应用,基于搬运机器人的“货到人”拣选系统已被证明是解决拆零拣选困境的重要手段之一。本文主要针对基于搬运机器人的“货到人”拣选系统中的订单问题进行研究,主要研究内容如下:首先针对基于搬运机器人的“货到人”拣选系统中,搬运通道
随着计算机视觉的不断进步,视觉伺服技术被引入机械臂控制领域,成为机械臂控制领域研究的核心内容之一。机械臂在工作过程中通过摄像机获得图像信息,使得操作系统更加灵活,因此,机械臂视觉伺服控制系统具有非常重要的研究价值。本文以六自由度机械臂视觉伺服系统这种结构复杂的多入多出系统为研究对象,针对视觉模型参数和摄像机内部参数未知的问题,以多入多出紧格式无模型自适应控制算法为基础,对机械臂视觉伺服系统进行了研
移动机器人作为帮助人类拓展认知范围的一类重要辅助工具,在人们的生产生活中占有越来越重要的地位。多面体机器人是一种由空间多环闭链连杆机构构成的多面体形态机构。针对地面移动机器人运动的高地形适应性需求,本论文对四面体移动机构面对台阶障碍的越障过程进行了分析,提出两种越障步态,并对其展开理论分析与样机实验。首先,对四面体移动机构支链进行构型设计,根据构型设计对其进行自由度分析,并提出基于对称驱动的滚动步
随着城市人口不断增加,公共交通压力与日俱增,传统公共交通方式已经制约了运输效率的提升。现代无轨列车是一种新型的城市交通运输工具,是对现有交通运输方式的补充,既具有公路汽车运行灵活、基建成本低的优点,又具有城轨列车载运量大、编组灵活的特点,是城市交通运输未来发展趋势。现代无轨列车的各节车体通过液压铰接机构连接,具备多轴转向的功能,可以提高车辆复杂工况下的运行灵活性。但是与单体客车、单铰接客车相比,多
在移动互联网时代,爆炸式增长的在线内容使得人们深受信息过载问题的困扰。作为缓解信息过载的利器,推荐系统能够从用户-项目历史交互中挖掘用户的个性化偏好,以过滤掉用户不感兴趣的内容。众所周知,传统推荐模型通常面临着数据稀疏和冷启动等问题,因而近年来越来越多的研究关注于融合社交网络等辅助信息来对用户兴趣进行充分建模,以改进现有推荐算法。然而,本文通过研究发现,现有社交推荐算法还存在以下问题:社交域对用户
为了帮助像考古学家、历史学家、网络审查员这类人从文档中快速查找感兴趣的内容,使用深度学习等技术对文档(如手写历史文档)进行快速、实时、精确的关键字定位是相关人员所迫切需求的,其在历史文献查阅、视觉搜索、图像检索领域具有广泛的应用价值。然而由于手写历史文档图像数据集标注困难且费时费力,使得训练数据严重缺乏不足以满足深度学习模型训练的需求。此外,手写历史文档图像具有多样的写作风格、多变的视觉外观、不均
目标检测技术是计算机视觉中的核心技术,被广泛应用在智能视频监控、自动驾驶、航空监测等领域。同时,随着遥感技术的不断成熟,可获取的遥感数据量急剧增加。因此,遥感图像目标检测技术逐渐成为研究热点,其指的是设计一个目标检测器,可以高效地识别出遥感图像中的感兴趣目标且对其进行定位。然而,此领域始终面临着许多严峻的难题。首先,由于图像涵盖的物体广泛且杂乱,造成了检测时复杂背景干扰的问题。然后,图像中的小目标
短句语义相似性判别作为自然语言处理的基础任务,对于下游的数据挖掘、信息检索、机器翻译等任务具有极其重要的作用。在目前基于匹配聚合框架的语义相似性模型中,序列对齐的过程中只考虑了单个特征空间的语义信息,并且对于全局信息的利用不够充分。另外,将序列转化为固定维度的向量的单步预测方式也会造成序列中重要信息的丢失。解决上述问题对于模型性能提升具有积极的作用。本文针对上述两方面的问题,提出基于混合全局信息的