基于深度自编码器的图像有损压缩算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:mouliyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能终端设备不断普及,每天产生大量图像、视频内容,图像编码作为数据存储和传输的关键技术一直是人们研究的重点。过去几十年中,传统图像编码发展逐渐遇到瓶颈,一方面因为编码标准中各模块计算和存储复杂度不断增加,未来按照当前编码模式持续提升性能更加困难;另一方面分类、检测等智能应用快速发展,现有编码算法难以应对此类需求。针对上述问题,基于深度学习的编码算法提供了新的解决思路,考虑到自编码器作为深度学习编码框架中的基础结构,本文重点研究基于深度自编码器的图像有损压缩算法。论文主要贡献概括如下:(1)提出自适应比特分配的多尺度自编码器图像压缩算法,解决传统自编码器网络没有充分利用各层特征和无法自适应进行比特分配的问题。算法将编码器中不同尺度的特征进行组合,利用自适应比特分配模块对特征进行处理,然后传递到解码端。实验表明,提出的算法在主、客观质量上比JPEG有明显的优势,在MSSSIM评估下,相比JPEG2000节约3.71%比特率。(2)提出分类精度保持的图像压缩算法,解决图像经过压缩算法后分类精度下降的情况。算法在率失真损失基础上引入分类特征损失,通过实验确定多尺度特征融合方案和损失函数融合权重,使网络在优化率失真性能的同时尽可能保持图像分类精度。实验表明,在MS-SSIM评估下,提出的算法能够达到与BPG相近的客观质量,同时重建图像在Top-1准确性上比BPG高2%。(3)提出感兴趣区域增强的图像压缩算法,解决压缩过程中对感兴趣区域质量下降的问题。算法中引入了感兴趣区域特征增强的编码器,通过计算重要性得分将感兴趣区域特征与原图特征融合增强感兴趣区域。实验表明,相较于JPEG、JPEG2000、BPG和一些深度学习压缩算法,所提出的算法在感兴趣区域和重建全图具有较好的客观质量,在MS-SSIM评估下,全图重建比BPG节约18.71%比特率,感兴趣区域节约38.64%比特率。
其他文献
近年来,同城快递领域市场发展迅速,客户对同城产品时效感知也愈发明显,随着新零售业态的不断升级,未来将催生出更多的同城寄件需求。当前,各大快递公司均积极把握市场机遇,布局同城快递。然而,以地面交通工具为主的配送模式已显现出时效差、易受城市道路交通影响等弊端,兴起的地下物流系统为解决此类问题提供了新思路。本文以J公司同城快递为研究对象,构建了基于地铁网络的“地面末端取派+地铁干线运输”的新型同城快递配
随着城市轨道交通不断发展,如何降低列车牵引能耗问题逐渐成为研究重点。列车运行曲线优化是降低列车牵引能耗的主要方法之一,其本质是一个多目标优化问题。传统解析和数值方法存在求解困难,计算时间长等缺点,智能优化算法建模相对简单,对数学模型要求不高、适应性强,在求解列车运行优化曲线的问题上取得了不错的优化效果。现有研究多数直接将智能优化算法应用于求解列车运行曲线,缺少对智能优化算法性能评价指标的梳理和对算
在线手写签名鉴别作为一种个人身份认证技术得到了社会和法律的双重接受,该技术已被广泛应用于信息安全、法医学和金融学等领域。在线手写签名鉴别算法也是模式识别领域中的热门研究课题之一。受到手写环境、签名者心情等因素的影响,真实笔迹会产生较大差异。此外,经过长时间训练模仿的熟练伪造签名也常常与真实笔迹难以区分。因此,对于熟练伪造签名的鉴别是在线手写签名鉴别中的一个难点。本文主要基于函数特征和全局参数特征对
车联网是融合了通信、汽车、交通等行业的新兴智能战略产业,用于应对交通设施日益增多的通信问题,为多样化的立体交通网络提供有效的通信服务。频谱资源管理技术是分配频谱资源、保证频谱利用率的重要手段。当前频谱资源管理技术存在计算复杂度高、频谱共享效率低、通信代价高等问题,严重限制了车联网的发展。因此为了提升车联网的频谱利用效率,本文研究了车联网动态频谱分配方案,主要研究内容有以下四点:(1)建立了车联网分
随着大数据时代的到来以及深度学习技术的蓬勃发展,目标检测与定位取得了跨越式的进步,性能不断提高。但是,目前深度学习的成功需要依赖大量的标注数据,而海量数据的标注费时费力,准确度也难以保证,限制了目标检测在实际任务中的应用。为了减轻对海量数据标注的依赖,研究人员开始关注弱监督目标定位方法,仅用图像类别标签训练来实现目标定位。目前的弱监督学习方法主要利用分类模型进行目标位置信息的挖掘,而分类模型仅关注
现如今,网络借贷业务飞速发展,据统计,截止2020年12月份,京东金条的用户数超过7000万,而京东白条的用户数更是突破2亿。随着借贷用户数量的飞速增长,逾期用户的数量也正在以极快的速度上升,因此如何有效地对逾期用户进行催收便成为现在急需解决的问题。目前,主要的催收方式还是依靠催收员对逾期用户进行催收,然而,由于许多催收人员缺乏专业的催收技巧,导致部分逾期用户拒绝还款,更有甚者还产生语言上的冲突。
地铁是最方便与经济的城市交通设施与出行方式。考虑其在城市的日常交通中的重要性,地铁车辆关键结构的可靠性与安全性方面皆有极高的要求。转向架构架是地铁车辆零部件中最为重要的结构之一,是轨道车辆的主要承载部件,为满足车辆的可靠性与安全性,对于转向架构架的疲劳寿命研究十分必要。本论文的主要研究内容如下:(1)选定某地铁动车转向架构架作为研究目标,根据标准U615-4计算构架分别在静强度加载与疲劳强度加载情
网络中的社区检测由于能够发现隐藏在网络中的一些有用信息而受到广泛的关注,识别网络中的社区也有助于有效地理解和利用网络,例如检测引文网络中的社区可以找到相关主题的文章,检测购物网络中的社区帮助构建推荐系统等。在当今时代,现实世界由各种各样的网络构成,因此利用网络中的社区来发现有价值的信息已经成为了研究的热点问题。检测网络中的社区是一个NP-难问题。目前已经有许多学者设计了不同的社区检测算法,并且现有
数据发布时的隐私保护问题以及如何防止用户隐私泄露已成为网络空间安全领域的研究热点。目前,该问题的最新解决方案是使用差分隐私机制,差分隐私是一个评估和保护数据隐私的严格数学框架,它具有更高的性能和坚实的理论基础;然而,使用差分隐私的现有技术无法有效地处理高维数据的发布问题。高维数据由于其数据量大而且相关性高的特点,在使用差分隐私机制发布数据时,数据的实用性比较差;特别是当输入数据集包含大量属性时,现
随着无人机技术的发展,以无人机为载体的航拍图像处理的相关技术研究成为了研究的热点。与地面摄像设备采集的图像内容不同,无人机航拍场景多为区域性、工程性、灾害性和军事性的区域监测等。其航拍图像具有分辨率高、时效性关联度高、视差大、拍摄角度灵活等特点,但是,受无人机飞行稳定性、风力、光照等影响,无人机航拍图像也存在着图像特征不稳定、影像倾斜度大、数量多、重叠不规则等问题,这对无人机航拍图像处理技术提出了