基于张量分解与卷积神经网络的RGB-D物体识别方法

来源 :广东工业大学 | 被引量 : 4次 | 上传用户:tiny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体识别是计算机视觉领域一个重要的研究方向,其主要目的是为了让计算机可以“看”懂真实世界中的物体,让计算机拥有感知物体的能力。在图像数据激增的时代,计算机自动识别图像中物体的能力将极大地提高人们处理图像、挖掘图像和管理图像的工作效率,因而有着巨大的应用前景。深度传感器的出现使得新一代相机可以获取物体的RGB-D图像,其中的深度图像弥补了RGB图像中缺少的物体空间结构信息。如何将RGB-D图像与物体识别技术有效地结合起来,提高物体识别准确率成为了计算机视觉领域的一个新的研究热点。本文围绕RGB-D物体识别技术,针对RGB-D图像融合及预测模型搭建问题,开展了基于张量分解与卷积神经网络的RGB-D物体识别方法的研究。提出了基于张量分解的RGB-D融合方法和基于边缘检测的卷积核数量确定方法。本文主要贡献如下:(1)设计了基于张量分解与卷积神经网络的RGB-D物体识别总体框架。该框架包含RGB-D图像融合及预测模型搭建两个模块。其中RGB-D图像融合模块主要包括图像预处理和张量分解;预测模型搭建模块中采用卷积神经网络模型作为预测模型。(2)针对RGB-D物体识别中如何有效利用深度图像中的空间结构信息来提高识别准确度的问题,提出了基于张量分解的RGB-D图像融合方法。该方法主要借鉴张量分解的优势——擅长处理多模态数据,创造性地用张量分解方法解决RGB-D图像融合问题。该方法首先分析RGB-D图像数据性质,再构造成对应的张量;然后,利用Tucker方法对张量进行分解,获得因子矩阵;最后通过因子矩阵对原张量进行投影,获得融合后的RGB-D图像。仿真实验结果表明该方法可提高物体识别准确率,在三个子数据集中,分别可提高19%、7%和11%。(3)针对卷积神经网络预测模型中卷积核数量多凭经验确定的问题,提出了基于边缘检测的卷积核数量确定方法。该方法首先对训练图像进行边缘检测获得边缘图像,然后对边缘图像进行边缘块提取并统计提取的边缘块,最后通过对边缘特征矩阵进行分析获得卷积核数量。通过在Mnist数据集和Chars74K数据集上的实验结果表明,该方法能依据图像集自适应的增加或减少卷积核数量,具有自适应能力。
其他文献
为科学观测和分析综采工作面初采期间顶板压力变化,通过安装液压支架测力仪,采用软件进行数据分析,测定支架有关工作参数。分析了支架与围岩的相互关系,得出了顶板变化的基本
为了研究原料淀粉特性对水晶皮质构品质的影响,该文选用小麦、玉米、马铃薯、木薯、绿豆5种淀粉原料,测定并分析淀粉颗粒特性、破损淀粉含量、糊化特性与水晶皮的透明性、质
<正> 我院在近3年内收治3例巨大体表肿瘤,术前均诊断为皮脂腺囊肿,经病理切片证实纯属误诊。现介绍如下。例1.女性,65岁。患者在右侧中下腹部发现黄豆大小肿块半年,无疼痛和
目的:观察糖尿病患者经皮冠状动脉介入治疗(PCI)术后造影剂肾病(CIN)的危险因素。方法:选取2008年11月—2011年12月患有糖尿病行PCI的患者并具有完整临床资料的病历383例,进
从文化视角创新和发展高校德育是德育的内在要求。当前高校德育目标明确,但学生主体作用发挥不够;内容丰富,但人文精神渗透有所忽视;方法多样,但针对性实效性有待提高。文化
研究背景与目的:急性冠脉综合征(Acute Coronary Syndrome,ACS)是冠心病的一种急、危、重的临床综合征,是非常危险的疾病状态,需要紧急、强化的医学干预。经皮冠状动脉介入(Pe
我国反垄断法实施中存在许多问题。反垄断执法机构设置问题、反行政垄断问题、反垄断法私人诉讼问题、反垄断司法机制问题是反垄断法实施过程中的核心疑难问题。通过对这四个
近年来,随着我国桥梁工程的迅速发展,桥梁的跨度越来越大,桥塔越来越高,体系也越来越柔,这对大跨度桥梁的抗震研究提出了许多新的课题。龙潭河大桥位于沪蓉国道湖北西段,其最
该文介绍了广(州)-清(远)高速公路银盏至北江二桥段煤系地层的分布及特点,对煤系土不良地质深路堑边坡的处理从路线选线、平纵、边坡防护及排水等多方位进行了探讨,并在施工
利用2010年1月1日—2018年12月31日开远市空气颗粒物PM10浓度、气象要素对开远市进行气象要素与空气颗粒物浓度相关性分析。结果表明,城区颗粒物质量浓度具有很明显的时间相