【摘 要】
:
图像描述是一门结合计算机视觉与自然语言处理领域的交叉学科,被广泛应用在智慧交通、生活娱乐、网络图像分析以及帮助视障人士感知周围环境等领域。目前,图像描述虽取得了一定的研究成果,但仍存在以下不足:特征提取不够充分、图像与描述语句无法充分融合、描述语句不够生动等问题。针对以上问题,本文在原有深度学习模型基础上,进行优化和改进,具体内容如下:1.针对图像特征提取不够充分,不能充分利用上下文信息等问题,提
论文部分内容阅读
图像描述是一门结合计算机视觉与自然语言处理领域的交叉学科,被广泛应用在智慧交通、生活娱乐、网络图像分析以及帮助视障人士感知周围环境等领域。目前,图像描述虽取得了一定的研究成果,但仍存在以下不足:特征提取不够充分、图像与描述语句无法充分融合、描述语句不够生动等问题。针对以上问题,本文在原有深度学习模型基础上,进行优化和改进,具体内容如下:1.针对图像特征提取不够充分,不能充分利用上下文信息等问题,提出一种基于融合注意力机制的语义描述模型。首先利用卷积神经网络对图像特征进行提取,其次使用融合注意力机制的方法计算图像空间和通道特征权重,生成上下文向量并进行加权求和,然后将其输入到循环神经网络中,生成最终的描述语句。通过仿真实验结果表明,利用融合注意力机制的方式,能充分提取图像特征,有效提升图像描述语句的准确度。2.针对传统的编解码模型容易出现误差累积现象,且会产生梯度消失和梯度爆炸等问题,加入一种生成对抗网络模型对图像内容进行描述,该模型包含一个生成器和一个判别器。首先在生成器中生成描述语句,其次在判别器中判断该语句是真实语句还是虚假语句,并反馈给生成器一个奖励值。然后使用策略梯度法使生成器能够接受到反馈信息,从而达到训练的目的。训练结束后,输出最终的描述语句。通过仿真实验结果表明,利用生成对抗网络模型生成描述语句的方式,能极大地避免误差累积现象,有效增加图像描述的自然性。3.针对传统编解码模型生成的描述语句缺乏感情色彩、不够生动等问题,加入一种包含积极和消极情绪描述的情感语料库,利用该语料库在生成器部分训练生成语句,可使生成的语句富含积极描述和消极描述的形容词。通过仿真实验结果表明,利用情感语料库生成描述语句的方式,能使描述语句生动形象,有效增加描述语句的多样性、生动性。
其他文献
针对图像描述方法中对图像文本信息的遗忘及利用不充分问题,提出了基于场景图感知的跨模态交互网络(SGCNet)。首先,使用场景图作为图像的视觉特征并使用图卷积网络(GCN)进行特征融合使图像的视觉特征和文本特征位于同一特征空间;然后,对模型生成的文本序列进行保存并添加对应的位置信息作为图像的文本特征,解决单层长短期记忆(LSTM)网络导致的文本特征丢失的问题;最后,使用自注意力机制从中提取出重要的图
为了提升家具设计中碳纤维复合材料的拉伸性能和弯曲性能。采用传统注塑(多浇口进胶)工艺和新型SVG(顺序阀浇口)工艺制备了碳纤维复合材料,考察了碳纤维质量分数和注塑成型工艺参数(熔体温度、模具温度、注射压力、注射速率)对碳纤维复合材料拉伸性能和弯曲性能的影响。结果表明,采用新型SVG工艺可以消除传统注塑成型工艺下的熔接痕缺陷和气穴缺陷;随着碳纤维质量从0增加至25%,不同熔体温度、模具温度、注射压力
活性粉末混凝土(RPC)是一种新型水泥基复合材料,具有高强度、高韧性、高耐久性、高经济性及稳定性等特点,其性能相较于普通混凝土和高强混凝土更具优越性。目前国内RPC混凝土只用于一些小型构件,如铁路人行道步板、市政下水井盖等,在大型构件领域尚属空白。本次针对RPC混凝土应用于桥梁工程进行试验研究,在基本配合比基础上,根据试验结果不断优化调整,得出满足工程要求的活性粉末混凝土(RPC)配合比;基于RP
《民法典》合同编以专章对保理合同的内容、保理欺诈、追索权、履行等做了规定,这是我国民事合同制度的重大创新。然而,保理合同的具体法律适用仍存在诸多问题,如客体范围狭窄、保理人虚构债权、各主体抵销权规定不明等,导致相关规则在适用时出现梗阻。需对保理合同的要素、各主体间的法律关系及法律适用进行分析,厘清司法实务中的争议焦点,以实现对保理合同各方主体利益的平等保护。
本次设计是为六层实验楼设计基础,建筑场地地势平缓,地上部分为框架结构,无地下室。主梁、次梁、楼板均为现浇整体式,混凝土强度为C30.本工程安全等级为二级。基础设计采用柱下独立扩展基础形式,柱下独立基础为浅基础,相对于深基础具有传力过程简单,明确,施工简单造价低等优点,本次设计采用扩展基础,扩展基础适用于宽基浅埋,且不受刚性角的限制,可以减少混凝土的用量,经上所述采用柱下独立扩展基础。钢筋采用HPB
目的 探讨激励式护理在内镜下食管静脉曲张套扎术患者中的应用效果。方法 纳入2019年10月至2020年10月新疆医科大学第一附属医院收治的106例中重度食管静脉曲张患者,所有患者均接受内镜下套扎治疗。采用随机数字表法将患者分为激励组(53例)和对照组(53例),对照组仅给予传统护理模式,激励组给予激励护理模式。比较两组焦虑自评量表(SAS)、抑郁自评量表(SDS)、纽芬兰纪念大学幸福度(MUNSH
环氧氯丙烷(ECH)与二氧化碳(CO2)的共聚反应产物具有可修饰的C―Cl键,是实现聚碳酸酯功能化的有效途径,然而该反应一直受制于较长的诱导期.本文提出了一种酸酐诱导增强共聚反应活性的策略,即在CO2/ECH共聚体系中引入微量环状酸酐以缩短诱导期,提高反应活性.以锌钴氰化络合物(DMC)催化剂为例,在CO2/ECH共聚体系中仅加入0.1 mol%的不同种类环状酸酐,ECH转化率可达到23.6%~8
为符合创新创业教育改革发展的需求,培养更多创新思维的优秀人才,以解决信息时代下高校毕业生的就业求职问题。高校教育需要进一步加强对大学生创新精神、创业能力的培养。现阶段,各高校在开展创新创业教育方面如火如荼。基于此,阐述了信息时代下做好大学生创新创业(创新创业)教育的意义,深入剖析其在创新创业过程中存在的问题,并提出了创新创业的教育新思路,以符合信息时代背景下各高校创新创业教育改革发展的需要,进一步
随着“线上+线下+物流”的新零售模式逐渐搭建完成,零售行业内竞争激烈,在2020年新冠疫情爆发之后,消费模式加速向线上转变,对线上平台的完善和物流资源的需求日益凸显,由此引发零售行业的一系列并购。以苏宁易购并购家乐福中国案例为研究对象,用哈佛框架下展开对并购前后财务绩效的分析。运用五力模型对苏宁并购家乐福进行战略分析,基于当前的环境形式探求苏宁易购并购家乐福的动因;在会计分析中,关注会计政策和会计
介绍了“十三五”期间中国环氧树脂行业取得的主要成就和存在问题,以及“十四五”期间中国环氧树脂行业发展思路和发展建议。