【摘 要】
:
注意力机制和视频语义嵌入使得视频描述任务取得了显著的提升,为更好地利用时序动态特征和语义信息,提出一种基于X-Linear的语义嵌入视频描述算法(X-Linear Semantic Embeddi
论文部分内容阅读
注意力机制和视频语义嵌入使得视频描述任务取得了显著的提升,为更好地利用时序动态特征和语义信息,提出一种基于X-Linear的语义嵌入视频描述算法(X-Linear Semantic Embedding Network,XLSNet)。该算法以基于编码解码器网络为基础,使用X-Linear注意力模块对视频特征进行编码,该模块使用双线性池化来增加视频时序特征的高阶交互,最终提取丰富的时序动态特征;为充分利用视频语义信息,使用语义嵌入的GRU和X-Linear作为解码器对视频描述进行生成。为防止过拟合现象,对解
其他文献
聚合物胶束是一种新型的给药系统,其疏水核适用于装载各种难溶性药物,作为疏水药物的载体可以增加疏水药物的水溶性和稳定性.采用直接溶解法将阿霉素(DOX)—脱氧胆酸钠(NaDC)
针对大型桥梁在施工阶段和运营期间发生结构变形问题,目前缺乏自动化、高频、实时与长期并且精确的检测手段。在数字图像处理与深度学习理论基础下,提出一种适用于大型桥梁结构变形的非接触式检测方法,并以此方法研发系统,可以对桥梁多个目标结构进行同步动态监测。该方法首先通过高分辨率摄影设备获取桥梁结构的动态视频序列图像;其次对图像进行预处理去除天气等外部因素对图像的影响;然后提取图像ROI确定待处理的具体桥梁
在当下快速的发展过程中,社会的现代化建设对环境带来了一定程度的破坏,为了实现持续性的社会发展,就需要对其各种生产生活所带来的污染物进行良好的监测。提供了一种对产污
针对现有防伪技术可靠性较低、容易被仿制、防伪成本高昂等问题,基于DeepLabv3,提出一种由热膨胀系数失配产生压缩应力形成随机褶皱防伪标识图案的识别方法。具体采用深度卷积网络分类算法中DeepLabv3进行分类识别,通过优化全连接层并设置不同的神经元节点,提高识别网络的分类准确率,缩减训练时间,训练准确率达96.58%,获得了能对褶皱纹理图案精准识别的网络模型,实现具有安全性的防伪目的。
MAX相材料因集合了陶瓷和金属的高硬度、高弹性模量、高温稳定性、可加工性、良好的导电/导热性等优异性能,在熔盐储热、熔盐电解、熔盐辅助合成和熔盐堆发电等变革性能源应
鸡尾酒算法是一种基于双向遍历的排序算法,相比于传统的冒泡排序算法在排序效率上有一定的提高,但仍存在大量的重复数据比较以及对初始输入序列随机度过于敏感等问题.针对上
多数应用场景中,SCARA机械臂的工作路径为固定的模式,为结合视觉信息,优化控制方式,采用激光打样的方式引导SCARA动作。以桃子TZ-500 SCARA机械臂和MATLAB为实验平台,使用D-H
针对生产同一产品的多家企业定产量的问题,建立一个微分对策模型.利用开环控制策略和反馈控制策略对微分对策模型进行分析,给出两种策略下的定产量,并就两种策略进行对比,通
根据GB11551-2014 《汽车正面碰撞的乘员保护》法规的要求,以某型客车车身为研究对象,将建好的几何模型导入HyperMesh软件中,通过拓扑修复、抽取中面以及简化模型等操作,完成
目前的传染病监控大都只是对发病地区居民健康和位置数据的采集和分析,未给出针对接触者健康监控、数据隐私保护和确诊收治的有效方法。因此,提出了一个针对接触者健康监控、