【摘 要】
:
自然语言处理(Natural language processing,NLP)的发展和应用是现代科技发展中重要的一环,短文本语义相似度计算广泛应用于NLP任务中,是NLP领域的基础,其重要性不言而喻。所以说大力研究和改进文本语义相似度计算方法,是现代科技发展的重要任务之一。本文采用深度学习方法计算短文本语义相似度,将训练后的深度学习模型作为文本编码器对文本编码,然后计算编码后的文本向量间的距离,最
论文部分内容阅读
自然语言处理(Natural language processing,NLP)的发展和应用是现代科技发展中重要的一环,短文本语义相似度计算广泛应用于NLP任务中,是NLP领域的基础,其重要性不言而喻。所以说大力研究和改进文本语义相似度计算方法,是现代科技发展的重要任务之一。本文采用深度学习方法计算短文本语义相似度,将训练后的深度学习模型作为文本编码器对文本编码,然后计算编码后的文本向量间的距离,最终将获得的距离数值作为文本相似度计算值。本文的主要工作如下:(1)基于卷积神经网络(Convolutional neural network,CNN)和门控循环单元(Gated recurrent unit,GRU)提出了COV-BIGRU文本编码器,COV-BIGRU编码器可以同时提取文本中重要语义信息和文本序列信息,在克服了CNN无法提取序列信息的同时,也克服了循环神经网络(Recurrent neural network,RNN)及长短期记忆网络(Long Short-term Memory,LSTM)等RNN变体无法有效提取文本中重要语义信息的缺点。最后将COV-BIGRU文本编码器与常用的深度学习文本编码器做对比实验,采用了Quora数据集,MSRP数据集和Sick数据集做验证,最终结果表明COVBIGRU编码器在三个数据集上的F1值均为最高值,其中在Quora数据集中F1值为90.02%,比LSTM编码器高出了8.39%,比CNN编码器F1值提高了4.2%。(2)基于深度学习文本相似度计算模型和Elasticsearch搜索引擎技术,设计并实现了基于语义相似度算法的搜索系统,该系统可以在数据库中不存在用户搜索内容的情况下为用户返回数据库中与用户搜索内容语义相似的内容。
其他文献
内弹道压力测试中弹底压力的测量对评估火炮性能至关重要。但由于压电式压力传感器在测量弹底压力过程中会随弹丸一起作加速运动,压电式压力传感器的加速度效应与所受火药燃烧产生的压力存在耦合,影响测试结果的准确性。因此,研制了同时测量弹底压力与加速度的弹底压力测试系统,通过二维回归分析对弹底压力测试进行解耦,保证弹底压力测试系统在弹底高压、高加速度的实测环境下测试结果的准确性。本文详细研究了石英晶体的压电效
在武器毁伤评估中,冲击波的压力参数对武器的研制与更新起着重要的作用。冲击波超压测试系统需要工作在超高温、超高压、强电磁干扰的恶劣测试环境中。因此,冲击波超压测试系统的稳定性,直接关系到武器的毁伤评估工作。对于存储式电子冲击波超压测试装置而言,电磁干扰对其的影响是不可忽视的。在某些特定的测试情况下,武器装备在爆炸过程中会产生强电磁脉冲,对冲击波超压测试系统的电磁兼性提出了很高的要求。本文针对爆炸产生
富氮唑类化合物5-氨基四唑(5-AT)、1,5-二氨基四唑(DAT)与3,6,7-三氨基-7H-[1,2,4]三唑并[4,3-b][1,2,4]三唑(TATOT)具有高含氮量、高生成焓、高密度和良好的热稳定性等优点,将其作为固体填料加入到发射药中有望降低爆热和提高做功能力。采用差示扫描量热法(DSC)和热重法(TG)研究了三种化合物与火药基体组分NC(硝化纤维素或硝化棉)、双基吸收药片,高能固体填
煤岩自动识别技术是实现井下综采工作面智能化、无人化的关键核心技术之一。分析煤岩图像特点可知,煤岩图像中的凹凸区域特征信息十分重要。而现有的图像特征提取算法对于煤岩图像高阶特征信息描述效果欠佳。针对上述情况,本文提出改进高阶差分中值完备局部二值模式(CLBP)的煤岩特征提取算法,并探究特征信息降维策略,在此基础上,构建了融合改进CLBP与感受野理论的煤岩识别模型。主要工作内容如下:(1)针对原CLB
1,1’-二羟基-5,5’-联四唑二羟胺盐(TKX-50)是一种极具应用价值的新型高能低感炸药,但由于工业品TKX-50存在晶体形貌不规则、长径比较大等问题,制约了TKX-50的规模化应用。为解决上述问题,本文对TKX-50晶体球形化控制技术进行了研究。主要工作有:(1)使用Materials Studio软件预测了TKX-50真空形貌,计算了TKX-50在单一溶剂水和六种体积比为1:1的二元溶剂
奥克托今(Octahydro-1,3,5,7-tetranitro-1,3,5,7-tetrazocin,HMX)是迄今为止爆轰性能和安全性能中综合性能最佳的单质炸药之一,同时也是目前广泛使用的能量最高的军用炸药。但随着钝感弹药技术的发展和需求,HMX较高的机械感度和冲击波感度已经无法满足不敏感弹药装药的安全性要求,急需寻找一种提高其本质安全性的技术途径。LLM-105是一种耐热性能显著、机械感度
3,4-二硝基吡唑(DNP)具有能量高、熔点低的优点,可以代替传统炸药梯恩梯作为熔铸载体炸药。为制备出高能熔铸炸药,本文选取DNP作为熔铸载体炸药,以HMX为高能主体炸药,并添加适量功能添加剂。采用理论计算与实验相结合的方法,完成了DNP基熔铸炸药的配方设计,确定了DNP基熔铸炸药的制备工艺,并对制备完成的熔铸炸药样品进行相关性能测试。本文主要研究内容如下:(1)通过对DNP基础性能进行测定,结果
在热处理行业,设备的控制精度和稳定性对产品的热处理质量起着至关重要的作用。渗碳工艺是热处理工艺中一道非常重要的工艺,它直接关系到热处理产品的品质,所以精确控制炉内碳势就变的非常重要。本论文以某工厂多用炉群控系统为研究对象,主要研究了基于欧姆龙PLC和工控机的多用炉群集散控制系统的设计和基于变论域模糊PID控制的多用炉碳势控制器的设计。首先介绍了多用炉生产线的组成、可控气氛多用炉的结构与工作原理、渗
随着各种光学技术的不断发展及其应用领域的不断拓宽,现代产业对光学产品的质量要求越来越高。光学元件在加工和使用过程中不可避免会产生表面缺陷,严重影响整个光学系统的性能。长期以来使用的目视检测法不仅难以满足大批量检测的工业需求,面对一些微小缺陷更是难以检测,因此缺陷检测的方法研究具有重要意义。基于此,本文开展了光学元件缺陷检测的方法研究。首先分析研究了光学元件表面缺陷的散射效应,针对微小缺陷散射信号易
聚叠氮缩水甘油醚(GAP)具有高密度、高生成焓、低摩擦感度以及低撞击感度等优点,在高能复合固体推进剂中具有广泛的应用前景。点击化学反应具有副产物无害、不受水分影响等优点,是替代异氰酸酯类固化反应的有效手段。六硝基六氮杂异伍兹烷(CL-20)是一种具有高能量密度、优异爆轰性能等特点的新型含能化合物,将其加入复合固体推进剂中可以显著提高推进剂的能量性能。本文以GAP为含能黏结剂、以CL-20为高能炸药