【摘 要】
:
近年来,由于网络的发达,知识总量的增加,人们获取到的有用信息却少之又少。常见的搜索引擎使得很多用户不能及时的从网络上获取到有用信息,同时存在噪声数据过多和信息重复等问题,针对此类问题,问答系统应运而生。一方面,问答系统可以从大量的信息中提取到用户需要的有效信息。另一方面,随着医药数字化时代的来临,网络上也出现了多样化且可利用的医药信息,因此,人们对医药信息与问答系统的结合愈发重视,而伴随着知识图谱
论文部分内容阅读
近年来,由于网络的发达,知识总量的增加,人们获取到的有用信息却少之又少。常见的搜索引擎使得很多用户不能及时的从网络上获取到有用信息,同时存在噪声数据过多和信息重复等问题,针对此类问题,问答系统应运而生。一方面,问答系统可以从大量的信息中提取到用户需要的有效信息。另一方面,随着医药数字化时代的来临,网络上也出现了多样化且可利用的医药信息,因此,人们对医药信息与问答系统的结合愈发重视,而伴随着知识图谱的迅猛发展,问答系统也不再拘泥于早期的形式,可以引入改进的相关算法和模型以此提升问答系统。本文采用互联网的数据集和中文知识图谱DBpedia部分数据集进行医药问答系统的设计,对候选实体评分排序和知识表示学习的相关模型进行研究并做出相应的改进,对问句相似度的计算提出混合式加权计算方法,并在公开数据集上进行实验验证,在此基础上,设计了医药问答系统。本文的研究内容主要包含以下几个方面:(1)在实体检索模块中,由于问句之间的相似度存在差异,需要考虑到各个特征对问句相似度计算的影响程度,本文引入混合式问句相似度计算,改进单词顺序相似度和编辑距离,并将各个特征的影响程度赋予不同的权重,对各个特征进行加权运算,对加权的特征值进行累加求和,得到最终的问句相似度,混合式问句相似度计算相比于传统的问句相似度计算方法准确率更高。(2)在候选实体排序任务中,知识图谱自带的实体链接工具对候选实体返回的结果是无序列表,为了改善这一现象,本文提出改进的多维评分机制MR-Rank算法对实体评分并从高到低排序,该算法基于实体的语义相似度、单词相似度和上下文相似度,可以有效减少无序实体产生的冗余。(3)为了解决TransE方法无法区分相似性极高的实体和无法处理复杂关系的问题,本文提出一种基于TransE方法的改进知识表示模型TransMR,引入用户输入的问句实体信息和单层神经网络模型,以此来提高区分相似度极高的实体表示和处理实体之间的复杂关系,实验证明本文的方法相比于传统的方法有所提升。本文采用互联网的医药网站获取部分数据集和DBpedia部分数据集并结合上述算法和TransMR模型实现了医药问答系统。
其他文献
近几年,计算机技术为复杂体系研究带来了崭新技术手段,从理论和实践上都使原来的科学研究产生很大变化,推动了涵盖流体力学等多领域的发展。格子玻尔兹曼方法(Lattice Boltzmann method,LBM)将流体离散成粒子,同时物理区域被离散成一系列格子,时间被离散成一系列步长,该方法具有计算效率高、稳定性高等优势;相场法(Phase field method,PFM)是一种处理界面的数学方法,
内生真菌广泛分布于植物组织中,可与寄主植物建立互惠共生关系。它们能够产生结构独特的生物碱、萜类、聚酮、醌类、酯类等多种类型的次级代谢产物,并具有广泛的生物活性,如抗肿瘤、抗炎、抗菌、抗病毒等多种活性。近年来,植物内生真菌已逐渐成为发现活性先导化合物的重要源泉,同时它也是替代植物次级代谢产物有潜力的新资源。本论文采用LC-MS分析与抗肿瘤活性测试相结合的方法,从80株内生真菌中选出3株活性较好且次级
得益于互联网技术的快速发展,各种在线社交平台如雨后春笋般不断涌现,成为连接用户关系和信息传播的重要媒介。人们逐渐将传统的线下交流方式转移到线上来对信息进行高效率低成本的管理,随着网络规模呈现井喷式增长,网络节点之间无时无刻不在发生信息交互,各节点之间的关系越来越复杂并处于动态变化中。因此开展对社会网络的研究能够了解网络的特征,明确节点的行为动机,揭示网络的信息传播规律,对促进社会的良好发展有着重要
玉米淀粉是常见的工业粉体原料,因其来源广泛、价格低廉并且富含多种有机物,广泛应用于食品加工、医药制造、造纸及合成材料等工业生产领域。在其生产、加工过程中易使粉体悬浮在空气中形成粉尘云,遇到电火花等微小火源,容易引起粉尘燃烧爆炸事故的发生。因此,研究玉米淀粉燃烧爆炸的抑制技术对保障人民生命财产安全具有现实意义。本文利用热重分析仪、20 L球形爆炸实验系统,分析了NaHCO3、Al(OH)3以及三聚氰
可见光通信(VLC)利用可见光光谱中较高的频段作为传输介质,以普通发光二极管作为光源,使LED在照明的同时还可以进行高速通信。VLC不仅能够解决射频通信领域中频谱资源短缺的问题,还能够与传统的射频通信技术交互融合,创造一系列应用,如家庭网络、车对车通信、航空器座舱的高速通信网络、火车数据通信、信号灯的数据信息传递、红绿灯的管理和通讯等。这些优势使VLC得到了极大的关注。但是,与射频系统类似,可见光
ABI5亚家族(At DPBFs/ABFs/ABI5)是一类碱性亮氨酸拉链类(b ZIP)转录因子,目前发现有九个成员,分别为ABF1、ABF2/AREB1、ABF4/AREB2、At DPBF1/ABI5、At DPBF2、At DPBF3/AREB3、At DPBF4/EEL、At DPBF5/ABF3、At5G42910。亮氨酸拉链结构常出现于真核生物DNA结合蛋白的C-端,作为转录因子识别
<正>在新近公布的安徽大学藏战国简第二册中,有整理者命名的《仲尼曰》篇,其中记有24条“仲尼曰”和1条“康子使人问政”仲尼答语,有着很重要的思想史价值。此篇篇末有“中尼之耑也”几字,整理者读为“仲尼之耑(语)也”,并认为“耑语”有三种可能读法,分别是端语、论语、短语(黄德宽、徐在国主编《安徽大学藏战国竹简(二)》,中西书局,2022年。下同)。鄙意当读为“颛语”,“颛”从“端”声,《淮南子·览冥》
由于天然岩体中存在着大量自然形成的节理、裂纹、层理和断层等构造,这些构造导致岩体的力学性质、振动、渗透、能量传递等多种性能发生改变。爆炸应力波在这些含节理、裂隙和断层的岩体中的传播与衰减也随着发生改变,进而影响工程爆破的效果及安全性。节理对工程爆破效果及安全性的影响又与节理的几何参数如节理填充物厚度D、爆源到节理的法向距离R、爆源到节理的竖向距离H和节理倾角θ有关。因此研究不同节理几何参数下爆炸应
近年来,随着地下隧道建设、地下硐室开挖、深层矿产资源开采等岩体工程的迅速发展,深部岩体爆破开挖工程猛增。深部岩体多处于高地应力环境中,爆破开挖时受到地应力和爆破荷载的共同作用,爆破环境复杂。因此深层岩体爆破动力响应和爆破特性研究具有重要的岩体爆破理论及实际工程意义。本文运用有限元软件ANSYS/LS-DYNA和后处理软件LS-PREPOST建立深层岩体单孔爆破模型,对不同地应力条件下岩体爆破过程进
分析了我国炼油工业发展面临的新态势,并就如何推进炼油工业结构调整和转型发展进行探讨。