基于深度学习的身心健康自动问答系统的研究和实现

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:sunjf2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答系统在自然语言处理领域受到广泛的关注,并在多个专业领域得到了充分的应用。随着开放的知识图谱中信息的实体和实体关系的增加,给基于知识图谱的问答系统的发展提供了完备的数据支持。但对于特定专业领域的知识图谱来说,开放的知识图谱通常会缺乏特定专业领域的专业知识和信息,具有一定的局限性。在过去的研究当中,科研人员已经在问答算法中引入许多外部知识和信息,这些模型用到的知识信息大都是非结构的文本数据,但仍存在许多问题。首先它们通常都非常依赖与这些非结构化的文本数据的质量。其次,它们通常把知识图谱中的三元组分开来看待,缺乏全局的视角和统筹全局的方法。最后,它们往往比较忽视实体关系在问答系统中的意义。本文首先实现了医学知识提取、医学知识融合以及医学知识存储等过程,其中运用了Bi-LSTM-CRF网络进行知识抽取,并且使用了实体对齐等多种数据预处理方法,将从不同来源收集的医学数据用于构建身心健康知识图谱。并将常识知识图谱和常识数据集作为数据和语料的补充,以此提高模型的鲁棒性和回答内容的丰富性。其后本文提出了基于身心健康知识图谱的全局对话模型,即GKCM(global knowledge conversational model)模型,在编码器端通过多重Multi-attention机制、1v1卷积核的特征提取以及残差连接的方式对医学知识三元组进行嵌入表示,加深了模型对于用户问题语义的理解。模型不仅能获取特定三元组以及其周边相邻三元组的实体和实体关系,还以迭代的方式获取了知识图谱全局的关键知识信息,理论上使得模型能够获得医学知识图谱的全局的视角,以便更好的抓住用户问题的语义信息和提升模型推理联系判断的能力。最后本文以医疗知识图谱为基础、GKCM网络模型为核心搭建的了一个简单的身心健康自动问答系统。本文使用的开发语言是python,前端使用Bootstrap框架和jQuery进行搭建,后端使用Flask构架,数据库使用Neo4j图形化数据库,前后端的数据交互通过Ajax实现,最终实现了用户与系统的问答交互等功能。
其他文献
对R290和R22的热力学性质进行了比较分析。在标准空调工况Ⅱ下,对它们的理论制冷循环性能进行了对比;并在KFR-35GW/R(35540)-N5型分体式热泵型挂壁式房间空调器上进行R290替代R22
空调系统的自动控制技术,发展至今已经有近百年的历史。在这漫长的发展历程中不断更新、不断完善,已形成了一套完整的理论体系和实用体系。因此,在具体热工参数控制方面通常有固
受益于现代化发展带来的便利,建筑在新时代下呈现出多元化发展趋势。全球化发展促使各国建筑形式互相借鉴,极大的满足了人们的视觉享受。然而从建筑学的角度分析,在符合现代建筑功能的情况下,展现自身地域性特色会使交流更加有意义,不同城市及地区建筑的多样性才会得以实现。当代博物馆的文化属性使其在人们心中具有重要地位,被视为地区文化的传播者与见证者。如何在博物馆建筑上恰当的体现自身的文化内涵并符合时代发展要求是
针对冷却顶板空调系统存在的结露问题,提出用对长波高透过性的薄膜包裹冷却顶板,并在冷却顶板和薄膜之间保留一空气夹层的解决方案。实验结果表明,加装薄膜可以有效解决冷却顶板
城市化和经济全球化进程加快,人们生活水平提高的同时,伴随出现了很多社会、环境问题。不透水面数据作为反映城市空间格局及发展变化的基础数据和城市规划、环境监测与保护的
连续刚构桥现在已发展成一种常见桥型,特别在山区,高墩与挂蓝悬臂施工,使得连续刚构桥更具优势。线型监控是连续刚构桥监控的重点,而预拱度又是线型的重要内容。以正在建设的
介绍了当手术室回风口非对称布置,无影灯采用F 600 mm双母灯布置时,利用CFD数值模拟方法模拟了动态情况下室内的速度、温度以及污染物浓度分布规律。
通过对2009年10月新疆赛果高速公路九标段温拌沥青技术试验路试验数据的搜集和整理,分析温拌沥青技术在新疆地区道路应用方面的适用性,对温拌沥青在新疆地区道路建设的大力推