医学关系抽取和知识图谱分布式表示研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lianjinling27
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会和经济的不断发展,人们的生活水平得到了极大地提升,对个人健康和生活问题开始投入越来越多的关注。同时,社会的发展也带来了技术的革新与进步,为了解决医疗费用和需求的增长与优质医疗资源不足之间的矛盾,智慧医疗技术应运而生,这将是一种可以充分利用医学文本知识来模拟医生进行学习和诊疗的技术。而智慧医疗的发展与学习医学知识必不可分,医学知识的来源整体上可概括为医学书籍、临床数据、网络数据三个方面,本文基于医学书籍、网络语料两个来源的数据,对知识图谱构建过程中的关系抽取技术和知识图谱的分布式表示进行了研究。(1)对医学数据进行人工标注,并训练有监督关系抽取模型。提出了基于自注意力机制的分段池化卷积神经网络分类模型,并引入了实体类别等特征使F1值达到了87.2%。(2)对不依赖人工标注的远程监督关系抽取进行了探索。在如何降低远程标注噪声问题方面进行了尝试:先后采用基于规则的方法、基于注意力机制的方法、基于增强学习的方法进行降噪,并探究了负例采样问题,最终的AUC值达到了0.489,也构建了一个涵盖信息较为丰富的基础医学知识图谱。(3)针对构建的基础知识图谱,将其由符号表示转化为更容易给其他任务提供信息输入的稠密低维实值向量表示。基于训练好的向量表示模型来预测知识图谱中的关系和实体,从而达到知识图谱补全的目的。经过上述研究,从各种医学书籍、医学网站出发构建了一个基础版的医学知识图谱。此外,本文构建的远程监督关系抽取框架可以在不需要人工标注的情况下适用于大部分医学语料,甚至是临床文本,这就相当于未来几乎可以将所有的医学知识都囊括到我们现有的知识图谱体系当中。进一步的,通过对知识图谱的分布式表示进行研究,可以直接将图谱的向量表示信息提供给对话问答、诊断推理等任务,从而能更好地发挥智慧医疗的作用,减少医生的诊断次数和诊断时间,促进优质医疗资源的下沉,弥补医疗资源的不足。
其他文献
贵州平均海拔1100米,主要由低山、宽谷和浅盆组成;贵州“地无三里平”,山原、山地约占贵州全省总面积的87%,丘陵占10%,盆地(坝子)、河谷台地和平原仅占3%。山地多而平地少,历
以上海证大喜马拉雅艺术中心工程为例,介绍了流体施工的特点和难点及工艺原理。主要从平面(空间)定位、水平剖面定位模板及内外曲面模板选择、内外模支架系统选择、钢筋混凝土
建筑使用后评价(Post-Occupancy Evaluation,简称POE)的核心任务之一就是收集使用者对建成环境的使用及评价信息,通过科学分析以了解他们对目标环境的价值判断及心理需求,为
在硫酸储存设计的时候需要重视选材与防腐技术。本文为了了解硫酸储罐的选材与防腐技术,将以常压硫酸储罐为基础,对其常用材料的特点、种类以及防腐技术的应用方法进行分析。
本文依据美国国务院最新解密的美国对外关系文件集(FRUS),试图探究美国在1978年初阿富汗政变到1979年末苏联入侵阿富汗期间的反应与政策。1978年4月,阿富汗爆发政变,亲苏的共
目的:骨髓抑制是恶性肿瘤患者在接受化学治疗后常出现的毒副反应,为了防治这一毒副反应,促进患者身体的恢复,课题组在中医理论指导下,结合多年临床工作经验的总结,自拟了“健
将30只雄性Wistar大鼠分为三组各10只,对照组(NC组)基础饮食饲养,高饱和脂肪酸组(HSF组)高饱和脂肪酸饲养,高糖组(HS组)高糖饲养。喂养24周后,观察三组体重(BW),血清总胆固醇(TC)、甘油三酯(T
对每个历史阶段的主题及其本质特征,我们党都有精准概括、深刻揭示。步入新时代,我们需要一个不同于以往的、清晰的、鲜明的主题词,"复兴"就是中国特色社会主义新时代的主题
目的:探讨糖尿病足的预防及护理措施。方法:选取广东省中医院芳村分院2015年收治的40例糖尿病足患者,对其临床资料进行回顾性的分析研究。结果:在40例患者当中,经过预防和护
目的:采用“筛选-强化性状-同种体质交配传代”的方式,结合先后天多因素复合的方法构建自发性肾阳虚体质动物模型。从动物宏观表征、生物学指标、组织切片、以方测证四个方面