基于深度学习的高血压中医医案知识图谱的构建

来源 :甘肃中医药大学 | 被引量 : 0次 | 上传用户:xm121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中医医案是医家诊疗经验的积累与总结,能够反映临床经验和学术特色,是具有参考和借鉴性的诊疗资料,历代医家都十分重视对医案的概述和总结。高血压病属于现代医学的疾病名称,其发病率高、影响广泛、病因病机未明、服药周期长,对工作和生活造成极大不便,患者依从性较差。利用中医药的方法进行治疗或辅助治疗,有望实现高效低毒的高血压治疗效果。如何有效精准分类、控制和预防高血压已成为当今社会人们必须认真面对的问题之一。随着人工智能以及大数据技术在医学方面的大规模应用,基于大数据深度学习的技术不仅为各种疾病提供更快速、精准的数据服务支持,而且研究人员可对临床医疗数据做进一步深度分析,也对其它病症提供有用的参考。在中医方面,中医医案的数据挖掘可以帮助我们发现大量隐藏的临证经验与用药规律。然而,一方面中医医案信息存储以自然语言为主,而这种形式不利于特征的获取且会产生信息“孤岛”问题,浪费资源;另一方面,中医医案尚缺乏统一的标注语料和规范,使通用的实体识别和关系抽取模型方法难以直接应用于中医医案中,为其自然语言处理任务带来巨大挑战。目前,结合中医独特文本进而构建医疗语料库已成为医疗领域科研的重点与难点。为了克服上述困难,医学知识图谱的构建及实现为医疗知识的可视化和分析提供了一种可行的解决方案。本文针对中医医案中中文分词困难、实体种类繁多、歧义等难点,提出了基于双向长短期记忆神经网络(Bi LSTM)和条件随机场(CRF)的混合模型进行命名实体识别;构建了基于深度学习技术的知识图谱实现可视化,先对中医医案的文本进行命名实体识别和关系抽取,再使用图数据库Neo4j存储医疗知识实现知识图谱可视化及分析,并在后期对知识图谱进行链路预测。论文的主要研究内容如下:(1)基于双向长短期记忆神经网络条件随机场(Bi LSTM-CRF)模型进行命名实体识别。根据深度学习模型特点,该模型使用Bi LSTM作为特征提取器,CRF进行序列标注,通过对语料集进行标注实现对医案中疾病、症状、证候、治法和处方五类实体进行命名实体识别,最后对识别的效果进行分析,表明实验的结果符合最初实体识别的需求。同时将深度学习模型应用于知识图谱,提高了知识图谱的应用范围。(2)优化基于深度学习的关系抽取模型的训练。针对实体间关系抽取的特征选择问题,本论文结合实体抽取设计出一种联合模型,采用“BIO+关系类型+位置标注”将原来的标记方式中的一系列预先确定的关联转化为三元组(实体信息,实体关系,实体在关系中的位置)。(3)利用图数据库Neo4j对知识图谱进行可视化分析。Neo4j使用非结构化的方式来存储关系复杂且关联深度大的数据,能够实现高效的关系查询。通过前两章从中医医案中识别出的实体及关系完成知识图谱的构建及可视化,旨在通过知识图谱将“平面化”的中医医案进行“多维度”呈现。(4)基于链路预测模型帮助找到和恢复知识图谱上丢失的信息。本文创新性地提出一种新的层级结构模型HSTP(Hierarchical Structure Type),该模型基于类型和层级结构获取信息,能够有效表达实体之间的语义关联,结果在链路预测任务的基准数据集上提高了3.9%左右,为解决知识图谱中缺失信息的发现与还原提供基础。本论文旨在通过上述内容的研究,设计并实现了针对中医医案知识图谱的构建,并利用深度学习提高医学知识图谱的语义理解,从命名实体识别、关系抽取、知识图谱的可视化及链路预测等内容进行了详细地阐述。知识图谱在中医领域的应用是将辨证论治知识体系中显性知识与隐性知识综合分析,运用知识图谱可视化技术表达出来,实现“病-症-证-方-药”的可视化。人工智能可以将医学知识嵌入到网络,用来指导和丰富医学文本得以表示,我们希望这一部分成果未来应用到更广泛的任务上,探索出人工智能研究的热点与未来中医药领域研究预测和发展的方向,为该领域专家和学者的深入研究提供借鉴与参考。
其他文献
习近平总书记指出没有网络安全就没有国家安全,网络安全的本质是对抗,对抗的本质是攻防两端能力的较量。网络空间靶场通过模拟真实的网络攻防作战实验环境,为攻防两端能力提供科学观察、测量和评估手段,网络空间靶场就是国家网络安全的“演兵场”,网络靶场建设成为了新时代国家培养网络空间安全人才、制胜网络空间领域的重要决策。本文旨在进一步提高数字网络空间靶场的安全可靠性,实时掌握数字网络空间靶场的基础资源状况、运
学位
习近平总书记在党的十九大报告中指出,经过长期努力,中国特色社会主义进入了新时代,这是我国发展新的历史方位,这一重大判断具有十分丰富的哲学内涵。民族自尊与文化自信作为民族传统体育文化传承的时代主题,对民族传统体育文化的发展与创新具有重要的意义。抛绣球是广西壮族最具代表性的民族传统体育项目之一,它产生于壮族人民的生产生活,蕴含着深厚的壮族文化。当前,随着广西高校对民族体育文化的积极发展,广西壮族抛绣球
学位
工作记忆(working memory)是指个体在执行认知任务中,对信息暂时储存与操作的能力,工作记忆的缺陷也会导致一些精神疾病(如精神分裂症)和神经退行性疾病(如阿尔茨海默病)的产生。近年来,随着脑机接口领域的高速发展,基于脑电信号的工作记忆研究也越来越成熟。本文基于不同工作记忆状态下的脑网络进行了社区结构研究和节点重要性分析,并在此基础上提出了一套能够实现对不同工作记忆任务和被试进行自适应调制
学位
“晚清新关华员”是指近代外籍税务司制度下的新式海关中的华籍关员,也包括新关兼管常关后的常关职员。一直以来,由于大历史的书写传统、文献资料的缺失与分散、原始海关档案的不充分利用及海关史研究中的“重洋轻华”等原因,华员群体成了海关中“沉默的大多数”。基于此,本文以晚清新关华员在中国近代社会变迁中的作用及影响为切入点,着眼于社会史中的海关史,海关史中的社会史,以社会变迁的视角来考察新关华员。具体而言,本
学位
在我国城镇化水平不断提高的社会背景下,越来越多的农户退出宅基地并逐渐向城镇转移与定居,由于代际差异的存在,不同年代的农户在宅基地退出问题上表现出不同,对此问题的深入研究有利于制定出更为合理的农村宅基地退出政策。为此,农户代际差异对其宅基地退出意愿的影响及作用路径进行研究,推进鄂西北地区宅基地退出的理论支撑被奠定,具有重要的指导意义。首先,本研究结合代际差异理论、农户土地产权理论及农户资产管理行为等
学位
在过去的十年中,报文分类算法得到了广泛的研究。随着链路速度快速增长,FPGA因兼有可编程性和高性能的特性而被广泛应用于实时网络处理中。面向现场可编程逻辑门阵列(Field Programmable Gate Array,简称FPGA)平台提出的基于静态随机存取存储器(Static Random-Access Memory,简称SRAM)的三态内容寻址存储器(Ternary Content Addr
学位
在大数据时代的背景下,人工量大或规则僵化的流量异常检测与流量分类方法显得效率低下且性能差。而基于深度学习的方法,通常具备端到端、自动化程度高和大数据适应性强等优点,能够在日益复杂的网络环境中取得出色的表现。然而该技术仍存在不足:一是深度学习的神经网络在应对新型流量时,训练时间短、训练样本少的情况下性能不理想。二是深度学习通常的离线训练和测试场景不适应在线的流量检测与分类。因此为解决上述问题,同时保
学位
2018年文化部与国家旅游局合并为文化和旅游部,文旅融合成为我国旅游发展的主流。2020年11月国家出台的《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》中,提出传承弘扬中华优秀传统文化、推动文化和旅游融合发展等内容。广西马山会鼓是壮族人民在稻作文化孕育中形成,至今已有近千年的历史沉淀。当前,广西马山会鼓依托文旅融合发展,对传承发展广西马山会鼓体育文化以及拓宽会鼓与
学位
随着计算机网络技术的发展,IP网作为承载网已成为趋势与现实。但是,由于大型网络中设备长期处于全天时全天候的工作状态,岗位人员难以在不影响正常业务的情况下进行故障复现、性能分析以及网络升级模拟验证。本文借助OPNET网络仿真技术的先进建模机制、模型库和外部接口,对某单位的业务IP网进行仿真研究,并建立仿真平台。具体来说,本文的主要工作与创新包括:首先,介绍了研究题目的背景,分析了当前网络性能测试方法
学位
当前正处于农村社会经济转型发展时期,土地利用转型是社会经济转型发展的产物。农村居民点作为农村土地利用的重要组成部分,其功能演变为农村社会经济发展创造需求,提供动力。由于不同区域农村居民点功能演变呈现出明显的差异性,系统认识农村居民点功能转型规律及其作用机理,主动调控农村居民点功能转型,可以引导农村社会经济转型发展符合社会经济发展规律,也是乡村振兴的内在要求。乡村振兴的最终目的是要全面提升农户的福利
学位