论文部分内容阅读
专业知识的总结提取是现代信息时代的研究热点,在医疗领域中就诊医生的选择一直是导医系统中的一个典型问题,时常会出现患者在挂号时,无法从系统中上百个医治领域相似的医生信息中,准确地选择到与自己症状与疾病最匹配的医生的情况,挂错号、挂号困难的问题时有发生。针对这样的问题,本文根据一家具体的市级医院的需求为背景进行分析,从实际出发,结合手中的门诊病历数据以及互联网权威网站爬取的数据研究并开发出一套基于知识图谱的中医智能导诊系统。由于在实际的医患问答场景中,患者的症状描述中可以用作分析的症状实体文本通常是包含在大量无意义的自然语言之中的。其描述大都具有内容形式较为随意、口语化词汇比较多的问题,这就给智能导诊的诊断这一过程创造了难度。本文将从如何在患者的自然语言描述的文本中获取症状这一实体信息的角度入手,提出一种能使用户与系统具有更少的交互轮数的智能导诊系统解决方案。同时,在实际的患者就诊的场景中,还存在一种问题:医生对患者的诊断结果通常不唯一,患者临床症状通常也不唯一。这个问题的表现以及难点主要反映在本文所获取的真实中医门诊病历数据上。该数据主要记录的是疾病实体与症状实体的多对多的关系。除此之外,还有数据量大、数据形式不统一、脏字符多等问题。为了有效地应用这一批珍贵的数据,本文首先对数据进行清洗和切分工作,接着提出一套面向此数据的从多对多关系中提取一对多关系的算法,找出了数据集涵盖的所有疾病的临床症状及体征这类知识,并建立知识图谱。本文所构建的智能导诊系统围绕其业务特征采用了命名实体识别技术,并结合知识图谱构建技术来完成整体业务逻辑。围绕这两项主要任务,本文介绍了相关的技术知识,并实验分析了将相关的技术应用在本场景下的可行性。在了解业务流程的主要难点后,本文提出一套完整的业务流程实现方案并实践完成。通过实验证明,本文提出的中医智能导诊系统能够很好的实现对于患者症状自述的诊断功能,并且将其导向相应的医生以及科室。