面向医疗领域的智能问答系统设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:exiaodong1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国民健康意识水平的不断提升,人民对于医疗健康知识更加关注,对于获取医疗健康知识的方式也提出了更高的要求。目前网络上提供的医疗知识获取方法还停留在依靠关键词搜索和人工回复的阶段,获取信息的便捷性、时效性、针对性和智能程度不足,影响了医疗健康知识的普及。而同时以深度学习技术为代表的新一代自然语言处理技术的出现,使得智能问答系统愈加成熟。因此,针对人们便捷获取医疗知识的需求,结合目前日益成熟的自然语言处理技术,本文研究并实现了面向医疗领域的智能问答系统。针对用户的提问,系统利用实体识别、文本分类和语义相似度计算等技术对用户问句进行处理解析,在医疗知识库中获取问句对应的知识并拼接生成答案或在问答库中获取与用户问句相匹配的答案。本文首先使用网络爬虫技术构建了以疾病为核心的医疗知识库,并使用了Neo4j图数据库存储方案,实现了医疗知识的结构化存储。其次,设计与实现了基于实体识别和文本分类的语义解析功能,在实体识别方面,通过综合使用医疗实体词典匹配和基于BiLSTM+CRF的实体识别模型,并使用规则和编辑距离计算判定的方法对结果进行融合处理,有效提升了实体识别在医疗实体词汇上的效果;在文本分类上,设计实现了基于融合特征的BiLSTM文本分类模型,将实体识别的结果提取为onehot向量融入到模型中,提高了模型在医疗问句分类上的效果。此外,实现了基于TF-IDF加权和word2vec的语句向量生成方法,并使用余弦相似度进行语义相似度的计算,通过TF-IDF算法对word2vec词向量进行加权计算,提高核心词汇在语句向量中所占的比重,得到了相似度计算问句匹配的良好效果。最后,使用模板匹配和知识库查询的答案生成方法与基于语义相似度计算结果问答集检索的答案生成方法得到问句答案。测试结果表明,本文实现的面向医疗领域的智能问答系统能够正确理解用户提问内容并作出符合预期的专业回答,系统性能表现良好,吞吐率及响应时间均在合理范围之内。
其他文献
学位
学位
学位
氮沉降是自然界重要的氮素循环过程,氮素是草地生态系统生产力的主要限制因子,因此氮沉降严重影响了包括凋落物分解在内的物质循环过程。为探究半干旱草地生态系统植物凋落物分解过程对氮沉降的响应,在北方农牧交错带草地生态系统野外观测研究站采用随机区组设计设置了8个水平(分别为0、1、2、4、8、16、24和32 g N·m-2·y-1)的氮添加处理,6次重复,用尼龙袋分解法测定该草地优势种赖草(Leymus
学位
学位
学位
冷链药品由于在流通中的时间及温度经历而引起的品质降低是累积和不可逆的,使冷链药品存储及配送环节成为了保证冷链药品质量的重要环节,特别是存放冷链药品的冷藏库是保证冷链药品存储质量的关键设备。实际上,工作中的冷藏库库温处于不停地波动中,库温的波动影响冷链药品的品质。为保证冷链药品的储存环境,2013年6月1日起实施的《药品经营质量管理规范》(Good Supply Practice,简称GSP)(卫生
学位
学位