基于知识图谱的糖尿病问答系统的研究与应用

来源 :中北大学 | 被引量 : 0次 | 上传用户:pploa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着我国居民消费水平的提升以及人口老龄化进程的加快,糖尿病患者数量大幅度攀升,且发病群体年轻化趋势明显。据调查显示,糖尿病的有效防治手段包括糖尿病知识教育、自我血糖监测、健康饮食等,而“互联网+”医学教育科普服务多年来积淀了大量的数字化诊疗信息。因此,研究如何利用互联网帮助用户简单有效地获取糖尿病防治知识是本文研究的重点。通过传统的搜索引擎查询知识,用户得到的是冗余的数据,难以快速精准地获取到知识。问答系统对用户问句进行语义解析,可以实现根据用户的意图反馈答案,知识图谱则可以实现大规模数据的整合,可利用查询语句从中查询有效数据。因此,本文研究并实现了基于知识图谱的糖尿病问答系统,并采用基于深度学习的命名实体识别模型增强系统问句解析能力,经测试,该系统可快捷、准确地为用户解答糖尿病防治知识,同时也响应了国家智慧医疗的政策。本文主要研究内容如下:(1)构建糖尿病领域的知识图谱。基于Python的网络爬虫技术,从“寻医问药”等医疗网站爬取糖尿病相关信息,并对数据进行清洗处理与知识抽取。为提升知识图谱的质量以及知识表达能力,将知识抽取后的数据与Dia KG知识图谱数据集进行多数据源知识融合,完成糖尿病领域知识图谱的构建与持久化。(2)研究命名实体识别算法。首先从糖尿病中文社区收集医疗问答数据集作为命名实体识别的自建语料集,并对数据集进行分词和实体标注,然后研究并构建了基于BERT+Bi LSTM+CRF的命名实体识别模型,在CCKS-2017数据集和自建数据集上分别进行了实验并做了结果比对,验证了该模型相较于其他模型而言,识别效果提升明显。(3)构建完整的糖尿病问答系统。基于上述研究成果,通过基于模板匹配与基于语义分析相结合的方式实现问答系统,具体实现流程包括:中文分词、问题分类、问句实体识别、句法依赖分析、查询语句构建与知识检索。已构建好的糖尿病知识图谱作为问答系统的数据源,利用Flask框架和D3.js工具对系统进行包装,通过浏览器访问的方式请求服务,最终实现自动问答功能和知识图谱可视化功能。本文通过以上工作,首先完成一个高质量的糖尿病知识图谱,接着采用深度学习技术改进问答任务中系统对用户问句的语义解析能力,最终实现一个能够切实方便的解决用户问诊需求的糖尿病问答系统。
其他文献
古琴是中国最古老的弹拨乐器,也是中国传统音乐文化的活态传承。每个时代琴家们喜爱的琴曲各有不同,而经典的琴曲总是会被人们牢记并广泛的流传。由南宋琴家郭沔创作,吴景略先生演奏版本的《潇湘水云》就是一首经过岁月磨炼、时代沉淀而备受人们喜爱的琴曲。本文选用此曲作为研究对象,全文共分为五个部分:第一部分的绪论中介绍了选题缘起、意义及研究现状;第二部分简述了琴曲的创作背景;第三部分对演奏谱本进行了细致的梳理,
学位
随着社交网站的兴起,微博凭借着效率高、传播力强、信息多元化等特点,成为了国内外最受欢迎的社交网络信息平台,它给人们获取和分享信息带来了便利,同时也存在大量的网络谣言。谣言不论是对国家,社会还是个人,都带来了严重的负面影响。目前,在社交网络平台上最常见的谣言识别方法是人工识别,此方法不仅会消耗大量的人力、物力和财力,而且效率很低。所以,许多专家和研究人员采用传统的机器学习的方法进行谣言识别,虽然取得
学位
自2008年全球金融危机爆发后,技术预见受到了世界各国的高度关注,颠覆性技术也已经成为各国战略规划的重点。2017年,十九大指出要“突出颠覆性技术创新”。2018年,习近平总书记在两院院士会议上提出,要把颠覆性技术创新作为重要突破口。同年,中关村科技园区出台了支持颠覆性技术创新的指导意见。但是,颠覆性技术在发展过程中的极大不确定性造成了其在一段时间内不会被重视的特点,这也是在对其进行识别和预测时的
学位
当前单图像和视频的超分辨率算法广泛应用在诸如医疗影像、视频监控与安全、遥感等领域,且有着举足轻重的应用场合和价值,因此一直是学术的研究重点。本文利用这些年图像视频处理方面取得巨大成就的深度学习技术,结合深度学习方法实现了对单图像和视频的超分辨率重建任务,研究内容主要包括以下几个方面:(1)针对目前主流算法中网络结构越来越深导致重建精度和速度都达不到兼顾得到效果,本文提出了残差网络与目标检测RFB相
学位
随着软件开发技术不断更新迭代,在软件工程中,如何有效地提升软件开发的效率与品质,是目前软件工程学研究的重点,软件复用是解决这一问题的重要途径。近年来,各种开源社区的出现,数不胜数的开发者和有关行业人士都加入到开源软件的学习与共享中。长久以往下来,开源社区中也积淀了大量的开源软件项目资源,其具有涉及领域广泛、质量参差不齐等特点,加大了用户寻找可复用项目资源的难度的同时也降低了推荐结果的准确率。在类似
学位
常家庄园不仅是晋商的代表性建筑,其规模更是超过了其他晋商大院。常氏家族一直以来重视孩子的读书教育,后代子孙人才辈出,被人们誉为“儒商世家”。常家庄园不但是晋中的标志性旅游景点,更在三晋地区民俗文化传播发展过程中产生了巨大的影响。相信随着社会的不断发展,常家庄园家风家训文化的宣传将可以更加普及和传播我国优良的传统民俗文化。研究晋商家之训并继承其优良的家风文化,回应了习近平总书记强调家风建设的重要性。
学位
随着信息技术的突破和个人智能设备的普及,网上办公、网上购物等活动逐渐成为人们的日常,但是这些技术便捷了人们的生活的同时,也造成了其越来越严重的数据泄露隐患,比如个人信息被滥用、过度收集、非法交易等,发展个人信息安全的保障技术刻不容缓。近年来,信息安全和密码学理论的相关研究逐步发展,尤其是与公钥密码技术相伴的数字签名技术有十分重要的研究和应用前景,这其中面向群体数字签名更是扮演着举足轻重的角色。面向
学位
支气管扩张症是一种常见的慢性呼吸道疾病,严重影响了患者的生活质量,带来了沉重的社会经济负担。CT影像是医生诊断支气管扩张的主要手段,通过CT影像可以获得更多的肺部细节。但由于CT影像的特性,也给医生的诊断工作增添更多机械性的负担。随着人工智能的发展,可利用计算机视觉领域的目标检测技术辅助诊断支气管扩张,及时发现支气管扩张并减轻医生的负担。本文基于深度学习对支气管扩张的检测进行了相关的研究,将目标检
学位
阻塞性睡眠呼吸暂停综合征(obstructive sleep apnea syndrome,OSAS)是上呼吸道反复部分或全部衰竭的一种疾病,大多数阻塞性睡眠呼吸暂停与不同程度的头颅骨骼变化有关。轻度疾病会影响患者的夜间睡眠质量,严重者会引发其他类型的疾病。目前,阻塞性睡眠呼吸暂停的主要检测方法是采用多导睡眠监测与传统机器学习方式,由于多导睡眠监测诊断方式存在高成本低效率的缺陷,而且传统机器学习又
学位
近年来,随着互联网技术的快速发展,社交平台上的信息量爆增,给人们的生活带来了很大的变化。与此同时,也伴随着大量的谣言。谣言一旦散播开来,那么造成的危害是难以估计的,它的散播速度和广度都是相当惊人的。那么如何高效地识别谣言且尽可能地减小其造成的危害,无疑已经成为一个亟待解决的难题。鉴于此,社会各界及政府部门都采取了不同的措施,力求通过相关技术来及时、准确地识别出谣言,进而维护社会的公平和正常秩序。作
学位