面向医学大数据的实验室检查结果结构化、标准化研究

来源 :苏州大学 | 被引量 : 2次 | 上传用户：haozi77805

【摘要】

：

目的:近年来,人工智能在医疗领域取得了前所未有的进展,对疾病的诊断和治疗具有重要的应用价值。而人工智能的发展,离不开大数据的支持。电子病历作为医学大数据的重要来源,

【作者】

：

杨涛

【出处】

：

苏州大学

【发表日期】

：

2020年01期

【关键词】

：

医学大数据电子病历信息抽提数据标准化自然语言处理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目的:近年来,人工智能在医疗领域取得了前所未有的进展,对疾病的诊断和治疗具有重要的应用价值。而人工智能的发展,离不开大数据的支持。电子病历作为医学大数据的重要来源,包含了大量的疾病诊疗知识和患者健康数据。其中,实验室检查作为临床信息的重要组成部分,对医生做出疾病诊断和治疗起到了举足轻重的作用。但是,这些信息都蕴含在非结构化的医学文本中,这对计算机读懂实验室检查信息带来了极大的困难。并且,由于检查的表述多种多样,其结构化、标准化本身就具有很大的挑战。除此之外,医学本体主要是以单个术语形式存在,但是实验室检查结果是一般是由“样本、检查对象和异常情况”三个部分构成,所以从检查本体到医学本体之间存在着结构和语义的差距。为了解决这一系列问题,本课题探索了通过建立UMLS编码的实验室检查知识库,并发展相应的算法,将电子病历中非结构化的实验室检查,转换为术语形式的结构化、标准化的表述方式,为后续的研究奠定了基础。方法:①构建知识库。利用相关英文实验室检查名称资源,构建以UMLS术语为核心的实验室检查知识库。②首先将自由文本中的实验室检查转换为结构化的三联体格式“样本—检查对象—异常情况”,再通过本知识库将此逻辑型的实验室检查表述转换为UMLS术语型表达。最终,我们选择在互联网上获取的电子病例作为语料集,评估本知识库及配套算法的效果。结果:我们将453个实验室检查映射到2242个UMLS术语,这453个检查中,72.6%为定量检查,27.4%为定性检查。另外,我们共收集了 966份电子病历,覆盖26个不同科室。以专家标注作为金标准,一共标注出12949个实验室检查结果,其中定量检查10585个,定性检查2364个。①对专家标注的金标准检查结果进行标准化的准确率、召回率和F1值分别为:1.000,0.731和0.845。②首先将这些病例进行预处理,经过算法输出为结构化的三联体格式,一共得到11219个结构化的实验室检查结果,再将这些结构化数据标准化为UMLS编码。统计结果,其中真阳性个数为7262个,准确率、召回率和F1值分别为:0.647,0.767和0.701。③我们使用了 210份病例,针对21个不同科室进行分科室测评,其中算法评估最高的为普外科,其F1值分别为0.933、0.833。结论:本课题构建了一个从逻辑表达表型到术语表达表型的知识库,并基于该知识库,发展了将病例中的实验室检查结果自动结构化、标准化的配套算法工具。该知识库及算法可以成功的将非结构化的实验室检查结果转换为结构化、标准化的术语型表述。这对计算机理解实验室检查结果以及电子病历的二次利用具有重要作用,例如相同特征的患者聚类、机器学习、医学人工智能等都具有重要应用价值。除此之外,该知识库也为我们以后构建实验室检查结果本体奠定了基础。

其他文献

商业银行发展普惠金融的现状及对策

普惠金融全称为普众惠金融体系,最早由联合国在2005年的"小额信贷年会"宣传时所提出。其宗旨为建立一个完整的金融体系,使得全社会各个阶层的人都能有效获取金融服务。每个人

期刊

商业银行普惠金融对策

高考现代文阅读试题文本选择标准摭谈

文本的选择是现代文阅读命题过程中最关键也是最重要的一环，文本的人文价值及难易度关系到试卷的水平、风格、检测的信度与效度，也体现了语文新课程理念、教学导向。

期刊

精细阅读价值取向品味鉴赏

京津冀协同发展背景下河北省城镇化发展效率现状及对策研究

河北省各地区城镇化发展对河北省总体布局和功能地位的调整以及推进京津冀协同发展有着重要意义。本文采用DEA模型对河北省的11个地级市的城镇化效率进行分析,并根据分析结果

期刊

京津冀城镇化DEA

用正交设计优化甜菜RAPD反应体系

采用正交设计对甜菜的RAPD反应体系进行优化．应用L25（5^6）正交表，研究了Taq、Mg^2＋、随机引物、dNTPs和DNA模板5种RAPD反应组分浓度变化对扩增结果的影响，并进行量化分析，试验结果表

期刊

甜菜RAPD反应体系正交设计sugar beet RAPD Reaction system Orthogonal design

基于高压压汞、氮气吸附技术研究泥页岩孔径分布——以青山口组泥页岩为例

<正>页岩油气是目前国内外研究的"热点",且资源潜力巨大。页岩油气一般以吸附态、游离态赋存在于泥页岩中,其勘探难度较大。因此研究泥页岩的孔径分布,对于勘探开发页岩油气

会议

P2P平台提现效率对投资者决策的影响研究——基于网贷之家数据

本文选取了网贷之家网站400家P2P借贷平台的数据,搜集了关于平台特征和经营状况的数据,通过构建计量模型来进行实证分析,考察了P2P平台提现效率对该投资者决策的影响。结果表

期刊

P2P借贷平台提现效率投资者

肮脏工作感知对身心福祉影响的应对策略研究

肮脏工作是指那些被视为在生理,社会或道德上受到污名的工作任务,以此来指代那些令人厌恶的或有辱人格的职业。肮脏工作对社会来说是必要的,但相关从业者由于从事这些必要但

学位

肮脏工作肮脏工作感知感知社会支持工作重塑工作投入离职倾向

企事业信息服务公共平台体系结构研究

企事业信息服务公共平台是企事业单位行业内部信息共享、决策支持的重要信息平台，在经济与社会事业发展中发挥着重要作用．介绍一种实现企事业专用网公共平台的快速对接方法，减少

期刊

企事业信息服务公共平台P2P开放式API黑板软件体系结构智能enterprises and private network P2P opening A

幼儿教育中幼儿自信心的培养途径探索

在新时代,各阶段的教学在不断地进行改革深化,取得了不少的成效。国家对幼儿园阶段教育越来越重视,在一定程度上也对学校和教师工作提出了新的要求。近几年以来,幼儿园阶段的

期刊

幼儿园自信心综合素质幼儿教育

集成与创新──《惠能评传》读后

期刊

《坛经》惠能禅禅学思想解脱论佛性论中国文化敦煌本唯心论本体论评传

面向医学大数据的实验室检查结果结构化、标准化研究

其他学术论文