医疗CT文本结构化研究与系统实现

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:connine_li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗行业和信息技术的迅速发展,目前各大医院在提供医疗服务的过程中都会产生大量非结构化的医疗文本数据。CT文本报告是一种非常重要的医疗文本数据,作为一种医疗数据的载体,记录器官CT下所见形态以及是否有病变等相关信息。CT文本报告对于医生对病人的疾病诊断非常重要,是最终诊断结果的一项重要依据。目前对于医疗相关文本处理的方法主要依靠诊疗医生的个人知识经验对文本进行处理,但是人工处理的方式不仅耗时耗力,而且医生的长时间处理可能会导致准确率难以得到保证。因此基于智能化方法挖掘医疗文本的价值具有行业实用意义。本文围绕医疗CT文本挖掘做了以下几点工作来实现非结构化CT文本价值挖掘:(1)针对医疗领域表述相对专业的特点,本文提出了一种结合条件随机场(CRF)和医疗固有规则推导的CT文本命名实体识别的方法,在对原始CT文本进行中文分词以及词性标注之后,使用CRF++工具对文本进行成分序列标注以及句子序列标注,然后结合人工归纳的推导规则以及使用word2vec对提取出的实体进行归一化训练后,能够有效提取文本中实体,挖掘出实体之间的关系。(2)本文创新地提出了应用于医疗文本数据的非结构化文本数据结构化方法论体系,即一种由CT文本报告预处理阶段、CT文本报告属性提取阶段和CT文本报告即时结构化三个阶段构成的一个对CT文本进行结构化的方法。(3)构建了医疗影像CT文本报告结构化原型系统,使用数据对系统进行测试,通过实验表明本文提出的结构化处理方法准确率可达86.7%,达到了系统预期设计的要求,为CT文本结构化提供了一种处理方法。
其他文献
财政收支及相关活动是产业空间结构升级的重要抓手和保障,能够引导社会资源优化配置、提高产业集聚度、增强区域经济竞争力。本文从投资和消费的变动两方面分析了财税政策激
6月29日,广东省潮州市农业局召开全市高致病性猪蓝耳病防控工作紧急会议,传达贯彻6月25日广东省农业厅在广州召开全省全省高致病性猪蓝耳病防控工作紧急会议精神,分析当前生猪疫
研究砖红壤对F-的吸附反应尤其是随后Al3+的释放过程,有助于增进对土壤酸化过程及其环境影响的理解.在初步揭示出F-吸附反应以及Al3+释放反应的动力学特征基础上,重点考察了pH
受机场附近160m限高制约,辽宁某电厂需采用烟塔合一技术.运用德国AUSTAL2000模型分析了环境风速、大气稳定度、烟气出口速度、烟气出口温度等参数与烟气抬升高度间的关系,预测了
利用连续三年(1993~1995年)对冬暖式塑料大棚系统观测的小气候资料及生物学资料,分析了大棚内主要气象要素的变化规律及其与作物生长发育的关系。结果表明:(1)棚内温度日变化范围在11~30℃内,基本适
主要介绍了"山东决策气象服务系统数据库子系统"的技术特点、存储内容、存储格式,以及数据库检索方式的设计和开发.
前言随着现代观测、计算机、通讯及天气预报技术的发展,尤其是9210工程的全面实施,解决了长期以来制约气象业务发展的资料传输瓶颈问题,预报员能够及时获取极其丰富的各类气象信息。
通过中尺度模式输出的物理量论断场资料,分析了特大暴雨的水汽源地、输送路径、辐合区域及降水机制。结果表明,本次特大暴雨是在弱有稳定层结条件下产生,通过潜热释放,又对大气环
排水处理一般解决以下问题:(1)去除污水中的有机物和悬浮物,得到透明的处理水;(2)去除氮、磷等营养盐类;(3)减少污泥生成,并设法把污泥转化为能有效利用的形态。针对这些问题
主要介绍新建济南至泰山无线扩频通信系统中的直序列扩频基本原理,电台基本性能和功能开关等技术.