基于模糊决策树的医学数据分类研究

来源 :北京交通大学 | 被引量 : 9次 | 上传用户:oyjing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,医院信息系统和医疗数字化设备的广泛应用,医学数据库中有关病人的案例、检验、诊断和治疗的信息大量积累,人们对于发掘医学数据中所蕴含知识的需求日益迫切。借助数据挖掘技术对这些宝贵的医学数据资源进行分析和处理发现有价值的信息,从而可以为疾病的诊断和治疗提供科学的决策。模糊决策树将模糊理论与决策树算法相结合,可以对医学数据中存在的模糊性和不确定性进行处理,增强决策树算法的适用性,实现更加准确有效的医学数据分类。本文主要开展了以下工作:(1)对模糊决策树的两种算法——模糊ID3算法和最小分类不确定性算法进行研究,在模糊数据集上完成模糊决策树的构建和规则提取,并利用模糊规则对新实例进行分类预测。总结清晰决策树与模糊决策树的区别。(2)对于医学数据集中的连续值属性,使用Kohonen特征映射算法和三角隶属度函数完成数据的模糊化处理,实现连续值属性的平滑划分,更自然合理地描述数据集属性的特征。(3)通过MATLAB实现模糊ID3算法和最小分类不确定性算法,并结合已有的C4.5和CART算法,在公开可用医学数据集上构建相应的分类模型。比较四种决策树算法生成模型的分类准确率以及规则数量的不同。模糊ID3算法在四组医学数据集上都获得了较高的分类准确率,且生成的规则数量适中,体现出模糊决策树算法在处理医学数据连续值属性上的优势且能对数据中存在的模糊性进行处理。(4)针对模糊决策树算法中的关键参数通常是依据经验设定的问题,本文提出使用改进粒子群算法对参数组合进行智能寻优从而改善模糊决策树性能。适应度函数综合考虑训练准确率、测试准确率、概括能力以及生成树的规模。使用优化的模糊决策树算法在公开可用医学数据集上构建分类模型,证明应用该方法进行医学数据分类的必要性与有效性。该方法既能够产生较为准确的预测结果,还能够以决策树的形式提供预测的理由。
其他文献
随着社会的发展,构建终身教育体系和建设学习型社会的推进,有关工作场所学习的研究日益广泛和深入。文章尝试从成人教育学的视角,以诺尔斯成人教育学概念框架的基本特点对“
目的通过检测浸润性乳腺癌中DNA拓扑异构酶Ⅱα(DNA-topoisomeraseⅡα,TopoⅡα)、肿瘤细胞增殖活性指标Ki67抗原的表达情况,探讨Topo IIα、Ki-67在浸润性乳腺癌发生、发展
华能布拖二期(补尔)风电场是凉山州规划建设千万装机风电基地的前期重要工程,本工程装机25台单机容量2.OMW的风力发电机组,年发电量在8000万KW.h左右,通过输电线路将清洁能源
针对起重机在风电吊装应用中吊机偏摆的具体问题,本文提供了一种起重机风电吊装专用揽风绳系统,使风机在吊装过程中平稳、不产生晃动,使吊装过程安全高效。详细介绍了专用揽
清代甘肃区域性的粮食市场已经形成。粮食市场的整合度有限。地理环境、灾变、仓储、粮食种类都是制约市场整合的因素。19世纪后半叶兵燹、地理交通等因素制约了甘肃粮食市场
目的探讨护理干预对需氧性阴道炎患者妊娠结局及新生儿的影响。方法选取2010年2月~2012年2月我院妇产科收治的95例需氧性阴道炎患者作为观察对象,随机分为干预组45例和对照组
研究目的:测定胃癌患者病理组织及血清中HSP70的表达水平,探索其在胃癌发生发展中的作用。结合中医脾虚理论,研究HSP70表达水平与胃癌患者年龄、性别、脾虚状态、发病部位、
目的探究助产护理在预防新生儿窒息中的应用价值。方法对2018年3月~2019年3月在本院足月分娩的产妇中,随机抽出80例参与研究,将这80例产妇按照分娩时间先后顺序分为两组(对照
随着社会的进步、经济的不断发展,建筑工程行业也在与时俱进、不断更新,相应的市场竞争体系也在不断完善,假使企业想要获得更加优质的发展,就需立足实际。就当下建筑行业的管
目的:建立同时测定3种不同大黄炮制品中没食子酸、桂皮酸、儿茶素含量的方法。方法:采用反相高效液相色谱法。色谱柱为Thermo ScientificTMHypersil GOLD Dim,流动相为甲醇-0