【摘 要】
:
随着我国国民生方式的改变及人口问题老龄化的加剧,不健康的生活方式日益突出,我国城乡地区心血管疾病的发病率逐年升高,其致死率已超过恶性肿瘤、呼吸疾病等其他疾病,我国城乡居民5例死亡中有2例属于心血管疾病。心血管疾病不仅对人类健康问题构成严峻的挑战,还给社会经济带来庞大的负担,已经成为重大公共卫生问题。近几年,由于机器学习尤其是集成学习的方法在各行业数据分析与预测方面有着较高的准确率,所以将机器学习方
论文部分内容阅读
随着我国国民生方式的改变及人口问题老龄化的加剧,不健康的生活方式日益突出,我国城乡地区心血管疾病的发病率逐年升高,其致死率已超过恶性肿瘤、呼吸疾病等其他疾病,我国城乡居民5例死亡中有2例属于心血管疾病。心血管疾病不仅对人类健康问题构成严峻的挑战,还给社会经济带来庞大的负担,已经成为重大公共卫生问题。近几年,由于机器学习尤其是集成学习的方法在各行业数据分析与预测方面有着较高的准确率,所以将机器学习方法和医疗领域相结合成为大趋势,这为未来的疾病研究带来了机遇,为研究严重威胁人类健康的心血管疾病提供了一个新的方向。本文结合被调查者提供的身体各项指标基于机器学习的各种算法对心血管疾病进行预测研究,从被调查者的性别、年龄、体重、身高、收缩压水平、舒张压水平、胆固醇水平、血糖水平、吸烟状况、饮酒状况、锻炼状况这11个指标出发,通过特征变化引入便于研究身高、体重的身体质量指数BMI及cat_bmi和便于研究收缩压、舒张压的cat_blood_pressure,并结合特征选择筛选出心血管疾病的主要危险因素分别为:年龄、性别、cat_bmi、cat_blood_pressure、胆固醇水平、血糖水平、吸烟状况、饮酒状况、锻炼状况,以及对各危险因素做了详尽的描述性统计,从而分析各危险因素对患心血管疾病是否有影响。通过建立心血管疾病预测模型对是否患心血管疾病进行预测,分别构建基于K近邻、逻辑回归、随机森林、XGBoost、Light GBM以及以逻辑回归模型、XGBoost模型、Light GBM模型作为初级学习器,随机森林模型作为次级学习器的融合模型采用10折交叉验证对模型进行训练,随机网格搜索法对参数进行调整,得到了各预测模型的分类结果,以上分析均通过python软件实现。从整体来看,融合模型的准确率、均衡准确率、召回率、F1值是所有模型中表现最好的,认为融合模型对心血管疾病的分类性能最好,且集成算法预测模型的分类性能要高于传统分类算法,而Stacking融合模型的分类性能更是优于集成算法预测模型。
其他文献
在大数据时代下互联网发展日新月异,新的数据正在源源不断产生,同时数据类型也越来越多,其中成分数据广泛应用在地理、经济和生物等领域。成分数据是反映相对信息的数据,具有Aitchison几何结构。分类是机器学习中一个重要的研究内容,生活中人们往往会根据某一对象或事件的某些特征进行分类,并依照分类结果进行决策。对于成分数据,如果直接应用传统的多分类算法,可能会产生误导性的结果。现有的关于成分数据分类方法
科技创新是一国经济发展的核心动力,也是国际竞争中的重要影响因素。中国经济步入新常态,发展创新经济成为必然趋势。党的二十大报告强调,必须要坚持科技是第一生产力、人才是第一资源、创新是第一动力。而高新技术产业作为我国科技创新的先锋,具有高投入、高风险的特点,一旦融资受到制约,就会对高新技术产业的发展造成打击,因此高新技术产业的发展需要金融支持。科技金融融合了科技资源和金融资源,能够保障不同阶段的高新技
随着工业化、城市化进程加快,坚持走绿色发展和高质量发展之路,是解决我国当前能源稀缺、环境问题的必然之路。“3060”双碳目标更是说明了提高能源利用效率的重要性,而绿色技术创新就是其中关键。为了降低能源消耗、保护环境,提高能源利用效率和发展绿色技术创新是促进我国建设美丽中国的重要途径。首先,本文通过梳理和总结国内外文献研究现状,对研究对象绿色技术创新和能源利用效率进行了概念界定,并且确定了能源利用效
随着我国老龄化程度的不断加剧,社会的养老压力进一步加大,传统的养老模式已无法全面适应日趋严峻的养老需求,新型化、多元化、高层次的养老模式成为发展趋势。其中,不管是从老人身心健康发展,还是减轻子女负担来说,机构养老都成为老人安享晚年的不错选择,因此合理规划和布局养老机构,有效配置养老基础设施和护理人员,积极了解和满足老年人机构养老的需求,成为养老服务业的重中之重。近年来养老机构始终存在一床难求和床位
随着我国经济的快速发展与医疗水平的逐渐进步,我国居民的人均寿命也在逐年增加,同时,由于我国人口的老龄化,老年人数量占比逐年增高,随之带来的就是一系列养老问题。自进入21世纪以来,有关于养老的问题就备受各界学者关注。同时近两年来我国实施了一对夫妻可以生育三个孩子的政策,随之家庭中的子女数量与结构问题也逐步引起了广泛关注。因此本文结合这两个热点问题,去实证分析子女数量与结构对于居民养老模式选择的影响具
商业银行作为国家金融系统中的中心环节,在国民经济中起着举足轻重的作用。信用风险对商业银行而言是一种巨大的危害,因为商业银行中存在着风险资产趋异性、信贷环境同质的特点,而商业银行信用风险的蔓延也将导致金融市场中信用风险的复杂程度增加。金融社会核算矩阵(FSAM)对传统的一国实体经营SAM方式做了拓展,为银行信用风险传染研究提供了有效工具。本文主要基于FSAM框架,构建乘数模型进行宏观金融联系分析,旨
数字经济是一种以科技技术为基础的新兴产业,它促进了各个产业的融合发展,而且催生出很多新产业、新模式和新需求。“双循环”格局下,大力发展数字经济,引导产业结构的优化与升级,进而促进我国经济向更高水平的方向发展。此背景下,深入研究我国数字经济的发展现状,并分析其对产业结构的优化与升级的影响,对促进我国数字经济的发展和产业结构的调整具有一定的现实意义。本文梳理了数字经济与产业结构优化升级的相关研究,并对
时序逻辑是研究状态随时间变化系统的逻辑特性,在软硬件验证中有着广泛应用,是模型检测的基础。基于对时间模型的不同描述以及为了处理更加复杂的计算特征,衍生出各种时序逻辑,具有不同的表达能力,正确理解其表达能力对于系统模型的形式化规约尤为重要。首先,介绍基于离散时间模型的线性时序逻辑LTL、计算树逻辑CTL和CTL*,以及基于连续时间模型的区间时序逻辑ITL和投影时序逻辑PTL,对它们的表达能力及区别进
提高老年人健康水平不仅是个人追求的目标,也是构建老年友好社会的最终目的,同时,实现健康老龄化有助于减轻社会负担,形成第二次人口红利。在人口老龄化迅速发展的今天,评估我国老年人健康水平,发现健康老龄化社会建设中的薄弱之处,寻找对健康老龄化有积极影响的因素并融入到养老服务体系建设中,有利于提升老年群体健康素养,有助于健康中国战略实现。本文从微观个体视角出发,利用CLHLS2018问卷数据,以问卷中60
随着中国经济迈入新发展新常态,中国经济已由高速发展转变为高质量增长阶段,国内经济的生产方式正经历变革,然而在这个关键时期新冠肺炎疫情(COVID-19,此后简称“新冠疫情”)突然爆发并蔓延至全球,对世界和中国经济造成了前所未有的巨大冲击。不同国家、不同地区疫情严重程度不同,经济受到的冲击效应强度也不一致,同时疫情的不同阶段对经济的影响会具有异质性。我国政府针对疫情不同的发展阶段也制定并实施相应的疫