基于生物标志的数据挖掘技术在肺癌预警预报系统中的应用

被引量 : 0次 | 上传用户:zoook
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的目前肺癌已成为癌症死亡的首要原因,在许多国家其发病率及死亡率呈上升趋势。检测肿瘤发生过程中的早期分子标志,从而发现癌前病变或早期癌变被认为是肺癌早期诊断最具应用前景的手段,但目前肿瘤标志距离临床应用还有一定的距离。近年来发展起来的数据挖掘技术在解决大量的变量带来的多参数问题上具有独特的优势。此研究用数据挖掘技术联合可能发生于肺癌早期的遗传学及表观遗传学分子生物标志和流行病学参数建立肺癌的早期预警模型,并评价各模型对肺癌预警效果。对象与方法1.研究对象的选择:200例原发性肺癌患者的血标本于2009年1月至2010年6月取自郑州大学第一附属医院呼吸内科和胸外科;200例正常对照血标本取自同期郑州大学第一附属医院体检科体健的正常人群。经知情同意后由专业的调查员和医生收集研究对象的流行病学资料并采集血标本。2.DNA甲基化水平检测:用实时荧光定量甲基化特异性PCR分析p16、RASSFIA和FHIT基因甲基化水平3.相对端粒长度的测定:用实时荧光定量PCR分析外周血DNA相对端粒长度。4.数据挖掘:把样本按3:1的比例随机分成训练集,分别用判别分析、决策树、人工神经网络和支持向量机建立模型,然后用训练好的模型对预测集进行预测,并结合诊断试验评价指标对这几种模型的预测结果进行比较,其中判别分析、决策树和支持向量机在SPSS Clementine12.0软件下运行,人工神经网络分别在SPSS Clementine12.0(C-神经网络)和Matlab7.1软件下运行(M-神经网络)。5.统计学分析在SPSS12.0软件下运行。根据定量资料分布类型选择表示方法和组间统计学检验方法。定性资料组间比较用χ2检验。检验水准α=0.05。结果:1.甲基化水平检测结果:p16、RASSFIA和FHIT基因在肺癌组的甲基化水平均高于对照组,差异有统计学意义(P<0.05);单因素分析3个基因的甲基化水平均与性别、年龄、吸烟史和肺癌的组织学类型及临床分期无关(P>0.05);分别按3个基因的甲基化水平分为4组后,随着甲基化水平的增加,肺癌的危险性增加(Ptrend<0.05)。2.相对端粒长度测定结果:肺癌组端粒长度显著短于对照组(P<0.001);按对照组的端粒长度分为4组,随着端粒的缩短,肺癌的危险性增加(P<0.001);此外,在对照组中,年龄的增加也会使端粒缩短(P<0.001)。3.数据挖掘模型的评价结果:判别分析对预测集的预测灵敏度、特异度、准确度、阳性预测值、阴性预测值和AUC分别为80.0%、54.0%、67.0%、63.6%、37.0%和0.670;C-神经网络预测集的预测灵敏度、特异度、准确度、阳性预测值、阴性预测值和AUC分别为78.0%、74.0%、76.0%、75.0%、77.8%和0.760,其中对21例临床Ⅰ+Ⅱ患者的预测准确率达到71.4%;M-神经网络对预测集的预测灵敏度、特异度、准确度、阳性预测值、阴性预测值和AUC分别为80.0%、76.0%、78.0%、76.9%、79.2%和0.780,其中对21例临床Ⅰ+Ⅱ患者的预测准确率达到71.4%;决策树对预测集的预测灵敏度、特异度、准确度、阳性预测值、阴性预测值和AUC分别为80.0%、82.0%、81.0%、81.6%、80.4%和0.810,其中对21例临床Ⅰ+Ⅱ患者的预测准确率达到76.2%;支持向量机对预测集的预测灵敏度、特异度、准确度、阳性预测值、阴性预测值和AUC分别为82.0%、80.0%、81.0%、80.4%、81.6%和0.810,其中对21例临床Ⅰ+Ⅱ患者的预测准确率达到76.2%;神经网络、决策树和支持向量机的AUC要高于判别分析,神经网络、决策树和支持向量机的AUC差别不大,但前者预测结果每次都不一样,而后两者输出结果一致且比较易理解。结论:1.外周血DNA p16、RASSFIA和FHIT基因启动子甲基化与肺癌有关;p16、RASSFIA和FHIT基因启动子甲基化率与肺癌的组织学类型和临床分期无关;外周血相对端粒长度缩短可以增加患肺癌的危险性。2.数据挖掘中的决策树、支持向量机和神经网络模型对肺癌的早期预警效果优于Fisher判别分析,可以用于肺癌的早期预警;决策树和支持向量机对肺癌的预警效果略好于人工神经网络模型的预警效果。
其他文献
新疆自古以来就是以维吾尔族为主的多民族居住地域。当古代丝绸之路开通之时,新疆作为丝绸之路重镇吸引了更多的民族迁移至此。来自世界各地的民族在迁居到新疆的同时,也带来
本文通过结合相关研究资料,在简要阐明基于工作过程导向下的项目化教学基本内涵的基础上,以专科院校教育学课程为例,重点针对该课程工作过程导向下的项目化教学策略进行分析
目的:探讨溃疡性结肠炎临证处方中止泻药的运用规律。方法:运用方剂计量学方法对溃疡性结肠炎临证处方中止泻药进行频数统计、构成比重和性味归经分析,同时进行同用度和聚类
本文采用量化的内容分析法与文本分析方法。通过美国主流媒体《纽约时报》对林书豪现象的报道,探讨和分析了新闻媒介对个人形象的报道,在议程设置框架下对受众的关注影响以及对
“十二五”以来,国家开始关注农业的供给侧结构性改革,“十九大”后社会的主要矛盾也发生了改变,整个社会在期待优质的农产品的供给。尊重食品安全客观规律,坚持源头治理,标
档案网络信息资源共享研究是档案信息化建设的重要内容,这几年关于网络信息资源共享研究的理论和实践都有很大的进步。但由于各省份经济发展的不平衡,不同地区网站数字化资源
李石青老中医善治支气管哮喘持续发作,提出:表里分治,麻黄主表;痰恋气痹,开泄通阳;哮兼呕逆,治从肝胃;反复久发,尤重扶正,验之临床,收效卓著。
"治未病"是中医学的健康观,是中医学奉献给人类的健康医学模式。"治未病"理念蕴含着丰富的预防医学思想,开展中医药"治未病"健康管理服务符合我国经济发展大局的需要,适应医
目的 研究哮喘患儿细胞内IL-4,IFN-γ表达率, IL-4 / IFN-γ比值及血清IgE水平的变化。方法用流式细胞术分别对哮喘发作期和缓解期患儿进行IL-4 ,IFN-γ检测,同时用酶联免疫法测定血清中IgE含量。结果 细胞内IL-4表达
“非法占有目的”作为刑法学中的一个重要概念,是绝大多数侵财型犯罪中行为人追求的目的,在认定侵财类犯罪中处于非常重要的地位。但对于如何理解和认定非法占有目的,理论上