【摘 要】
:
基因表达谱数据具有高维度、低样本和连续型等特点,建立肿瘤分类模型的关键在于准确找出一组能够决定癌症基因样本类别的特征基因.传统的特征选择方法在处理连续型数据时要进
【机 构】
:
河南师范大学计算机与信息工程学院,河南省高校计算智能与数据挖掘工程技术研究中心
论文部分内容阅读
基因表达谱数据具有高维度、低样本和连续型等特点,建立肿瘤分类模型的关键在于准确找出一组能够决定癌症基因样本类别的特征基因.传统的特征选择方法在处理连续型数据时要进行离散化,这可能会丢失一些重要信息,导致分类精度下降.针对上述问题,本文提出一种改进的Relief算法,并利用该算法对基因进行排序生成候选特征集合,然后引入能直接处理连续型数据的邻域粗糙集属性约简模型,提出一种基于邻域粗糙集和粒子群优化的特征基因选择算法.实验结果表明,该算法可快速有效地选取肿瘤特征基因,能获得较好的分类效果.
其他文献
滨柃是山茶科柃木属(柃属)常绿低矮灌木,树高1~2m。滨柃耐阴、耐瘠薄、耐干旱、抗风性强,能耐一定程度的盐碱。分布于我国东南沿海及海岛,日本中南部、朝鲜中南部、韩国济州
摘要:随着经济的迅速发展,社会生产和生活对于交通运输的需求不断提高。公路作为交通运输中一种使用最为广泛的运输方式,它的质量安全关系重大。目前,我国的公路事业迅猛发展,对于我国的经济发展产生了巨大的推动作用。但是公路发展过程中依然存在很严重的安全问题,这些问题不仅严重的威胁了经济发展 ,而且还对人民的人身安全形成了严重的威胁,这些问题的产生源于公路试验检测过程。本学主要就公路试验检测中产生的问题和应
3月下旬的一个晚上,笔者像往常一样习惯性地连接上网络,并打开邮箱查收邮件,看到了老同学发来的一封邮件,就打开了。同学的一大幅照片赫然映入眼帘,照片的人物背景像是狼牙山五壮士的塑像,倒很符合这位大班长喜欢英雄人物的风格。
在社会主义市场经济体制逐渐确立以来,建筑行业作为国民经济的支柱性产业,获得了广阔的发展空间.尤其是在市场化进程不断加快背景下,建筑工程规模和数量得到了空前的增长,行
在当前激烈的市场竞争背景下,建筑行业作为国民经济的支柱性产业之一,伴随着城市化进程加快呈现出广阔的发展前景.在建筑工程施工中,施工监理作为保证施工活动有序开展,为工
"我们采用了各种技术手段阻止垃圾短信,或者干脆由公司来为这些高昂的费用买单",Verizon Wireless的发言人Jeffrey Nelson说,"短信业务的生命力越强,我们就会有更多的利润"。